数据库原理与应用(I)第 1、2 和 3 章(导论、系统结构、关系数据库)
目录
第一章:数据库系统概论
1.1什么是数据库
1.数据
2.数据库(DB)
3.数据库管理系统(DBMS)
4.数据库系统(DBS)——数据库
5.数据管理技术发展过程
1.3数据库系统的组成
1.最基本组成部分
2.数据库系统的硬件
3.数据库系统的软件
4.数据库中的组成人员
1.4数据库系统的特点
1.数据结构化
2.数据共享性高、冗余度低、易扩充
3.数据独立性高
4.数据由DBMS统一管理和控制
第二章:数据库系统结构
2.1数据模型的概念
1.数据模型(Data Model)
2.数据模型的分类
2.2概念模型
1.基本概念——信息世界
2.ER表示法——实体-联系法
3.概念模型实例分析
2.3逻辑模型-关系模型
1.逻辑模型概述(Logical Data Model)
2.关系模型(重点)——描述实体和实体关系之间
2.4数据库系统的三级模式
1.模式(概念模式)
2.外模式——数据库用户(包括应用程序员和最终用户)
3.内模式(存储模式)
4.例题分析
2.5数据库的二级映像功能与数据独立性
1.概述
2.外模式/概念模式映像
3.概念模式/内模式映像
第三章:关系数据库
3.1关系数据库结构
关系数据库相关基本概念
3.2关系的完整性
关系完整性约束
3.3关系代数
1.关系代数运算符
2.传统的集合运算
3.专门的关系运算
第一章:数据库系统概论
1.1什么是数据库
1.数据
- 数据—描述事务的符号记录
- 数据是数据库管理的基本对象
- 数据的含义=数据的语义,数据和语义不可分
2.数据库(DB)
- 定义:是长期存储在计算机内、有组织、可分享的大量数据的集合。是存放数据的仓库。
- 数据库的基本特征:数据按一定的数据模型组织、描述和存储 || 可共享 || 冗余度小 || 数据独立性高 || 可扩展
- 数据库中的数据3个特点:永久存储、可组织、可共享
- 数据模型(数据库的核心概念):每个数据库中的数据都是按照某种数据模型来组织的。
3.数据库管理系统(DBMS)
- 定义:是位于用户和操作系统之间的一层数据管理系统软件,专门用于对数据进行管理和维护。
- 功能:科学地组织和存储数据、高效地获取和维护数据。
4.数据库系统(DBS)——数据库
- 一个系统引入数据库后的系统构成
5.数据管理技术发展过程
(1)人工管理阶段
(2)文件系统阶段(可长期保存数据)(数据共享性差、独立性差、冗余度大,浪费空间,最严重会造成数据的不一致)
(3)数据库系统阶段(DBMS相当于一个中间人 连接 ——> 应用程序&数据库)
(4)新一代数据库管理系统
1.3数据库系统的组成
1.最基本组成部分
- 数据库
- 数据库管理系统(DBMS)(及其开发工具)——核心
- 应用系统(软硬件环境)
2.数据库系统的硬件
(1)对硬件要求很高
(2)要有足够大的内存——操作系统、数据库管理系统、数据缓冲区、应用程序
(3)要有足够大的硬盘空间——数据库
(4)最好有空闲的磁盘——存放备份数据
3.数据库系统的软件
(1)DBMS
(2)OS(操作系统)
(3)具有数据库访问接口的高级语言及编程环境,以便开发应用程序。
(4)实用工具(以DBMS为核心,一般为数据库厂商提供)
4.数据库中的组成人员
(1)数据库管理员(DBA)
(2)系统分析员
(3)数据库设计人员(一般由DBA担任)
(4)应用程序编写人员
(5)用户
1.4数据库系统的特点
1.数据结构化
2.数据共享性高、冗余度低、易扩充
3.数据独立性高
(1)物理独立性
(2)逻辑独立性
4.数据由DBMS统一管理和控制
(1)Security 数据安全性保护
(2)Integrity 数据完整性检查
(3)Concurrency 并发控制——对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果
(4)Recovery 数据库恢复
第二章:数据库系统结构
2.1数据模型的概念
1.数据模型(Data Model)
- 模拟和抽象现实世界的数据特征,用来描述数据是如何组织、存储、操作
2.数据模型的分类
(1)Conceptual 概念模型
- 按用户观点来建模——> 数据库设计
- 信息世界
- ER模型
(2)Logical 逻辑模型
- 按计算机系统的观点建模——>DBMS实现
- 机器世界
- 层次、网状、关系模型等
(3)Physical 物理模型
- 数据在具体DBMS产品中的物理存储方式和存取方法
- 机器世界
3.数据模型的组成要素
(1)数据结构(eg.学生基本信息)
(2)数据操作(eg.对学生信息进行查询、修改、删除操作)
(3)数据完整性约束条件(eg.对性别信息进行约束)
2.2概念模型
1.基本概念——信息世界
(1)实体 Entity
(2)属性 Attribute :实体所具有的特性
(3)码 Key :能唯一标识实体的属性集
(4)域 Domain:某属性的取值范围
(5)实体集 Entity Set:同一类型实体的集合
(6)实体型 Entity Type:实体名(属性1,属性2,属性3……)——抽象和刻画同类实体
2.ER表示法——实体-联系法
- 实体:矩形
- 联系(本身也是一种实体,也可有属性):菱形(3种类型)
- 属性:椭圆形
3.概念模型实例分析
2.3逻辑模型-关系模型
1.逻辑模型概述(Logical Data Model)
(1)逻辑模型面向——> 用户 & 系统(概念模型必须要转化成逻辑模型)
(2)逻辑模型:用什么样的数据结构来组织数据
主要包括三类模型:
- 非关系模型:层次、网状模型…
- 关系模型(重点):目前主流的数据库系统都是基于此
- 面向对象模型:目前数据库技术的研究方向
2.关系模型(重点)——描述实体和实体关系之间
- 用二维表来组织数据,一个二维表=一个关系
三个关系右部分所示
2.4数据库系统的三级模式
此处笔记整理来源于https://www.cnblogs.com/kunpengit/archive/2013/03/14/2959088.html
1.模式(概念模式)
(1)是数据库中全体数据的逻辑结构和特征的描述
(2)综合了所有用户的需求
(3)一个数据库只有一个概念模式
2.外模式——数据库用户(包括应用程序员和最终用户)
(1)一个数据库可以有多个外模式
(2)外模式是保证数据安全的一个有力措施
3.内模式(存储模式)
(1)是数据物理结构和存储方式的描述
(2)是数据在数据库内部的表示方式
(3)一个数据库只有一个内模式
4.例题分析
- 建立的2个外模式都来源于一个关系——学生信息二维表
- 内模式—描述整个数据库的计算机底层表示
- 三级模式结构有利于高效地组织和管理数据,提高数据独立性(物理、逻辑独立性),保证数据库安全的重要措施
2.5数据库的二级映像功能与数据独立性
1.概述
2.外模式/概念模式映像
(1)外模式:描述数据的局部逻辑结构
(2)概念模式:描述数据的全局逻辑结构
(3)每一个外模式,数据库系统都有一个外模式/模式映像;
其定义了外模式(局部逻辑结构)与概念模式(全局逻辑结构)之间的对应关系,映像定义通常包含在各自外模式的描述中。
(4)优点:保证数据的逻辑独立性
若要改变概念模式(eg.给某个关系增加或删除若干属性), 则使DBA修改映像关系即可,不会改变外模式,也不必修改应用程序。
3.概念模式/内模式映像
(1)概念模式:描述数据的全局逻辑结构
(2)内模式:描述数据物理结构和以及存储方式(存储结构)
定义了概念模式(全局逻辑结构)与内模式(存储结构)之间的对应关系,该映像定义包含在概念模式描述中。
(3)模式/内模式映像唯一
(4)优点:保证数据的物理独立性
第三章:关系数据库
3.1关系数据库结构
关系数据库相关基本概念
(1)关系:一个二维表=一个关系
(2)元祖/记录:关系中每一行的数据
(3)属性、域
(4)码:又称“键”,取值具有唯一性的属性
(5)候选码:一个关系中所有的码构成候选码
(6)主码:由候选码中产生,作为元祖标识。其取值唯一、不为空。
(7)外码:
- 外码是另一个表的主码
- 插入数据必须先给所关联外码的那个表插入数据
- 保证两个表之间的数据一致性
3.2关系的完整性
关系完整性约束
- 对关系模型提出的某种约束条件
- 保证数据库中数据的正确性、相容性
- 完整性包括:域完整性、实体完整性、参照完整性(前三个关系模型必须满足)、用户定义完整性
(1)域完整性:指属性的值域的完整性
(2)实体完整性: 关系数据库中所有的表都必须有主码
杜绝下述2种情况的出现
- 无主码值的记录
- 与其他记录的主码值相同的记录
(3)参照完整性:
- 外码的取值必须参照主码的取值
- 关系中不允许引用不存在的记录
(4)用户定义完整性
3.3关系代数
1.关系代数运算符
- 运算对象是关系,运算结果也是关系。
- 并相容性概念
2.传统的集合运算
3.专门的关系运算
下一篇: 计算机组成原理 01 - 系统介绍
推荐阅读
-
数据库原理与应用(I)第 1、2 和 3 章(导论、系统结构、关系数据库)
-
windows下进程间通信的(13种方法)-摘 要 本文讨论了进程间通信与应用程序间通信的含义及相应的实现技术,并对这些技术的原理、特性等进行了深入的分析和比较。 ---- 关键词 信号 管道 消息队列 共享存储段 信号灯 远程过程调用 Socket套接字 MQSeries 1 引言 ---- 进程间通信的主要目的是实现同一计算机系统内部的相互协作的进程之间的数据共享与信息交换,由于这些进程处于同一软件和硬件环境下,利用操作系统提供的的编程接口,用户可以方便地在程序中实现这种通信;应用程序间通信的主要目的是实现不同计算机系统中的相互协作的应用程序之间的数据共享与信息交换,由于应用程序分别运行在不同计算机系统中,它们之间要通过网络之间的协议才能实现数据共享与信息交换。进程间通信和应用程序间通信及相应的实现技术有许多相同之处,也各有自己的特色。即使是同一类型的通信也有多种的实现方法,以适应不同情况的需要。 ---- 为了充分认识和掌握这两种通信及相应的实现技术,本文将就以下几个方面对这两种通信进行深入的讨论:问题的由来、解决问题的策略和方法、每种方法的工作原理和实现、每种实现方法的特点和适用的范围等。 2 进程间的通信及其实现技术 ---- 用户提交给计算机的任务最终都是通过一个个的进程来完成的。在一组并发进程中的任何两个进程之间,如果都不存在公共变量,则称该组进程为不相交的。在不相交的进程组中,每个进程都独立于其它进程,它的运行环境与顺序程序一样,而且它的运行环境也不为别的进程所改变。运行的结果是确定的,不会发生与时间相关的错误。 ---- 但是,在实际中,并发进程的各个进程之间并不是完全互相独立的,它们之间往往存在着相互制约的关系。进程之间的相互制约关系表现为两种方式: ---- (1) 间接相互制约:共享CPU ---- (2) 直接相互制约:竞争和协作 ---- 竞争——进程对共享资源的竞争。为保证进程互斥地访问共享资源,各进程必须互斥地进入各自的临界段。 ---- 协作——进程之间交换数据。为完成一个共同任务而同时运行的一组进程称为同组进程,它们之间必须交换数据,以达到协作完成任务的目的,交换数据可以通知对方可以做某事或者委托对方做某事。 ---- 共享CPU问题由操作系统的进程调度来实现,进程间的竞争和协作由进程间的通信来完成。进程间的通信一般由操作系统提供编程接口,由程序员在程序中实现。UNIX在这个方面可以说最具特色,它提供了一整套进程间的数据共享与信息交换的处理方法——进程通信机制(IPC)。因此,我们就以UNIX为例来分析进程间通信的各种实现技术。 ---- 在UNIX中,文件(File)、信号(Signal)、无名管道(Unnamed Pipes)、有名管道(FIFOs)是传统IPC功能;新的IPC功能包括消息队列(Message queues)、共享存储段(Shared memory segment)和信号灯(Semapores)。 ---- (1) 信号 ---- 信号机制是UNIX为进程中断处理而设置的。它只是一组预定义的值,因此不能用于信息交换,仅用于进程中断控制。例如在发生浮点错、非法内存访问、执行无效指令、某些按键(如ctrl-c、del等)等都会产生一个信号,操作系统就会调用有关的系统调用或用户定义的处理过程来处理。 ---- 信号处理的系统调用是signal,调用形式是: ---- signal(signalno,action) ---- 其中,signalno是规定信号编号的值,action指明当特定的信号发生时所执行的动作。 ---- (2) 无名管道和有名管道 ---- 无名管道实际上是内存中的一个临时存储区,它由系统安全控制,并且独立于创建它的进程的内存区。管道对数据采用先进先出方式管理,并严格按顺序操作,例如不能对管道进行搜索,管道中的信息只能读一次。 ---- 无名管道只能用于两个相互协作的进程之间的通信,并且访问无名管道的进程必须有共同的祖先。 ---- 系统提供了许多标准管道库函数,如: pipe——打开一个可以读写的管道; close——关闭相应的管道; read——从管道中读取字符; write——向管道中写入字符; ---- 有名管道的操作和无名管道类似,不同的地方在于使用有名管道的进程不需要具有共同的祖先,其它进程,只要知道该管道的名字,就可以访问它。管道非常适合进程之间快速交换信息。 ---- (3) 消息队列(MQ) ---- 消息队列是内存中独立于生成它的进程的一段存储区,一旦创建消息队列,任何进程,只要具有正确的的访问权限,都可以访问消息队列,消息队列非常适合于在进程间交换短信息。 ---- 消息队列的每条消息由类型编号来分类,这样接收进程可以选择读取特定的消息类型——这一点与管道不同。消息队列在创建后将一直存在,直到使用msgctl系统调用或iqcrm -q命令删除它为止。 ---- 系统提供了许多有关创建、使用和管理消息队列的系统调用,如: ---- int msgget(key,flag)——创建一个具有flag权限的MQ及其相应的结构,并返回一个唯一的正整数msqid(MQ的标识符); ---- int msgsnd(msqid,msgp,msgsz,msgtyp,flag)——向队列中发送信息; ---- int msgrcv(msqid,cmd,buf)——从队列中接收信息; ---- int msgctl(msqid,cmd,buf)——对MQ的控制操作; ---- (4) 共享存储段(SM) ---- 共享存储段是主存的一部分,它由一个或多个独立的进程共享。各进程的数据段与共享存储段相关联,对每个进程来说,共享存储段有不同的虚拟地址。系统提供的有关SM的系统调用有: ---- int shmget(key,size,flag)——创建大小为size的SM段,其相应的数据结构名为key,并返回共享内存区的标识符shmid; ---- char shmat(shmid,address,flag)——将当前进程数据段的地址赋给shmget所返回的名为shmid的SM段; ---- int shmdr(address)——从进程地址空间删除SM段; ---- int shmctl (shmid,cmd,buf)——对SM的控制操作; ---- SM的大小只受主存限制,SM段的访问及进程间的信息交换可以通过同步读写来完成。同步通常由信号灯来实现。SM非常适合进程之间大量数据的共享。 ---- (5) 信号灯 ---- 在UNIX中,信号灯是一组进程共享的数据结构,当几个进程竞争同一资源时(文件、共享内存或消息队列等),它们的操作便由信号灯来同步,以防止互相干扰。 ---- 信号灯保证了某一时刻只有一个进程访问某一临界资源,所有请求该资源的其它进程都将被挂起,一旦该资源得到释放,系统才允许其它进程访问该资源。信号灯通常配对使用,以便实现资源的加锁和解锁。 ---- 进程间通信的实现技术的特点是:操作系统提供实现机制和编程接口,由用户在程序中实现,保证进程间可以进行快速的信息交换和大量数据的共享。但是,上述方式主要适合在同一台计算机系统内部的进程之间的通信。 3 应用程序间的通信及其实现技术 ---- 同进程之间的相互制约一样,不同的应用程序之间也存在竞争和协作的关系。UNIX操作系统也提供一些可用于应用程序之间实现数据共享与信息交换的编程接口,程序员可以通过自己编程来实现。如远程过程调用和基于TCP/IP协议的套接字(Socket)编程。但是,相对普通程序员来说,它们涉及的技术比较深,编程也比较复杂,实现起来困难较大。 ---- 于是,一种新的技术应运而生——通过将有关通信的细节完全掩盖在某个独立软件内部,即底层的通讯工作和相应的维护管理工作由该软件内部来实现,用户只需要将通信任务提交给该软件去完成,而不必理会它的具体工作过程——这就是所谓的中间件技术。 ---- 我们在这里分别讨论这三种常用的应用程序间通信的实现技术——远程过程调用、会话编程技术和MQSeries消息队列技术。其中远程过程调用和会话编程属于比较低级的方式,程序员参与的程度较深,而MQSeries消息队列则属于比较高级的方式,即中间件方式,程序员参与的程度较浅。 ---- 4.1 远程过程调用(RPC)