数据库基础教程
第1章 數據庫概覽——實例、概念與認識
數據管理 是 數據處理 的中心活動,直接影響數據處理的效率,兩者密不可分。隨著計算機科學與技術的發展,利用計算機進行數據管理經歷了三個階段,即人工管理階段、文件系統階段和數據庫系統階段。
1.1 數據管理系統的進展
- 人工管理階段
計算機主要用于科學計算,無磁盤等直接存取的設備,無操作系統。程序員將數據處理納入程序設計的過程中。此階段數據不長期保存在計算機中;應用程序管理數據,數據與程序不具有獨立性;數據是面向應用的。 - 文件系統階段
計算機開始用于數據處理,外存儲器有了磁盤、磁鼓等直接存取設備,軟件有操作系統,且操作系統中有了專門的數據管理軟件——文件系統。此階段數據能夠長期保存,反復操作;由專門軟件對數據進行管理,程序與數據之間有了一定的獨立性。但由于數據文件是面向應用的,數據的組織和管理直接依賴于應用程序,數據共享性差,冗余度大,數據獨立性差。 - 數據庫系統階段
數據處理成為計算機應用的主要領域,數據庫系統的主要特征是數據的統一管理和數據共享。數據采用統一的數據模型進行組織和存儲,由數據庫管理軟件進行統一管控,應用程序在DBMS的控制下,采用統一的方式對數據庫中的數據進行訪問和操作。
數據庫系統階段的特點:
1.2 理解數據庫系統
三個概念:數據庫,數據庫管理系統,數據庫系統
- 數據庫:長期存儲在計算機內的、有組織的、可共享的數據集合。
- 數據庫管理系統:位于用戶和操作系統之間,對數據進行統一管理與控制的專門系統軟件。
- 數據庫系統:帶有數據庫并利用數據庫技術進行數據管理的計算機系統。
1.3 數據庫系統結構
數據庫系統 由數據庫、數據庫管理系統(DBMS)、數據庫管理員(DBA)、數據庫應用系統和用戶組成。數據庫系列產品很多,它們建立于不同的操作系統之上,支持不同的數據模型,采用不同的數據庫語言,但他們在體系結構上具有相同的特征,即采用 三級模式 結構,提供 兩級映像 功能。
- 模式也稱邏輯模式或概念模式,是數據庫中全體數據的邏輯結構和特征的描述。模式是面向所有用戶的公共數據視圖,是數據庫的全局視圖。一個數據庫只有一個模式,它既不涉及物理存儲細節,也不涉及應用程序和程序設計語言。
- 外模式也稱子模式或用戶模式,它是模式的子集。外模式是具體面向應用的,是數據庫用戶所能使用的局部數據的邏輯結構和特征的描述。由于不同應用有不同的外模式,因此一個數據庫應有多個外模式。
- 內模式也稱存儲模式,是數據庫的物理結構,是數據庫在存儲介質上的存儲結構。內模式主要描述數據的物理結構和存儲方式,一個數據庫只有一個內模式。
數據庫系統的三級模式是對數據的三個抽象層次,兩級映像定義了三級模式間的對應關系。模式是數據庫的核心和關鍵,獨立于數據庫的其他層次。內模式由DBMS定義,無需數據庫設計人員設計。
三級模式兩級映像的優點
- 保證數據獨立性。外模式/模式映像保證了數據的邏輯獨立性;模式/內模式映像保證了數據的物理獨立性。
- 有利于數據共享,減少數據冗余。
- 有利于數據的安全性。不同用戶在各自外模式下根據要求操作數據,只能對限定的數據進行操作。
- 簡化了用戶接口。用戶按外模式編寫應用程序或輸入命令,而無需了解數據庫全局邏輯結構和內部存儲結構,方便用戶使用。
數據庫管理系統的主要功能:
1.4 數據模型
1.4.1 數據模型的概念
模型是現實世界特征的抽象與模擬,可分為實物模型和抽象模型。數據模型是一種抽象模型,是對現實世界數據特征的抽象,為數據庫系統的信息表示和操作提供必須的抽象框架。
數據模型的選擇應滿足三方面要求:①能較真實地模擬現實世界②易于理解③便于在計算機上實現。根據實際問題的需要和應用目的的不同,有三種層面上的數據模型。
面向用戶的模型,是現實世界到機器世界的一個中間層次。其基本特征是按用戶觀點對信息建模,與具體的DBMS無關。概念數據模型的作用和意義在于描述現實世界的概念化結構,使數據庫設計人員在設計的初始階段能夠擺脫計算機系統和DBMS具體技術的約束,集中精力分析數據及其聯系。最常用的概念模型是實體-聯系(E-R)模型。
按計算機系統的觀點對數據建模,服務于DBMS的應用實現。結構化數據數據模型包括:層次結構、網狀模型、關系模型等。
用于描述數據在存儲介質上的組織結構,它與具體DBMS有關,也與操作系統和硬件有關,是物理層次上的數據模型。
1.4.2 概念數據模型
概念數據模型是現實世界到信息世界的抽象,是數據庫設計人員與用戶進行交流的工具。因此概念數據模型的選擇應具有較強的語義表達能力,同時還應簡單、清晰、便于用戶理解。目前使用較多的概念數據模型描述工具有E-R模型、UML等。
實體指客觀存在并可相互區別的事物。實體可以是人、事或物,也可以是抽象的概念。屬性是實體的特征,刻畫了實體在某方面的特征?,F實世界中事物之間的聯系反映在E-R模型中就是實體間的聯系。
在數據庫系統中,引入的對象通常都有“型”和“值”之分?!靶汀笔菍ο筇卣鞯某橄竺枋?#xff0c;“值”是對象的具體內容。實體型指對某一數據結構和特征的描述,通常由實體名和屬性名的集合來抽象和刻畫同類實體。實體值是實體型的內容,由描述實體的各個屬性值組成。實體集指具有相同實體型的若干實體構成的集合。
實體內部/之間的聯系:實體集內部各實體間/不同實體集中實體間的聯系。
存在性/功能性聯系:學校有老師,工廠有車間/老師授課,學生選課。
兩個實體型之間的聯系:一對一聯系(1:1)、一對多聯系(1:n)、多對多聯系(m:n)。
用矩形框表示實體型,框內標明實體名;用橢圓表示實體型的屬性;用無向線段連接實體和屬性;用菱形框表示聯系,用無向邊分別與有關實體連接,同時在無向邊旁標注聯系類型。
1.4.3 邏輯數據模型
邏輯數據模型是數據庫管理系統呈現給用戶的數據模型,即用戶從數據庫中看到的數據組織形式,它與DBMS直接相關。用概念數據模型描述的數據,必須用邏輯數據模型表示才能由DBMS管理。
數據模型的三要素
邏輯數據模型是嚴格定義的一組概念的集合,主要由數據結構、數據操作和數據完整性約束三部分組成,通常稱為邏輯數據模型的三要素。
數據模型的類型
數據結構是刻畫數據模型最重要的方面。因此在數據庫系統中,通常按照其數據結構的類型來命名數據模型。數據模型的發展帶動了數據庫系統的更新換代。先后出現了層次模型、網狀模型、關系模型、面向對象模型、對象關系模型等邏輯數據模型。其中層次模型和網狀模型統稱為格式化模型。
關系數據模型
關系模型源于數學,具有完備的關系理論作為基礎,因此被普遍采用。
(1)數據結構。非形式化地討論,關系模型地基本數據結構是表格,使用二維表來表示實體及其聯系。
(2)數據操作。關系模型的數據操作主要包括查詢和更新。關系數據操作有兩個顯著特點:操作對象和結果均為集合;關系模型將操作中的存取路徑向用戶屏蔽起來。
(3)數據完整性約束。對數據模型中的數據操作必須滿足完整性約束規則。關系完整性約束規則包括三類:實體完整性、參照完整性和用戶定義完整性。
1.5 數據庫系統的發展
1.5.1 數據庫系統發展的階段
采用規格化模型的數據庫系統屬于第一代數據庫系統。層次模型數據庫系統代表:IBM公司的IMS(Information Management System);網狀模型的典型代表是DBTG系統。
第一代數據庫系統的主要特點有:
(1)支持三級模式體系結構。
(2)用存儲路徑表示實體間的聯系。
(3)導航式的數據操縱語言。
第二代數據庫系統是指支持關系數據模型的關系數據庫系統。關系模型由E.F.Codd提出。支持的實驗系統有System R和INGRES,商用系統有System R發展來的SQL/DS以及INGRES實驗系統發展來的INGRES關系數據庫軟件產品。Foxpro、Access、Oracle、SQL Server、 Sybase、 DB2、 Informix。
第二代數據庫系統的主要特點有:
(1)概念單一,實體以及實體之間的聯系都用關系表示。
(2)以關系代數為基礎,形式化基礎好。
(3)數據獨立性強,數據的物理存取路徑對用戶屏蔽。
(4)語言標準化,即創建了結構化查詢語言SQL(Structured Query Language)。
第三代數據庫系統是指以更豐富的數據模型、更強大的數據管理能力為特征,滿足更廣泛更復雜的新應用需求的各類數據庫系統的大家族。這些新的數據庫系統包括:面向對象數據庫、分布式數據庫、并行數據庫、統計數據庫、空間數據庫等。
第三代數據庫管理系統的三個基本特征:
(1)第三代數據庫系統應支持數據管理,對象管理和知識管理。
(2)第三代數據庫系統必須保持或繼承第二代數據庫系統的技術。即必須保持第二代數據庫系統的非過程化數據存取方式和數據獨立性等特征。
(3)第三代數據庫系統必須對其他系統開放。數據庫系統的開放性表現在:支持數據庫語言標準,支持網絡標準,系統具有良好的可移植性、可連接性、可擴展性和互操作性等。
1.5.2 數據庫系統主要研究領域
DBMS是數據庫系統的基礎與核心,開發可靠性好、效率高、功能齊全的DBMS始終是數據庫領域研究的重要內容。并且為了充分發揮數據庫的應用功能,還需開發一些必須能在DBMS上運行的軟件系統。
在DBMS支持下,設計與開發滿足用戶要求的數據庫應用系統,這是數據庫領域研究的另一個重要內容。
總結
- 上一篇: 紫色范冰冰WIN7主题包
- 下一篇: 番茄工作方法以及番茄工作表