當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

数据库学习笔记

發布時間：2023/12/14 数据库 23 豆豆

生活随笔收集整理的這篇文章主要介紹了数据库学习笔记小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章導航

ppt下載
數據庫系統概述
- 數據
- 數據管理
- 數據庫
- 數據模型
- 數據庫系統結構
- DBMS
數據模型
- 基礎概念
- E(ntity)-R(elationship)概念模型（基礎）
- - 基本概念
  - E-R數據模型
- 層次數據模型
- - 特征
  - 儲存結構
  - 點評
- 網狀數據模型
- - 表示方法
  - 點評
- 關系數據模型（主流）
- - 基本概念
  - 表示方法
  - 數據操縱
  - 點評
- 面向對象數據模型（發展）
關系數據庫
- 關系模型的基本概念
- - 基本概念
  - 關系的定義
  - - 基礎概念
    - 關系的概念
    - 關系的特殊性
  - 規范化的關系
  - 關系與關系模式
  - 關系數據庫與關系數據庫模式
  - 鍵
  - - 鍵定義和超鍵
    - 其他鍵類型
  - 關系的完整性約束
- 關系代數
- - 關系代數概述
  - - 分類：
  - 傳統的集合運算
  - - 并差交
    - 笛卡爾積
  - 專門的關系運算
  - - 選擇
    - 投影
    - 連接
    - 除法
  - 擴充的關系運算
  - - 屬性重命名
    - 外連接
  - 關系代數應用
  - - 用于增刪查改
    - 案例解析
    - 典型關系代數語言：ISBL
- 關系演算
- - 元組關系演算
  - - 元組關系演算語言：ALPHA
  - 域關系演算
  - - 域關系演算語言QBE
- 關系數據語言
- 關系運算的安全性與等價性
SQL語言（核心）
- SQL概述
- SQL數據定義
- - SCHEMA定義
  - TABLE定義
  - 建立索引
- SQL數據操縱——查詢
- - 單表查詢
  - 連接查詢
  - 嵌套查詢
  - - IN類子查詢
    - ANY/ALL子查詢
    - EXIST類子查詢
  - 集合查詢
  - 派生表查詢
- SQL數據操縱——增刪改
- SQL視圖
- SQL數據控制
- 嵌入式SQL
查詢優化
安全性控制
完整性控制
故障恢復技術
并發控制
數據庫設計
- 理論部分
- - 關系數據庫層次重論
  - 關系模型的存儲異常
  - 函數依賴
  - - 定義與類型
    - 邏輯蘊涵與閉包
    - 函數依賴公理——Armstrong公理
    - 屬性閉包
    - 最小依賴集
  - 關系模式的規范化——模式分解
- 設計流程
- - 數據分析與需求分析——SA方法
  - 概念模型設計——E-R模型
  - - 數據抽象與局部視圖設計
    - 視圖集成
    - 驗證全局概念結構
  - 數據模型——邏輯數據庫設計
  - - 轉換
    - 優化
    - 子模式設計
  - 數據模型——物理數據庫設計
  - - 選擇存取路徑
    - 設計關系，索引等數據庫文件的物理儲存結構
  - 建立數據庫與測試維護

ppt下載

ppt 提取碼：cyyy

數據庫系統概述

數據

數據本質上是對現實世界的編碼，與現實一一對應，數據由各種成分組成，都是字段。

數據管理

人工管理：程序與數據集1對1

文件系統：以系統為中介，鏈接程序與文件

數據庫系統：以DBMS為中介，且文件被封裝為一個整體（DB）

大數據：正在發展

數據庫

優點：

繼承了前面的儲存，有組織

發揚了結構化，獨立性（解耦），減少冗余，提高了數據容量

增加了共享性，安全保護。

簡言之，數據庫高度抽象，建立程序與數據之間的通道。

通常來說，數據庫指DBMS。

發展：

層次，網狀數據庫。

關系數據庫。Oracle，MySQL，SQL Server等等。

新型數據庫。解決數據量變大，以及網絡環境的。網絡的，分布式，面向對象的，多媒體的。NoSQL，NewSQL。

數據模型

三要素：

數據結構，即基本的組織方式，數據定義，這個是最基本的。

數據操作，CRUD+其他高級操作

完整性約束，這個個人感覺是區別與文件系統的核心，更復雜，更抽象。

三要求：

真實模擬

便于鏈接人（讓人理解）

便于鏈接計算機（在計算機上實現，讓計算機理解）

分類：

概念模型：最頂層的設計，產品端提出要求，和具體實現無關

數據模型：和DBMS設計關系較大，比如有層次模型，網狀模型，關系模型，面型對象數據模型，對象關系數據模型，半結構化數據模型。

基本數據模型（前面的2）也分兩層：

邏輯數據模型：相當于定義DBMS的一些操作，概念。

物理數據模型：具體在操作系統上實現DBMS。

數據庫系統結構

（視圖）外模式：與視圖對應，又名子模式，與程序，用戶綁定。

外模式-模式映像：用戶級。接口。

（概念）模式：綜合所有數據，是一種邏輯上的全局描述。

模式-內模式映像：管理員，設計師級。接口。

（物理）內模式：是模式的物理實現的描述。

操作系統：將硬件操作封裝，通過物理內模式描述來操作數據庫。

物理數據庫：文件。

DBMS

這門課主要學習DBMS，后面會逐章學習。

定義功能

操縱功能

保護功能

維護功能

數據模型

基礎概念

核心：

將現實事物抽象為數據，并將現實中事物之間的聯系抽象為數據之間的聯系。說白了就是用數據去復刻現實，在此之上添加更多的操作。

內容：

概念模型：最頂層的設計，產品端提出要求，和具體實現無關

數據模型：和DBMS設計關系較大，比如有層次模型，網狀模型，關系模型，面型對象數據模型，對象關系數據模型，半結構化數據模型。

基本數據模型（前面的2）也分兩層：

邏輯數據模型：相當于定義DBMS的一些操作，概念。

物理數據模型：具體在操作系統上實現DBMS。

實現步驟：

按照上面的結構自頂向下逐層分解，直到實現。

E(ntity)-R(elationship)概念模型（基礎）

這個是樸素的關系思想，和知識圖譜非常像。

基本概念

實體：

實例：某個具體的東西，或者是一個抽象的概念（比如一節課）

實體集（set）：同類實體（實例）集合，這里應該是一張表。

實體型（type）：名字+若干特征，用于描述一個實體集的特征。

屬性：

屬性的類型：就是字段

屬性的值：字段的具體值

屬性的域（domain）：屬性的定義域

特殊屬性-鍵（key）：獨一無二，實體id

實體間的聯系：

實體內部聯系：各屬性之間聯系

實體之間聯系：各實體集之間的聯系，往往是一個動作描述，這一點和實際不同，在計算機中我們只關注大類。

兩個實體集之間的聯系從數量上說，有鏈式，樹式，圖式。當然也可以多個實體集有聯系。實體集內部不同實體也可以有聯系。

E-R數據模型

圖形表示：

實體用矩形——無向邊鏈接——屬性用橢圓

聯系用菱形，無向邊鏈接實體集，上面注明連接類型（鏈樹圖）。

聯系本身也算實體，所以也有屬性。

聯系的語義：

基數比約束。就是幾對幾

參與約束。描述完全參與或者部分參與

參與度：實體集中的某個實體參與聯系的最小次數比最大次數。基數比約束和參與約束都可以通過參與度統一表示。

弱實體：

類比面向對象中的組合。就相當于把實體中的一些屬性弄出來變成新的實體，但是這個實體是對原實體依賴的，是他的成員。比如家長，可以作為學生的屬性，也可以提出來。

依賴于其他實體存在的實體。

實體，聯系，連線都用雙框表示

子實體：

將基實體特例化。

將超類分割為子類

子類繼承超類屬性，聯系

子類之間也可以有聯系

表示方法如下：加兩邊短線表示孩子，然后用圓圈鏈接線。

模型綜合舉例：

層次數據模型

這是最早的，比較混沌。代表是，IBM的IMS。

特征

相比于E-R模型的圖結構，層次結構是樹形結構，有點面向對象的味道。

只能處理一對多聯系，多對多只能通過分解成一對多來實現。

記錄值必須按照路徑查看，才有意義，有點huffman編碼的味道。

子女不能脫離雙親記錄值獨立存在，每次插入都必須從根部找下來，每次刪除節點都必須遞歸刪除所有子節點。

每個記錄類型定義一個排序字段，稱為碼字段

儲存結構

按照前序遍歷的順序，把所有記錄值按照物理順序存放。

用指針直接將樹結構儲存。

點評

優點：

數據結構直觀

查詢效率高

缺點

不能直接反應多對多聯系

插入刪除效率低

網狀數據模型

有點像E-R模型，是有向圖結構。代表是DBTG系統。

層次模型可以說是網狀數據模型的一個特例。

表示方法

實體：用結點表示

屬性：用字段描述

聯系：用連線描述，多對多聯系仍然是分解成一對多聯系。

點評

優點

圖更容易模擬顯示世界

指針存取效率比較高

缺點

結構會隨著體量而逐漸復雜，冗雜

操作不太容易

編程實現不太容易

關系數據模型（主流）

IBM的研究員提出的，獲得了圖靈獎。

基本概念

關系：基本數據結構單元是二維表，稱為關系，可以用來描述一個實體集

屬性，域，同上。但是屬性不可分是一個基本原則。

元組：實體集中的一個個體，有包括Key在內的若干屬性（分量）

鍵：主鍵只能有一個，但是可以有多個候選鍵

關系模式：用于描述一個實體集，形式為，關系名（屬性名1，屬性名2，…，屬性名n），是實體的封裝。

關系數據庫模式：一組關系模式的集合，是實體集的封裝。

關系數據庫：一組關系模式所對應的關系的集合，是關系數據庫模式的封裝。

表示方法

實體集用關系表示

一切聯系都用關系表示，一種樸素的想法就是，將兩個被連接實體集的主鍵包含在關系中，表明聯系，再加入額外的屬性用來說明聯系的更多信息。

通過關系的組合可以模擬出各種復雜的聯系

數據操縱

CRUD是基本，而且通過SQL語句高度封裝，我們這里解釋一下本質，對數據的全部操作都可以歸結為對關系的運算。

也就是說，關系型數據庫，實體是關系，聯系是關系，操作還是關系操作，操作結果仍然是關系。

關系運算：

關系代數

關系演算

點評

優點：

數據結構簡單，概念單一

建立在嚴格的數學概念基礎上，具有良好的擴展性，可以建立復雜的架構

存取路徑對用戶透明，數據獨立性好，開發簡單

缺點：

查詢效率一般，為此需要進行查詢優化

語義貧乏，難以描述特別復雜的對象（似乎和前面所說的復雜結構有所矛盾？）

面向對象數據模型（發展）

起源于OOP，將數據結構定義成對象，支持面向對象的各種層次結構。

但是有待研究，或許是未來的新的爆發點。

關系數據庫

關系模型的基本概念

基本概念

數據結構：現實中實體與實體之間的聯系均用關系來表示

邏輯結構：二維表，每一個實體集都是一張二維表

數學基礎：集合代數

關系的定義

基礎概念

笛卡爾積。若干個集合的笛卡爾積是這些集合的全排列，每一個位置上都可以出現該集合的任一元素。

元組。Tuple，同Python里的寫法，有n個元素則叫做n元組

分量。元組里的元素被稱為第i個分量.。寫作

d_i

（值）域。域是相對于分量來說的，即第i 個分量的取值空間稱作第i 個分量的域。寫作

D_i

。經常的，我們會對若干個域進行笛卡爾積運算。

基數（cardinal number）。對于一個域，本身就是一個集合，自然有基數。寫作

m_i

。對于有限集，就是n，無限可列集就是

?0\alef_0

，無限不可列集

?\alef

。對若干個域進行的笛卡爾積也是集合，易得為

M=∏miM=\prod m_i

關系的概念

n個域，對應n個分量，對應n個屬性。n個域的笛卡爾積可以產生M個n元組，這樣就可以排列出M行n列的二維表。

定義：

D1×?×DnD_1\times\cdots\times D_n

的子集稱為

D1,?,DnD_1,\cdots,D_n

上的關系。域笛卡爾積產生的二維表是全排列，實際上不一定用全排列，所以用子集作為關系。

寫作：

R(Di,?,Dn)R(D_i,\cdots,D_n)

，R為關系名，n為關系的度或者目，

D1,?,DnD_1,\cdots,D_n

為關系的域。聯系一下離散數學，當n=2，則為二元關系。

關系的每一行對應一個元組，用t 表示

關系的每一列對應一個域，同時對應一個屬性，記作

A_i

t[A_i]

表示元組t 在

A_i

屬性上的值

dom(A_i)

表示屬性

A_i

的域

關系的特殊性

分量的次序沒有關系。可以用屬性名綁定分量，這樣無論如何排列，總能通過屬性名綁定找到對應的分量。

數學意義上的關系可以是無限的，但是實際上受到儲存空間限制。

關系必須是簡單的二維表，每一列都不可分

本質上，關系是一個笛卡爾積產生的集合，只不過被表達成二維表

規范化的關系

理論上規范化的關系應該有以下特征：

一個屬性必然屬于一個域。同時多個屬性也可以共享一個域。

列次序無關緊要，行次序也無關緊要，重點在于關系本身。

每個分量都是原子的，不可再拆分的。

每個元組都是獨一無二的，滿足集合的不重性

實際上的DBMS不一定滿足。

關系與關系模式

關系的型：指關系模式（對標實體型），用來描述一種關系類型，寫作

R(A1,?,An)R(A_1,\cdots,A_n)

，或者簡單用R來描述

關系的值：指元組的集合（對標實體集），就是關系的內容，是一種類型的具體表示。所以一般將關系r 寫為

r (R)

，即建立在關系類型R上的一個關系值。

實際上，完整的關系模式不能簡單用1來描述，而是 $R (U, D, D OM, F)$

R：關系名

U：屬性名集合

D：屬性的域集合

DOM：屬性名和屬性域的映射，用來鏈接U與D

F：屬性間的數據依賴關系集合。這個難以用二維表描述。

關系數據庫與關系數據庫模式

一個關系數據庫中有p 個關系，所以數據庫對關系是包含關系，據此引出以下概念

關系數據庫模式：

R={R1,?,Rp}R=\{R_1,\cdots,R_p\}

（注意這里是大括號）。從這里可以看出，關系數據庫模式就是該庫中所有關系型的集合

關系數據庫：

d={r1,?,rp}d=\{r_1,\cdots,r_p\}

。同上，關系數據庫就是庫中所有關系值的集合。

關系模式與關系統稱為關系，根據上下文判斷。

鍵

鍵定義和超鍵

屬性名通常記作K

鍵的本質目的在于區分元組，即區分行。所以有一個硬性要求： $?t1,t2有t1[K]≠t2[K]\forall t_1,t_2 有t_1[K]\neq t_2[K]$

鍵的形式就是用于區分作用的屬性或者屬性組合。

理想中的鍵就是一種一一對應，具有最小屬性數。

超鍵就是鍵的超集，超鍵是鍵，可以用于區分元組，但是超鍵允許冗余屬性存在。

其他鍵類型

主鍵與候選鍵與候補鍵：在n個候選鍵中選出1個主鍵與n-1個候補鍵

候選鍵中的屬性成為主屬性，其他的稱作非鍵屬性（非主屬性）

聯合鍵與全鍵：多個屬性組成的鍵。如果是所有屬性的聯合鍵，那就是全鍵。

外鍵：外鍵是屬于另外一個關系的。具體來說就是，外鍵在被參照關系中。外鍵可以給出不同關系之間的聯系。可以看這篇文章,外鍵其實就是約束了值的范圍。

https://blog.csdn.net/sinat_41803693/article/details/84021238?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%A4%96%E9%94%AE&utm_medium=distribute.pc_search_result.none-task-blog-2_allsobaiduweb~default-1-84021238.142^v14pc_search_result_control_group,157^v14control&spm=1018.2226.3001.4187

關系的完整性約束

為了保證數據庫與現實世界的一致性，需要維護完整性。

實體完整性約束。即實體中不能有空的

參照完整性約束。描述兩個關系的聯系，一個關系是參照，含有外鍵，另一個是被參照，其主鍵作為參照的外鍵。比如這個右邊就是一個被參照的，左邊就是參照（別的關系的），每次參照都要取被參照的主鍵。

其他約束。用戶自定義后由系統支持。

關系代數

關系代數概述

基礎是集合代數，

實際上是一種抽象的查詢語言，用關系的運算來表達查詢指令

運算的對象與結果都是關系

分類：

傳統集合運算。交并差，廣義笛卡爾積，以及將元組作為元素來進行集合代數運算

專門的關系運算。選擇，投影，連接，除

擴充的關系運算。為數據庫應用而引進的特殊運算

傳統的集合運算

并差交

對于同一個關系模型的兩個關系進行運算，產生新的集合（關系）。同傳統的并差交一樣，保留集合的唯一性。

笛卡爾積

關系來源于對域的笛卡爾積。而我們這里的笛卡爾積又是對關系作用的，但是本質相通。

對于R與S的笛卡爾積，是針對每一個元組，進行全排列組合。

新關系的度數為原有度數之和，內容是元組拼接的全排列。

專門的關系運算

選擇

對應select語句，條件就是一個布爾表達式，選出所有真值的行合并為一個新關系，是原有關系的子集。

寫法：

σF(R)={t∣t∈R∧F(t)}\sigma_F(R)=\{t|t\in R \wedge F(t)\}

舉例：

σage<20(R)\sigma_{age<20}(R)

，對R中年齡小于20的進行選擇

投影

選擇是從行的角度提取，投影是從列的角度提取。提取一個屬性集對應的關系。

寫法：

∏x(R)={t[X]∣t∈R}\prod_x(R)=\{t[X]|t\in R\}

舉例：

∏name,dept(Student)\prod_{name,dept}(Student)

，這里可以看出，屬性集并沒有寫成集合形式，只是用逗號隔開而已，這種寫法和集合具有一一對應的關系，不用擔心混淆。

這里需要注意，行的提取肯定不會出現重復，但是提取列可能重復。比如僅僅提取一個列，但是這個列的屬性只有1種，那最后投影出來的就只有1行。所以投影是會去重的。

本質上，這是因為為每一行都是有唯一鍵的，但是部分列不一定具有鍵，所以存在重復可能。

連接

連接是列上的合并+行上的篩選。

條件連接

將滿足條件的元組進行拼接。

從這一點看，本質上這就是兩個元組的笛卡爾積的子集，這個子集符合我們前面的條件。所以也自然可以轉換形式。

寫法：

R?AθBSR\mathop{\bowtie}\limits_{A\theta B} S

。如果碰到重復的屬性，我們可以用關系.屬性來進行區分

R?AθBS=σAθB(R×S)R\mathop{\bowtie}\limits_{A\theta B}S=\sigma_{A\theta B}(R\times S)

即條件連接可以作為笛卡爾積的子集，然后進行一個條件的選擇。

舉例：

等值連接

$θ\theta$ 為=的條件叫做等值連接。

這里就會有個問題，明明都等值了，為什么還要保留相同的兩列呢？這里只是為了形式保持一致，符合條件連接定義。后面用自然連接特殊化。

自然連接

自然連接寫法不需要加條件，自動合并相同屬性組。

自然連接本質上是一種等值連接，但是相比于等值連接來說，進行了重復列刪除的操作，提高了簡潔性，犧牲了形式一致性。

除法

像集

像集是一個屬性中元素到另一個屬性中元素的映射。

前面的是原象，后面的是像集。

寫法：

$Z_{原象值}=\{Z上的像集\}$

舉例：

除法

本質上就是，去掉兩個關系中相同的屬性后剩下的屬性。

步驟：

找到相同的屬性，假設為A，B

在左邊關系中找出每個元素對應的AB上的像集

在右邊關系中找出AB的投影

如果左邊有某個元素的像集包含右邊的投影集，那么就保留該元素

這本質上就是一種包含關系，符合

\div

的概念，用左邊元素去包含右邊整個集合，包含的介質就是左邊該元素的像集和右邊整個集合的投影，包含就留下來，不包含就舍去。

非常抽象，所以要給足例子：

例1：

例2：

這個例子里包含了實際意義。就是進行一個篩選，篩選是滿足像集包含投影的條件的。

擴充的關系運算

屬性重命名

就是簡單意義上的重命名，即，復制一份并給一個屬性重命名或者一組屬性重命名。
就是生成一個等價的新關系。

寫法：

$r′(R′)=δA→B(r)r^\prime(R^\prime)=\delta_{A\rightarrow B}(r)$

其中，R為原來關系模式，r為原來關系。

用法：

做同一個關系的笛卡爾積。一個關系無法進行，于是復制一份。

做同一個關系的自然連接。同樣式單個關系沒辦法自然連接，鏈接和沒連接一樣，重命名后，重命名列不會被消去。

外連接

前面的條件連接，包括自然連接，都會把不滿足條件的元組去掉。
對于不滿足條件的元組，還可以有另一種處理方法：保留，但是強行合并的部分用NULL區分，由此分出三種保留方法。

左外連接。保留左邊不匹配項，右邊強行合并用NULL。

右外連接。保留右邊不匹配項，左邊強行合并有NULL。

完全外連接。保留所有不匹配項，分別用NULL。

關系代數應用

用于增刪查改

對數據庫的各種操作，增刪查改，都可以用關系代數表達式來表示。這就是完備性。但是注意，某種操作并不一定只有一種關系表達式，而是可以有各種方法。
當然，一般不直接用關系代數表達式，而是將表達式封裝進SQL語言。
這里對關系代數的效果進行理解：

交。

并。一般用于插入。直接∪上一個元組。

差。一般用于刪除，取補，取反。

選擇。取一些行。

投影。取一些列。

連接。將兩個表匹配+合并。通常是使用自然連接，一來是＝關系最常用，二來是能夠去重復列，很多時候進行匹配列數不會增加。對于表示聯系的關系，可以用

S?SC?CS\bowtie SC \bowtie C

，來制造一個直觀的表，將多對多轉換成一一對應關系。

除。多用于篩選全部的情況。比如篩選選修了所有課程的學生學號。

重命名。

外連接。

案例解析

首先聲明一下，S代表學生，C代表課程，SC代表選修關系。

首先用選擇篩選學生，然后用投影提取學號和姓名屬性。

首先將SC中選C1篩選出來，然后進行匹配鏈接，最后再將學號提取出來。
還有一種方法，先進行匹配連接，然后篩選C1課程，最后將學號提取出來。
至于不選C1的，就用差進行取補運算即可。

涉及到“全部”二字，自然要用除。為了控制除的相同屬性與最后結果，我們需要進行投影。

這里從全部變成“至少”。至少兩門的情況下，需要建立臨時關系，再除。

一般的除，只能剩下一列，那我如果結果要多列怎么辦？用除的結果匹配連接一下就好。

第一種方法簡單粗暴，直接先將多對多轉化為一一對應的選修表，然后將其中Cpno=5的選修找出來，再提取這些學生的名字。這里可能會重復，但剛好投影的特性就是去重。
后面兩種方法，運用了很多投影，投影可以將問題簡化，只關注對解決問題有效的列。

插入和刪除比較簡單，插入就并，刪除就差，條件判斷通過查找來實現。
刪除操作中，首先將S和C選擇+投影出來簡化問題，然后匹配，就可以得出一條元組（這里的選擇方式最后只能得出一條元組），然后刪去即可。

這個問題的核心在于同一個系。所以首先用重命名復制一份，只保留Sdept（專業）進行匹配，最后的話就會匹配出所有專業相同學生的組合，包括李勇和他自己。然后將和李勇專業相同的匹配篩選出來，這個時候左半邊就都是李勇，最后取出右半邊的同學。
注意李勇還是會存在，如果不想要，就進行刪去。

這個問題可以簡化，用除法。這里為什么可以放兩個元素在左邊，不會吧問題搞復雜嗎？是因為Sno和Sname是一一對應的，所以無所謂。在同一個系可以理解為這個學生所在的系包含這個系，自然引出除。
這是除的特殊用法，一個學生只能在一個系中，所包含的系也不可能同時有兩種。

典型關系代數語言：ISBL

這是關系代數的簡單抽象，僅僅是將符號編碼成計算機內的符號而已。然后屬性重命名之類的特殊操作也有對應寫法。
這個語言實用性不強，畢竟只是簡單抽象的編程語言。

關系演算

比較抽象，通過謂詞演算來進行操作，至于具體怎么實現，由系統解決。
這可以說是對關系代數的封裝。
所以這個非過程化的，通過關系演算推測背后的實現比較麻煩。

元組關系演算

進行簡單觀察看出，元組運算對列的選取采用下標方式。S（t）表示t是S中的元組，后面加上t[5]=“計算機”的限制條件。

第二個表達式，首先聲明t屬于S，然后聲明u屬于SC，u滿足選修C1課且u和t在學生方面匹配

元組關系演算語言：ALPHA

了解即可。

域關系演算

了解即可，核心在于，謂詞變元的基本對象是域變量。
域關系演算用于非專業用戶，多用于圖形界面的表格直接查詢。

域關系演算語言QBE

關系數據語言

關系數據語言，將關系代數封裝，具體的存取路徑由DBMS優化機制完成。
而且可以嵌入高級語言中使用，畢竟已經變成高級語言了。
我們現在都用SQL（Structured Query Language）語言，兼顧關系代數和關系演算的雙重特性，非過程化·，但是足夠結構化。

關系運算的安全性與等價性

這里的安全指的是，不要產生無限的關系，否則會溢出內存。

關系代數運算是安全的，因為本地關系有限，所以只要經過有限次關系代數運算，產生的結果就是有限。

關系演算不一定安全，需要加以限制，定義一個有限的符號集。

確定安全以后，關系代數，元組關系演算，域關系演算三者是可以互相轉換的，必然有表達式可以用來替代。

SQL語言（核心）

SQL概述

SQL是現在標準的數據庫描述語言。體現出聲明式特征，高度非過程化。
綜合性強：

數據定義。DDL語言特征

數據操縱。DML語言特征

數據控制。DCL語言特征

可以提供兩種使用方式：

交互式SQL。獨立，cmd。

嵌入式SQL。嵌入高級程序中，具備過程性。

SQL數據定義

SCHEMA定義

如果不指定模式名，默認為用戶名。此處體現出用戶和SCHEMA的內在聯系

TABLE定義

域定義相當于typedef。

constraint是標準約束定義。

強制綁定模式可以用模式.表命名，或者在模式創建中定義表。

改表可以增刪改列。但是新增列是空值，所以不能用NOT NULL

建立索引

索引用于自定義存取路徑，加快查詢。
通常用B+樹實現。B+樹就是平衡多路查找樹，用于二分查找。

如果不加UNIQUE意味著可能一個索引對應多個數據，但是不推薦在很多重復上建立，沒意義.

聚集索引強制儲存空間級別的排序。這樣，如果要查詢15-20之間的數，查到15順著物理空間找就好了，用不著反復二分查找，對于范圍查找有奇效。

索引不會被依賴，所以不用cascade之類的聲明

SQL數據操縱——查詢

查詢是數據庫核心技術，本質是對數據操縱對象的選擇，是一切操縱的基礎。

單表查詢

基礎，最花的玩法。
基礎查：

投影：SELECT選擇一些列，可以選擇保留重復值。
列可以是屬性，也可以是計算后的值，表達式，聚集函數。
列還可取別名。

選定數據來源：FROM，這里可以給表取別名。

選擇：WHERE加各種條件。比較，與或非，BETWEEN，IN，LIKE（匹配字符串），是否為NULL，EXIST
選擇的各種條件是查詢的靈魂。

排序：ORDER BY有兩種，ASC（ascending），DESC（descending）

聚集查詢：GROUP BY對結果分組，不分組默認全部為一組。
組內調用聚集函數，聚集函數可以選擇是否保留重復值
算出的組可以用HAVING篩選。注意WHERE作用于元組級別，HAVING作用于組級別。如果同時用，就會先進行WHERE篩選，然后聚集，最后用HAVING篩選

連接查詢

設計兩個以上表的查詢，需要連接：

如果不嵌套，直接連接，那么連接幾張表，FROM后面就需要放幾張表，這代表笛卡爾積。

加上where相當于條件連接。如果再加上AND篩選，相當于連接后再篩選。

如果where是等于，相當于等值連接。

對于特殊的連接，可以將FROM后面的笛卡爾積改成連接聲明：
A NARURAL JOIN B 則產生一個自然連接表
以此類推，INNER JOIN,LEFT OUTER JOIN ,RIGHT OUTER JOIN,FULL OUTER JOIN
只不過涉及到內，左右全連接，就要用ON條件而不是where條件，這個比較奇怪。

嵌套查詢

嵌套查詢可以替代連接查詢。其實連接查詢會產生比較大的中間結果，所以一般不這么搞。
注意子查詢不能用ORDER BY，估計也沒人用，沒意義。

子查詢分兩種：

不相關子查詢。不依賴于父查詢，所以可以一次性查出內層結果，然后外層用內層結果判斷即可。

相關子查詢。子查詢的WHERE要用到父查詢的數據，尤其是在比較的時候，這時就得先進行一個父查詢，然后丟進子查詢查結果，匹配決定父查詢是否合格。依次，逐個將父查詢全部查完就OK。

注意：

子查詢一定要在條件判斷的右邊。

IN類子查詢

含義就是父查詢的某個屬性處于子查詢的范圍內。
其實很多時候都是等于查詢結果，但是IN對這種兼容，等于不也是處于內部嗎。

“信息系統”只在C中，所以要與SC關聯，再和S關聯。關聯也很簡單，就是IN也可以用鏈接一步到位，由此可見，嵌套查詢多是用于多表查詢。可以替代連接操作。

ANY/ALL子查詢

any代表存在，而不是任意，all代表所有，這才是任意。
這個可以和統計查詢相替代。比如查詢比ALL都大，相當于比MAX聚集函數結果大。

EXIST類子查詢

EXIST+select字句可以產生一個布爾值，效率比較高。
相比于IN，他沒那么層次分明，習慣于將判斷一股腦對到select子句中。
而且還可以組合邏輯謂詞，這是難點，但是也可以實現復雜的邏輯。

集合查詢

集合查詢就是將兩個查詢塊通過交并差形成新結果。
但是集合查詢也是可以替代的。

派生表查詢

派生表是針對FROM進行優化。
先把數據來源用SELECT字句修改，然后再這個數據里面再進行篩選。
其實前面的自然連接就是這種修改。

SQL數據操縱——增刪改

SQL視圖

SQL數據控制

嵌入式SQL

查詢優化

安全性控制

完整性控制

故障恢復技術

并發控制

數據庫設計

理論部分

關系數據庫層次重論

前面學的是分成內模式，模式，外模式，但是實際使用中沒有這么簡單。

首先是關系和關系模式，關系指的是數據本身，關系模式指的是數據的結構定義，比如你的屬性列。
關系模式在SQL中用TABLE定義。
基于模式，產生外模式VIEW。

這里會有人問，SCHEMA是什么？SCHEMA將若干個TABLE聚合，相當于命名空間，而SCHEMA一般是和一個數據庫用戶綁定起來。這也是為什么TABLE默認創建在于用戶同名的SCHEMA上。

最終，所有SCHEMA中的所有TABLE構成數據庫。

關系模型的存儲異常

下面的例子缺點很明顯：

數據冗余，本質是信息耦合，可以將一些信息拆出來，這就是后面的模式分解。

插入/刪除異常。有一些數據因為被其他列以及約束影響，不能正常插入和刪除。

更新異常。因為重復太多，難免出現誤差，根本解決辦法就是不重復。

以上四點統稱為數據存儲異常。

根源在于模式設計有問題，沒有反映出本質聯系，這些本質聯系就是數據依賴，所謂的模式優化，就是要發現這些聯系，并且做出分解。

數據依賴：

函數依賴，這是最主要的，從1NF到BCNF

多值依賴，從BCNF到4NF

連接依賴，略過。

函數依賴

定義與類型

顧名思義，就是函數映射，可以多對一，但是不可以一對多。

函數依賴分三種：

平凡與非平凡。平凡就是自己依賴自己，這是固有屬性。

完全函數依賴和部分函數依賴。部分依賴就是有一些屬性是可有可無的，而完全依賴就是缺一不可。

傳遞函數依賴和直接函數依賴。顧名思義，傳遞的依賴，而其中有一種特殊的，叫直接函數依賴，這種就是AB互相依賴，實際上是等價關系，所以相當于沒傳遞，直接依賴。

邏輯蘊涵與閉包

函數依賴集F對應一個關系模式R（U，F）

對于F中的某個依賴FD，其被F邏輯蘊涵。只要FD滿足R，那么就說F邏輯蘊涵FD。

一般給出的F都不全，所以用F的閉包 $F^+$ 表示所有邏輯蘊涵的FD集合。

函數依賴公理——Armstrong公理

三條推理規則：

自反。自身可以確定自身，集合本身就具有不重復性，平凡函數，自己頂自己。

增廣。用Z將原來的函數特殊化，左右同時增加屬性依然成立。XZ推YZ可能是完全依賴XZ也可以推出Y，但是這就是部分依賴了。

傳遞。不區分XY是否單向，所以最后可能是一一對應，也可能是多對一

三條推論：

合成規則。可以將同一條件得出的兩個結論合并。

分解規則。可以將一個結論分解成多個結論。

偽傳遞規則。

屬性閉包

屬性閉包是一個工具，用于導出被蘊含的FD或者判斷依賴是否屬于F。

對于一個依賴X->Y，如果可以用X導出Y，說明這個依賴被F蘊含。否則就不蘊含。

核心就是，給你一些條件屬性，你能通過F導出多少結果。

具體算法如下：

用自己作為初值（自反）之后迭代

每一次迭代，用當前擁有的條件推結果，將結果中新的部分加入條件集

直到不再產生新的結果

這個肯定是有限步，即使每次只得出一個屬性，也只需要做U-X+1次即可。

最小依賴集

當兩個依賴集可以互相完全導出，那么就是等價的。

在所有等價依賴集中，最小的那個就是最小函數依賴集。有趣的是，這個還不是唯一的，如果計算路徑不一樣的話。

怎么算就要從最小依賴集特性入手：

右邊都是單屬性

沒有多余的函數依賴。如果一個函數依賴可以被剩余部分導出，說明多余。

左邊沒有多余屬性。

拆分單屬性。

去掉多余依賴。逐個去掉，用屬性閉包測試是否可以用X推出Y，如果能導出，就多余，注意，如果去掉了，就直接去掉就OK，因為總是等價的，后面可以用新的集合判斷。這也就能解釋為什么最小依賴不唯一，因為你去掉的順序不一樣。
3 縮減部分依賴。看看將某個屬性縮減后，縮減后依賴是否屬于集合。比如將AB變成A或者B，看看能否導出結果，能導出就說明可以縮減，只需要一部分就可以導出結果。

關系模式的規范化——模式分解

關系模式規范化就是將原有模式分解重構成為更加優化的模式。最終目的是要解決數據存儲問題。其理論就是各種關系范式。不斷規范的過程就是關系范式升級的過程。但是實際上不一定要有多高，關鍵在于適合。

規范化就是模式分解的過程，模式分解就是將列拆分，重構成為兩個新關系。最終目的是減少數據冗余以及提高性能。

模式分解有兩個指標：

無損連接分解。分解后的表進行自然連接，結果和原表一樣。

保持函數依賴。判斷標準用函數依賴集等價判斷，但是這個并不一定能保證，實際中有的函數依賴沒意義也不需要保持。有的則需要保持來減輕異常。

先給個定義：非候選鍵部分的屬性叫做非主屬性。

模式有以下幾個等級，逐級加強：

1NF。特征是屬性不可分割。這是基本要求

2NF。特征是候選鍵到非主屬性沒有冗余屬性。做法是將候選鍵到非主屬性的部分函數依賴全部變成完全函數依賴。

3NF。特征是不存在因為傳遞引起的冗余。做法是將傳遞函數依賴都去掉。

BCNF。特征是候選鍵內部一一對應，所有依賴都可以用候選鍵作為起點。做法是將候選鍵內部的部分依賴去掉。BCNF是函數依賴范疇內的最優結果。

4NF。存在多值依賴時候只能用4NF優化。

進一步還可用連接依賴優化，但是沒必要了。

設計流程

數據分析與需求分析——SA方法

這一步最耗時，最困難。在進行前期調差后，對信息進行SA分析，自頂向下，逐層分解。

數據字典是核心結果。

概念模型設計——E-R模型

概念模型通常采用E-R模型。且和具體的DBMS無關。

概念模型通常采用自底向上設計。之后逐步集成。

數據抽象與局部視圖設計

三種常用抽象：

分類。表示一個實體屬于一個實體型。

聚集。表示成分，屬性。復雜的聚集，成分還可以是聚集，但是在N1原則中，這個被破除。

概括。超類型和子類型。

設計的原則如下：

大致思路是，找出實體，以及對應的屬性，然后規定聯系。聯系常常是動作，比如所屬，包含。

視圖集成

合并需要消除沖突：

屬性沖突。屬性類型，范圍，域沖突

命名沖突。屬性名字沖突

結構沖突。關系模型沖突，比如列目不同。

合并還需要消除冗余，可以在這一步完成，后面也可以通過規范化來解決。

驗證全局概念結構

略。

數據模型——邏輯數據庫設計

將概念模型轉化為數據模型的模式，比如關系數據庫對應關系模式。
之后需要進行優化。

轉換

對于關系數據庫，將實體，屬性，聯系都轉換為關系模式。

實體和屬性簡單，難點在于聯系。

1:1聯系和1：n聯系。可以獨立也可以歸并到一端。

m：n聯系和多方聯系。只能單獨成關系，單獨成關系的鍵一般是聯合鍵，比如SC中的（sno，cno）

優化

這一步主要通過規范化實現。

確定數據依賴，得出依賴集F。

消除冗余依賴。進行極小化處理。

確定范式。一般是3NF或者BCNF足夠了。而且有時候2NF反而更好。根據實際情況來。

還可以通過分解方法實現，這是針對實際應用的優化：

水平分解。將一個關系中的一些元組分出去，這個可能對并發好處。

垂直分解。將屬性分開，這個也是看情況。

子模式設計

設計出模式以后，還可以設計外模式。外模式根據用戶需求來。

數據模型——物理數據庫設計

這一步設計內模式。

選擇存取路徑

這個相當于模式——內模式映像。

即如何實現SQL語句。

常用存取方法：

索引。主流的是B+樹索引。

Cluster（聚簇）。

HASH

設計關系，索引等數據庫文件的物理儲存結構

這個涉及到儲存的硬件。用性能來評估。

建立數據庫與測試維護

數據庫投入運行需要逐步測試，

后面維護需要用到重組織，目的是提高系統性能。

重新安排儲存位置。

回收垃圾

減少指針鏈。

可以看到，這些都是和實際的數據打交道，并不會影響到數據模型結構（包括邏輯結構和物理結構）變化。

總結

以上是生活随笔為你收集整理的数据库学习笔记的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【引用】各种软件视频教学
下一篇： 30 岁的超级玛丽怎样改变了游戏行业？

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

数据库

数据库学习笔记

文章導航

ppt下載

數據庫系統概述

數據

數據管理

數據庫

數據模型

數據庫系統結構

DBMS

數據模型

基礎概念

E(ntity)-R(elationship)概念模型（基礎）

基本概念

E-R數據模型

層次數據模型

特征

儲存結構

點評

網狀數據模型

表示方法

點評

關系數據模型（主流）

基本概念

表示方法

數據操縱

點評

面向對象數據模型（發展）

關系數據庫

關系模型的基本概念

基本概念

關系的定義

基礎概念

關系的概念

關系的特殊性

規范化的關系

關系與關系模式

關系數據庫與關系數據庫模式

鍵

鍵定義和超鍵

其他鍵類型

關系的完整性約束

關系代數

關系代數概述

分類：

傳統的集合運算

并差交

笛卡爾積

專門的關系運算

選擇

投影

連接

除法

擴充的關系運算

屬性重命名

外連接

關系代數應用

用于增刪查改

案例解析

典型關系代數語言：ISBL

關系演算

元組關系演算

元組關系演算語言：ALPHA

域關系演算

域關系演算語言QBE

關系數據語言

關系運算的安全性與等價性

SQL語言（核心）

SQL概述

SQL數據定義

SCHEMA定義

TABLE定義

建立索引

SQL數據操縱——查詢

單表查詢

連接查詢

嵌套查詢

IN類子查詢