数据库范式学习总结
數據庫范式
設計關系數據庫時,遵從不同的規范要求,設計出合理的關系型數據庫,這些不同的規范要求被稱為不同的范式,各種范式呈遞次規范,越高的范式數據庫冗余越小。
目前關系數據庫有六種范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式
(BCNF)、第四范式(4NF)和第五范式(5NF,還又稱完美范式)。
中文名 數據庫標準化
外文名 Database Normalization?
定 ? ?義 減少數據庫中數據冗余的過程
目錄
1 范式簡介
2 各類范式
? 第一范式(1NF)
? 第二范式(2NF)
? 第三范式(3NF)
? 巴斯-科德范式(BCNF)
3 范式應用實例
? 第一范式(1NF)
? 第二范式(2NF)
? 第三范式(3NF)
范式簡介
設計關系數據庫時,遵從不同的規范要求,設計出合理的關系型數據庫,這些不同的規范要求被稱為不同的范式,各種范式呈遞次規范,越高的范式數據庫冗余越小。
目前關系數據庫有六種范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式
(BCNF)、第四范式(4NF)和第五范式(5NF,又稱完美范式)。滿足最低要求的范式是第一范式(1NF
)。在第一范式的基礎上進一步滿足更多規范要求的稱為第二范式(2NF),其余范式以次類推。一般說
來,數據庫只需滿足第三范式(3NF)就行了。
各類范式
第一范式(1NF)所謂第一范式(1NF)是指在關系模型中,對域添加的一個規范要求,所有的域都應該是原子性的,即數
據庫表的每一列都是不可分割的原子數據項,而不能是集合,數組,記錄等非原子數據項。即實體中的
某個屬性有多個值時,必須拆分為不同的屬性。在符合第一范式(1NF)表中的每個域值只能是實體的一
個屬性或一個屬性的一部分。簡而言之,第一范式就是無重復的域。
說明:在任何一個關系數據庫中,第一范式(1NF)是對關系模式的設計基本要求,一般設計中都必須滿
足第一范式(1NF)。不過有些關系模型中突破了1NF的限制,這種稱為非1NF的關系模型。換句話說,是
否必須滿足1NF的最低要求,主要依賴于所使用的關系模型。
在1NF的基礎上,非碼屬性必須完全依賴于候選碼[在1NF基礎上消除非主屬性對主碼的部分函數依賴]
第二范式(2NF)是在第一范式(1NF)的基礎上建立起來的,即滿足第二范式(2NF)必須先滿足第一范
式(1NF)。第二范式(2NF)要求數據庫表中的每個實例或記錄必須可以被唯一地區分。選取一個能區
分每個實體的屬性或屬性組,作為實體的唯一標識。例如在員工表中的身份證號碼即可實現每個一員工
的區分,該身份證號碼即為候選鍵,任何一個候選鍵都可以被選作主鍵。在找不到候選鍵時,可額外增
加屬性以實現區分,如果在員工關系中,沒有對其身份證號進行存儲,而姓名可能會在數據庫運行的某
個時間重復,無法區分出實體時,設計辟如ID等不重復的編號以實現區分,被添加的編號或ID選作主鍵
。(該主鍵的添加是在ER設計時添加,不是建庫時隨意添加)
第二范式(2NF)要求實體的屬性完全依賴于主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部
分的屬性,如果存在,那么這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與
原實體之間是一對多的關系。為實現區分通常需要為表加上一個列,以存儲各個實例的唯一標識。簡而
言之,第二范式就是在第一范式的基礎上屬性完全依賴于主鍵。
第三范式(3NF)
在1NF基礎上,任何非主屬性不依賴于其它非主屬性[在2NF基礎上消除傳遞依賴]
第三范式(3NF)是第二范式(2NF)的一個子集,即滿足第三范式(3NF)必須滿足第二范式(2NF)。
簡而言之,第三范式(3NF)要求一個關系中不包含已在其它關系已包含的非主關鍵字信息。例如,存在
一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那么在員工信息
表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不
存在部門信息表,則根據第三范式(3NF)也應該構建它,否則就會有大量的數據冗余。簡而言之,第三
范式就是屬性不依賴于其它非主屬性,也就是在滿足2NF的基礎上,任何非主屬性不得傳遞依賴于主屬性
。
巴斯-科德范式(BCNF)
Boyce-Codd Normal Form(巴斯-科德范式)
在1NF基礎上,任何非主屬性不能對主鍵子集依賴[在3NF基礎上消除對主碼子集的依賴]
巴斯-科德范式(BCNF)是第三范式(3NF)的一個子集,即滿足巴斯-科德范式(BCNF)必須滿足第三范
式(3NF)。通常情況下,巴斯-科德范式被認為沒有新的設計規范加入,只是對第二范式與第三范式中
設計規范要求更強,因而被認為是修正第三范式,也就是說,它事實上是對第三范式的修正,使數據庫
冗余度更小。這也是BCNF不被稱為第四范式的原因。某些書上,根據范式要求的遞增性將其稱之為第四
范式是不規范,也是更讓人不容易理解的地方。而真正的第四范式,則是在設計規范中添加了對多值及
依賴的要求。
對于BCNF,在主碼的任何一個真子集都不能決定于主屬性。關系中U主碼,若U中的任何一個真子集X都不
能決定于主屬性Y,則該設計規范屬性BCNF。例如:在關系R中,U為主碼,A屬性是主碼中的一個屬性,
若存在A->Y,Y為主屬性,則該關系不屬于BCNF。
一般關系型數據庫設計中,達到BCNF就可以了!
范式應用實例
下面以一個學校的學生系統為例分析說明,這幾個范式的應用。第一范式(1NF)
數據庫表中的字段都是單一屬性的,不可再分。這個單一屬性由基本類型構成,包括整型、實數、字符
型、邏輯型、日期型等。在當前的任何關系數據庫管理系統(DBMS)中,傻瓜也不可能做出不符合第一
范式的數據庫,因為這些DBMS不允許你把數據庫表的一列再分成二列或多列。因此,你想在現有的DBMS
中設計出不符合第一范式的數據庫都是不可能的。
首先我們確定一下要設計的內容包括那些。學號、學生姓名、年齡、性別、課程名稱、課程學分、系別
、學科成績,系辦地址、系辦電話等信息。為了簡單我們暫時只考慮這些字段信息。我們對于這些信息
,所關心的問題有如下幾個方面。
學生有那些基本信息
學生選了那些課,成績是什么?
每個課的學分是多少
學生屬于那個系,系的基本信息是什么。
第二范式(2NF)
首先我們考慮,把所有這些信息放到一個表中(學號,學生姓名、年齡、性別、課程、課程學分、系別
、學科成績,系辦地址、系辦電話)下面存在如下的依賴關系。
(學號, 課程名稱) → (姓名, 年齡, 成績, 學分)
問題分析
因此不滿足第二范式的要求,會產生如下問題
數據冗余:同一門課程由n個學生選修,"學分"就重復n-1次;同一個學生選修了m門課程,姓名和年齡就
重復了m-1次。
更新異常:
1)若調整了某門課程的學分,數據表中所有行的"學分"值都要更新,否則會出現同一門課程學分不同的
情況。
2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由于還沒有"學號"關鍵字,課程名稱和學分也
無法記錄入數據庫。
刪除異常 :假設一批學生已經完成課程的選修,這些選修記錄就應該從數據庫表中刪除。但是,與此同
時,課程名稱和學分信息也被刪除了。很顯然,這也會導致插入異常。
解決方案
把選課關系表SelectCourse改為如下三個表:
學生:Student(學號,姓名,年齡,性別,系別,系辦地址、系辦電話);
課程:Course(課程名稱,學分);
選課關系:SelectCourse(學號,課程名稱,成績)。
第三范式(3NF)
接著看上面的學生表Student(學號,姓名,年齡,性別,系別,系辦地址、系辦電話),關鍵字為單一
關鍵字"學號",因為存在如下決定關系:
(學號)→ (姓名,年齡,性別,系別,系辦地址、系辦電話
但是還存在下面的決定關系
(學號) → (系別)→(系辦地點,系辦電話)
即存在非關鍵字段"系辦地點"、"系辦電話"對關鍵字段"學號"的傳遞函數依賴。
它也會存在數據冗余、更新異常、插入異常和刪除異常的情況。(數據的更新,刪除異常這里就不分析
了,可以參照2.1.1進行分析)
根據第三范式把學生關系表分為如下兩個表就可以滿足第三范式了:
學生:(學號,姓名,年齡,性別,系別);
系別:(系別,系辦地址、系辦電話)。
上面的數據庫表就是符合I,Ⅱ,Ⅲ范式的,消除了數據冗余、更新異常、插入異常和刪除異常。
========
數據庫 三范式最簡單最易記的解釋
數據庫 三范式最簡單最易記的解釋,整理一下方便大家記憶。
..書上講了好多, 歸結起來3句話:?
1NF:字段不可分;?
2NF:有主鍵,非主鍵字段依賴主鍵;?
3NF:非主鍵字段不能相互依賴;?
解釋:?
1NF:原子性 字段不可再分,否則就不是關系數據庫;?
2NF:唯一性 一個表只說明一個事物;?
3NF:每列都與主鍵有直接關系,不存在傳遞依賴;?
不符合第一范式的例子(關系數據庫中create不出這樣的表):?
表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ......?
存在的問題: 因為設計不出這樣的表, 所以沒有問題;?
不符合第二范式的例子:?
表:學號, 姓名, 年齡, 課程名稱, 成績, 學分;?
這個表明顯說明了兩個事務:學生信息, 課程信息;?
存在問題:?
數據冗余,每條記錄都含有相同信息;?
刪除異常:刪除所有學生成績,就把課程信息全刪除了;?
插入異常:學生未選課,無法記錄進數據庫;?
更新異常:調整課程學分,所有行都調整。?
修正:?
學生:Student(學號, 姓名, 年齡);?
課程:Course(課程名稱, 學分);?
選課關系:SelectCourse(學號, 課程名稱, 成績)。?
滿足第2范式只消除了插入異常。?
不符合第三范式的例子:?
學號, 姓名, 年齡, 所在學院, 學院聯系電話,關鍵字為單一關鍵字"學號";?
存在依賴傳遞: (學號) → (所在學院) → (學院地點, 學院電話)?
存在問題:?
數據冗余:有重復值;?
更新異常:有重復的冗余信息,修改時需要同時修改多條記錄,否則會出現數據不一致的情況?
刪除異常?
修正:?
學生:(學號, 姓名, 年齡, 所在學院);?
學院:(學院, 地點, 電話)。?
作者:sunxing007
========
總結
- 上一篇: TCP/IP协议学习笔记
- 下一篇: Linux原始套接字学习总结