Oracle 实例恢复时 前滚(roll forward) 后滚(roll back) 问题
?
?????? 在ITPUB 論壇上看到一個(gè)有關(guān)實(shí)例恢復(fù)時(shí) 前滾(roll forword)和回滾(roll back)的討論。在這里小整理一下,也理理自己的一個(gè)思路。
?
一. 什么時(shí)候需要實(shí)例恢復(fù)
?????? 在shutdown?normal?or?shutdown?immediate下,也就是所謂的clean?shutdown,checkpoint也會(huì)自動(dòng)觸發(fā),并且把SCN紀(jì)錄寫回。?當(dāng)發(fā)生checkpoint時(shí),會(huì)把SCN寫到四個(gè)地方:
?
三個(gè)地方于control?file內(nèi):
(1)SYSTEM?CHECKPOINT?SCN
(2)Datafile?checkpoint?SCN?
(3)Stop?SCN
?
一個(gè)在datafile?header內(nèi):
Start?SCN
?
1.1 Clean shutdown 時(shí)
?????? 當(dāng)clean?shutdown?時(shí),checkpoint會(huì)進(jìn)行,并且此時(shí)datafile的stop?scn和控制文件里的start?scn會(huì)相同。?等到open數(shù)據(jù)庫時(shí),Oracle檢查datafile?header中的start?scn和存于control?file中的datafile的scn是否相同,?如果相同,接著檢查start?scn和stop?scn是否相同,如果仍然相同,數(shù)據(jù)庫就會(huì)正常開啟,否則就需要recovery。
?????? 等到數(shù)據(jù)庫開啟后,儲(chǔ)存在control?file中的stop?scn就會(huì)恢復(fù)為NULL值,此時(shí)表示datafile是open在正常模式下了。
?
1.2 非正常shutdown
?????? 如果不正常SHUTDOWN?(shutdown?abort),則mount數(shù)據(jù)庫后,會(huì)發(fā)現(xiàn)stop?scn并不是等于其它位置的scn,?而是等于NULL,這表示Oracle在shutdown時(shí)沒有進(jìn)行checkpoint,下次開機(jī)必須進(jìn)行crash?recovery(實(shí)例恢復(fù))。
?
注意一點(diǎn):
?????? (1)啟動(dòng)數(shù)據(jù)庫時(shí),如果發(fā)現(xiàn)STOP?SCN?=?NULL,表示需要進(jìn)行crash?recovery;
?????? (2)啟動(dòng)數(shù)據(jù)庫時(shí),如果發(fā)現(xiàn)有datafile?header的START?SCN?不等于儲(chǔ)存于CONTROLFILE的DATAFILE?SCN,表示需要進(jìn)行Media?recovery
?
1.3 crash?recovery 順序問題
?????? 必須先進(jìn)行roll?forward(從redo?log?file中從目前的start?SCN開始,重做后面的已提交之交易)。 再從roll?back?segment?做rollback未完成(dead?transaction)交易。檢驗(yàn)controlfile中的SCN會(huì)等于datafile?header的SCN
?
關(guān)于這塊內(nèi)容,具體參考:
?????? RedoLog Checkpoint 和 SCN關(guān)系
?????? http://blog.csdn.net/tianlesoftware/archive/2010/01/24/5251916.aspx
?
二. ?Crash Recovery 過程
?????? 當(dāng)數(shù)據(jù)庫突然崩潰,而還沒有來得及將buffer cache里的臟數(shù)據(jù)塊刷新到數(shù)據(jù)文件里,同時(shí)在實(shí)例崩潰時(shí)正在運(yùn)行著的事務(wù)被突然中斷,則事務(wù)為中間狀態(tài),也就是既沒有提交也沒有回滾。這時(shí)數(shù)據(jù)文件里的內(nèi)容不能體現(xiàn)實(shí)例崩潰時(shí)的狀態(tài)。這樣關(guān)閉的數(shù)據(jù)庫是不一致的。
?
?????? 下次啟動(dòng)實(shí)例時(shí),Oracle會(huì)由SMON進(jìn)程自動(dòng)進(jìn)行實(shí)例恢復(fù)。實(shí)例啟動(dòng)時(shí),SMON進(jìn)程會(huì)去檢查控制文件中所記錄的、每個(gè)在線的、可讀寫的數(shù)據(jù)文件的END SCN號(hào)。
?????? 數(shù)據(jù)庫正常運(yùn)行過程中,該END SCN號(hào)始終為NULL,而當(dāng)數(shù)據(jù)庫正常關(guān)閉時(shí),會(huì)進(jìn)行完全檢查點(diǎn),并將檢查點(diǎn)SCN號(hào)更新該字段。
?????? 而崩潰時(shí),Oracle還來不及更新該字段,則該字段仍然為NULL。當(dāng)SMON進(jìn)程發(fā)現(xiàn)該字段為空時(shí),就知道實(shí)例在上次沒有正常關(guān)閉,于是由SMON進(jìn)程就開始進(jìn)行實(shí)例恢復(fù)了。
?
?????? SMON進(jìn)程進(jìn)行實(shí)例恢復(fù)時(shí),會(huì)從控制文件中獲得檢查點(diǎn)位置。于是,SMON進(jìn)程到聯(lián)機(jī)日志文件中,找到該檢查點(diǎn)位置,然后從該檢查點(diǎn)位置開始往下,應(yīng)用所有的重做條目,從而在buffer cache里又恢復(fù)了實(shí)例崩潰那個(gè)時(shí)間點(diǎn)的狀態(tài)。這個(gè)過程叫做前滾,前滾完畢以后,buffer cache里既有崩潰時(shí)已經(jīng)提交還沒有寫入數(shù)據(jù)文件的臟數(shù)據(jù)塊,也還有事務(wù)被突然終止,而導(dǎo)致的既沒有提交又沒有回滾的事務(wù)所弄臟的數(shù)據(jù)塊。
?
?????? 前滾一旦完畢,SMON進(jìn)程立即打開數(shù)據(jù)庫。但是,這時(shí)的數(shù)據(jù)庫中還含有那些中間狀態(tài)的、既沒有提交又沒有回滾的臟塊,這種臟塊是不能存在于數(shù)據(jù)庫中的,因?yàn)樗鼈儾]有被提交,必須被回滾。打開數(shù)據(jù)庫以后,SMON進(jìn)程會(huì)在后臺(tái)進(jìn)行回滾。
?
?????? 有時(shí),數(shù)據(jù)庫打開以后,SMON進(jìn)程還沒來得及回滾這些中間狀態(tài)的數(shù)據(jù)塊時(shí),就有用戶進(jìn)程發(fā)出讀取這些數(shù)據(jù)塊的請求。這時(shí),服務(wù)器進(jìn)程在將這些塊返回給用戶之前,由服務(wù)器進(jìn)程負(fù)責(zé)進(jìn)行回滾,回滾完畢后,將數(shù)據(jù)塊的內(nèi)容返回給用戶。
?
?
三. 為什么數(shù)據(jù)庫的實(shí)例恢復(fù)是先前滾再回滾
?
?????? 回滾段實(shí)際上也是以回滾表空間的形式存在的,既然是表空間,那么肯定就有對應(yīng)的數(shù)據(jù)文件,同時(shí)在buffer cache 中就會(huì)存在映像塊,這一點(diǎn)和其他表空間的數(shù)據(jù)文件相同。
??????
?????? 當(dāng)發(fā)生DML操作時(shí),既要生成REDO(針對DML操作本身的REDO Entry)也要生成UNDO(用于回滾該DML操作,記錄在UNDO表空間中),但是既然UNDO信息也是使用回滾表空間來存放的,那么該DML操作對應(yīng)的UNDO信息(在BUFFER CACHE生成對應(yīng)中的UNDO BLOCK)就會(huì)首先生成其對應(yīng)的REDO信息(UNDO BLOCK's REDO Entry)并寫入Log Buffer中。
?
?????? 這樣做的原因是因?yàn)?/span>Buffer Cache中的有關(guān)UNDO表空間的塊也可能因?yàn)閿?shù)據(jù)庫故障而丟失,為了保障在下一次啟動(dòng)時(shí)能夠順利進(jìn)行回滾,首先就必須使用REDO日志來恢復(fù)UNDO段(實(shí)際上是先回復(fù)Buffer Cache中的臟數(shù)據(jù)塊,然后由Checkpoint寫入UNDO段中),在數(shù)據(jù)庫OPEN以后再使用UNDO信息來進(jìn)行回滾,達(dá)到一致性的目的。
?????? 生成完UNDO BLOCK's REDO Entry后才輪到該DML語句對應(yīng)的REDO Entry,最后再修改Buffer Cache中的Block,該Block同時(shí)變?yōu)榕K數(shù)據(jù)塊。
?
?????? 實(shí)際上,簡單點(diǎn)說REDO的作用就是記錄所有的數(shù)據(jù)庫更改,包括UNDO表空間在內(nèi)。
?
?
?
?
?
整理自網(wǎng)絡(luò)
---------------------------------------------------------------------------------------------------
Blog: http://blog.csdn.net/tianlesoftware
網(wǎng)上資源: http://tianlesoftware.download.csdn.net
相關(guān)視頻:http://blog.csdn.net/tianlesoftware/archive/2009/11/27/4886500.aspx
DBA1 群:62697716(滿); DBA2 群:62697977(滿) DBA3 群:62697850(滿)??
DBA 超級(jí)群:63306533(滿); DBA4 群: 83829929 DBA5群: 142216823
聊天 群:40132017? 聊天2群:69087192
--加群需要在備注說明Oracle表空間和數(shù)據(jù)文件的關(guān)系,否則拒絕申請
轉(zhuǎn)載于:https://www.cnblogs.com/springside-example/archive/2011/03/29/2529768.html
總結(jié)
以上是生活随笔為你收集整理的Oracle 实例恢复时 前滚(roll forward) 后滚(roll back) 问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何使用应用程序库缓存
- 下一篇: 解决fstream不能打开带有中文路径文