说说你对binlog、redo log和undo log的理解
這里寫自定義目錄標(biāo)題
- 說說你對(duì)binlog、redo log和undo log的理解
- binlog
- binlog使用場(chǎng)景
- binlog日志格式
- redo log
- 為什么需要redo log
- redo log基本概念
- redo log記錄形式
- redo log與binlog區(qū)別
- undo log
說說你對(duì)binlog、redo log和undo log的理解
你好同學(xué)! 日志是mysql數(shù)據(jù)庫(kù)的重要組成部分,記錄著數(shù)據(jù)庫(kù)運(yùn)行期間各種狀態(tài)信息。mysql日志主要包括錯(cuò)誤日志、查詢?nèi)罩尽⒙樵內(nèi)罩尽⑹聞?wù)日志、二進(jìn)制日志幾大類。作為開發(fā),我們重點(diǎn)需要關(guān)注的是二進(jìn)制日志(binlog)和事務(wù)日志(包括redo log和undo log),本文接下來會(huì)詳細(xì)介紹這三種日志。接下來,我就來對(duì)這三個(gè)log進(jìn)行簡(jiǎn)單的聊聊,至少在面試中,咱們心里有底。
binlog
binlog使用場(chǎng)景
binlog日志格式
redo log
為什么需要redo log
我們都知道,事務(wù)的四大特性里面有一個(gè)是持久性,具體來說就是只要事務(wù)提交成功,那么對(duì)數(shù)據(jù)庫(kù)做的修改就被永久保存下來了,不可能因?yàn)槿魏卧蛟倩氐皆瓉淼臓顟B(tài)。那么mysql是如何保證一致性的呢?最簡(jiǎn)單的做法是在每次事務(wù)提交的時(shí)候,將該事務(wù)涉及修改的數(shù)據(jù)頁(yè)全部刷新到磁盤中。但是這么做會(huì)有嚴(yán)重的性能問題,主要體現(xiàn)在兩個(gè)方面:
因?yàn)镮nnodb是以頁(yè)為單位進(jìn)行磁盤交互的,而一個(gè)事務(wù)很可能只修改一個(gè)數(shù)據(jù)頁(yè)里面的幾個(gè)字節(jié),這個(gè)時(shí)候?qū)⑼暾臄?shù)據(jù)頁(yè)刷到磁盤的話,太浪費(fèi)資源了!
一個(gè)事務(wù)可能涉及修改多個(gè)數(shù)據(jù)頁(yè),并且這些數(shù)據(jù)頁(yè)在物理上并不連續(xù),使用隨機(jī)IO寫入性能太差!
因此mysql設(shè)計(jì)了redo log,具體來說就是只記錄事務(wù)對(duì)數(shù)據(jù)頁(yè)做了哪些修改,這樣就能完美地解決性能問題了(相對(duì)而言文件更小并且是順序IO)。
redo log基本概念
redo log包括兩部分:一個(gè)是內(nèi)存中的日志緩沖(redo log buffer),另一個(gè)是磁盤上的日志文件(redo log file)。mysql每執(zhí)行一條DML語句,先將記錄寫入redo log buffer,后續(xù)某個(gè)時(shí)間點(diǎn)再一次性將多個(gè)操作記錄寫到redo log file。這種先寫日志,再寫磁盤的技術(shù)就是MySQL里經(jīng)常說到的WAL(Write-Ahead Logging) 技術(shù)。
在計(jì)算機(jī)操作系統(tǒng)中,用戶空間(user space)下的緩沖區(qū)數(shù)據(jù)一般情況下是無法直接寫入磁盤的,中間必須經(jīng)過操作系統(tǒng)內(nèi)核空間(kernel space)緩沖區(qū)(OS Buffer)。因此,redo log buffer寫入redo log file實(shí)際上是先寫入OS Buffer,然后再通過系統(tǒng)調(diào)用fsync()將其刷到redo log file中,過程如下:
鏈接: link.、
mysql支持三種將redo log buffer寫入redo log file的時(shí)機(jī),可以通過innodb_flush_log_at_trx_commit參數(shù)配置,各參數(shù)值含義如下:
redo log記錄形式
前面說過,redo log實(shí)際上記錄數(shù)據(jù)頁(yè)的變更,而這種變更記錄是沒必要全部保存,因此redo log實(shí)現(xiàn)上采用了大小固定,循環(huán)寫入的方式,當(dāng)寫到結(jié)尾時(shí),會(huì)回到開頭循環(huán)寫日志。如下圖:
redo log與binlog區(qū)別
由binlog和redo log的區(qū)別可知:binlog日志只用于歸檔,只依靠binlog是沒有crash-safe能力的。但只有redo log也不行,因?yàn)閞edo log是InnoDB特有的,且日志上的記錄落盤后會(huì)被覆蓋掉。因此需要binlog和redo log二者同時(shí)記錄,才能保證當(dāng)數(shù)據(jù)庫(kù)發(fā)生宕機(jī)重啟時(shí),數(shù)據(jù)不會(huì)丟失。
undo log
數(shù)據(jù)庫(kù)事務(wù)四大特性中有一個(gè)是原子性,具體來說就是 原子性是指對(duì)數(shù)據(jù)庫(kù)的一系列操作,要么全部成功,要么全部失敗,不可能出現(xiàn)部分成功的情況。實(shí)際上,原子性底層就是通過undo log實(shí)現(xiàn)的。undo log主要記錄了數(shù)據(jù)的邏輯變化,比如一條INSERT語句,對(duì)應(yīng)一條DELETE的undo log,對(duì)于每個(gè)UPDATE語句,對(duì)應(yīng)一條相反的UPDATE的undo log,這樣在發(fā)生錯(cuò)誤時(shí),就能回滾到事務(wù)之前的數(shù)據(jù)狀態(tài)。同時(shí),undo log也是MVCC(多版本并發(fā)控制)實(shí)現(xiàn)的關(guān)鍵。
一個(gè)簡(jiǎn)單的表格是這么創(chuàng)建的:
總結(jié)
以上是生活随笔為你收集整理的说说你对binlog、redo log和undo log的理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里巴巴开源分布式框架Seata TCC
- 下一篇: 支付宝(即时到账批量退款业务错误码)