突然停電了,我的數(shù)據(jù)還沒(méi)保存到數(shù)據(jù)庫(kù)……
最近看到全國(guó)各地都在“拉閘限電”,嚇的我趕緊登上后臺(tái)服務(wù)器,看了看MySQL數(shù)據(jù)庫(kù)是否有問(wèn)題,還好一切如常,也沒(méi)聽(tīng)說(shuō)北京有停電通知,好歹松了一口氣。
忽然想到一個(gè)問(wèn)題,萬(wàn)一數(shù)據(jù)庫(kù)正在執(zhí)行寫入操作,突然斷電了,會(huì)是怎么樣的呢?
從MySQL V5.5開(kāi)始,InnoDB成為了默認(rèn)的存儲(chǔ)引擎。InnoDB中將頁(yè)作為磁盤管理的最小單位,數(shù)據(jù)校驗(yàn)和數(shù)據(jù)寫入到磁盤都是以頁(yè)為單位操作的,通常情況下默認(rèn)每個(gè)頁(yè)的大小為16KB。但由于文件系統(tǒng)對(duì)數(shù)據(jù)頁(yè)(16KB)的寫入多數(shù)情況下都不是原子操作,意味著當(dāng)服務(wù)器斷電時(shí)可能只寫了部分?jǐn)?shù)據(jù)。
一個(gè)數(shù)據(jù)頁(yè)的大小是16K,假設(shè)在把內(nèi)存中的臟頁(yè)(頁(yè)中有記錄被更新過(guò))寫到磁盤時(shí),寫了2K突然掉電,則前2K數(shù)據(jù)是新的,后14K是舊的,那么磁盤中的這個(gè)數(shù)據(jù)頁(yè)就是不完整的,是一個(gè)壞掉的數(shù)據(jù)頁(yè)。
可能有經(jīng)驗(yàn)的DBA會(huì)想到,如果發(fā)生寫失效,可以利用redo log進(jìn)行恢復(fù)。
這也許能夠解決部分問(wèn)題,但redo log中記錄的是對(duì)頁(yè)的物理操作,redo log只能加上舊的、校檢完整的數(shù)據(jù)頁(yè)恢復(fù)一個(gè)臟塊,不能修復(fù)壞掉的數(shù)據(jù)頁(yè)。如果數(shù)據(jù)頁(yè)本身已經(jīng)發(fā)生了損壞,再對(duì)其進(jìn)行重做是沒(méi)有意義的。
那么就沒(méi)有其它辦法了嗎?當(dāng)然不是!這個(gè)時(shí)候double write就閃亮登場(chǎng)了。
開(kāi)啟了Double write(兩次寫/雙寫)后,在將內(nèi)存中的臟頁(yè)寫入到磁盤之前,會(huì)先保存該頁(yè)的副本,當(dāng)磁盤中的數(shù)據(jù)頁(yè)壞掉時(shí),可以利用副本來(lái)還原該頁(yè),再執(zhí)行重做,這就完美的解決了redo log無(wú)法修復(fù)壞頁(yè)的問(wèn)題啦。
Double write由兩部分組成,一部分是內(nèi)存中的double write緩存,共有128個(gè)頁(yè)(2MB);另一部分是磁盤上共享表空間中連續(xù)的128個(gè)頁(yè)(2MB)。
下面我們來(lái)看一下將數(shù)據(jù)頁(yè)寫入磁盤的過(guò)程:
1 拷貝:當(dāng)一系列機(jī)制觸發(fā)數(shù)據(jù)頁(yè)緩沖池中的臟頁(yè)(圖中黃色塊)刷新時(shí),并不直接寫入磁盤數(shù)據(jù)文件中,而是先拷貝到內(nèi)存中的double write緩存中;
2 順序?qū)懀?/span>接著將double write緩存區(qū)中的數(shù)據(jù)分兩次順序?qū)懭氲酱疟P的共享表空間中,每次寫入1MB。共享表空間中的double write頁(yè)是連續(xù)存儲(chǔ)的,采用順序?qū)懙姆绞侥軌蚝苎杆俚耐瓿蓪懟夭僮?,開(kāi)銷較小。
3 離散寫:將double write緩存區(qū)中的臟頁(yè)數(shù)據(jù)寫入到實(shí)際的各個(gè)表空間文件。當(dāng)臟頁(yè)里的數(shù)據(jù)完全寫回磁盤后,即可將double write中的頁(yè)標(biāo)記為可覆蓋。
如果在將臟頁(yè)刷新回磁盤的過(guò)程中發(fā)生崩潰,在恢復(fù)時(shí),InnoDB存儲(chǔ)引擎可以從共享表空間中的double write中找到該頁(yè)的最近的一個(gè)副本,將其復(fù)制到表空間文件,再利用redo log進(jìn)行重做,就完成了恢復(fù)過(guò)程。
因存在副本,媽媽再也不用擔(dān)心我的電腦突然斷電了!
有人可能會(huì)問(wèn),在寫redo log的時(shí)候是否需要double write支持呢?
答案是不需要的,因?yàn)閞edo log在往磁盤中記錄信息的時(shí)候是以512字節(jié)為單位進(jìn)行寫入的,而磁盤IO的最小單位恰巧也是512字節(jié),那么就無(wú)所謂數(shù)據(jù)損壞啦。
有人可能會(huì)覺(jué)得開(kāi)啟double write會(huì)帶來(lái)性能的損耗,其實(shí)呢,內(nèi)存中的double write緩存對(duì)應(yīng)的磁盤共享表空間的文件是連續(xù)存儲(chǔ)的,寫入時(shí)是順序?qū)?。順序?qū)懙男阅芊浅8?,稍微犧牲一點(diǎn)性能來(lái)保證數(shù)據(jù)頁(yè)的完整是非常有必要的!
- 上一篇: 移動(dòng)互聯(lián)網(wǎng)進(jìn)軍營(yíng)的趨勢(shì)分析 2021/1/6
- 下一篇:同濟(jì)大學(xué)照明改造2期工程完工,來(lái)欣賞一波美圖 2021/1/5