文章詳情頁

MySQL是如何保證數據的完整性

瀏覽：2日期：2023-10-13 10:54:20

數據的一致性和完整性對于在線業務的重要性不言而喻，如何保證數據不丟呢？今天我們就探討下關于數據的完整性和強一致性，MySQL做了哪些改進。

一. MySQL的二階段提交

在Oracle和MySQL這種關系型數據庫中，講究日志先行策略（Write-Ahead Logging）,只要日志持久化到磁盤，就能保證MySQL異常重啟后，數據不丟失。在MySQL中，提到日志不得不提的就是redo log和binlog。

1. redo log

redo log又稱重做日志文件，詳細的記錄了對每一個數據頁里面的數據行的修改，記錄的是數據修改之后的值。Redo log是用來做數據庫crash recovery的，是保證數據安全的非常重要的功能之一。

redo log的寫入的方式是順序寫、循環寫，通過innodb_log_file_size和innodb_log_files_in_group兩個參數控制redo log的文件大小和個數。redo log在寫入磁盤前會先寫redo log buffer中，大小由innodb_log_buffer_size控制。日志在寫入redo log buffer后是如何持久化到磁盤的呢？為了控制redo log的寫入策略，Innodb根據innodb_flush_log_at_trx_commit參數不同的取值采用不同的策略，它有三種不同的取值：

1. 設置為 0 的時候：事務提交時由MySQL的后臺Master線程每隔1秒將緩存區的文件刷新到日志文件中。 2. 設置為 1 的時候，表示每次事務提交時都將 redo log 直接持久化到磁盤，保證了事務日志不丟失，但會對數據庫性能稍有影響。 3. 設置為 2 的時候，表示每次事務提交時都只是把 redo log 寫到日志文件中，但不會刷盤，由文件系統自行刷磁盤。

三種模式下，0的性能最好，但是不安全，MySQL進程一旦崩潰會導致丟失一秒的數據。1的安全性最高，但是對性能影響最大，2的話主要由操作系統自行控制刷磁盤的時間，如果僅僅是MySQL宕機，對數據不會產生影響，如果是主機異常宕機了，同樣會丟失數據。

2. binlog

binlog又稱二進制日志，記錄了對MySQL數據庫執行更改的所有操作，不包含select和show操作，主要起到了恢復、復制、審計等功能。Binlog的格式主要有statement、row、mixed三種。

Statement：基于操作的SQL語句記錄到binlog中，不建議使用。

Row：基于行的變更情況記錄，會記錄行更改前后的內容，row模式也是數據庫不丟數據的重要保證，推薦使用。

Mixed：混合前兩個模式，不建議使用。

Binlog的寫入邏輯也比較簡單：事務執行過程中，先寫入binlog cache,事務提交時再寫入binlog文件。binlog cache由binlog_cache_size和max_binlog_size參數控制，每個線程分配一個binlog cache,但是共用binlog文件。

Binlog的寫入日志文件的機制由sync_binlog控制：

1. sync_binlog=0 的時候，表示每次提交事務都只 write，不 fsync； 2. sync_binlog=1 的時候，表示每次提交事務都會執行 fsync，將數據刷盤； 3. sync_binlog=N(N>1) 的時候，表示n次事務提交之后，MySQL才進行一次fsync動作，將binlog cache中的數據刷入磁盤。

innodb_flush_log_at_trx_commit和sync_binlog都設置為1是MySQL數據中經典的雙一模式，是數據庫不丟數據的保障。

MySQL數據采取WAL機制就是為了減少每次臟數據刷盤帶來的性能影響，如果設置”雙一”策略會不會影響數據庫的性能呢？其實這主要得益于redo log和binlog都是順序寫，磁盤的順序寫比隨機寫的速度要快的多，加上MySQL內部的組提交機制，已經大幅降低了對磁盤的IOPS消耗了。

3. 兩階段提交

MySQL引入二階段提交（two phase commit or 2pc），MySQL內部會將普通事務當做一個XA事務（內部分布式事務）來處理,會自動為每個事務分配一個唯一的ID（XID），COMMIT會被動的分成Prepare和Commit兩個階段。

第一階段：Transaction Prepare Phase

此時SQL已經成功執行，并生成xid信息及redo和undo的內存日志。然后調用prepare方法完成第一階段，將事務狀態設為TRX_PREPARED，并將redo log刷盤。

第二階段：Commit Phase

如果事務第一階段進入prepare階段，則將產生的binlog寫入文件并刷盤，此時事務已經鐵定要提交了。

具體異常場景分析：

1. 當事務在prepare階段crash，數據庫recovery的時候該事務未寫⼊Binary log并且存儲引擎未提交，則該事務rollback。

2. 當事務在binlog階段crash，此時⽇志還沒有成功寫⼊到磁盤中，啟動時會rollback此事務。3. 當事務在binlog⽇志已經fsync()到磁盤后crash，但是InnoDB沒有來得及commit，此時MySQL數據庫recovery的時候將會讀出⼆進制⽇志的Xid_log_event，然后告訴InnoDB提交這些XID的事務，InnoDB提交完這些事務后會回滾其它的事務，使存儲引擎和⼆進制⽇志始終保持⼀致。

MySQL的二階段提交就保證了數據庫在異常宕機重啟后的數據不丟失。

二. Double Write

前面我們說了，redo log、binlog以及二階段提交保證了數據在MySQL異常重啟后能夠通過前滾和回滾恢復數據。MySQL在recovery時通過redo log進行恢復，redo log記錄的是頁上的物理操作，但是這里有個問題，如果頁本身就是錯的，比如發生頁的部分寫問題(頁大小是 16K，假設在把內存中的臟頁寫到數據庫的時候，寫了4K 突然掉電。也就是前兩 4K 是新的，后 12K 是舊的，那么這個數據頁就是不完整的，是一個壞掉的數據頁), 這時redo恢復的時候會去校驗數據頁的完整性，此時數據頁已經損壞了，故無法使用 redo log 進行恢復，這個數據就丟失了。

Double Write原理:

1、當刷新緩沖池臟頁時，并不直接寫到數據文件中，而是先拷貝至double write buffer。

2、然后從double write buffer分兩次寫入磁盤共享表空間中，每次寫入 1MB。

3、最后再從double write buffer寫入數據文件。雖然數據總是寫入兩次，但是由于double write 寫入的時候是順序寫，實際上也就犧牲了系統性能的 10%左右。

這樣就可以解決上文提到的部分寫失效的問題，因為在磁盤共享表空間中已有數據頁副本拷貝，如果數據庫在頁寫入數據文件的過程中宕機，在實例恢復時，可以從共享表空間中找到該頁副本，將其拷貝覆蓋原有的數據頁，再應用重做日志即可。

3. 小結

今天我們聊了MySQL的二階段提交和double write機制，分別解決了在MySQL宕機重啟以及發生頁的部分寫的場景下，MySQL是如何做到不丟失數據。那如果我們的操作系統宕機無法啟動了，又該怎么辦呢？MySQL在集群架構中又做了哪些優化來保證數據不丟失呢？我們下一章再來和大家分享MySQL在集群架構中的優化改進。

相關文章：

1. 用shell抽取，更新db2的數據2. Mysql入門系列：建立MYSQL客戶機程序的一般過程3. 恢復從 Access 2000、 Access 2002 或 Access 2003 中數據庫刪除表的方法4. Mysql入門系列：MYSQL創建、刪除、索引和更改表5. ACCESS轉SQL數據庫相關的幾個技能6. Microsoft Office Access修改代碼字體大小的方法7. 啟動MYSQL出錯 Manager of pid-file quit without updating file.8. Microsoft Office Access設置默認日期為當前日期的方法9. MySQL中InnoDB和MyISAM類型的差別10. DB2 XML 全文搜索之為文本搜索做準備

排行榜

					
					Mysql入門系列：MYSQL創建、刪除、索引和更改表
Mysql入門系列：建立MYSQL客戶機程序的一般過程
啟動MYSQL出錯 Manager of pid-file quit without updating file.
ACCESS轉SQL數據庫相關的幾個技能
用shell抽取，更新db2的數據
Microsoft Office Access修改代碼字體大小的方法
恢復從 Access 2000、 Access 2002 或 Access 2003 中數據庫刪除表的方法
MySQL存儲過程例子（包含事務、參數、嵌套調用、游標循環等）
Microsoft Office Access設置默認日期為當前日期的方法
Mysql入門系列：MYSQL客戶機程序2—增加錯誤檢查
Mysql入門系列：安排預防性的維護MYSQL數據庫服務器
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

MySQL是如何保證數據的完整性