昨天突然有個客戶說誤操作,自己刪除了大量數據,CTO直接將我拉到一個討論組裡,說要幫他們恢復數據。他們自己挖的坑,打算讓開發那邊根據業務日誌去恢復,被告知只記錄的刪除主鍵這樣的信息,物理刪除,無能為力。
上伺服器看了下記錄的日誌,發現好幾台上面都有被誤刪的記錄輸出。阿里RDS雖然可以複製一個恢復到刪除時間點前的實例,但這散落的幾萬個id找起來費力,還有就是幾個表之間關聯的資料也要恢復,覺得麻煩。
想到 MySQL 的閃回方案。以前看過好幾篇相關文章,甚至差點自己用python擼一個來解析binlog,反轉得到回滾sql,實在沒空,這下要急用了。趕緊找了下網路「現成的方案」。
正文開始
MySQL(含阿里RDS)快速閃回可以說是對資料庫誤操作的後悔藥,flashback功能可以將資料庫回到誤操作之前。但是即使oracle資料庫也只支援短時間內的閃回。
網路上現有開源的MySQL閃回實現,原理都是解析binlog,生成反向sql: (必須為row模式)
對於delete 操作,生成insert (DELETE_ROWS_EVENT)
對於update 操作,交換binlog裡面值的順序(UPDATE_ROWS_EVENT)
#對於insert 操作,反向產生delete ( WRITE_ROWS_EVENT)
對於多個event,要逆向產生sql
上面兩種實作方式,都是透過python-mysql-replication 套件,模擬出原庫的一個從庫,然後show binary logs
來取得binlog,發起同步binlog的請求,再解析EVENT。但阿里雲 RDS 的binlog在同步給從函式庫之後, 很快就被 purge 掉了 。如果要恢復 昨天 的 部分資料 ,兩個方案都是拿不到binlog的。也就是閃回的時間有限。
還有一些比較簡單的實現,就是解析 binlog 物理文件,實現回滾,如 binlog-rollback.pl
,試過,但是速度太慢。
為了不影響速度,又想使用比較成熟的閃回方案,我們可以這樣做:
借助一個自建的mysqld 實例,將已purge掉的binlog拷貝到該實例的目錄下
在自建實例裡,提前創建好需要恢復的表(結構),因為工具需要連接上來從information_schema.columns
取得元資料資訊
拷貝的時候,可以替換掉mysql實例自己的binlog檔名,保持連續
mysql-bin.index,確保檔名還能被mysqld辨識到
show binary logs 看一下是否在清單裡面
總之就是藉助另外一個mysql,把binlog event傳輸過來。溫馨提示:
python mysqlbinlog_back.py --host="localhost" --username="ecuser" --password="ecuser" --port=3306 \ --schema=dbname --tables="t_xx1,t_xx2,t_xx3" -S "mysql-bin.000019" -E "2017-03-02 13:00:00" -N "2017-03-02 14:09:00" -I -U ===log will also write to .//mysqlbinlog_flashback.log=== parameter={'start_binlog_file': 'mysql-bin.000019', 'stream': None, 'keep_data': True, 'file': {'data_create': None, 'flashback': None, 'data': None}, 'add_schema_name': False, 'start_time': None, 'keep_current_data': False, 'start_to_timestamp': 1488430800, 'mysql_setting': {'passwd': 'ecuser', 'host': 'localhost', 'charset': 'utf8', 'port': 3306, 'user': 'ecuser'}, 'table_name': 't_xx1,t_xx2,t_xx3', 'skip_delete': False, 'schema': 'dbname', 'stat': {'flash_sql': {}}, 'table_name_array': ['t_xx1', 't_xx2', 't_xx3'], 'one_binlog_file': False, 'output_file_path': './log', 'start_position': 4, 'skip_update': True, 'dump_event': False, 'end_to_timestamp': 1488434940, 'skip_insert': True, 'schema_array': ['dbname'] } scan 10000 events ....from binlogfile=mysql-bin.000019,timestamp=2017-03-02T11:42:14 scan 20000 events ....from binlogfile=mysql-bin.000019,timestamp=2017-03-02T11:42:29 ...
binlog為ROW格式,dml影響的每一行都會記錄兩個event:Table_map和Row_log。而table_map裡面的table_id並不會影響它在哪個實例上應用,這個id可以認為是邏輯上,記錄表結構版本的機制- 當它在table_definition_cache 沒有找到表定義時,id自增1,分配給要記錄到binlog的表。
mysqlbinlog_back.py 使用經驗 :
以上是MySQL根據離線binlog快速「閃回」的詳情介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!