Zusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung-MySQL-Tutorial-php.cn

Dieser Artikel bringt Ihnen relevantes Wissen über MySQL, das hauptsächlich die Lösungen für die Master-Slave-Verzögerung und die Lese-/Schreib-Trennung vorstellt. Ich hoffe, dass es für alle hilfreich ist.

Zusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung

Empfohlenes Lernen: MySQL-Video-Tutorial

Wir alle wissen, dass Internetdaten eine Eigenschaft haben, die meisten Szenarien sind mehr lesen und weniger schreiben, wie zum Beispiel: Weibo, WeChat, Taobao Business Gemäß dem Twenty-eight-Prinzip kann die Leseverkehrsquote sogar 90 % erreichen读多写少，比如：微博、微信、淘宝电商，按照 二八原则，读流量占比甚至能达到 90%

结合这个特性，我们对底层的数据库架构也会做相应调整。采用 读写分离

处理过程：

客户端会集成 SDK，每次执行 SQL 时，会判断是 写 或 读 操作
如果是 写 SQL，请求会发到 主库
主数据库执行SQL，事务提交后，会生成 binlog ，并同步给 从库
从库 通过 SQL 线程回放 binlog ，并在从库表中生成相应数据
如果是 读 SQL，请求会通过 负载均衡 策略，挑选一个 从库 处理用户请求

看似非常合理，细想却不是那么回事

主库 与 从库 是采用异步复制数据，如果这两者之间数据还没有同步怎么办？

主库刚写完数据，从库还没来得及拉取最新数据，读 请求就来了，给用户的感觉，数据丢了？？？

针对这个问题，今天，我们就来探讨下有什么解决方案？

一、强制走主库

针对不用的业务诉求，区别性对待

场景一：

如果是对数据的 实时性 要求不是很高，比如：大V有千万粉丝，发布一条微博，粉丝晚几秒钟收到这条信息，并不会有特别大的影响。这时，可以走 从库。

场景二：

如果对数据的 实时性 要求非常高，比如金融类业务。我们可以在客户端代码标记下，让查询强制走主库。

二、从库延迟查询

由于主从库之间数据同步需要一定的时间间隔，那么有一种策略是延迟从从库查询数据。

比如：

select sleep(1)
select * from order where order_id=11111;

Nach dem Login kopieren

在正式的业务查询时，先执行一个sleep 语句，给从库预留一定的数据同步缓冲期。

因为是采用一刀切，当面对高并发业务场景时，性能会下降的非常厉害，一般不推荐这个方案。

三、判断主从是否延迟？决定选主库还是从库

方案一：

在从库执行命令 show slave status

查看 seconds_behind_master 的值，单位为秒，如果为 0，表示主备库之间无延迟

方案二：

比较主从库的文件点位

还是执行 show slave status，响应结果里有截个关键参数

Master_Log_File 读到的主库最新文件
Read_Master_Log_Pos 读到的主库最新文件的坐标位置
Relay_Master_Log_File 从库执行到的最新文件
Exec_Master_Log_Pos 从库执行到的最新文件的坐标位置

两两比较，上面的参数是否相等

方案三：

比较 GTID 集合

Auto_Position=1 主从之间使用 GTID 协议
Retrieved_Gtid_Set 从库收到的所有binlog日志的 GTID 集合
Executed_Gtid_Set 从库已经执行完成的 GTID 集合

比较 Retrieved_Gtid_Set 和 Executed_Gtid_Set

In Kombination mit dieser Funktion werden wir auch entsprechende Anpassungen an der zugrunde liegenden Datenbankarchitektur vornehmen. Verwenden Sie Lese-Schreib-Trennung

Verarbeitungsprozess:

Der Client integriert das SDK und jedes Mal, wenn SQL ausgeführt wird, wird es wird als write- oder read-Vorgang beurteilt
🎜Wenn es sich um write SQL handelt, wird die Anfrage an gesendet die Hauptbibliothek🎜
🎜Die Master-Datenbank führt SQL aus. Nachdem die Transaktion übermittelt wurde, wird binlog generiert und mit dem Slave synchronisiert Bibliothek🎜
🎜Slave-Bibliothek spielt binlog über den SQL-Thread ab und generiert entsprechende Daten in der Slave-Bibliothekstabelle🎜
🎜Wenn es sich um read SQL handelt, durchläuft die Anfrage die Load Balancing-Strategie und es wird eine Slave-Bibliothek ausgewählt Behandeln Sie die Benutzeranfrage🎜

🎜Es scheint sehr vernünftig, aber es ist nicht wahr, wenn Sie sorgfältig darüber nachdenken🎜🎜Hauptbibliothek und Slave-Bibliothek verwendet die asynchrone Replikation von Daten. Was ist, wenn die Daten zwischen den beiden noch nicht synchronisiert sind? 🎜🎜Die Hauptbibliothek hat gerade das Schreiben der Daten abgeschlossen, und bevor die Slave-Bibliothek Zeit hat, die neuesten Daten abzurufen, kommt die read-Anfrage, die dem Benutzer das Gefühl gibt, dass die Daten verloren gegangen sind ? ? ? 🎜🎜Als Antwort auf dieses Problem wollen wir heute besprechen, welche Lösungen es gibt? 🎜🎜1. Erzwungene Nutzung der Hauptdatenbank 🎜🎜Behandeln Sie unterschiedliche Geschäftsanforderungen für unterschiedliche Anforderungen. 🎜🎜🎜Szenario 1: 🎜🎜🎜Wenn die Echtzeit-Anforderungen für Daten nicht sehr hoch sind, z : Großes V hat zig Millionen Fans, wenn er eine Weibo-Nachricht postet und seine Fans die Nachricht ein paar Sekunden später erhalten, wird das keine besonders große Wirkung haben. Zu diesem Zeitpunkt können Sie zu aus der Bibliothek wechseln. 🎜🎜🎜Szenario 2: 🎜🎜🎜Wenn die Echtzeit-Anforderungen an Daten sehr hoch sind, beispielsweise bei Finanzdienstleistungen. Wir können erzwingen, dass die Abfrage unter dem Client-Code-Tag an die Hauptdatenbank weitergeleitet wird. 🎜🎜2. Verzögerte Abfrage aus der Slave-Datenbank🎜🎜Da die Datensynchronisierung zwischen Master- und Slave-Datenbanken ein bestimmtes Zeitintervall erfordert, gibt es eine Strategie, um die Abfrage von Daten aus Slave-Datenbanken zu verzögern. 🎜🎜Zum Beispiel: 🎜

select master_pos_wait(file, pos[, timeout]);

Nach dem Login kopieren

🎜Führen Sie bei einer formellen Geschäftsabfrage zunächst eine Schlafanweisung aus, um einen bestimmten Datensynchronisationspufferzeitraum für die Slave-Datenbank zu reservieren. 🎜🎜Da es sich um eine Einheitslösung handelt, wird die Leistung bei Geschäftsszenarien mit hoher Parallelität drastisch sinken. Diese Lösung wird im Allgemeinen nicht empfohlen. 🎜🎜3. Bestimmen Sie, ob Master und Slave verzögert sind? Entscheiden Sie, ob Sie die Master-Bibliothek oder die Slave-Bibliothek wählen möchten🎜🎜🎜Option 1: 🎜🎜🎜Führen Sie den Befehl show Slave Status🎜🎜aus der Slave-Bibliothek aus, um den Wert von

seconds_behind_master anzuzeigen. Code>, die Einheit ist Sekunden, wenn es 0 ist, was bedeutet, dass es keine Verzögerung zwischen der Master- und der Slave-Datenbank gibt🎜🎜🎜Option 2: 🎜🎜🎜Vergleichen Sie die Dateipunkte der Master- und Slave-Datenbank🎜🎜Oder führen Sie <code aus>Slave-Status anzeigen

, es gibt einen Schlüssel im Antwortergebnis Parameter🎜

🎜Master_Log_File Die zuletzt aus der Hauptbibliothek gelesene Datei🎜
🎜Read_Master_Log_Pos Die Koordinatenposition der Zuletzt aus der Hauptbibliothek gelesene Datei🎜
🎜Relay_Master_Log_File Ausgeführt aus der Bibliothek Die Koordinatenposition der zuletzt abgerufenen Datei🎜
🎜Exec_Master_Log_Pos ausgeführt aus der Bibliothek🎜

🎜Auto_Position=1 GTID-Protokoll zwischen Master und Slave verwenden🎜
🎜Retrieved_Gtid_Set GTID-Satz aller von der Bibliothek empfangenen Binlog-Protokolle🎜

Retrieved_Gtid_Set

Executed_Gtid_Set

针对这个问题，有什么解决方案？

这个问题跟 MQ消息队列既要求高吞吐量又要保证顺序是一样的，从全局来看确实无解，但是缩小范围就容易多了，我们可以保证一个分区内的消息有序。

回到 主从库 之间的数据同步问题，从库查询哪条记录，我们只要保证之前对应的写binglog已经同步完数据即可，可以不用管主从库的所有的事务binlog 是否同步。

问题是不是一下简单多了

四、从库节点判断主库位点

在从库执行下面命令，返回是一个正整数 M，表示从库从参数节点开始执行了多少个事务

select master_pos_wait(file, pos[, timeout]);

Nach dem Login kopieren

file 和 pos 表示主库上的文件名和位置
timeout 可选，表示这个函数最多等待 N 秒

缺点：

master_pos_wait 返回结果无法与具体操作的数据行做关联，所以每次接收读请求时，从库还是无法确认是否已经同步数据，方案实用性不高。

五、比较 GTID

执行下面查询命令

阻塞等待，直到从库执行的事务中包含 gtid_set，返回 0
超时，返回 1

select wait_for_executed_gtid_set(gtid_set, 1);

Nach dem Login kopieren

MySQL 5.7.6 版本开始，允许在执行完更新类事务后，把这个事务的 GTID 返回给客户端。具体操作，将参数session_track_gtids 设置为OWN_GTID，调用 API 接口mysql_session_track_get_first 返回结果解析出 GTID

处理流程：

发起 写 SQL 操作，在主库成功执行后，返回这个事务的 GTID
发起 读 SQL 操作时，先在从库执行 select wait_for_executed_gtid_set (gtid_set, 1)
如果返回 0，表示已经从库已经同步了数据，可以在从库执行 查询 操作
否则，在主库执行 查询 操作

缺点：

跟上面的 master_pos_wait 类似，如果 写操作 与 读操作 没有上下文关联，那么 GTID 无法传递。方案实用性不高。

六、引入缓存中间件

高并发系统，缓存作为性能优化利器，应用广泛。我们可以考虑引入缓存作为缓冲介质

处理过程：

客户端 写 SQL ，操作主库
同步将缓存中的数据删除
当客户端读数据时，优先从缓存加载
如果缓存中没有，会强制查询主库预热数据

缺点：

K-V 存储，适用一些简单的查询条件场景。如果复杂的查询，还是要查询从库。

七、数据分片

参考 Redis Cluster 模式，集群网络拓扑通常是 3主 3从，主节点既负责写，也负责读。

通过水平分片，支持数据的横向扩展。由于每个节点都是独立的服务器，可以提高整体集群的吞吐量。

转换到数据库方面

常见的解决方式，是分库分表，每次读写都是操作主库的一个分表，从库只用来做数据备份。当主库发生故障时，主从切换，保证集群的高可用性。

推荐学习：mysql视频教程

Das obige ist der detaillierte Inhalt vonZusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!