Heim > Datenbank > MySQL-Tutorial > Zusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung

Zusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung

WBOY
Freigeben: 2022-05-26 21:18:05
nach vorne
1868 Leute haben es durchsucht

Dieser Artikel bringt Ihnen relevantes Wissen über MySQL, das hauptsächlich die Lösungen für die Master-Slave-Verzögerung und die Lese-/Schreib-Trennung vorstellt. Ich hoffe, dass es für alle hilfreich ist.

Zusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung

Empfohlenes Lernen: MySQL-Video-Tutorial

Wir alle wissen, dass Internetdaten eine Eigenschaft haben, die meisten Szenarien sind mehr lesen und weniger schreiben, wie zum Beispiel: Weibo, WeChat, Taobao Business Gemäß dem Twenty-eight-Prinzip kann die Leseverkehrsquote sogar 90 % erreichen读多写少,比如:微博、微信、淘宝电商,按照 二八原则,读流量占比甚至能达到 90%

结合这个特性,我们对底层的数据库架构也会做相应调整。采用 读写分离

处理过程:

  • 客户端会集成 SDK,每次执行 SQL 时,会判断是  或  操作

  • 如果是  SQL,请求会发到 主库

  • 主数据库执行SQL,事务提交后,会生成 binlog ,并同步给 从库

  • 从库 通过 SQL 线程回放 binlog ,并在从库表中生成相应数据

  • 如果是  SQL,请求会通过 负载均衡 策略,挑选一个 从库 处理用户请求

看似非常合理,细想却不是那么回事

主库 与 从库 是采用异步复制数据,如果这两者之间数据还没有同步怎么办?

主库刚写完数据,从库还没来得及拉取最新数据, 请求就来了,给用户的感觉,数据丢了???

针对这个问题,今天,我们就来探讨下有什么解决方案?

一、强制走主库

针对不用的业务诉求,区别性对待

场景一:

如果是对数据的 实时性 要求不是很高,比如:大V有千万粉丝,发布一条微博,粉丝晚几秒钟收到这条信息,并不会有特别大的影响。这时,可以走 从库

场景二:

如果对数据的 实时性 要求非常高,比如金融类业务。我们可以在客户端代码标记下,让查询强制走主库。

二、从库延迟查询

由于主从库之间数据同步需要一定的时间间隔,那么有一种策略是延迟从从库查询数据。

比如:

select sleep(1)
select * from order where order_id=11111;
Nach dem Login kopieren

在正式的业务查询时,先执行一个sleep 语句,给从库预留一定的数据同步缓冲期。

因为是采用一刀切,当面对高并发业务场景时,性能会下降的非常厉害,一般不推荐这个方案。

三、判断主从是否延迟?决定选主库还是从库

方案一:

在从库 执行 命令 show slave status

查看 seconds_behind_master 的值,单位为秒,如果为 0,表示主备库之间无延迟

方案二:

比较主从库的文件点位

还是执行 show slave status,响应结果里有截个关键参数

  • Master_Log_File   读到的主库最新文件

  • Read_Master_Log_Pos 读到的主库最新文件的坐标位置

  • Relay_Master_Log_File 从库执行到的最新文件

  • Exec_Master_Log_Pos 从库执行到的最新文件的坐标位置

两两比较,上面的参数是否相等

方案三:

比较 GTID 集合

  • Auto_Position=1   主从之间使用 GTID 协议

  • Retrieved_Gtid_Set 从库收到的所有binlog日志的 GTID 集合

  • Executed_Gtid_Set 从库已经执行完成的 GTID 集合

比较 Retrieved_Gtid_Set 和 Executed_Gtid_Set

In Kombination mit dieser Funktion werden wir auch entsprechende Anpassungen an der zugrunde liegenden Datenbankarchitektur vornehmen. Verwenden Sie Lese-Schreib-Trennung

Verarbeitungsprozess:

  • Der Client integriert das SDK und jedes Mal, wenn SQL ausgeführt wird, wird es wird als write- oder read-Vorgang beurteilt

  • 🎜Wenn es sich um write SQL handelt, wird die Anfrage an gesendet die Hauptbibliothek🎜
  • 🎜Die Master-Datenbank führt SQL aus. Nachdem die Transaktion übermittelt wurde, wird binlog generiert und mit dem Slave synchronisiert Bibliothek🎜
  • 🎜Slave-Bibliothek spielt binlog über den SQL-Thread ab und generiert entsprechende Daten in der Slave-Bibliothekstabelle🎜
  • 🎜Wenn es sich um read SQL handelt, durchläuft die Anfrage die Load Balancing-Strategie und es wird eine Slave-Bibliothek ausgewählt Behandeln Sie die Benutzeranfrage🎜
🎜Es scheint sehr vernünftig, aber es ist nicht wahr, wenn Sie sorgfältig darüber nachdenken🎜🎜Hauptbibliothek und Slave-Bibliothek verwendet die asynchrone Replikation von Daten. Was ist, wenn die Daten zwischen den beiden noch nicht synchronisiert sind? 🎜🎜Die Hauptbibliothek hat gerade das Schreiben der Daten abgeschlossen, und bevor die Slave-Bibliothek Zeit hat, die neuesten Daten abzurufen, kommt die read-Anfrage, die dem Benutzer das Gefühl gibt, dass die Daten verloren gegangen sind ? ? ? 🎜🎜Als Antwort auf dieses Problem wollen wir heute besprechen, welche Lösungen es gibt? 🎜🎜1. Erzwungene Nutzung der Hauptdatenbank 🎜🎜Behandeln Sie unterschiedliche Geschäftsanforderungen für unterschiedliche Anforderungen. 🎜🎜🎜Szenario 1: 🎜🎜🎜Wenn die Echtzeit-Anforderungen für Daten nicht sehr hoch sind, z : Großes V hat zig Millionen Fans, wenn er eine Weibo-Nachricht postet und seine Fans die Nachricht ein paar Sekunden später erhalten, wird das keine besonders große Wirkung haben. Zu diesem Zeitpunkt können Sie zu aus der Bibliothek wechseln. 🎜🎜🎜Szenario 2: 🎜🎜🎜Wenn die Echtzeit-Anforderungen an Daten sehr hoch sind, beispielsweise bei Finanzdienstleistungen. Wir können erzwingen, dass die Abfrage unter dem Client-Code-Tag an die Hauptdatenbank weitergeleitet wird. 🎜🎜2. Verzögerte Abfrage aus der Slave-Datenbank🎜🎜Da die Datensynchronisierung zwischen Master- und Slave-Datenbanken ein bestimmtes Zeitintervall erfordert, gibt es eine Strategie, um die Abfrage von Daten aus Slave-Datenbanken zu verzögern. 🎜🎜Zum Beispiel: 🎜
select master_pos_wait(file, pos[, timeout]);
Nach dem Login kopieren
Nach dem Login kopieren
🎜Führen Sie bei einer formellen Geschäftsabfrage zunächst eine Schlafanweisung aus, um einen bestimmten Datensynchronisationspufferzeitraum für die Slave-Datenbank zu reservieren. 🎜🎜Da es sich um eine Einheitslösung handelt, wird die Leistung bei Geschäftsszenarien mit hoher Parallelität drastisch sinken. Diese Lösung wird im Allgemeinen nicht empfohlen. 🎜🎜3. Bestimmen Sie, ob Master und Slave verzögert sind? Entscheiden Sie, ob Sie die Master-Bibliothek oder die Slave-Bibliothek wählen möchten🎜🎜🎜Option 1: 🎜🎜🎜Führen Sie den Befehl show Slave Status🎜🎜aus der Slave-Bibliothek aus, um den Wert von seconds_behind_master anzuzeigen. Code>, die Einheit ist Sekunden, wenn es 0 ist, was bedeutet, dass es keine Verzögerung zwischen der Master- und der Slave-Datenbank gibt🎜🎜🎜Option 2: 🎜🎜🎜Vergleichen Sie die Dateipunkte der Master- und Slave-Datenbank🎜🎜Oder führen Sie <code aus>Slave-Status anzeigen, es gibt einen Schlüssel im Antwortergebnis Parameter🎜
  • 🎜Master_Log_File Die zuletzt aus der Hauptbibliothek gelesene Datei🎜
  • 🎜Read_Master_Log_Pos Die Koordinatenposition der Zuletzt aus der Hauptbibliothek gelesene Datei🎜
  • 🎜Relay_Master_Log_File Ausgeführt aus der Bibliothek Die Koordinatenposition der zuletzt abgerufenen Datei🎜
  • 🎜Exec_Master_Log_Pos ausgeführt aus der Bibliothek🎜
  • ul>🎜Vergleichen Sie die beiden Parameter, um zu sehen, ob die oben genannten Parameter gleich sind🎜🎜🎜Option 3:🎜 🎜🎜GTID-Sätze vergleichen🎜
    • 🎜Auto_Position=1 GTID-Protokoll zwischen Master und Slave verwenden🎜
    • 🎜Retrieved_Gtid_Set GTID-Satz aller von der Bibliothek empfangenen Binlog-Protokolle🎜
    • 🎜Executed_Gtid_Set Der GTID-Satz, der von der Bibliothek ausgeführt wurde🎜
    🎜Vergleichen Sie, ob die Werte ​​von Retrieved_Gtid_Set und Executed_Gtid_Set sind gleich🎜🎜Beim Ausführen von Business SQL Stellen Sie während des Betriebs zunächst fest, ob die Slave-Datenbank die neuesten Daten synchronisiert hat. Dies bestimmt, ob die Master-Bibliothek oder die Slave-Bibliothek betrieben werden soll. 🎜🎜🎜Nachteile: 🎜🎜🎜Unabhängig davon, welche der oben genannten Lösungen angewendet wird, kann der Wert der Slave-Bibliothek niemals mit dem Wert der Hauptbibliothek mithalten, wenn in der Hauptbibliothek häufig Schreibvorgänge ausgeführt werden, und der Leseverkehr wird dies tun Rufen Sie immer die Hauptbibliothek auf. 🎜

    针对这个问题,有什么解决方案?

    这个问题跟 MQ消息队列 既要求高吞吐量又要保证顺序是一样的,从全局来看确实无解,但是缩小范围就容易多了,我们可以保证一个分区内的消息有序。

    回到 主从库 之间的数据同步问题,从库查询哪条记录,我们只要保证之前对应的写binglog已经同步完数据即可,可以不用管主从库的所有的事务binlog 是否同步。

    问题是不是一下简单多了

    四、从库节点判断主库位点

    在从库执行下面命令,返回是一个正整数 M,表示从库从参数节点开始执行了多少个事务

select master_pos_wait(file, pos[, timeout]);
Nach dem Login kopieren
Nach dem Login kopieren
  • file 和 pos 表示主库上的文件名和位置

  • timeout 可选, 表示这个函数最多等待 N 秒

缺点:

master_pos_wait 返回结果无法与具体操作的数据行做关联,所以每次接收读请求时,从库还是无法确认是否已经同步数据,方案实用性不高。

五、比较 GTID

执行下面查询命令

  • 阻塞等待,直到从库执行的事务中包含 gtid_set,返回 0

  • 超时,返回 1

select wait_for_executed_gtid_set(gtid_set, 1);
Nach dem Login kopieren

MySQL 5.7.6 版本开始,允许在执行完更新类事务后,把这个事务的 GTID 返回给客户端。具体操作,将参数session_track_gtids 设置为OWN_GTID,调用 API 接口mysql_session_track_get_first 返回结果解析出 GTID 

处理流程:

  • 发起  SQL 操作,在主库成功执行后,返回这个事务的 GTID

  • 发起  SQL 操作时,先在从库执行 select wait_for_executed_gtid_set (gtid_set, 1)

  • 如果返回 0,表示已经从库已经同步了数据,可以在从库执行 查询 操作

  • 否则,在主库执行 查询 操作

缺点:

跟上面的 master_pos_wait 类似,如果 写操作 与 读操作 没有上下文关联,那么 GTID 无法传递 。方案实用性不高。

六、引入缓存中间件

高并发系统,缓存作为性能优化利器,应用广泛。我们可以考虑引入缓存作为缓冲介质

处理过程:

  • 客户端  SQL ,操作主库

  • 同步将缓存中的数据删除

  • 当客户端读数据时,优先从缓存加载

  • 如果 缓存中没有,会强制查询主库预热数据

缺点:

K-V 存储,适用一些简单的查询条件场景。如果复杂的查询,还是要查询从库。

七、数据分片

参考 Redis Cluster 模式, 集群网络拓扑通常是 3主 3从,主节点既负责写,也负责读。

通过水平分片,支持数据的横向扩展。由于每个节点都是独立的服务器,可以提高整体集群的吞吐量。

转换到数据库方面

常见的解决方式,是分库分表,每次读写都是操作主库的一个分表,从库只用来做数据备份。当主库发生故障时,主从切换,保证集群的高可用性。

推荐学习:mysql视频教程

Das obige ist der detaillierte Inhalt vonZusammenfassung der Lösungen für MySQL-Master-Slave-Verzögerung und Lese-/Schreibtrennung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:csdn.net
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage