Alibaba はなぜサービス検出に ZooKeeper を使用しないのですか?-IT業界-php.cn

未来の交差点に立って、歴史の失われた道を振り返ると興味深いことがよくあります。なぜなら、何かが事前に起こっていたのに、別のことは起こらなかったかのように、私たちはうっかりクレイジーな考えを抱いてしまうからです。。何が起こるか？オーストリア＝ハンガリー帝国の王位継承者であるフェルディナンド大公とその妻が、情熱的なセルビア人青年プリンツィプに射殺されなかったらどうなっていたか、そして邱老道がもし射殺していたらどうなっていたかのように。牛家村を通らなかったのか？

2007 年末、タオバオは「カラフルストーン」と呼ばれる社内再構築プロジェクトを立ち上げました。その後、淘宝網のサービス化、流通の自主研究、インターネットミドルウェアシステムの始まりとなり、同年に淘宝網サービス登録センターConfigServerが誕生しました。

2008 年頃、元インターネット大手の Yahoo は、Google が発表した Chubby と Paxos に関する論文を参照したビッグデータ分散調整製品 ZooKeeper を徐々に公に公開し始めました。

2010 年 11 月、ZooKeeper は Apache Hadoop のサブプロジェクトから Apache のトップレベルプロジェクトに発展し、ZooKeeper が産業グレードの成熟した安定した製品になったことを正式に発表しました。

2011 年、アリババは Dubbo をオープンソース化しました。オープンソースをより良くするために、アリババの内部システムとの関係を切り離す必要がありました。Dubbo は登録センターとしてオープンソースの ZooKeeper をサポートしました。その後、中国でこのような状況下、Dubbo ZooKeeper の典型的なサービス指向ソリューションにより、ZooKeeper は登録センターとして有名になりました。

2015 年のダブル 11、ConfigServer サービスの開始からほぼ 8 年が経過、アリババ社内の「サービス規模」は数百万を超え、「数千マイル離れた」IDC ディザスタリカバリテクノロジーの推進もAlibaba は、ConfigServer 2.0 から ConfigServer 3.0 への内部アーキテクチャのアップグレードを開始しました。

時は 2018 年に向かって進んでいます。10 年の節目に立って、刻々と変化する新しいテクノロジーの概念を追いかける際に、少しペースを落としてサービスディスカバリの分野を詳しく見てみたいと考えている人がどれだけいるでしょうか。人々が考えたことがある質問、または私が考えたことがある質問:

サービス検出、ZooKeeper は本当に最良の選択ですか?

歴史を振り返ると、時々神話もありますが、サービス検出の文脈において、ZooKeeper が HSF 登録センターの ConfigServer よりも早く誕生していたらどうなっていただろうか?

最初に ZooKeeper を使用し、次に Alibaba のサービス指向のシナリオとニーズに適応するために ZooKeeper を必死に変換してパッチを適用するという回り道をするでしょうか?

しかし、今日の人々と先人の肩の上に立つと、サービスディスカバリの分野において、ZooKeeper は単純に最良の選択ではないということを今日ほどしっかりと認識したことはありません。長年私たちと一緒に活動してきた Eureka と同じように、この記事「Eureka! Why You Shouldn't Use ZooKeeper for Service Discovery」では、サービスディスカバリに ZooKeeper を使用すべきではない理由をしっかりと説明しています。

私のやり方は一人ではありません。

登録センターの要件分析と主要な設計上の考慮事項

次に、サービス発見のための需要分析に戻り、主要なシナリオにおけるアリババの実践と組み合わせて、1 つずつ分析し、一緒に議論しましょう。 ZooKeeper が登録センターソリューションとして最適ではない理由。

登録センターは CP システムですか?

読者は CAP 理論と BASE 理論に精通していると思いますが、これらは分散システムと BASE の構築を導く重要な原則の 1 つとなっています。インターネットアプリケーション: ここでは、理論の詳細には触れずに、登録センターのデータ一貫性と可用性要件の分析に直接進みます:

データ一貫性要件分析

登録センターの最も重要な機能は、

service- を使用したクエリ関数Si = F(サービス名)とみなすことができます。 nameをクエリパラメータとして指定します。service-name対応するサービスの利用可能なendpoints (ip:port)が戻り値です。

注: 以下のテキストでは、サービスを svc と省略します。

最初に重要なデータを見てみましょうエンドポイント (ip:ポート)不整合の影響、つまり、CAP の C を満たさない場合の結果:

Alibaba はなぜサービス検出に ZooKeeper を使用しないのですか?

上の図に示すように、svcB が 10 個のノード (レプリカ/レプリカ) をデプロイする場合、同じサービス名 svcB の場合、呼び出し元 svcA の 2 つのノードの 2 つのクエリは一貫性のないデータを返します。例: S1 = {ip1,ip2,ip3...,ip9}、S2 = {ip2,ip3,....ip10} では、この不一致の影響は何でしょうか?

svcB の各ノードのトラフィックが少し不均衡になることに気づいたと思います。

他の 8 ノード {ip2...ip9} と比較すると、ip1 と ip10 のリクエストトラフィックは少し小さいですが、分散システムでは、ピアツーピアが展開されている場合であっても、トラフィックが少ないことは明らかです。サービス、リクエストが到着する時間、ハードウェアステータス、オペレーティングシステムのスケジュール、仮想マシン GC など、どの時点でも、ピアツーピアで展開されたノードのステータスを完全に一貫させることはできず、一貫性がない場合は、登録センターが SLA で約束された時間内にある限り、データが 1 秒以内 (たとえば、1 秒以内) に一貫した状態 (つまり、結果整合性を満たす) に収束すると、トラフィックはすぐに不安定になる傾向があります。したがって、登録センターは結果的に整合性のあるモデルを使用して設計されており、実稼働環境では完全に許容されます。

パーティショントレランスと可用性要件の分析

次に、ネットワークパーティションの場合の登録を見てみましょう。センターが利用できない場合のサービスコールへの影響は、CAP の A が満たされていない場合の影響です。

以下に示すような、典型的な ZooKeeper の 3 マシンルームのディザスタリカバリ 5 ノード展開構造 (つまり、2-2-1 構造) を考えてみましょう。コンピュータールームは 3 ネットワークパーティションが発生すると、コンピュータールーム 3 はネットワーク上のアイランドになります。ZooKeeper サービス全体は利用可能ですが、リーダーに接続できないため、ノード ZK5 は書き込み可能ではないことがわかります。