SQL 挿入のために複数のデータベース接続を確立することに利点はありますか?

Question

私は大規模なデータ収集に関連するプロジェクトを書いています。現在、.NETFramework4.8 と Mysql パッケージを使用して接続を開始し、データベース サーバーにデータを挿入しています。 1 秒あたり約 400,000 行を挿入します。 SQL 接続がプログラムのボトルネックになるのではないかと心配しています。 SQL を使用してマルチスレッド接続を作成し、コンシューマ キューを使用してデータを挿入すると、速度が速くなり、それだけの価値がありますか (長所と短所)。私の直感では、そのほうが高速になると思いますが、スレッドのオーバーヘッドの観点からどの程度のパフォーマンスが得られるかはわかりません。私は SQL の専門家ではないので、誰かが

P粉373596828 · Answer

噂、意見、伝聞、事実、バージョン関連のベンチマーク、個人的な経験など...

複数のスレッドによりスループットが向上しますが、制限があります:

スループットの上限は理論上の制限の約半分です。 (あなたの「パーセンテージ」) (これはマルチスレッドパッケージに基づくベンチマークです。名前は忘れました。10 年前のことです。)
複数のスレッドは、ミューテックスやその他の必要なロックメカニズムに関して互いに競合します。
5.7 あたりから、MySQL のマルチスレッドの制限は 64 スレッドになり、この値を超えるとスループットが停滞するか、さらには低下します。 (出典: 多くの Oracle ベンチマークは、あるバージョンが以前のバージョンよりも大幅に優れていることを誇っています。) (一方、スレッドごとのレイテンシーは桁外れに大きくなっています。)
可能であれば、各スレッドはデータをバッチで処理する必要があります。

＃＃＃バッチ処理：＃＃＃

は、単一スレッドから一度に多数の行を INSERT する最速の方法です。ただし、ファイルを LOAD に書き込むコストを含めると、一括挿入よりも遅くなる可能性があります。 BULK
が続きます。ただし、特定の制限または「利益逓減」に達すると、行数は「数百」に制限されます。バッチ挿入は、
クエリごとに 1 行を挿入するよりも 10 倍高速です。したがって、これ (または LOAD DATA) は高速取り込みに使用する価値があります。 (出典: 多数の 異なる 時間制限テスト)

一部のデータソースは、一度に 1 行のみを送信する必要があります (例: N 秒ごとに車両からのセンサーデータ)。これには、データをバッチ処理するための中間層が必要です。

データ収集に関するディスカッション:

正規化はディスクの占有領域を縮小するのに役立ちます。バッチで行うのが最適です。

パーティショニング
#パーティションを参照してください。 巨大な「ファクト」テーブルは検索が困難です。取り込むときに概要データを構築することを検討してください: 概要テーブル
上記の処理を行った後、元のデータを破棄することもできます。 1 日あたり 1 テラバイトのデータを取得しているようです。

php 8、私も来ます

ウェブサイトのレイアウトを 30 分で学ぶ

ビデオチュートリアルに精通したOracleの入門

あなたの最初のUNI-APPコード

ゼロからアプリの起動までフラッター

兄弟連新版Linuxビデオチュートリアル

AXURE 9 ビデオチュートリアル (プロダクトマネージャーのインタラクティブな製品設計 UI に適しています)

基礎能力ゼロ PS ビデオチュートリアル

16日間のUIビデオチュートリアル

PS テクニックとスライステクニックのビデオチュートリアル

アリクラウド環境構築およびプロジェクトオンラインビデオチュートリアル

コンピュータネットワークの概要 - プログラマが身につけるべき基礎知識

プログラマーのための基本チュートリアル - HTTP プロトコルの説明

Websocket ビデオチュートリアル