Azure 上の Polars Deltalake のパフォーマンスが消費者グレードのラップトップとどのように比較されるのか疑問に思ったことはありますか?
いいえ?そうですね。私があなたの好奇心を刺激したのであれば、読み続けてください。
出場者はこちらです
利用可能なアプリ サービス プランの完全なリストについては、「価格」を参照してください。
テストでは 3 つのシナリオが測定されます
コードは REST API エンドポイント経由で実行されます:
HP EliteBook で func start を使用して https://localhost:7071 を起動しました。
Azure I に公開するには、https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
の手順に従いました。
必要な開発環境をセットアップします。これにより、
経由で関数を公開できるようになりました。
func azure functionapp公開 function-hekori-learning-002.
Terraform を使用して、北ヨーロッパ リージョンに Azure リソースをセットアップしました。
これは、https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read にアクセスしたときに実行されるコードを示すコード スニペットです
@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS) def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse: logging.info('Reading from delta table') tic = time.time() df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options ) df = df.sql( "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc" ) toc = time.time() logging.info(f"Elapsed time {toc - tic:.2f} seconds") return func.HttpResponse( "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds", status_code=200 )
ご覧のとおり、HP EliteBook はすべてのシナリオでおよそ 1 桁高速です。
これは私の個人的な解釈です
デルタ テーブルのサイズは 3 つのコミットと 2 つの寄木細工ファイルという小さいことに注意してください。つまり、ランタイムは、コンピューティング ユニットからのファイル アクセスのオーバーヘッドを効果的に測定します。
この記事を読んで、コア外処理のための大規模なデータセットを使用したベンチマーク結果をさらに確認したい場合は、この記事に ?
そして購読しますか?私のチャンネルへ???.
以上がPolars Delta Lake: 小規模データでの Azure 機能とラップトップの比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。