tea-tasting: A/B テストの統計分析用の Python パッケージ-Python チュートリアル-php.cn

tea-tasting: a Python package for the statistical analysis of A/B tests

イントロ

私は、A/B テストの統計分析用の Python パッケージ、tea-tastingを開発しました:

スチューデントの t 検定、ブートストラップ、CUPED による分散削減、検出力分析、その他のすぐに使える統計手法とアプローチ。
BigQuery、ClickHouse、PostgreSQL/GreenPlum、Snowflake、Spark、Pandas、および Ibis がサポートする 20 以上のバックエンドなど、幅広いデータバックエンドをサポートします。
拡張可能な API: カスタム指標を定義し、選択した統計テストを使用します。
手作業を減らすための便利なAPIと、エラーを最小限に抑えるためのフレームワーク。

このブログ投稿では、実験の分析に

ティーテイスティングを使用することのそれぞれの利点を探ります。

試してみたい場合は、ドキュメントを確認してください。

統計的手法

ティーテイスティングには、実験の分析で必要となる可能性のあるもののほとんどをカバーする統計的手法とテクニックが含まれています。

スチューデントの t 検定と Z 検定を使用してメトリクスの平均と比率を分析します。または、ブートストラップを使用して、選択した他の統計を分析します。また、Bootstrap を使用して分位数を分析するための事前定義されたメソッドもあります。

tea-tastingは、A/B テストのさまざまなバリエーションのサンプル比の不一致も検出します。

tea-tastingは、平均値の比率の分析にデルタ法を適用します。たとえば、セッションがランダム化単位ではないと仮定した場合の、平均セッション数ごとの平均注文数です。

実験前のデータ、メトリクス予測、またはその他の共変量を使用して分散を減らし、実験の感度を高めます。このアプローチは、CUPED または CUPAC とも呼ばれます。

Student の t 検定と Z 検定における

パーセントの変化の信頼区間の計算は難しい場合があります。絶対変化の信頼区間を取得し、それを制御平均で割るだけでは、偏った結果が生成されます。ティーテイスティングはデルタ法を適用して正しい間隔を計算します。

Student の t 検定と Z 検定の統計的検出力を分析します。考えられるオプションは 3 つあります:

詳細については、詳細なユーザーガイドをご覧ください。

ロードマップには以下が含まれます:

選択した統計テストを使用してカスタム指標を定義できます。

データバックエンド

実験データを保存および処理するためのさまざまなデータベースとエンジンが多数あります。また、ほとんどの場合、詳細な実験データを Python 環境に取り込むのは効率的ではありません。スチューデントの t テストや Z テストなどの多くの統計テストでは、分析のために集計されたデータのみが必要です。

たとえば、生の実験データが ClickHouse に保存されている場合、Python 環境で詳細なデータを取得して集計を実行するよりも、ClickHouse で直接個数、平均、分散、および共分散を計算する方が高速かつ効率的です。

必要なすべての統計を手動でクエリすることは、困難でエラーが発生しやすい作業になる可能性があります。たとえば、CUPED を使用した比率メトリクスの分析と分散削減には、行数と分散だけでなく、共分散も必要です。でも心配しないでください。

お茶の試飲がこれらすべての作業を行ってくれます。

tea-tastingは、データを Pandas DataFrame または Ibis Table として受け入れます。 Ibis は、さまざまなデータバックエンドへの DataFrame API として機能する Python パッケージです。 BigQuery、ClickHouse、PostgreSQL/GreenPlum、Snowflake、Spark を含む 20 以上のバックエンドをサポートします。 SQL クエリを作成し、Ibis テーブルとしてラップして、tea-tastingに渡すことができます。紅茶の試飲

では次のことを前提としていることに留意してください: