統計分析ツールキットの構築:PHPの平均、中央値、標準偏差
平均を計算します:array_sum()を使用して要素の数で除算して平均を取得します。 2。中央値を計算します:並べ替え後、中間値を取得し、要素さえあるときに2つの中間数の平均を取得します。 3。標準偏差を計算します。最初に平均を見つけてから、各値と平均の平方差の平均(サンプルはn-1)を計算し、最後に平方根を取得します。これら3つの機能をカプセル化することにより、中小規模のデータの分析に適した基本的な統計ツールクラスを構築し、空の配列と非数値入力の処理に注意を払い、外部ライブラリに依存することなくデータのコア統計的特徴を実現できます。
ユーザー分析、調査結果、または財務上の数字であっても、PHPでデータを操作する場合、数字の分布を要約して理解する必要があることがよくあります。 PHPにはすべての統計的測定のための組み込み関数は含まれていませんが、平均、中央値、標準設計のためのシンプルなツールキットを作成することは簡単で非常に有用です。

PHPにこれら3つのコア統計関数を実装する方法は次のとおりです。
1。平均の計算(平均)
平均は、すべての値の合計を値の数で割ったものです。それは中心的な傾向の最も一般的な尺度です。

関数計算($ data){ if(empty($ data)){ 0を返します。 //または例外をスローします } return array_sum($ data) / count($ data); }
例:
$ scores = [85、90、78、92、88]; Echo Calculatemean($ scores); //出力:86.6
注:この関数は、入力が数値配列であると想定しています。汚れたデータを処理する場合は
is_numeric()
でタイプチェックまたはフィルタリングを追加することができます。
2。中央値を見つける
中央値は、データがソートされたときの中央値です。偶数の観測値がある場合、それは2つの中間値の平均です。
関数calculatemedian($ data){ if(empty($ data)){ 0を返します。 } sort($ data); $ count = count($ data); $ middle =(int)($ count / 2); if($ count%2){ //奇数カウント:中間値を返します $ data [$ middle]を返します。 } それ以外 { //偶数カウント:2つの中間値の平均を返します return($ data [$ middle -1] $ data [$ middle]) / 2; } }
例:
$ values = [3、1、4、1、5、9、2]; エコーcalculatemedian($ values); //出力:3
なぜそれが重要なのか:中央値は平均よりも外れ値の影響を受けないため、歪んだデータの方が良くなります。
3。コンピューティング標準偏差
標準的な決定は、平均からの数字の広がりがどのように広がるかを測定します。低いSDは、値が平均に近いことを意味します。高いSDは、それらが広がることを意味します。
サンプル標準偏差(分母でn-1
を使用)を実装します。これは、データのサブセットを分析するときに一般的に使用されます。
関数calculateStandardDeviation($ data){ $ count = count($ data); if($ count <2){ 0を返します。 // SDは2つ未満の値で意味がありません } $ mean = calculatemean($ data); $ squareddifferences = array_map(function($ value)use($ veam){ return($ value -$ mean)** 2; }、$ data); $ variance = array_sum($ squareddifferences) /($ count -1); //サンプルの分散 return sqrt($ variance); }
例:
$ dataset = [2、4、4、4、5、5、7、9]; echo calculateStandardDeviation($ dataset); //出力:〜2.14
ヒント:完全なデータ(母集団全体)で作業している場合は、人口標準偏差(
/ $count
/ ($count - 1)
)を使用します。
すべてをまとめる:シンプルなツールキット
これらをヘルパークラスまたはユーティリティファイルにグループ化できます。
クラスStatisticStoolkit { public static関数は($ data){ empty($ data)を返しますか? 0:array_sum($ data) / count($ data); } public static関数の中央値($ data){ if(empty($ data))return 0; sort($ data); $ count = count($ data); $ mid =(int)($ count / 2); return($ count%2)? $ data [$ mid] :( $ data [$ mid -1] $ data [$ mid]) / 2; } public static function stdev($ data){ $ n = count($ data); if($ n <2)0を返します。 $ mean = self :: mean($ data); $ variance = array_sum(array_map(fn($ x)=>($ x -$ mean)** 2、$ data)) /($ n -1); return sqrt($ variance); } }
使用法:
$ data = [10、12、23、23、16、23、21、16]; エコー「平均:」。 StatisticStoolkit ::平均($ data)。 "\ n"; エコー「中央値:」。 StatisticStoolkit :: Media($ data)。 "\ n"; エコー「標準偏差:」。 round(StatisticStoolkit :: stdev($ data)、2)。 "\ n";
出力:
平均:18 メディア:18.5 標準偏差:5.26
最終メモ
- これらの関数は、小規模から中程度のデータセットでうまく機能します。
- 大規模または複雑な統計分析については、外部ツール(Python with Pandasなど)の使用とAPIを介して統合することを検討してください。
- 常に入力データを検証およびクリーニングします。数値を保証し、空の配列のようなエッジケースを処理します。
PHPで独自の統計ツールキットを構築すると、基本的なタスクを外部ライブラリに依存することなく、柔軟性と洞察が得られます。
基本的に、いくつかの機能を使用すると、生の数値から意味のある要約に移動できます。
以上が統計分析ツールキットの構築:PHPの平均、中央値、標準偏差の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undress AI Tool
脱衣画像を無料で

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Stock Market GPT
AIを活用した投資調査により賢明な意思決定を実現

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

bcmathisentialforAccuratecurateptocurrencycalcatulationsinphpbecuseating-pointarithmeticincecceptesuncectesubleroundingErrors.1..2 Yieldimimpreciseresults(e.g.、0.300000000000000000000000000precyptowsyptowyprectoyptoyprecyptoyprecyptoyppowsyptowprecyptowprecyptowprecyptowprecyptowprecyptowprecyptowprecyptowpreciseResults)

浮動小数点数は不正確です。PHPの一般的な問題です。答えは、IEEE754ダブルエシジョン形式を使用していることです。これにより、小数を正確に表現できなくなります。 1.0.1や0.2などの数値は、バイナリの無限ループ10進数であり、コンピューターはエラーを引き起こすために切り捨てられる必要があります。 2。浮動小数点数を比較する場合、abs($ a- $ b)など、==の代わりに許容範囲を使用する必要があります。

round()は、「roundhalftoeven」を「roundhalfup」ではなく使用します

平均を計算します:array_sum()を使用して要素の数で除算して平均を取得します。 2。中央値を計算します:並べ替え後、中間値を取得し、要素さえあるときに2つの中間数の平均を取得します。 3。標準偏差を計算します。最初に平均を見つけてから、各値と平均の平方差の平均(サンプルはn-1)を計算し、最後に平方根を取得します。これらの3つの機能をカプセル化することにより、基本的な統計ツールを構築し、中小規模のデータの分析に適しており、空の配列と非数値入力の処理に注意を払い、外部ライブラリに依存することなくデータのコア統計的特徴を実現できます。

usenativemath forfast、small operations withinphp_int_max where precisionlossis notanissue.2.usebcmatheforexactdecimalathmeticlikefinancialcalculation、特に特に環境を保持する場合は特に、提案と予測を導入する場合

モジュラーリットメティジーインシンスインフェッジグラプグラフィックアプリケーションデスペフプノットパフォーマンス - パフォーマンス

AvectorInphpGraphicsSposition、direction、orvelocityusinglasslikevector3dwithx、y、zcomponents.2.basicoperationsincludeaddition、減算、筋肉拡張、および拡張性フォームメントアンドスケーリング

gmpisessentyfor forhandlinglargeintegersinphpbeyondnativelimits.1.gmpenablessablessablessisistraryinteintegerarithticusing inting intingistimized clibraries、unterinative integertertegersthationtegertegerstegertegerstegerstegerstegersはbasedring.2.usgmpforheyintegeroperiationsを使用してください
