大きなファイルを読み取るのはいつも頭痛の種です。PHP を直接使用して小さなファイルを読み取ることもできますが、大きな記事になると次のことがわかります。一般的に使用されるメソッドが正常に使用できない、または時間がかかりすぎるため、PHP での大きなファイルの読み取りの問題の解決策を見てみましょう。この例がお役に立てば幸いです。
PHP では、ファイルを読み取るときに、file や file_get_contents などの関数を使用するのが最も速い方法で、数行の簡単なコードで必要な関数を美しく完成させることができます。ただし、操作するファイルが比較的大きなファイルの場合、これらの機能では不十分な場合があります。ここでは、大きなファイルを読み込むときによく使用される操作方法について説明します。
要件:
約 500 万行からなる 8 億のログ ファイルがあり、PHP を使用して最後の数行の内容を返します。
実装方法:
1. ファイル機能を直接使用して操作します
ファイル関数はすべてのコンテンツを一度にメモリに読み込みます。また、不適切に作成されたプログラムがメモリを大量に消費してシステム メモリが不足し、サーバーのメモリがクラッシュすることを防ぐために、PHP はデフォルトで最大使用量に制限されています。 16M。php.ini のmemory_limit = 16M で設定されます。この値が -1 に設定されている場合、メモリ使用量は制限されません。
以下は、 file を使用してこのファイルの最後の行を抽出するコードです:
リーリー コード全体の実行には 116.9613 (s) かかります。
私のマシンには 2G のメモリがあり、F5 キーを押して実行すると、システムがグレーになり、ほぼ 20 分後に回復します。このような大きなファイルをメモリに直接読み込むと、非常に深刻な結果が生じることがわかります。したがって、memory_limit をあまり高く調整することはできません。そうでない場合は、コンピューター室に電話してマシンをリセットするように依頼するしかありません。
2. Linux tail コマンドを直接呼び出して、最後の数行を表示します
Linux コマンドラインでは、tail -n 10 access.log を直接使用して、ログ ファイルの最後の数行を簡単に表示できます。PHP を直接使用して、tail コマンドを呼び出すことができます。
コード全体の実行には 0.0034 (s) かかります
3. PHP の fseek を直接使用してファイル操作を実行します
この方法は最も一般的な方法であり、ファイルの内容をすべて読み取る必要はなく、ポインターを介して直接操作するため、効率が非常に優れています。 fseek を使用してファイルを操作する場合、さまざまな方法があり、効率が若干異なる場合があります。一般的に使用される方法は次の 2 つです。
まず fseek を通じてファイルの最後の EOF を見つけ、次に最後の行の開始位置を見つけ、この行のデータを取得し、次に次の行の開始位置を見つけ、次にこの行の位置を取得する、というようになります。 $num が見つかるまで OK です。
実装コードは以下の通りです
リーリー
方法 2
引き続き fseek を使用してファイルの末尾から読み取りますが、今回は少しずつ読み取るのではなく、データを部分的に読み取るたびに、読み取ったデータを buf に配置して渡します。改行文字 (\n) の数は、データの最後の $num 行が読み取られたかどうかを判断するために使用されます。
実装コードは以下の通りです
リーリー
方法 3
リーリー
コード全体の実行には 0.0003(秒)かかります方法 4、PHP の stream_get_line 関数は、500,000 項目を含む大きなデータ ファイルを読み取るのに約 20 秒かかります。サンプルコードは以下の通りです
リーリー
上記は PHP で大きなファイルを読み取る 4 つの方法です。皆さんの学習に役立つことを願っています。興味があるかもしれない記事: