1. filesize() 関数は不正な値を返します。
curl を使用してページをローカルにダウンロードする場合、ダウンロードされた一時ファイル tmpHtml.txt の内容をバッファに読み取る必要があります。 fread() を使用して読み取るため、読み取るサイズを渡す必要があるため、最初に filesize(‘./tmpHtml.txt’) を使用して一時ファイルのサイズを取得します。奇妙なのは、取得した一時ファイルのサイズが正しくないことです。デバッグ用にブレークポイントを設定し、filesize() を呼び出した後、ハード ディスク上のファイルを手動で検索しました。ファイル サイズは、filesize() で取得した結果と異なります。 。
php.net でファイルサイズを検索すると、関数の説明に次の文が表示されます。 注: この関数の結果はキャッシュされます。詳細については、clearstatcache() を参照してください。
clearstatcache() をもう一度確認すると、その理由がわかりました。
PHP は、パフォーマンスを向上させるために、これらの関数 (クエリ用に関数テーブルが提供されています) の戻り情報をキャッシュします。ただし、場合によっては、キャッシュされた情報をクリアしたい場合もあります。たとえば、スクリプト内で同じファイルを複数回チェックし、そのファイルがスクリプトの実行中に削除または変更される危険性がある場合は、ファイル ステータス キャッシュをクリアする必要があります。この場合、clearstatcache() 関数を使用して、PHP によってキャッシュされたファイル情報をクリアできます。
2. UTF-8 でエンコードされた PHP スクリプトで、GBK でエンコードされた中国語の Web コンテンツをパターン マッチングするときに中国語を照合する方法。
昨日の開発では、GBK でエンコードされた文字列「Apple」を含むコンテンツを照合する必要があったので、次のコードを書きました:
コードをコピー コードは次のとおりです:
$pat = '/< ;img /> ;/';
$pat = iconv('UTF-8', 'GB2312', $pat);
$ret = preg_match_all($pat, $contents, $matches);
コードをコピーします コードは次のとおりです:
$pat = ' //' ;
$content = iconv('GB2312', 'UTF-8', $contents);
$ret = preg_match_all($pat, $contents, $matches) ;