スクレイピングのための HTTP データ消費の最適化
HTTP GET データ スクレイピング操作の効率を高めるためには、次の可能性を考慮することが重要です。大量のデータを配信する URL に遭遇する割合。これを防ぐには、GET リクエストが受信するデータ サイズを制限し、潜在的なボトルネックを防ぎます。
解決策: io.LimitedReader によるデータ消費の制限
幸いなことに、Go の ioパッケージは、便利なソリューションである io.LimitedReader を提供します。提供された io.Reader から読み取られるデータ量を定義された制限に制限し、この制限に達するとデータの取得を事実上遮断します。
limitedReader := &io.LimitedReader{R: response.Body, N: limit} body, err := io.ReadAll(limitedReader)
この例では、io.LimitedReader はデータの読み取りを制限します。 HTTP 応答の本文から指定された制限まで。
または、io.LimitReader 関数を使用して同じことを達成できます。 result:
body, err := io.ReadAll(io.LimitReader(response.Body, limit))
io.LimitedReader または io.LimitReader を利用すると、HTTP GET リクエストから取得されるデータの量を効果的に制御し、過剰なデータによってスクレイパーが圧倒されるのを防ぐことができます。
以上がデータ スクレイパーの過負荷を防ぐために HTTP GET リクエストを最適化するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。