コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > ウェブフロントエンド > htmlチュートリアル > Python クローラーが html_html/css_WEB-ITnose の遅延読み込み部分 (layload_url) を処理する方法

Python クローラーが html_html/css_WEB-ITnose の遅延読み込み部分 (layload_url) を処理する方法

WBOY

リリース： 2016-06-24 11:47:22

オリジナル

2487 人が閲覧しました

リンク「http://s.1688.com/selloffer/industry_offer_search.htm?mixWholesale=true&industryFlag=food&categoryId=1032913&from=industrySearch&n=y&filt=y#_fb_top」のソースコードをダウンロードします。結果にはページの一部のみが含まれます。 ; このページには合計 60 個の製品がありますが、ソースコードから解析できるのは 20 個だけであり、ページめくりのリンクが見つかりません

上記のソースコードで実装された遅延読み込みである必要があります。新しい部分は、ページのプーリーを一番下までスクロールすると、このページを解析し、完全なページのソースコードを取得し、60 個の製品とページめくりリンクをすべて解析する方法を教えてください。

ディスカッションに返信 (解決策)

要素を監査し、データソースリンクを見つけて、そのリンクを直接使用してデータを取得します

うーん。。。今答えても遅すぎるかどうかはわかりません。これにより、Firefox を通じて遅延読み込み URL アドレスをキャプチャでき、パターンを見つけることができます。たまたま 1688 データをクロールしていて、遅延読み込みの問題に遭遇しました。その後、Firefox を介して URL をキャプチャしたところ、div sw-layload-url 内の URL を取り出し、最後に &callback=any 文字を追加するだけでよいことがわかりました。 .string を入力し、毎回 &startIndex= これを変更します (startIndex=20、startIndex=40)。これにより、json データが返されます
あなたが投稿した URL を試しましたが、なぜデータが返されないのかわかりません。棚から撤去されました。。。私が言ったことを試してみてください
、それを解決してより良い方法があれば、私と共有していただければ幸いです

。

関連ラベル：

Python爬虫如何处理html中的延迟加载部分（delayload_url）

ソース：php.cn

前の記事：html table_html/css_WEB-ITnose 次の記事：外部サブページ操作の親 page_html/css_WEB-ITnose

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

NullPointerException とは何ですか?どのように修正すればよいですか?

2024-10-22 09:46:29
初心者からプログラマーへ: 旅は C の基礎から始まります

2024-10-13 13:53:41
PHP による Web 開発のロックを解除する: 初心者ガイド

2024-10-12 12:15:51
C の謎を解く: 新人プログラマーのための明確でシンプルな道

2024-10-11 22:47:31
コーディングの可能性を解き放つ: まったくの初心者のための C プログラミング

2024-10-11 19:36:51
内なるプログラマーを解き放つ: まったくの初心者のための C

2024-10-11 15:50:41
C で生活を自動化する: 初心者向けのスクリプトとツール

2024-10-11 15:07:41
PHP を簡単に: Web 開発の最初のステップ

2024-10-11 14:21:21
Python で何でも構築: 創造性を解き放つための初心者ガイド

2024-10-11 12:59:11
コーディングの鍵: 初心者のための Python の力を解き放つ

2024-10-11 12:17:31

最新の問題

function_exists() はカスタム関数を決定できません Function test () {return true;} if (function_exists ('test')) {echo "テストは関数です";

から 2024-04-29 11:01:01

0

3

2190

Google Chromeのモバイル版を表示する方法こんにちは、先生、Google Chrome をモバイル版に変更するにはどうすればよいですか?

から 2024-04-23 00:22:19

0

11

2340

子ウィンドウは親ウィンドウを操作しますが、出力は応答しません。最初の 2 つの文は実行可能ですが、最後の文は実装できません。

から 2024-04-19 15:37:47

0

1

1963

親ウィンドウには出力がありません document.onclick = function(){ window.opener.document.write('私は子ウィンドウの出力です');

から 2024-04-18 23:52:34

0

1

1849

CSS マインドマッピングに関するコースウェアはどこにありますか? コースウェア

から 2024-04-16 10:10:18

0

0

1906

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート