Python2.7 の urllib2 モジュールを使用して、Web ページのソース コードを取得する非常に単純なコードを作成しましたが、返された Web ページのソース コードには、</html> などの下半分しかありません。 </body> と他の結論の単語。 ですが、<!doctype><html> などの上部にコードはありません。誰かが私を助けてくれることを願っています。ありがとうございます。コードは次のとおりです:
import urllib2
resp = urllib2.urlopen("http://www.baidu.com")
print resp.read()
次のように Web ページを取得します (最初と最後)。
コードは問題ありませんが、問題はコマンドウィンドウです。 resp.read() はすべてのコンテンツを取得しますが、コマンド ウィンドウは完全には表示されません。
python test.py > res.txt 閲覧用にファイルに出力します