ニュース収集について緊急の質問がありますが、新浪、捜狐、テンセントのニュース収集が禁止されているというのは本当ですか?
収集するランダムな Sina ページを探していると、タイトル部分は取得できるのですが、(ページのソース コードを表示して) テキスト部分が取得できないのはなぜですか?
関数内容($preg,$con,$num=1) {
Preg_match($preg,$con,$arr);
return $arr[$num];
}
$con=file_get_contents("http://mil.news.sina.com.cn/2012-12-14/1646709659.html");
$preg="#