因工作需求,需要抓取別人網站的數據,使用php+ curl 但是遇到問題無解
聽說內地的神人很多,請各位神人幫小弟,來自台灣的小弟已經爬文爬文三天了。
網址如下:
先進入:
http://www .cbssports.com/mlb/scoreboard
然後,選擇下方正在比賽中的賽事,點選GAMETRACKER 就可以看到直播
問題來了
以這個網址為例:以這個網址為例:(當各位大大看到時,也許賽事已經結束了
)
ttp: //www.cbssports.com/mlb/gametracker/live/MLB_20140527_TB@TOR 小弟寫的程序如下:
$game=array();
$ch = curl_in ();
$search1=$_GET['searcharg'];
$url="http://www.cbssports. com/mlb/gametracker 🎜>$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); ch);
preg_match_all('/進行字串解析 )
目前已知問題:
不管是
save as save as > 檢視原始檔 ,有些該出現的html都沒有出現,例如:
原始網站為:
http://sports.cbsimg.net/images/baseball/mlb/players/60x80/1961062.jpg
"border="0">
Pitcher:M. Mariot | # 48 RP |
5.73 ERA, 11.0 IP,9 K's , 6 BB
不管是另存新檔的網頁或是 curl抓出來的結果是
|