Python爬蟲如何爬取span和span中間的內容並分別存入字典裡？-PHP中文網路問答

文章專題學習下載問答程式設計字典遊戲最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Python爬蟲如何爬取span和span中間的內容並分別存入字典裡？

phpcn_u1582 2017-05-18 10:52:42

0

5

2035

我想把房屋概況分別抓出來並分別儲存為獨立的列進字典裡，但是行內元素沒有辦法直接用for迴圈摳出來。
這是我的程式碼：

soup.select('.house-info li')[1].text.strip()

這是網頁html程式碼：

房屋概况：住宅 |1室1厅1卫 |46m² | (高层)/共18层 |南北 | 豪华装修

phpcn_u1582

全部回覆 (5)

曾经蜡笔没有小新2017-05-18 10:54:42 5樓

其實還是很簡單的，你看這個還是有規律的，規律在於有分隔符號|，我寫了個DEMO

something = '''房屋概况：住宅 |1室1厅1卫|46m²| (高层)/共18层 |南北 | 豪华装修 
'''; soup = BeautifulSoup(something, 'lxml') plaintext = soup.select('li')[0].get_text().strip()

透過get_text()得到內在所有內容，然後移除空格。後面你就用split分割吧，後面的不寫了。
如果有問題再交流。

點贊+0

新增回覆

给我你的怀抱2017-05-18 10:54:42 4樓

我感覺這個html代碼寫錯了呢,標籤的內容文字在標籤外面

正確的標籤內容就兩個:

房屋概況：
46m²

點贊+0

新增回覆

巴扎黑2017-05-18 10:54:42 3樓

內部文字

點贊+0

新增回覆

滿天的星座2017-05-18 10:54:42 2樓

你這種情況，我覺得用 for 迴圈加上正規表示式是最方便的，如果所有模版都是這樣固定的話

點贊+0

新增回覆

黄舟2017-05-18 10:54:42 1樓

用pyquery吧

從 pyquery 導入 PyQuery 作為 Q

Q(text).find('.house-info li').text()

點贊+0

新增回覆

熱門專題

更多>

php8，我來也

30分鐘學會網站佈局

尚觀Oracle入門到精通視頻教程

你的第一行UNI-APP程式碼

Flutter 從頭到應用程式啟動

兄弟連新版Linux視頻教程

AXURE 9影片教學（適用於產品經理互動產品設計UI）

零基礎PS影片教學

16天帶你入門UI視頻教程

PS技巧和切片技巧影片教學

阿裡雲環境搭建以及項目上線視頻教程

電腦網路概述－程式設計師必須掌握的基礎知識

程式設計師必備教學——HTTP協定講解

Websocket影片教學

我感覺這個html代碼寫錯了呢,標籤的內容文字在標籤外面

正確的標籤內容就兩個: