Python爬虫如何爬取span和span中间的内容并分别存入字典里？-PHP中文网问答

文章专题学习下载问答编程词典手游最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Python爬虫如何爬取span和span中间的内容并分别存入字典里？

phpcn_u1582 2017-05-18 10:52:42

0

5

2054

我想把房屋概况分别抓出来并分别作为独立的列存储进字典里，但是行内元素没有办法直接用for循环抠出来。
这是我的代码：

soup.select('.house-info li')[1].text.strip()

这是网页html代码：

房屋概况：住宅 |1室1厅1卫 |46m² | (高层)/共18层 |南北 | 豪华装修

phpcn_u1582

全部回复 (5)

曾经蜡笔没有小新2017-05-18 10:54:42 5 楼

其实还是很有简单的，你看这个还是有规律的，规律在于有分隔符|，我写了个DEMO

something = '''房屋概况：住宅 |1室1厅1卫|46m²| (高层)/共18层 |南北 | 豪华装修 
'''; soup = BeautifulSoup(something, 'lxml') plaintext = soup.select('li')[0].get_text().strip()

通过get_text()得到内在所有内容，然后去除空格。后面你就用split进行分割吧，后面的不写了。
如果有问题再交流。

点赞+0

添加回复

给我你的怀抱2017-05-18 10:54:42 4 楼

我感觉这个html代码写错了呢,标签的内容文本在标签外面

正确的标签内容就两个:

房屋概况：
46m²

点赞+0

添加回复

巴扎黑2017-05-18 10:54:42 3 楼

内部文字

点赞+0

添加回复

滿天的星座2017-05-18 10:54:42 2 楼

你这种情况，我觉得用 for 循环加上正则表达式是最方便的，如果所有模版都是这样固定的话

点赞+0

添加回复

黄舟2017-05-18 10:54:42 1 楼

用pyquery吧

从 pyquery 导入 PyQuery 作为 Q

Q(text).find('.house-info li').text()

点赞+0

添加回复

热门专题

更多>

php8，我来也

30分钟学会网站布局

尚观Oracle入门到精通视频教程

你的第一行 UNI-APP 代码

Flutter 从头到应用启动

兄弟连Linux新版视频教程

AXURE 9视频教程（适合产品经理交互产品设计UI）

零基础PS视频教程

16天带你入门UI视频教程

PS技巧和切片技巧视频教程

阿里云环境搭建以及项目上线视频教程

计算机网络概述——程序员必须掌握的基础知识

程序员必备教程——HTTP协议讲解

Websocket视频教程

我感觉这个html代码写错了呢,标签的内容文本在标签外面

正确的标签内容就两个: