Bagaimanakah perangkak Python merangkak kandungan antara rentang dan rentang dan menyimpannya dalam kamus masing-masing?
phpcn_u1582
phpcn_u1582 2017-05-18 10:52:42
0
5
2139

Saya mahu menangkap profil rumah secara berasingan dan menyimpannya dalam kamus sebagai lajur bebas, tetapi tiada cara untuk mengekstrak terus elemen sebaris menggunakan gelung for.
Ini kod saya:

soup.select('.house-info li')[1].text.strip()

Ini ialah kod html halaman web:

<li><span class="info-tit">房屋概况:</span>住宅
                        <span class="splitline">|</span>1室1厅1卫
                        
                        <span class="splitline">|</span><span title="建筑面积">46m²</span>
                        
                        <span class="splitline">|</span> (高层)/共18层
                        
                        <span class="splitline">|</span>南北
                        
                        <span class="splitline">|</span> 豪华装修
                        
                    </li>
phpcn_u1582
phpcn_u1582

membalas semua(5)
曾经蜡笔没有小新

Sebenarnya, ia sangat mudah. ​​Anda boleh lihat ada corak dalam pemisah |

something  = '''<li><span class="info-tit">房屋概况:</span>住宅  <span class="splitline">|</span>1室1厅1卫<span class="splitline">|</span><span title="建筑面积">46m²</span><span class="splitline">|</span> (高层)/共18层

                        <span class="splitline">|</span>南北

                        <span class="splitline">|</span> 豪华装修

                    </li>''';

soup  = BeautifulSoup(something, 'lxml')
plaintext = soup.select('li')[0].get_text().strip()
Dapatkan semua kandungan dalaman melalui get_text(), dan kemudian keluarkan ruang. Anda boleh menggunakan split untuk membahagikannya kemudian, dan saya tidak akan menulis selebihnya.

Jika anda mempunyai sebarang pertanyaan, sila hubungi.

给我你的怀抱

Saya rasa kod html ini ditulis salah, teks kandungan label berada di luar label

Hanya ada dua kandungan label yang betul:

  • Gambaran Keseluruhan Rumah:

  • 46m²

巴扎黑

InnerTeks

滿天的星座

Dalam kes anda, saya fikir ia adalah paling mudah untuk menggunakan gelung for ditambah ungkapan biasa, jika semua templat dibetulkan seperti ini

黄舟

用pyquery吧

daripada pyquery import PyQuery sebagai Q

Q(teks).cari('.info-rumah li').teks()

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan