Saya mahu menangkap profil rumah secara berasingan dan menyimpannya dalam kamus sebagai lajur bebas, tetapi tiada cara untuk mengekstrak terus elemen sebaris menggunakan gelung for.
Ini kod saya:
soup.select('.house-info li')[1].text.strip()
Ini ialah kod html halaman web:
<li><span class="info-tit">房屋概况:</span>住宅
<span class="splitline">|</span>1室1厅1卫
<span class="splitline">|</span><span title="建筑面积">46m²</span>
<span class="splitline">|</span> (高层)/共18层
<span class="splitline">|</span>南北
<span class="splitline">|</span> 豪华装修
</li>
Sebenarnya, ia sangat mudah. Anda boleh lihat ada corak dalam pemisah |
Dapatkan semua kandungan dalaman melalui get_text(), dan kemudian keluarkan ruang. Anda boleh menggunakan split untuk membahagikannya kemudian, dan saya tidak akan menulis selebihnya.Jika anda mempunyai sebarang pertanyaan, sila hubungi.
Saya rasa kod html ini ditulis salah, teks kandungan label berada di luar label
Hanya ada dua kandungan label yang betul:
Gambaran Keseluruhan Rumah:
46m²
InnerTeks
Dalam kes anda, saya fikir ia adalah paling mudah untuk menggunakan gelung for ditambah ungkapan biasa, jika semua templat dibetulkan seperti ini
用pyquery吧
daripada pyquery import PyQuery sebagai Q
Q(teks).cari('.info-rumah li').teks()