从网站上打印html后发现fieldset标签里的id属性和原网站上的属性不同,猜想可能是被js修改了这个id的值,试了很多办法都没有成功。主要是没办法获取被修改后的id的值
从图上可以看出,两者的id不同,请教大神,有什么办法能够获取被修改后的id的值吗?
全部代码贴在下面:
response = urllib.urlopen(url)
soup =BeautifulSoup(response,'lxml')
# text_que = soup.find_all('li',class_="QUES_LI")
print soup.prettify()
除非你了解他這個ID的生成規則,不然的話是無法直接取得的。
但是我們要過得修改後的值,確是有許多的方法。
一,先取得相關元素再定位,例如你可以取得父元素,然後再定位到子元素再取得他的ID值。
二,用正規匹配獲取。只要變動的值的周圍是固定的,就有方法取得。
請問這是什麼網站