Heim > Web-Frontend > js-Tutorial > Leitfaden zum Lesen von Webseitenelementen

Leitfaden zum Lesen von Webseitenelementen

WBOY
Freigeben: 2024-04-09 12:39:02
Original
1231 Leute haben es durchsucht

Um Webseitenelemente mit Python zu lesen, befolgen Sie diese Schritte: Importieren Sie den Webdriver aus der Selenium-Bibliothek. Starten Sie einen Browser wie Chrome Driver. Verwenden Sie die find_element_by_*-Methoden, um Webseitenelemente zu finden. Verwenden Sie element.text, um Elementtext zu lesen. Verwenden Sie element.get_attribute(), um Elementattribute zu lesen. Verwenden Sie element.location und element.size, um die Position und Größe des Elements zu lesen.

Leitfaden zum Lesen von Webseitenelementen

Leitfaden zum Lesen von Webelementen

Das Lesen von Webseitenelementen ist eine wichtige Aufgabe für die Website-Automatisierung und Datenextraktion. In diesem Artikel erfahren Sie, wie Sie den Text, die Attribute und die Position von Webseitenelementen mit Python und Selenium lesen.

Importieren Sie die erforderlichen Bibliotheken.

from selenium import webdriver
Nach dem Login kopieren

Starten Sie den Browser.

driver = webdriver.Chrome()  # 或其他浏览器驱动程序
Nach dem Login kopieren
< code>find_element_by_id("my_id")

  • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")
  • find_element_by_xpath("//element/path")

    find_element_by_* 方法查找元素:

    • find_element_by_id("my_id")
    • find_element_by_name("my_name")
    • find_element_by_class_name("my_class")
    • find_element_by_xpath("//element/path")
    • Elementtext lesen

    text = element.text
    Nach dem Login kopieren
    Elementattribute lesen

    value = element.get_attribute("attribute_name")
    Nach dem Login kopieren
    Elementposition lesen

    location = element.location  # 返回 {x, y} 坐标
    size = element.size  # 返回 {width, height}
    Nach dem Login kopieren
    Praktischer Fall

    Extrahieren Sie Filmtitel und Bewertungen von der IMDb-Website:

    # 打开 IMDb 网站
    driver.get("https://www.imdb.com/")
    
    # 获取前 10 部电影的标题和评分
    titles = []
    ratings = []
    for i in range(1, 11):
        # 查找标题元素
        title_element = driver.find_element_by_xpath(f"(//h3)[{i}]/a")
        # 读标题
        title = title_element.text
    
        # 查找评分元素
        rating_element = driver.find_element_by_xpath(f"(//strong)[{i}]")
        # 读评分
        rating = rating_element.text
    
        titles.append(title)
        ratings.append(rating)
    
    # 打印结果
    for title, rating in zip(titles, ratings):
        print(f"{title}: {rating}")
    Nach dem Login kopieren

    Dies führt zu ähnlichen Ergebnissen wie:

    The Shawshank Redemption: 9.3
    The Godfather: 9.2
    The Dark Knight: 9.0
    Schindler's List: 9.0
    12 Angry Men: 9.0
    ...
    Nach dem Login kopieren

    Das obige ist der detaillierte Inhalt vonLeitfaden zum Lesen von Webseitenelementen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

  • Verwandte Etiketten:
    Quelle:php.cn
    Erklärung dieser Website
    Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
    Beliebte Tutorials
    Mehr>
    Neueste Downloads
    Mehr>
    Web-Effekte
    Quellcode der Website
    Website-Materialien
    Frontend-Vorlage