So extrahieren Sie Informationen aus einer Schattenwurzel mit Selenium Python
Selenium bietet ein robustes Framework für die Webautomatisierung, einschließlich der Möglichkeit zum Extrahieren Informationen aus dynamisch geladenen Webelementen wie Schattenwurzeln. Dieser Leitfaden zeigt, wie Sie die Herausforderung meistern, Produktetiketten und andere Felder aus einem bestimmten Online-Shop innerhalb eines Schattenstamms zu extrahieren.
Die Herausforderung: Informationen aus einem Schattenstamm extrahieren
Wenn man auf Schattenwurzeln stößt, ist es notwendig, alternative Strategien für die Elementlokalisierung und -extraktion zu erkunden. Der herkömmliche XPath-Ansatz reicht möglicherweise nicht aus. Dieser Leitfaden stellt eine Lösung vor, die die Methodeexecute_script() von Selenium nutzt, um auf den Schattenstamm zuzugreifen und die gewünschten Informationen abzurufen.
Lösung: Verwendung von ShadowRoot.querySelector()
Zu Um das Produktetikett zu extrahieren, verwenden Sie den folgenden Ansatz:
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text) </code>
Ausgabe:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
Schlussfolgerung
Diese Lösung zeigt, wie effektiv extrahiert wird Informationen aus einem Schattenstamm mithilfe von Selenium Python und bietet so eine zuverlässige Technik zur Automatisierung von Webinteraktionen auch in anspruchsvollen Szenarien.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich mit Selenium Python Informationen aus einer Schattenwurzel?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!