Comment extraire des informations d'une racine fantôme à l'aide de Selenium Python
Selenium fournit un cadre robuste pour l'automatisation Web, y compris la possibilité d'extraire informations provenant d’éléments Web chargés dynamiquement tels que les racines fantômes. Ce guide montrera comment surmonter le défi de l'extraction des étiquettes de produits et d'autres champs d'une boutique en ligne spécifique au sein d'une racine fantôme.
Le défi : extraire des informations d'une racine fantôme
Lorsque vous rencontrez des racines d'ombre, il devient nécessaire d'explorer des stratégies alternatives pour la localisation et l'extraction des éléments. L'approche XPath conventionnelle peut ne pas suffire. Ce guide présente une solution qui exploite la méthode execute_script() de Selenium pour accéder à la racine fantôme et récupérer les informations souhaitées.
Solution : Utiliser ShadowRoot.querySelector()
Pour extraire l'étiquette du produit, utilisez l'approche suivante :
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text) </code>
Résultat :
La especial mezcla de nueces, maní, almendras y marañones x 450 g
Conclusion
Cette solution montre comment extraire efficacement informations provenant d'une racine fantôme à l'aide de Selenium Python, fournissant une technique fiable pour automatiser les interactions Web, même dans des scénarios difficiles.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!