Supposons que j'écrive un script de nœud qui utilise fetch
pour récupérer le contenu de la page HTML dans une variable.
Maintenant, j'ai un sélecteur CSS pour ce type de contenu. Comment puis-je l'utiliser pour extraire du contenu HTML et/ou texte reconnu par les sélecteurs CSS.
S'il existe des outils/packages existants que je peux exploiter, veuillez donner une réponse à deux niveaux :
Pour extraire le contenu HTML/texte identifié par les sélecteurs CSS dans Node.js, vous pouvez utiliser différents packages tels que Cheerio, jsdom ou Puppeteer. Voici des exemples d'utilisation des sélecteurs CSS pour extraire du contenu pour des outils basés sur des sélecteurs CSS purs et basés sur jQuery :
Basé sur des sélecteurs CSS purs : Cheerio est un package rapide et flexible qui analyse le HTML et vous permet d'utiliser des sélecteurs CSS pour extraire des données. Voici comment utiliser Cheerio pour extraire du contenu via des sélecteurs CSS :
Outils basés sur jQuery : Si vous préférez la syntaxe jQuery, vous pouvez utiliser un package comme jQuery ou JSDOM. Voici un exemple utilisant jQuery :
Dans les deux exemples, nous chargeons d'abord le contenu HTML à l'aide d'un package (Cheerio ou JSDOM), puis utilisons des sélecteurs CSS pour sélectionner le contenu souhaité. Enfin, nous extrayons le texte de l'élément sélectionné à l'aide de la méthode text().