Maison > interface Web > js tutoriel > Utilisez cheerio pour créer un robot d'exploration Web simple dans Node.js (tutoriel détaillé)

Utilisez cheerio pour créer un robot d'exploration Web simple dans Node.js (tutoriel détaillé)

亚连
Libérer: 2018-06-02 14:30:03
original
3396 Les gens l'ont consulté

Cet article présente principalement Node.js pour utiliser cheerio pour créer un exemple simple de robot d'exploration Web. Maintenant, je le partage avec vous et le donne comme référence.

Cet article présente Node.js pour utiliser cheerio pour créer un exemple simple de robot d'exploration Web, partagez-le avec tout le monde, il présente les fonctionnalités suivantes :

Objectif

  1. Terminer Obtenir les informations sur le titre du site Web

  2. Sortir les informations obtenues dans un nouveau fichier

  3. Outil : cheerio, utiliser npm pour télécharger npm install cheerio

  4. La méthode d'utilisation de l'API de cheerio est fondamentalement la même que la méthode d'utilisation de jQuery

  5. Si vous maîtrisez en utilisant jQuery, vous démarrerez rapidement avec cheerio

2. Partie de code

Introduction : obtenez le titre de la liste de la page de défauts du segment, obtenez le numéro de la liste des titres. , et enfin le sortir dans le fichier pageTitle.txt

const https = require('https');
const fs = require('fs');
const cheerio = require('cheerio');
const url = 'https://segmentfault.com/';

https.get(url, (res) => {
  let html = '';
  res.on('data', (data) => {
    html += data;
  });
  res.on('end', () => {
    getPageTitle(html);
  });
}).on('error', () => {
  console.log('获取网页信息错误');
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $('.news__item-title');
  let data = [];
  let index = 0;
  let fileName = 'pageTitle.txt';
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find(&#39;a&#39;).text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, &#39;utf8&#39;, (err) => {
    if (err) {
      console.log(&#39;fs文件系统创建新文件失败&#39;, err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}
Copier après la connexion

J'ai compilé ce qui précède pour vous, j'espère que cela vous sera utile à l'avenir.

Articles associés :

Parlez de l'utilisation de la bibliothèque d'animation JS Velocity.js

vue toggle crée une classe de changement de clic (explication avec des exemples)

Vue2.0 Comment ajouter des styles aux onglets et aux transitions de changement de page

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal