社区学习工具库休闲

简体中文

首页 > web前端 > js教程 > 在Node.js中使用cheerio制作简单的网页爬虫（详细教程）

在Node.js中使用cheerio制作简单的网页爬虫（详细教程）

亚连

发布： 2018-06-02 14:30:03

原创

3399 人浏览过

本篇文章主要介绍了Node.js 利用cheerio制作简单的网页爬虫示例，现在分享给大家，也给大家做个参考。

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例，分享给大家，具有如下：

1. 目标

完成对网站的标题信息获取
将获取到的信息输出在一个新文件
工具: cheerio，使用npm下载npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本一致
如果熟练使用jQuery，那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题，将获取到的标题列表编号，最终输出到pageTitle.txt文件里

const https = require(&#39;https&#39;);
const fs = require(&#39;fs&#39;);
const cheerio = require(&#39;cheerio&#39;);
const url = &#39;https://segmentfault.com/&#39;;

https.get(url, (res) => {
  let html = &#39;&#39;;
  res.on(&#39;data&#39;, (data) => {
    html += data;
  });
  res.on(&#39;end&#39;, () => {
    getPageTitle(html);
  });
}).on(&#39;error&#39;, () => {
  console.log(&#39;获取网页信息错误&#39;);
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $(&#39;.news__item-title&#39;);
  let data = [];
  let index = 0;
  let fileName = &#39;pageTitle.txt&#39;;
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find(&#39;a&#39;).text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, &#39;utf8&#39;, (err) => {
    if (err) {
      console.log(&#39;fs文件系统创建新文件失败&#39;, err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}

登录后复制

上面是我整理给大家的，希望今后会对大家有帮助。

相关文章：

聊聊JS动画库 Velocity.js的使用

vue toggle做一个点击切换class(实例讲解)

Vue2.0 给Tab标签页和页面切换过渡添加样式的方法

以上是在Node.js中使用cheerio制作简单的网页爬虫（详细教程）的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

cheerio javascript node.js

来源：php.cn

上一篇：如何使用vue源码解析事件机制下一篇：如何使用AngularJs用户输入动态模板XSS攻击

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

在weebox中有关弹出窗口不居中问题

2018-06-23 18:19:43
在vue+canvas中有关excel-like组件如何使用

2018-06-23 18:17:39
在JavaScript中有关class如何调用

2018-06-23 18:11:37
使用Vue框架如何实现上拉刷新功能

2018-06-23 18:10:14
使用Vue移动端如何实现图片裁剪组件

2018-06-23 18:06:43
有关微信小程序模板和模块化用法（详细教程）

2018-06-23 18:04:28
在vue2中如何实现上拉加载功能

2018-06-23 18:02:45
使用Vue2如何实现三级联动

2018-06-23 18:00:45
在vue2中如何实现数据请求显示loading图

2018-06-23 17:58:23
使用元素全屏如何做到设置与监听

2018-06-23 17:56:41

最新问题

仅 CSS 方法可在单击时动态修改图像 src，无需使用 JavaScript 我需要仅使用css更改鼠标单击时图像的src喜欢img:active{}

来自于 2024-04-06 19:25:49

0

1

505

放大 d3.js 时散点图点不会保持值这是我第一次使用d3.js，所以请耐心等待。我在vue.js文件中将其作为纯JavaScript实现。我正在尝试制作具有缩放功能的散点图。到目前为止，我几乎一切正常，但当我缩放时，...

来自于 2024-04-06 18:16:26

0

1

403

供应商特定伪元素上的 JavaScript 悬停事件我有以下htmlinput标签。$("input[type='range']::-webkit-slider-thumb").on('hover',functi...

来自于 2024-04-06 15:35:24

0

1

274

使用 Javascript / Jquery 提交表单且不带按钮我试图通过调用JavaScript函数并使用JQUERY/PHP执行表单来提交没有按钮的表单。我希望表单在后端静默执行，而无需重新加载页面。不幸的是，它不断返回JavaScript...

来自于 2024-04-06 14:54:03

0

2

421

使用'折叠显示”类自定义 Bootstrap 手风琴标题的外观我想设置具有类collapseshow的面板的卡标题样式。在此示例中，它是第一个面板。我尝试使用CSS来使用.accordion.card.card-headerbutton.bt...

来自于 2024-04-06 12:53:11

0

1

376

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1423369
php入门教程之一周学会PHP

4268915
JAVA 初级入门视频教程

2537727
小甲鱼零基础入门学习Python视频教程

507507
PHP 零基础入门教程

862855

最新下载

更多>

网站特效

网站源码

网站素材

前端模板