社群學習工具庫休閒

繁体中文

首頁 > web前端 > js教程 > 在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）

在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）

亚连

發布： 2018-06-02 14:30:03

原創

3399 人瀏覽過

本篇文章主要介紹了Node.js 利用cheerio製作簡單的網頁爬蟲範例，現在分享給大家，也給大家做個參考。

本文介紹了Node.js 利用cheerio製作簡單的網頁爬蟲範例，分享給大家，具有如下：

1. 目標

完成對網站的標題資訊取得
將取得到的資訊輸出在一個新檔案
工具: cheerio，使用npm下載npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本上一致
如果熟練使用jQuery，那麼cheerio將會很快上手

2. 程式碼部分

介紹: 取得segment fault頁面的清單標題，將取得到的標題清單編號，最後輸出到pageTitle.txt檔案裡

const https = require(&#39;https&#39;);
const fs = require(&#39;fs&#39;);
const cheerio = require(&#39;cheerio&#39;);
const url = &#39;https://segmentfault.com/&#39;;

https.get(url, (res) => {
  let html = &#39;&#39;;
  res.on(&#39;data&#39;, (data) => {
    html += data;
  });
  res.on(&#39;end&#39;, () => {
    getPageTitle(html);
  });
}).on(&#39;error&#39;, () => {
  console.log(&#39;获取网页信息错误&#39;);
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $(&#39;.news__item-title&#39;);
  let data = [];
  let index = 0;
  let fileName = &#39;pageTitle.txt&#39;;
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find(&#39;a&#39;).text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, &#39;utf8&#39;, (err) => {
    if (err) {
      console.log(&#39;fs文件系统创建新文件失败&#39;, err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}

登入後複製

上面是我整理給大家的，希望未來會對大家有幫助。

相關文章：

聊聊JS動畫庫Velocity.js的使用

vue toggle做一個點擊切換class(實例講解)

Vue2.0 給Tab標籤頁和頁面切換過渡新增樣式的方法

以上是在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

cheerio javascript node.js

來源：php.cn

上一篇：如何使用vue源碼解析事件機制下一篇：如何使用AngularJs用戶輸入動態模板XSS攻擊

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

在weebox中有關彈出視窗不居中問題

2018-06-23 18:19:43
在vue+canvas中有關excel-like元件如何使用

2018-06-23 18:17:39
在JavaScript中有關class如何調用

2018-06-23 18:11:37
使用Vue框架如何實現上拉刷新功能

2018-06-23 18:10:14
使用Vue行動端如何實現圖片裁切組件

2018-06-23 18:06:43
有關微信小程式模板和模組化用法（詳細教程）

2018-06-23 18:04:28
在vue2中如何實現上拉載入功能

2018-06-23 18:02:45
使用Vue2如何實現三級連動

2018-06-23 18:00:45
在vue2中如何實作資料請求顯示loading圖

2018-06-23 17:58:23
使用元素全螢幕如何做到設定與監聽

2018-06-23 17:56:41

最新問題

僅 CSS 方法可在單擊時動態修改圖片 src，無需使用 JavaScript 我需要僅使用css更改滑鼠單擊時圖像的src喜歡img:active{}

來自於 2024-04-06 19:25:49

0

1

505

放大 d3.js 時散佈圖點不會保持值這是我第一次使用d3.js，所以請耐心等待。我在vue.js檔案中將其作為純JavaScript實作。我正在嘗試製作具有縮放功能的散點圖。到目前為止，我幾乎一切正常，但當我縮放時，...

來自於 2024-04-06 18:16:26

0

1

403

供應商特定偽元素上的 JavaScript 懸停事件我有以下htmlinput標籤。 $("input[type='range']::-webkit-slider-thumb").on('hover',funct...

來自於 2024-04-06 15:35:24

0

1

274

使用 Javascript / Jquery 提交表單且不含按鈕我試圖透過呼叫JavaScript函數並使用JQUERY/PHP執行表單來提交沒有按鈕的表單。我希望表單在後端靜默執行，而無需重新載入頁面。不幸的是，它不斷傳回JavaScript...

來自於 2024-04-06 14:54:03

0

2

421

使用「折疊顯示器」類別自訂 Bootstrap 手風琴標題的外觀我想設定具有類別collapseshow的面板的卡片標題樣式。在此範例中，它是第一個面板。我嘗試使用CSS來使用.accordion.card.card-headerbutton....

來自於 2024-04-06 12:53:11

0

1

376

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1423369
php入門教程之一週學會PHP

4268914
JAVA 初級入門影片教學

2537726
小甲魚零基礎入門學習Python影片教學

507507
PHP 零基礎入門教學

862855

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板