masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > hujung hadapan web > tutorial js > Node.js如何爬取豆瓣数据实例分享

Node.js如何爬取豆瓣数据实例分享

小云云

Lepaskan： 2018-03-06 09:18:16

asal

1292 orang telah melayarinya

一直自以为自己vue还可以，一直自以为webpack还可以，今天在慕课逛node的时候，才发现，自己还差的很远。众所周知，vue-cli基于webpack，而webpack基于node，对node不了解，谈什么了解webpack。所以就自己给自己出了一道题，爬取豆瓣数据，目前还处于初级阶段。今天就浅谈爬取到豆瓣的数据，再另一个页面用自己的方式展现，后续会跟进。

1、需要解决的问题

搭建服务
怎么处理爬到的数据
怎么自动打开默认浏览器

2、搭建服务

搭建服务有好几种方式，一开始我用的http，但是http有个弊端就是不能解析https协议的url，所以就用了express，解析https协议的网址我用了request包，豆瓣的网址是https的，

今天爬取的是https://movie.douban.com/chart这个网址；如下图，我要获取的有三个部分，图片、电影名字、电影链接.

3、怎么处理爬到的数据

我们用request爬到的数据，怎么处理呢？cheerio包可以让我们像Jq那样处理爬到的html数据。

①、首先解析数据，取到爬取网页的html数据；

②、然后利用cheerio包操作爬到的数据，取到你想要的数据。

③、取到数据，创建html，输出到页面。如下图，我用的字符串拼接，办法有点笨，还没有找到更好的办法。

4、怎么自动打开默认浏览器

不知道你有没有看vue-cli中webpack的配置，自动打开浏览器，vue-cli用的opn包.

这个包用起来很方便，引入包，直接调用opn（url）即可；

5、展示

相关推荐：

php如何爬取天猫和淘宝商品数据

nodejs实现爬取网站图片功能_node.js

有关爬取图片的课程推荐5篇

Atas ialah kandungan terperinci Node.js如何爬取豆瓣数据实例分享. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

javascript node.js 实例

sumber：php.cn

Artikel sebelumnya：nodejs爬虫superagent和cheerio体验案例 Artikel seterusnya：AjaxUpLoad.js实现文件上传的实例代码

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

最新php程序员工具箱 v1.0版本介绍

1970-01-01 08:00:00
vue-cli 自定义指令directive 添加验证滑块详解

1970-01-01 08:00:00
PHP之IMAP收取邮件实例详解

2023-03-19 18:36:02
Redis常见的使用场景分享

2023-03-21 07:36:01
JS 数字和字符串之间相互转化详解

1970-01-01 08:00:00
Dreamweaver网页中添加电子邮箱链接的实例分享

1970-01-01 08:00:00
Vue filter介绍及其使用

1970-01-01 08:00:00
php基础知识笔记分享

2023-03-20 14:32:01
微信小程序文件类API详解

1970-01-01 08:00:00
JS实现的ajax和同源策略详解

1970-01-01 08:00:00

Isu terkini

Kaedah CSS sahaja untuk mengubah suai imej src secara dinamik pada klik tanpa menggunakan JavaScript Saya perlu menukar src imej pada klik tetikus hanya menggunakan css seperti img:active{}

daripada 2024-04-06 19:25:49

0

1

505

Titik Scatterplot tidak mengekalkan nilai semasa mengezum masuk d3.js Ini adalah kali pertama saya menggunakan d3.js, jadi harap bersabar. Saya melaksanakannya ...

daripada 2024-04-06 18:16:26

0

1

403

Acara tuding JavaScript pada elemen pseudo khusus vendor 我有以下htmlinput标签。$("input[type='range']::-webkit-slider-thumb").on('hover',functi...

daripada 2024-04-06 15:35:24

0

1

274

Hantar borang tanpa butang menggunakan Javascript/Jquery Saya cuba menyerahkan borang tanpa butang dengan memanggil fungsi JavaScript dan melaksana...

daripada 2024-04-06 14:54:03

0

2

421

Sesuaikan penampilan pengepala akordion Bootstrap menggunakan kelas CollapseDisplay Saya ingin menggayakan tajuk kad panel dengan rancangan runtuh kelas. Dalam contoh ini, ia...

daripada 2024-04-06 12:53:11

0

1

376

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan