python - 前端er 想爬数据 从什么入门好?
PHP中文网
PHP中文网 2017-04-18 09:56:30
0
9
393

本人前端一枚

想做一个demo练手,需要得到爬取数据的本领,请问从哪里开始学习呢?

场景:爬取商品价格的数据,得到双十一前后的价格趋势变化,我可以如何入手呢?

我是JavaScript使用者,尽量使用node,如果Python学习成本比较高,求推荐教程和爬取数据的方法

PHP中文网
PHP中文网

认证0级讲师

membalas semua(9)
Peter_Zhu

Syorkan https://github.com/alsotang/n...

洪涛

Rantai alat perangkak:

Gunakan superagent untuk memulakan permintaan http Selepas mendapat respons, gunakan cheerio untuk menghuraikan teks Kemudian anda boleh menggunakan sintaks yang serupa dengan jQuery untuk mengendalikan Dom.

Mongodb boleh digunakan untuk penyimpanan data, dan mongoose boleh digunakan sebagai alat ORM yang sepadan.

Contoh kod
https://github.com/zhanyouwei...

洪涛

Bukankah kos pembelajaran Python diketahui paling rendah? ? Mudah untuk bermula dengan perangkak Python Terdapat banyak tutorial dalam talian

Ty80

scrapy pasti berada di kedudukan pertama! ! !

小葫芦

Bermula dengan Node dengan tegas, anda boleh merujuk kepada pengalaman baru saya https://github.com/hanzichi/f...

洪涛

Kos pembelajaran Python tidak terlalu tinggi, izinkan saya bercakap tentang pengalaman saya
Pada mulanya saya menggunakan urllib, atau urllib2, dan mendapati bahawa saya sangat teruja untuk merangkak data
Kemudian saya melihat halaman di mana Sambungan Ditutup , saya belajar tentang httplib2
dan kemudian melihat permintaan
dan kini saya melihat scrapy

Merangkak ialah metafizik Saya rasa matlamat soalan itu bagus untuk menyemak arah aliran harga, tetapi saya rasa kita boleh menetapkan matlamat kecil dahulu dan merangkak Ensiklopedia Baidu~

迷茫

Perangkak nod hanya berharga 20

小葫芦

nodej superagent + cheerio

伊谢尔伦

nodejs request + cheerio juga bagus.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan