网页爬虫 - python爬虫案例
ringa_lee
ringa_lee 2017-04-17 17:50:11
0
1
1192

请问大家能不能给我一点提点,我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习


目前已知的爬虫工具有:

  1. Beautiful Soup

  2. Scrapy

  3. cola

  4. pyspider

  5. PyQuery

  6. grab

ringa_lee
ringa_lee

ringa_lee

membalas semua(1)
Ty80

Jika anda benar-benar tidak tahu, berikut adalah beberapa maklumat untuk rujukan anda, tetapi perkara utama ialah anda harus membacanya...

Pertama sekali, apakah itu perakak web:

  1. Anda hanya boleh melihat perangkak web wiki

  2. Datang ke laman web ini sekali lagi: Sekolah Matematik Universiti mempunyai beberapa pengajaran mudah (dan video), yang saya percaya sangat sesuai untuk pemula Anda boleh mulakan dari artikel ini: Apa itu perangkak web

Kemudian datang Tutorial pengenalan:

  1. Malah, terdapat kaedah yang sangat mudah. ​​Hanya pilih alat perangkak untuk membaca dokumen tersebut. Jika anda tiada arah, anda boleh memilih untuk membaca dokumen Beautiful Soup Chinese terlalu rumit, anda akan mengambil sedikit masa untuk membaca semuanya.

  2. Sebentar tadi, Sekolah Matematik Universiti mempunyai beberapa siri pengajaran pengenalan dan pengajaran praktikal, saya fikir ia patut dijadikan rujukan

    1. Mula menggunakan Python untuk menulis perangkak web (Perangkak)

    2. Cara memasang Jupyter (Buku Nota Ipython)

    3. Pengenalan kepada operasi Jupyter (1)

    4. Bagaimana cara menggunakan GET untuk merangkak kandungan web

    5. Bagaimana untuk menggunakan POST untuk merangkak kandungan web?

    6. Bagaimana untuk menggunakan suite Python: BeautifulSoup4 untuk menganalisis kandungan web

      ?
    7. Bagaimana untuk menggunakan permintaan Python dan BeautifulSoup4 untuk melengkapkan perangkak Taobao

Langkah seterusnya ialah memahami

alat dan rangka kerja perangkak:

  1. Tempat ini sangat lengkap: Senarai alat perangkak Python dengan pautan muat turun kod Github

  2. Blog ini juga mempunyai banyak kandungan pengajaran

Untuk perbincangan tentang alatan dan rangka kerja perangkak, sila rujuk artikel Zhihu ini: Apabila menulis perangkak dalam Python, kaedah dan rangka kerja manakah yang lebih baik?


Saya rasa terdapat banyak sumber di Internet, anda boleh mencuba semuanya, semuanya sukar pada mulanya, ayuh!

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan