python - Tolong beritahu saya cara merangkak Jianshu untuk menghantar dalam tempoh masa tertentu.
黄舟
黄舟 2017-05-18 10:55:49
0
1
715

Saya mahu merangkak siaran Jianshu dalam tempoh masa tertentu, seperti 13 April 2013 - 13 Mei 2013

Idea yang ingin saya cuba adalah seperti berikut:

  • Baidu

    • Menggunakan sintaks tapak Baidu

    • Tarikh terhad

    • Perhatikan kira-kira 70 siaran

  • Google

    • sintaks tapak google

    • Tarikh terhad

    • Perhatikan kira-kira 120 siaran

Pelaksanaan: Gunakan Python untuk meminta terus hasil carian, kemudian ubah hala URL yang diperoleh untuk mendapatkan URL buku pendek sebenar, dan kemudian minta URL sebenar

Soalan

  1. Adakah keputusan yang diperoleh menggunakan kaedah ini boleh dipercayai? Adakah terdapat kaedah yang lebih dipercayai?

  2. Perlukah saya menggunakan Google atau Baidu?

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

membalas semua(1)
过去多啦不再A梦

Untuk menjadi komprehensif, anda boleh menggunakan semua antara muka enjin carian arus perdana dan anda tidak perlu dihadkan kepada antara muka enjin carian tertentu. Beginilah cara sesetengah rakan sepasukan kami mencari topik tertentu, kerana sesetengah laman web tidak menyediakan kaedah carian yang memenuhi keperluan Pada masa ini, kami hanya boleh menggunakan enjin carian. Walau bagaimanapun, maklumat yang dicari melalui enjin carian mungkin tidak menyeluruh Perjanjian robot menetapkan bahawa jika anda tidak boleh mencari, enjin carian tidak akan memasukkannya

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan