W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
spider是定義一個特定站點(或一組站點)如何被抓取的類,包括如何執(zhí)行抓取(即跟蹤鏈接)以及如何從頁面中提取結(jié)構(gòu)化數(shù)據(jù)(即抓取項)。換言之,spider是為特定站點(或者在某些情況下,一組站點)定義爬行和解析頁面的自定義行為的地方。
對于蜘蛛來說,抓取周期是這樣的:
盡管這個循環(huán)(或多或少)適用于任何類型的蜘蛛,但是為了不同的目的,有不同類型的默認(rèn)蜘蛛被捆綁成 Scrapy 。我們將在這里討論這些類型。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: