close

Python 爬蟲練習紀錄(一)

 

最後會再重新整理此系列文章

所有爬行練習僅做為學術用途

若無意間侵犯到您的權益

請告知我會立即停止於該網站的爬蟲練習

 

 

練習方式:

練習用對象網站: urcosme

練習目標:爬行該網站,並將獲得的資料存入線上mysql資料庫

 

主程式:

列出選單來選擇各分類來爬行

進入選單後,使用者輸入要爬行的文章數量

超過一定的文章數量程式需能翻頁繼續尋找

 

 

副程式:

1.爬出該頁面內的標籤

2.爬出該頁面主圖片

3.爬出該頁面文章內容

4.爬出該頁面文章中圖片

 

arrow
arrow
    全站熱搜

    ivankao 發表在 痞客邦 留言(0) 人氣()