使用Python對貼圖網站進行爬蟲,

使用 BeautifulSoup、requests與os套件,

把特定系列的貼圖url彙整成一檔案。

產生一個名為first_sticker_url.txt的檔案,如下:

stickers.PNG

 

對貼圖網站進行爬蟲,點入某系列貼圖的網址,網頁呈現如下:

pre_stickers.PNG

 

程式碼第25行為檔案的操作,其方法有兩種表示,

  • 第一種為:

stickers3_m1.PNG

  • 第二種為:

stickers3.PNG

此兩種方法最大的差別為第二種會自動關閉檔案

但如果還是想確認檔案是否真的關閉了,

可以在處理完成後加入 file.closed,執行後會傳回 True。

而當使用第一種時,必需在處理完成後加入file.close()

 

第31行印出,也就是產生的first_sticker_url.txt檔案存在哪裡囉~

stickers2.PNG

程式碼

 

  • 參考了PyCon Taiwan的教學影片:

https://www.youtube.com/watch?v=mQ7cgzhTiiY

  • 以及Python的Documentation之(7. Input and Output-7.2.1):

https://docs.python.org/3/tutorial/inputoutput.html


請不吝指教 =)

arrow
arrow
    文章標籤
    python crawler
    全站熱搜

    Jialin 發表在 痞客邦 留言(0) 人氣()