Python 專案開發入門的十堂課
第九堂 利用 Python 開發各種項目:網路爬蟲程式庫
BeautifulSoup4
重點整理
開發網路爬蟲有一些注意事項,例如查看該網站的條款及規則、避免過於頻繁地抓取資料及定時重新拜訪等等。
進行網路爬蟲如果是 HTTPS 網站要先設定 SSL ,然後取得網頁物件,再用
BeautifulSoup
物件進行資料處理。
相關文章
Python 入門指南 - 單元 28 - 認識第三方程式庫與 Django
上一支影片 - PyPI 及基本安裝指令
回 Python 專案開發入門的十堂課 - 目錄
下一支影片 - 資料科學程式庫
Pandas
、
NumPy
及
Matplotlib
回 Python 教材
回程式語言教材首頁