Python 專案開發入門的十堂課

第九堂 利用 Python 開發各種項目:網路爬蟲程式庫 BeautifulSoup4

重點整理

  1. 開發網路爬蟲有一些注意事項,例如查看該網站的條款及規則、避免過於頻繁地抓取資料及定時重新拜訪等等。
  2. 進行網路爬蟲如果是 HTTPS 網站要先設定 SSL ,然後取得網頁物件,再用 BeautifulSoup 物件進行資料處理。

相關文章

上一支影片 - PyPI 及基本安裝指令
回 Python 專案開發入門的十堂課 - 目錄
下一支影片 - 資料科學程式庫 PandasNumPyMatplotlib
回 Python 教材
回程式語言教材首頁