分享用Python的beautifulsoup4來抓取大樂透表格資料
相關課程:ChatGPT輔助EXCEL VBA網路爬蟲與圖表繪製班
https://ojt.wda.gov.tw/ClassSearch/Detail?OCID=157308&plantype=1
這篇分享文,主要可以和 [分享QueryTables物件改用IE物件來抓取大樂透表格資料]比較,
一個是用EXCEL VBA的IE物件,一個是用Python的beautifulsoup4來擷取資料,
兩相比對,沒有各有所長,但若是存為EXCEL,那當然直接用VBA是最直接,
但若是便利性和後續程式擴充的支援,當然還是Python較有優勢。
今天主要是學習利用beautifulsoup的find與find_all方法,以解析HTML的標籤與class,
find是取一個或第一個標籤資料,取得的資料型態為文字,
而find_all方法,是取得多個標籤資料,資料型態為串列型態。
練習下載大樂特歷史資料,先找到table標籤,
再取得tr與td標籤,很快地就可以取得所有資料,
其他的就是去除換行與空白,可以用replace方法即可解決問題。
範例一:大樂特歷史資料下載
網址:https://www.lotto-8.com/listltobigbbk.asp?indexpage=1&orderby=new
**可先藉由 html-online分析
https://html-online.com/editor/
完整程式碼:
import requests
from bs4 import BeautifulSoup
url = "https://www.lotto-8.com/listltobigbbk.asp?indexpage=1&orderby=new"
html = requests.get(url)
html.encoding="utf-8"
sp = BeautifulSoup(html.text, "html.parser")
tbl = sp.find("table","auto-style4")
list_tr = tbl.find_all("tr")
for i in range(len(list_tr)):
list_td=list_tr[i].find_all("td")
print(list_td[0].text+","+list_td[1].text.replace("\xa0","")+","+list_td[2].text)
**日期改為標準格式 年/月/日
list_td[i].text[0:4]+"/"+list_td[i].text[4:9]
將下載資料存成EXCEL
import requests
from openpyxl import Workbook
wb = Workbook()
sheet = wb.active
from bs4 import BeautifulSoup
url = "https://www.lotto-8.com/listltobigbbk.asp?indexpage=1&orderby=new"
html = requests.get(url)
html.encoding="utf-8"
sp = BeautifulSoup(html.text, "html.parser")
tbl=sp.find("table","auto-style4")
# print(tbl.text)
list_tr=tbl.find_all("tr")
for i in range(0,len(list_tr)):
list_td=list_tr[i].find_all("td")
S=list_td[0].text+","+list_td[1].text.replace("\xa0","")+","+list_td[2].text
list1=S.split(",")
print(list1)
sheet.append(list1)
wb.save("E:\\大樂透.xlsx")
開課資訊公布在FB或是部落格:
https://www.facebook.com/scuexcelvba/
教學論壇(之後課程會放論壇上課學員請自行加入):
https://groups.google.com/g/tcfst_python_2024
課程簡介:
單元01_建置Python開發環境與程式測試
單元02_基本語法與結構控制件
單元03_迴圈資料結構與自訂函數
單元04_串列、字典與檔案與資料庫處理
單元05-1_ChatGPT+Excel自動化程式設計基礎
單元05-2_ChatGPT+Python自動化程式設計基礎
單元05-3_ChatGPT協助撰寫Excel與Python程式
單元05-4_開放資料處理CSV和JSON資料處理
單元05-5_Python網頁資料擷取基礎
單元05-6_網頁資料擷取台彩與股市資料
單元06_使用Pandas與處理_Excel_試算表
單元07_用Python操作Excel儲存格、欄列與工作表
單元08_用Python操作Excel樞紐分析表與折線圖表
吳老師 113/5/24
懶人包: EXCEL函數與VBA http://terry28853669.pixnet.net/blog/category/list/1384521 EXCEL VBA自動化教學 http://terry28853669.pixnet.net/blog/category/list/1384524 |
其他相關學習:
- EXCEL VBA網路爬取大樂透歷史資料(20191129)
- 用EXCEL VBA快速將大量的EXCEL檔轉為PDF檔
- 範例_字串切割與Do_While迴圈不定數量結果
- 直接用VBA取得儲存格中的數字或英文資料
- 20190916VBA進階班開課訊息
- EXCEL下拉清單用VBA自動查詢與顯示不同資料
- 最新的完整VBA與Python教學影音DVD分享
- 讓EXCEL VBA具有進度狀態條功能(表單設計)
- EXCEL當資料庫VLOOKUP與TEXT函數做飯店管理
- 從VBA到Pyhton用懶人包快速建立開發環境分享
- 利用LARGE與SAMLL函數計算前後三名工資與轉VBA
- SUMIF函數計算苗栗和宜蘭總人數與用VBA累加
- 從EXCEL VBA到建立Python開發
- 學員想學VBA到Python入門卻苦無名額因此整理上課影音講義分享
- EXCEL VBA進階範例尋找與判斷負0到9的值
- 使用VBA製作銷貨訂購單與儲存資料(EXCEL當資料庫)
- EXCEL太複雜工作還是交給VBA吧!範例班級成績查詢
- EXCEL快速資料分欄用INDEX函數與VBA
- EXCEL匯出資料到MYSQL與PHP、Phthon、R、APP共用資料
- 從VBA到建立Python開發懶人包分享
- EXCEL VBA表單設計成績輸入將EXCEL當資料庫
- INDEX與INDIRECT函數將單欄資料轉為三欄與VBA
- 從計算數字個數到留下數字或英文或中文自訂函數
- EXCEL VBA用XMLHTTP物件抓取外匯資料
- 勞工大學選課日,不到一小時,就快額滿
- 如何在EXCEL中自訂函數與用增益集分享VBA自訂函數
- EXCEL VBA批次查詢清單到新增與刪除工作表
- EXCEL2013版VBA如何快速建立查詢系統
- EXCEL VBA改用MYSQL當成資料庫存放大量資料
- EXCEL VBA自動化與自動繪製表格框線(樣式顏色粗細)
- VBA處理大數據如何自訂留下數字函數
- VBA處理大數據政府開放與快速做出查詢系統
- 如何將大量EMAIL自動串接與用OUTLOOK自動批次寄信
- 如何用VLOOKUP函數做飯店管理分享
- 東吳進修廣部88期的EXCEL VBA課又額滿了
- 如何計算年齡並格式化與用VLOOKUP查詢時數
- 如何在EXCEL VBA中快速刪除空白列
- EXCEL VBA大數據自動化設計上課心得分享
- 如何用EXCEL統計樂透彩中獎機率範例
- 如何用COUNTIF函數篩選黑名單(無須撰寫VBA)
- 如何將EXCEL公式改直接貼上修改為VBA
- 如何用EXCEL VBA設計銷貨單將EXCEL當資料庫
- 如何撰寫自動日期格式化的VBA程式
- 如何增加EXCEL VBA按鈕(86)
- 如何用VBA搜尋關鍵字後上色與複製到新工作表
- 如何用VBA搜尋關鍵字後上色與複製到新工作表
- EXCEL函數與VBA設計第6次上課(證照106與110)
- 如何增加EXCEL VBA按鈕
- 如何利用日期函數製作年曆VBA範例
- 如何用EXCEL VBA設計銷貨單分享
- 如何學會欄列鎖定技巧與VBA設計之二(範例:大型試算表)
- 如何學會欄列鎖定技巧與VBA設計之一(範例:大型試算表)
- 從EXCEL函數到VBA自動化(函數應用大升級)
- 如何將檢視與參照函數函數轉EXCEL VBA設計
- 提高工作效率_黑名單篩選範例分享
- 北市公訓處EXCEL函數進階班第1天上課
- 公訓處EXCEL進階課程分享
- 如何用VBA呼叫Outlook郵寄信件
- 如何顯示進度狀態列(ProgressBar)
- 提高效率VBA入門班第1次上課心得分享
- EXCEL VBA處理股票分析自動最佳化範例
- 如何在EXCEL VBA中快速刪除空白列
- 定存範例轉VBA與只能輸入數字的InputBox
- 如何增加EXCEL VBA下拉選單與SQL查詢之01_如何增加下拉清單
- 如何學會EXCEL VBA錄製與修改巨集系列之一
- EXCEL VBA入門:如何撰寫自動格式化的VBA程式(以日期格式為範例)
- EXCEL VBA入門之一:如何函數轉VBA(自強EXCEL函數與VBA設計)
- 如何當下拉清單改變時自動抓取資料之一
- 東吳EXCEL VBA 與資料庫雲端設計第1次上課(2014)
- 如何自動刪除相同名稱的工作表
- EXCEL函數與VBA進階班總整理
- 如何增加EXCEL VBA按鈕
- 如何將EXCEL函數轉成VBA
- 如何在VBA中建立EXCEL的自訂函數讓公式變簡單
- 如何利用VLOOKUP函數與MID函數取得資料
- 如何用EXCEL VBA設計銷貨單分享--從EXCEL函數到VBA雲端自動化(2014)
- 如何用EXCEL VBA設計年曆範例分享--從EXCEL函數到VBA雲端自動化(2014)
- 如何將數學函數轉EXCEL VBA設計之一(東吳EXCEL VBA與資料庫雲端設計)
- 如何將檢視與參照函數函數轉EXCEL VBA設計(東吳EXCEL VBA與資料庫雲端設計)
- 從EXCEL函數到VBA雲端自動化(2014)第2次上課
- 從EXCEL函數到VBA雲端自動化(2014)第1次上課
- 如何將日期函數轉EXCEL VBA設計(東吳EXCEL VBA與資料庫雲端設計)
- 如何學會欄列鎖定技巧與VBA設計之一(範例:大型試算表)
- 如何學會字串處理與VBA設計之一
- 如何將數學函數轉EXCEL VBA設計之二(東吳EXCEL VBA與資料庫雲端設計)
- 如何設計VBA表單與EXCEL當資料庫用(85期)
- 提高效率VBA入門班第1次上課心得分享
- EXCEL VBA處理股票分析自動最佳化範例
- 如何在EXCEL VBA中快速刪除空白列
- 定存範例轉VBA與只能輸入數字的InputBox
- 如何學會EXCEL VBA資料庫系列之一
- EXCEL VBA入門:如何撰寫自動格式化的VBA程式
- EXCEL VBA入門之一:如何函數轉VBA
- 回覆Excel VBA入門與進階課的差異?
- 如何批次下載股市資料到EXCEL中之2
- 如何用VBA快速取得期貨交易資料(開收高低量)
- 如何在EXCEL VBA隱藏與顯示工作表
- 如何移動工作表與排序之1
- 如何批次下載股市資料到EXCEL中之1
- 如何批次下載股市資料到EXCEL中
- 如何建立表單與將EXCEL當成資料庫
- 如何讓用ACCESS將EXCEL的資料
- 如何排序工作表
- 如何將單次查詢改為批次查詢(EXCEL VBA自動化)
- 如何在EXCEL VBA的工作表隨機上顏色
- 如何快速在EXCEL中建立查詢系統(免資料庫)之2
- 如何精簡VBA程式與傳遞引數
- 如何快速在EXCEL中建立查詢系統(免資料庫)之1
- 如何將大量工作表整合在一個工作表
- 如何在EXCEL VBA新增沒有重複名稱工作表
- 如何自動下載YAHOO股市資料到EXCEL中
- 如何建立表單與將EXCEL當成資料庫使用
- 如何在EXCE VBA中複製工作表
- 如何在EXCEL VBA如何保護工作表
- 如何在EXCEL VBA新增沒有重複名稱工作表
- 如何在EXCEL工作表中移動
- EXCEL VBA辦公自動化_如何建立查詢系統
- 如何當下拉清單改變時自動抓取資料之一
- 如何將數學函數轉EXCEL VBA設計之二
- 如何增加EXCEL VBA按鈕
- 如何設定EXCEL VBA開發環境設定說明
- 如何將EXCEL函數轉成VBA
- 如何再VBA中建立EXCEL的自訂函數讓公式變簡單
- VBA處理大數據政府開放與快速做出查詢系統
- 如何將大量EMAIL自動串接與用OUTLOOK自動批次寄信
- 如何用VLOOKUP函數做飯店管理分享
- 東吳進修廣部88期的EXCEL VBA課又額滿了
- 如何計算年齡並格式化與用VLOOKUP查詢時數
- 如何在EXCEL VBA中快速刪除空白列
- EXCEL VBA大數據自動化設計上課心得分享
- 如何用EXCEL統計樂透彩中獎機率範例
- 如何用COUNTIF函數篩選黑名單(無須撰寫VBA)
- 如何將EXCEL公式改直接貼上修改為VBA
- 如何用EXCEL VBA設計銷貨單將EXCEL當資料庫
- 如何撰寫自動日期格式化的VBA程式
- 如何增加EXCEL VBA按鈕(86)
- 如何用VBA搜尋關鍵字後上色與複製到新工作表
- 如何用VBA搜尋關鍵字後上色與複製到新工作表
- EXCEL函數與VBA設計第6次上課(證照106與110)
- 如何增加EXCEL VBA按鈕
- 如何利用日期函數製作年曆VBA範例
- 如何用EXCEL VBA設計銷貨單分享
- 如何學會欄列鎖定技巧與VBA設計之二(範例:大型試算表)
- 如何學會欄列鎖定技巧與VBA設計之一(範例:大型試算表)
- 從EXCEL函數到VBA自動化(函數應用大升級)
- 如何將檢視與參照函數函數轉EXCEL VBA設計
- 提高工作效率_黑名單篩選範例分享
- 北市公訓處EXCEL函數進階班第1天上課
- 公訓處EXCEL進階課程分享
- 如何用VBA呼叫Outlook郵寄信件
- 如何顯示進度狀態列(ProgressBar)
- 如何批次下載股市資料到EXCEL中
- 如何建立表單與將EXCEL當成資料庫
- 如何讓用ACCESS將EXCEL的資料
- 如何排序工作表
- 如何將單次查詢改為批次查詢(EXCEL VBA自動化)
- 如何在EXCEL VBA的工作表隨機上顏色
- 如何快速在EXCEL中建立查詢系統(免資料庫)之2
- 如何精簡VBA程式與傳遞引數
- 如何快速在EXCEL中建立查詢系統(免資料庫)之1
- 如何將大量工作表整合在一個工作表
- 如何在EXCEL VBA新增沒有重複名稱工作表
- 如何自動下載YAHOO股市資料到EXCEL中
- 如何建立表單與將EXCEL當成資料庫使用
- 如何在EXCE VBA中複製工作表
- 如何在EXCEL VBA如何保護工作表
- 如何在EXCEL VBA新增沒有重複名稱工作表
- 如何在EXCEL工作表中移動
- EXCEL VBA辦公自動化_如何建立查詢系統
ChatGPT,EXCEL,VBA,Python,自強工業基金會,EXCEL,VBA,函數,程式設計,線上教學,PYTHON安裝環境
沒有留言:
張貼留言