生活随笔
收集整理的這篇文章主要介紹了
Golang爬虫终极杀器——Chromedp让你成为二维码登陆终结者(教程)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Golang爬蟲終極殺器——Chromedp讓你成為二維碼登陸終結者(教程)
Github源碼 - chromedp文章項目Gitee源碼
1 Chromedp是什么
chromedp是一個更快、更簡單的Golang庫用于調用支持Chrome DevTools協議的瀏覽器,同時不需要額外的依賴(例如Selenium和PhantomJS)
Chrome和Golang都與Google有著相當密切的關系,而Chrome DevTools其實就是Chrome瀏覽器按下F12之后的控制終端
2 為什么不使用Selenium
對于Golang開發來說,使用chromedp更為便捷,因為它僅僅需要Chrome瀏覽器而并不需要依賴ChromeDriver,省去了依賴問題,有助于自動化的構建和多平臺架構的遷移
3 文章解決了什么需求
如何使用chromedp進行二維碼登陸如何將二維碼展示在無圖形化的終端上(makiuchi-d/gozxing解碼 skip2/ go-qrcode編碼)如何保存Cookies實現短時間免登陸
網站會更新,文章不保證更新,請務必學會舉一反三
4 如何使用chromedp進行二維碼登陸
4.1 安裝chromedp
下載并安裝Chrome瀏覽器創建Golang項目,開啟Go Module(在項目目錄下使用終端輸入go mod init)在項目目錄下使用終端輸入:go get -u github.com/chromedp/chromedp(如果有依賴問題請刪除-u)
4.2 嘗試打開網站(以金山文檔https://account.wps.cn/為例)
重新設置chromedp使用"有頭"的方式打開,以便于我們進行debug
func main(){ctx
, _ := chromedp
.NewExecAllocator(context
.Background(),append(chromedp
.DefaultExecAllocatorOptions
[:],chromedp
.Flag("headless", false),)...,)
}
創建chromedp上下文對象
func main(){...ctx
, _ = context
.WithTimeout(ctx
, 30*time
.Second
)ctx
, _ = chromedp
.NewContext(ctx
,chromedp
.WithLogf(log
.Printf
),)
}
執行自定義的任務
func main(){......if err
:= chromedp
.Run(ctx
, myTasks()); err
!= nil {log
.Fatal(err
)return}
}
至此程序的初始化過程已經完成,接下來就是任務——打開登陸頁面
func myTasks() chromedp
.Tasks
{return chromedp
.Tasks
{chromedp
.Navigate(loginURL
),}
}
運行一下程序,可以看到Chrome被打開,同時訪問了我們指定的網站
4.3 獲取二維碼(點擊過程)
需要點擊微信登陸按鈕,先找到按鈕的選擇器,右鍵按鈕并在菜單中點擊檢查,然后可以看到按鈕的元素
右鍵元素打開菜單找到copy下的copy selector,即獲取到選擇器
我們嘗試點擊微信登陸按鈕,發現還需要點擊一下確認,重復上述步驟獲取確認按鈕的選擇器
用代碼執行上述點擊步驟
func myTasks() chromedp
.Tasks
{return chromedp
.Tasks
{chromedp
.Navigate(loginURL
),chromedp
.Click(`#wechat > span:nth-child(2)`),chromedp
.Click(`#dialog > div.dialog-wrapper > div > div.dialog-footer > div.dialog-footer-ok`),}
}
運行程序即可直達二維碼展示界面
用同樣的方式,獲取二維碼圖片的選擇器
用代碼實現獲取二維碼,有兩點需要注意,第一是二維碼有加載過程,第二是二維碼是元素渲染,我們需要用截圖的方式獲取(也可以用js來獲取對應的href并下載,但是為了照顧小白,選擇最簡單的)
func myTasks() chromedp
.Tasks
{return chromedp
.Tasks
{.........getCode(),}
}func getCode() chromedp
.ActionFunc
{return func(ctx context
.Context
) (err
error) {var code
[]byteif err
= chromedp
.Screenshot(`#wximport`, &code
, chromedp
.ByID
).Do(ctx
); err
!= nil {return}if err
= ioutil
.WriteFile("code.png", code
, 0755); err
!= nil {return}return}
}
執行程序即可發現目錄下已經存儲了二維碼圖片文件,我們可以通過掃描此二維碼進行登陸,與瀏覽器上掃描為同一種效果
5. 如何將二維碼展示在無圖形化的終端上(與chromedp無關,屬于額外內容)
在上述步驟中,我們已經獲取了二維碼,接下來我們需要在終端顯示二維碼,首先是解碼,這里使用gozxing庫
func printQRCode(code
[]byte) (err
error) {img
, _, err
:= image
.Decode(bytes
.NewReader(code
))if err
!= nil {return}bmp
, err
:= gozxing
.NewBinaryBitmapFromImage(img
)if err
!= nil {return}res
, err
:= qrcode
.NewQRCodeReader().Decode(bmp
, nil)if err
!= nil {return}return
}
然后重新編碼來輸出二維碼到終端,這里使用go-qrcode庫
import ("github.com/makiuchi-d/gozxing""github.com/makiuchi-d/gozxing/qrcode"goQrcode
"github.com/skip2/go-qrcode"
)func printQRCode(code
[]byte) (err
error) {.........qr
, err
:= goQrcode
.New(res
.String(), goQrcode
.High
)if err
!= nil {return}fmt
.Println(qr
.ToSmallString(false))return
}
修改我們第二步的過程
func getCode() chromedp
.ActionFunc
{return func(ctx context
.Context
) (err
error) {......if err
= printQRCode(code
); err
!= nil {return err
}return}
}
運行程序即可查看效果
6. 如何保存Cookies實現短時間免登陸
在上述過程中,我們可以通過二維碼掃描登陸,網站會在登陸之后進行跳轉,跳轉后我們需要保存cookies來維持我們的登錄狀態,代碼實現如下
func saveCookies() chromedp
.ActionFunc
{return func(ctx context
.Context
) (err
error) {if err
= chromedp
.WaitVisible(`#app`, chromedp
.ByID
).Do(ctx
); err
!= nil {return}cookies
, err
:= network
.GetAllCookies().Do(ctx
)if err
!= nil {return}cookiesData
, err
:= network
.GetAllCookiesReturns
{Cookies
: cookies
}.MarshalJSON()if err
!= nil {return}if err
= ioutil
.WriteFile("cookies.tmp", cookiesData
, 0755); err
!= nil {return}return}
}
獲取到Cookies之后,我們需要在程序運行時將Cookies從臨時文件中加載到瀏覽器中
func loadCookies() chromedp
.ActionFunc
{return func(ctx context
.Context
) (err
error) {if _, _err
:= os
.Stat("cookies.tmp"); os
.IsNotExist(_err
) {return}cookiesData
, err
:= ioutil
.ReadFile("cookies.tmp")if err
!= nil {return}cookiesParams
:= network
.SetCookiesParams
{}if err
= cookiesParams
.UnmarshalJSON(cookiesData
); err
!= nil {return}return network
.SetCookies(cookiesParams
.Cookies
).Do(ctx
)}
}
通過上述兩步我們已經可以保持登陸狀態,然后我們需要檢查一下是否成功,這里調用瀏覽器執行js腳本獲取當前頁面的網址,判斷是否已經個人中心頁面,如果為真,則停止操作
func checkLoginStatus() chromedp
.ActionFunc
{return func(ctx context
.Context
) (err
error) {var url
stringif err
= chromedp
.Evaluate(`window.location.href`, &url
).Do(ctx
); err
!= nil {return}if strings
.Contains(url
, "https://account.wps.cn/usercenter/apps") {log
.Println("已經使用cookies登陸")chromedp
.Stop()}return}
}
最終重新設置我們的瀏覽器任務即可
func myTasks() chromedp
.Tasks
{return chromedp
.Tasks
{loadCookies(),...checkLoginStatus(),.........saveCookies(),}
}
我們使用已經登陸的cookies運行程序可以發現我們成功跳過登陸過程
總結
以上是生活随笔為你收集整理的Golang爬虫终极杀器——Chromedp让你成为二维码登陆终结者(教程)的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。