Python + Selenium 练习篇 - 获取页面所有邮箱
生活随笔
收集整理的這篇文章主要介紹了
Python + Selenium 练习篇 - 获取页面所有邮箱
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
代碼如下:
# coding=utf-8
import re??? #python中利用正則,需要導入re模塊
from selenium import webdriver
driver = webdriver.Chrome()
driver.maximize_window()
url = ("http://home.baidu.com/contact.html")
driver.get(url)
doc = driver.page_source?? #獲得頁面源代碼
emails = re.findall(r'[\w]+@[\w\.-]+',doc) #正則表達式,找出xxx@xxx.xxx的字段并保存
for email in emails:??? #循環打印匹配的郵箱
??? print (email)?
注意:在python正則表達式語法中,python中字符串前面加上r表示原生字符串,用\w表示匹配字母數字及下劃線。re模塊下findall方法返回的是一個匹配子字符串的列表
轉載于:https://www.cnblogs.com/AmyHu/p/8821255.html
總結
以上是生活随笔為你收集整理的Python + Selenium 练习篇 - 获取页面所有邮箱的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ZooKeeper架构设计及其应用要点
- 下一篇: 控件自定义和QQ皮肤