Python爬虫学习(1)
生活随笔
收集整理的這篇文章主要介紹了
Python爬虫学习(1)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
使用Python爬取網頁中html內容
# coding=utf-8
import urllib
import urllib2
import re
url = "http://3ms.huawei.com/km/blogs/details/5171043"
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html命令詳解:
urlopen()可以接收三個參數即urlopen(url, data, timeout)?
url即你要請求的url地址,data是訪問這個url需要傳送的數據,timeout是超時時間?
url是必填參數,其余兩個是可選參數?
urllib.request.urlopen(url)會返回一個http.client.HTTPResponse對象?
這個返回的對象可以使用read()方法,來返回數據
url即你要請求的url地址,data是訪問這個url需要傳送的數據,timeout是超時時間?
url是必填參數,其余兩個是可選參數?
urllib.request.urlopen(url)會返回一個http.client.HTTPResponse對象?
這個返回的對象可以使用read()方法,來返回數據
總結
以上是生活随笔為你收集整理的Python爬虫学习(1)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python中文问题 或 SyntaxE
- 下一篇: auto_ptr使用总结