python3爬虫初探(一)之urllib.request
生活随笔
收集整理的這篇文章主要介紹了
python3爬虫初探(一)之urllib.request
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
#----第一把武器-----urllib.request---------
urllib.request是python3自帶的庫(python3.x版本特有),我們用它來請求網頁,并獲取網頁源碼。話不多說,上代碼。
import urllib.request #調入要使用的庫url = 'http://www.baidu.com' data = urllib.request.urlopen(url) #urlopen用來打開一個網頁 data = data.read() #這里的rend()是必須的,否則不能打印源碼。 print(data) #在python3里面print是要加括號的 #b'<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/ #這是部分源碼,現在已經成功走出第一步了,之后就是解析網頁了。總結
以上是生活随笔為你收集整理的python3爬虫初探(一)之urllib.request的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 爬虫基于ADSL动态获取ip
- 下一篇: python3爬虫初探(二)之reque