python练习册 每天一个小程序 第0009题
生活随笔
收集整理的這篇文章主要介紹了
python练习册 每天一个小程序 第0009题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1 '''
2 題目描述:
3 找出一個html文件中所有的url
4
5 思路 :
6 利用正則表達式進行匹配
7
8 '''
9
10
11 import re
12
13
14 with open('test.txt') as fp:
15 text = fp.read()
16 pattern = re.compile(
17 "((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9\&%_\./-~-]*)?", re.DOTALL)
18 urls = pattern.findall(text)
19 for i in urls:
20 full_url = ''
21 for url in i:
22 full_url += url
23
24 print full_url
?
轉載于:https://www.cnblogs.com/deen-/p/7184045.html
總結
以上是生活随笔為你收集整理的python练习册 每天一个小程序 第0009题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 测试build出来的dist文件夹是否编
- 下一篇: HDU 2564 饭卡