python抓取qq群消息,python 爬取qq群员信息
流程:
打開qq群高級管理網頁
將所有表格數據刷新出來
保存網頁,存儲的網頁訪問地址:http://qq.site.com/
執行腳本即可
# coding: utf-8
"""
獲取QQ群員信息
獲取的集合順序說明:
1 ID
2 昵稱
3 群昵稱
4 QQ號
5 性別
6 Q齡
7 入群時間
8 等級(積分)
9 最后發言
流程:
打開qq群高級管理網頁
將所有表格數據刷新出來
保存網頁,存儲的網頁訪問地址:http://qq.site.com/
執行腳本即可
"""
import os
import re
import json
from bs4 import BeautifulSoup
import datetime
import requests as req
# 獲取網頁以及網頁主體信息
content = req.get('http://qq.site.com/')
soup = BeautifulSoup(content.content, "html.parser")
table = soup.find("table", {'id': 'groupMember'})
tb_list = table.find_all("tbody", {'class': 'list'})
# 提取字符
def get_string(info):
info = info.strip()
return info
# 提取number
def get_number(info):
info = re.findall(r'\d+', str(info), re.I)[0]
return info
# 提取日期 2016/10/27 -> 2016-10-27
def get_date(info):
info = info.replace("/", "-")
return info
data = []
for item in tb_list:
tr_mb = item.find_all("tr", {'class': 'mb'})
for tr in tr_mb:
td = tr.find_all("td")
data.append({
'nickname': get_string(td[2].get_text()),
'group_nickname': get_string(td[3].get_text()),
'qq_number': get_string(td[4].get_text()),
'sex': get_string(td[5].get_text()),
'qq_age': get_number(td[6].get_text()),
'in_time': get_date(get_string(td[7].get_text())),
'integral': get_number(td[8].get_text()),
})
break
print(data)
其他方法:
直接在高級管理,審查元素,network中獲取api接口返回數據。以上純屬學習。
總結
以上是生活随笔為你收集整理的python抓取qq群消息,python 爬取qq群员信息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python task done_pyt
- 下一篇: 算法 --- 快慢指针判断链表是否有环