优雅的PHP采集框架QueryList
生活随笔
收集整理的這篇文章主要介紹了
优雅的PHP采集框架QueryList
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
基本介紹:
QueryList是一套用于內容DOM解析的PHP工具,它使用更加現代化的開發思想,語法簡潔、優雅,可擴展性強。相比傳統的使用晦澀的正則表達式來做DOM解析,QueryList使用了更加強大而優雅的CSS選擇器來做DOM解析,大大降低了PHP做DOM解析的門檻,同時也讓DOM解析代碼易讀易維護,讓你從此告別晦澀難懂且不易維護的正則表達式😀。
傻瓜教程:
1:安裝
這里用的是v4最新版,php要求大于7.1,我是在tp里面安裝的,安裝也非常簡單,在終端執行如下一行代碼就可以
composer require jaeger/querylist2:引用
在index控制器里面引用這個
use QL\QueryList;3:確定采集地址
如歷史上的今天,百度一搜索就有,地址是https://www.baidu.com/s?wd=歷史上的今天
4:確定頁面采集目標
打開采集地址,按F12,點擊下圖的小箭頭或者ctrl+shift+c,選中要采集的內容。
可以看到:
要采集的東西就是一堆class=card_ZQsT-的<a>標簽的合集;
img標簽的src地址就是頭像地址;
class="year-tag_3Iqeg" 里面內容為年份信息;
class="title_3qCGt" 里面包含的是事件信息;
?5:設置采集規則進行采集
public function index() {$api = "https://www.baidu.com/s?wd=歷史上的今天";$rules = ["content" => [".title_3qCGt","text"],"year" => [".year-tag_3Iqeg","text"],"img" => ["img","src"],];$range = '.card_ZQsT-';$data = QueryList::get($api)->rules($rules)->range($range)->queryData();echo(json_encode($data));die; }6:采集結果
?歷史今天采集就此完成,當然,采集可能會遇到各種各樣的問題,官方文檔地址:http://www.querylist.cc/docs/guide/v4
總結
以上是生活随笔為你收集整理的优雅的PHP采集框架QueryList的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于OpenCV3的鱼眼摄像头的标定
- 下一篇: 半自动化给PDF加书签-Python实现