querylist.php下载,PHP 强大的采集工具,QueryList
# QueryList簡介
***
`QueryList`是一個基于`phpQuery`的通用列表采集類,是一個簡單、 靈活、強大的采集工具,采集任何復雜的頁面 ? ? 基本上就一句話就能搞定了。
# QueryList 安裝
通過`composer`安裝:
```
composer require jaeger/querylist
```
更多安裝方法:[QueryList多種安裝方式](https://doc.querylist.cc/site/index/doc/7)
# QueryList 使用
下面演示`QueryList`用一句代碼采集百度搜索結果:
```php
//獲取采集對象
$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array(
'title'=>array('h3','text'),
'link'=>array('h3>a','href')
));
//輸出結果:二維關聯數組
print_r($hj->data);
```
上面的代碼實現的功能是采集百度搜索結果頁面的所有搜索結果的`標題`和`鏈接`,然后分別以二維關聯數組的格式輸出。
采集結果:
```
Array
(
[0] => Array
(
[title] => QueryList|基于phpQuery的無比強大的PHP采集工具
[link] => http://www.baidu.com/link?url=IIsMhpzI2PylnmW8vPALcwIfJgHhKFu2SWXEj7yQ-6o7KStbLfmuoWGmalpx1xYE
)
[1] => Array
(
[title] => 介紹- QueryList指導文檔
[link] => http://www.baidu.com/link?url=edktLqt6f9KwYJ6oip1EDXvwIXh-nHcFImVJeqRm56-VU3zIcqLRYeM83VyYQE_X
)
//省略....
)
```
## Query() 靜態方法
返回值:`QueryList對象`
Query方法為`QueryList`唯一的主方法,用靜態的方式調用。
**原型:**
> QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)
**中文解釋:**
```
QueryList::Query(采集的目標頁面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
//采集規則
$rules = array(
'規則名' => array('jQuery選擇器','要采集的屬性'[,"標簽過濾列表"][,"回調函數"]),
'規則名2' => array('jQuery選擇器','要采集的屬性'[,"標簽過濾列表"][,"回調函數"]),
..........
[,"callback"=>"全局回調函數"]
);
//注:方括號括起來的參數可選
```
### 參數解釋:
查看文檔:http://doc.querylist.cc/site/index/doc/11
## QueryList 擴展
**Request 網絡操作擴展**
可以實現如攜帶cookie、偽造來路等任意復雜的網絡請求,再也不用擔心QueryList內置的抓取功能太弱了。
**Login 模擬登陸擴展**
可以實現模擬登陸然后采集。
**Multi 多線程插件**
多線程(多進程)采集擴展。
**DImage圖片下載擴展**
可實現簡單的圖片下載需求。
擴展安裝以及使用教程:[QueryList擴展文檔](https://doc.querylist.cc/site/index/doc/19),獲取更多擴展可以關注`QueryList`社區和交流群。
## 其它說明
1.`QueryList`內置的只是簡單的源碼抓取方法,遇到更復雜的抓取情況,如:需要登陸
身份驗證 時,請配合其它的PHP的HTTP工具(推薦使用[Guzzle](http://guzzle-cn.readthedocs.io/zh_CN/latest/))來使用,通過將輔助的HTTP類抓取到的網頁源碼傳給`QueryList`即可。
2.采集程序請在PHP命令行模式(PHP CLI)下運行。
3.`QueryList`依賴`phpQuery`,`phpQuery`項目主頁:[phpQuery文檔](https://code.google.com/p/phpquery/)
## 尋求幫助?
- QueryList交流社區: [http://querylist.cc/](http://querylist.cc/)
- QueryList文檔: [http://doc.querylist.cc/](http://doc.querylist.cc/)
- QueryList交流QQ群:123266961
- Git@OSC:http://git.oschina.net/jae/QueryList
- GitHub:https://github.com/jae-jae/QueryList
## Author
Jaeger
## Lisence
QueryList is licensed under the license of MIT. See the LICENSE for more details.
總結
以上是生活随笔為你收集整理的querylist.php下载,PHP 强大的采集工具,QueryList的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 产品经理入门教程01—— 需求调研和需求
- 下一篇: td 首行缩进_Simditor编辑器,