php解析html类库simple_html_dom
生活随笔
收集整理的這篇文章主要介紹了
php解析html类库simple_html_dom
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本文介紹simple_html_dom,就是用來處理網頁,可以寫爬蟲抓取信息;
背景:在項目中獲得一個很長的html標簽的長字符串,需要解析到里面所有的標簽的的src地址;
用正則匹配來做比較麻煩,在朋友的推薦下使用simple_html_dom非常方便,
這個組件不光可以解析字符串,也可以直接傳入文件地址和網頁url;
下面舉例:
<?php $content = '';//html內容// header("Content-type: text/html; charset=utf-8"); include('simple_html_dom.php'); $html = new simple_html_dom(); $html->load($content); $img = $html->find('img'); foreach ($img as $value) { $src[] = $value->getAttribute('data-src'); //獲取自定義屬性要用getAttribute,否則無法取到 } echo "<pre>"; var_dump($src); echo "</pre>"; 復制代碼首先要引入simple_html_dom庫。git地址:github.com/samacs/simp…
參照git里面的例子使用
中文文檔:microphp.us/plugins/pub…
總結
以上是生活随笔為你收集整理的php解析html类库simple_html_dom的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 企业建设什么样的网站才能符合用户?
- 下一篇: Java socket调用Http协议G