Jsoup介绍||jsoup解析url || Jsoup解析字符串||Jsoup解析文件
生活随笔
收集整理的這篇文章主要介紹了
Jsoup介绍||jsoup解析url || Jsoup解析字符串||Jsoup解析文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Jsoup
抓取到頁面之后,還需要對頁面進行解析。可以使用字符串處理工具解析頁面,也可以使用正則表達式,但是這些方法都會帶來很大的開發(fā)成本,所以我們需要使用一款專門解析html頁面的技術。
jsoup介紹
jsoup 是一款Java 的HTML解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于jQuery的操作方法來取出和操作數據。
jsoup的主要功能如下:
1. 從一個URL,文件或字符串中解析HTML;
2. 使用DOM或CSS選擇器來查找、取出數據;
3. 可操作HTML元素、屬性、文本;
先加入Jsoup依賴:
<!--Jsoup--> <dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.10.3</version> </dependency> <!--測試--> <dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.12</version> </dependency> <!--工具--> <dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.7</version> </dependency> <dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version> </dependency>?
jsoup解析url——Jsoup可以直接輸入url,它會發(fā)起請求并獲取數據,封裝為Document對象
PS:雖然使用Jsoup可以替代HttpClient直接發(fā)起請求解析數據,但是往往不會這樣用,因為實際的開發(fā)過程中,需要使用到多線程,連接池,代理等等方式,而jsoup對這些的支持并不是很好,所以我們一般把jsoup僅僅作為Html解析工具使用
Jsoup解析字符串
???????Jsoup解析文件
???????
總結
以上是生活随笔為你收集整理的Jsoup介绍||jsoup解析url || Jsoup解析字符串||Jsoup解析文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HttpClient的连接池||Http
- 下一篇: 使用dom方