jsoup 标准化html代码,Jsoup从元素抽取属性,文本和HTML
在解析獲得一個Document實例對象,并查找到一些元素之后,你希望取得在這些元素中的數據。要取得一個屬性的值,可以使用Node.attr(String key) 方法
對于一個元素中的文本,可以使用Element.text()方法
對于要取得元素或屬性中的HTML內容,可以使用Element.html(), 或 Node.outerHtml()方法
示例:String?html?=?"
An?example?link.
";Document?doc?=?Jsoup.parse(html);//解析HTML字符串返回一個Document實現
Element?link?=?doc.select("a").first();//查找第一個a元素
String?text?=?doc.body().text();?//?"An?example?link"//取得字符串中的文本
String?linkHref?=?link.attr("href");?//?"http://example.com/"//取得鏈接地址
String?linkText?=?link.text();?//?"example""//取得鏈接地址中的文本
String?linkOuterH?=?link.outerHtml();
//?"example"
String?linkInnerH?=?link.html();?//?"example"//取得鏈接內的html內容
上述方法是元素數據訪問的核心辦法。此外還其它一些方法可以使用:
這些訪問器方法都有相應的setter方法來更改數據。
參考資料:
總結
以上是生活随笔為你收集整理的jsoup 标准化html代码,Jsoup从元素抽取属性,文本和HTML的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机应用计算题(88)10,计算机应用
- 下一篇: 职业技术学校计算机专业部教师,江安职校计