java利用htmlparser得到网页html内容
生活随笔
收集整理的這篇文章主要介紹了
java利用htmlparser得到网页html内容
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
java利用htmlparser得到網頁html內容,利用org.htmlparser.Parser包我們可以很輕松取到任何頁面的源代碼,方法如下:
?
/*** 返回網頁內容* * @param path* @return*/public static String getItemDesc() {String htmlStr = "";try {URL url = new URL("http://www.lingshij.com");URLConnection conn = url.openConnection();conn.setConnectTimeout(5000);conn.setReadTimeout(15000);Parser parser = new Parser();parser.setConnection(conn);parser.setEncoding("GBK");TextExtractingVisitor visitor = new TextExtractingVisitor();parser.visitAllNodesWith(visitor);htmlStr = visitor.getExtractedText();} catch (ParserException e) {e.printStackTrace();} catch (MalformedURLException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} catch (Exception e) {e.printStackTrace();}return htmlStr;}?
轉載于:https://www.cnblogs.com/stream1/archive/2012/08/03/htmlparser.html
總結
以上是生活随笔為你收集整理的java利用htmlparser得到网页html内容的全部內容,希望文章能夠幫你解決所遇到的問題。