java txt html格式_java中xml(txt/html等格式)解析问题,请教java高手,请勿粘贴其他网页上的内容(能查的都看了)。...
目的:通過對網頁內容解析,獲得需要的內容,如網頁的標題Title,主要內容,描述信息;而里面的廣告、超鏈接、無關緊要的信息統統不要,從而達到對用戶上網行為的分析的目的。下面是我...
目的:通過對網頁內容解析,獲得需要的內容,如網頁的標題Title,主要內容,描述信息
;而里面的廣告、超鏈接、無關緊要的信息統統不要,從而達到對用戶上網行為的分析的目的。
下面是我做的一個:只能對xml文件解析,其他的格式不行。其次這只是對一級子元素判斷,未判斷二級或三級等。
需要導入jdom jar包
1.放在E盤的app.xml文檔
loops
look
loops1
look1
java處理程序
package example;
import org.jdom.*;
import org.jdom.input.SAXBuilder;
import java.io.*;
import java.util.*;
/**
* Xml 解析工作實現(讀取分析)
*
Title:
*
Description:
*
Copyright: Copyright (c) 2005
*
Company:
* @author Yaming
* @version 1.0
*/
public class XmlReader {
private Element m_RootElement = null;
public Element getM_RootElement() {
return m_RootElement;
}
public void setM_RootElement(Element m_RootElement) {
this.m_RootElement = m_RootElement;
}
/**
* 構造函數
* @param xmlFile String
* 根據文件的路徑初始化dom的根
*/
public class XmlReader {
private Element m_RootElement = null;
public Element getM_RootElement() {
return m_RootElement;
}
public void setM_RootElement(Element m_RootElement) {
this.m_RootElement = m_RootElement;
}
/**
* 構造函數
* @param xmlFile String
* 根據文件的路徑初始化dom的根
*/
public XmlReader(String xmlFile) {
try {
SAXBuilder builder = new SAXBuilder();//解析器定義
Document doc=null;
doc=builder.build(new FileInputStream(xmlFile));//讀入Xml文件,獲得Doc
this.m_RootElement = doc.getRootElement();//獲得Xml文件的最上面的根
// System.out.println("1========"+m_RootElement);
}
catch (IOException ex) {
this.m_RootElement=null;
}
catch (JDOMException ex) {
this.m_RootElement=null;
}
}
/**
* 獲得指定名字的根的內容,此方法只適用于此xml
* @param curRoot Element Your XmlRoot
* @param codeName String Your XmlCode
* @return List
*/
public List getElement(Element curRoot,String codeName) {
List result = new ArrayList();
if (null == curRoot) {
curRoot = m_RootElement;
}//判斷Xml是否存在,以及根是否正確解析
if (null != curRoot) {
List l=curRoot.getChildren();//獲得最上層根的所有字節點
Iterator it=l.iterator();//遞歸取出
while(it.hasNext()){
Element e=(Element)it.next();
if(e.getName().equalsIgnoreCase(codeName)){//獲取這些根是否為所需要的
List l1=e.getChildren();//如果需要,解析出這個子節點的所有子節點
Iterator it1=l1.iterator();
while(it1.hasNext()){
Element e1=(Element)it1.next();
result.add(e1.getTextTrim());//取出所包含的值,放到要返回的結果集中
} } }}
return result;
}
展開
總結
以上是生活随笔為你收集整理的java txt html格式_java中xml(txt/html等格式)解析问题,请教java高手,请勿粘贴其他网页上的内容(能查的都看了)。...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java compareable接口_J
- 下一篇: linuxu盘安装教程(linux u