纯Java实现PDF转txt文件
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                纯Java实现PDF转txt文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                展示這個Demo的原因是一哥們需要我幫他把一些PDF格式的資料轉為txt,我在網上找了下在線的工具,都不好用,網上大多數的在線pdf轉txt文件都需要付費,而免費的一次轉換文件大小不能超過2M,比較痛苦,于是去網上搜了下Java實現Pdf轉txt,剛好看見了大神寫的代碼(http://www.cnblogs.com/fanc/p/6197786.html),就直接拿來用了,哈哈,在此分享下!
package demo;import java.io.File; import java.io.FileOutputStream; import java.io.OutputStreamWriter; import java.io.Writer; import java.net.MalformedURLException; import java.net.URL;import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper;public class PdfToTxt {public static void main(String[] args) {try {//取得F盤下的pdf的內容readPdf("F:/SJXLX/心理咨詢師考試重點整理---20150429.pdf");} catch (Exception e) {e.printStackTrace();}} /*** 傳入一個.pdf文件* @param file* @throws Exception*/public static void readPdf(String file) throws Exception {// 是否排序boolean sort = false;// pdf文件名String pdfFile = file;// 輸入文本文件名稱String textFile = null;// 編碼方式String encoding = "UTF-8";// 開始提取頁數int startPage = 1;// 結束提取頁數int endPage = Integer.MAX_VALUE;// 文件輸入流,生成文本文件Writer output = null;// 內存中存儲的PDF DocumentPDDocument document = null;try {try {// 首先當作一個URL來裝載文件,如果得到異常再從本地文件系統//去裝載文件URL url = new URL(pdfFile);//注意參數已不是以前版本中的URL.而是File。document = PDDocument.load(pdfFile);// 獲取PDF的文件名String fileName = url.getFile();// 以原來PDF的名稱來命名新產生的txt文件if (fileName.length() > 4) {File outputFile = new File(fileName.substring(0, fileName.length() - 4)+ ".txt");textFile ="F:/SJXLX/"+outputFile.getName();}} catch (MalformedURLException e) {// 如果作為URL裝載得到異常則從文件系統裝載//注意參數已不是以前版本中的URL.而是File。document = PDDocument.load(pdfFile);if (pdfFile.length() > 4) {textFile = pdfFile.substring(0, pdfFile.length() - 4)+ ".txt";}}// 文件輸入流,寫入文件倒textFileoutput = new OutputStreamWriter(new FileOutputStream(textFile),encoding);// PDFTextStripper來提取文本PDFTextStripper stripper = null;stripper = new PDFTextStripper();// 設置是否排序stripper.setSortByPosition(sort);// 設置起始頁stripper.setStartPage(startPage);// 設置結束頁stripper.setEndPage(endPage);// 調用PDFTextStripper的writeText提取并輸出文本stripper.writeText(document, output);System.out.println(textFile + " 輸出成功!");} finally {if (output != null) {// 關閉輸出流output.close();}if (document != null) {// 關閉PDF Documentdocument.close();}}} }成功轉換幾十個pdf文件,截圖為證!
Java項目運行需要的基礎包我會上傳,需要下載的請自便,不謝!
 
 
總結
以上是生活随笔為你收集整理的纯Java实现PDF转txt文件的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 使用 auto-drawing 画一个户
 - 下一篇: 定时器/计数器实验报告