JAVA读取PDF、WORD文档实例代码

读取PDF文件jar引用

创新互联主要从事网站制作、成都网站制作、网页设计、企业做网站、公司建网站等业务。立足成都服务环翠,十余年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18982081108


  org.apache.pdfbox
  pdfbox
  1.8.13

读取WORD文件jar引用


  org.apache.poi
  poi-scratchpad
  3.16-beta1


  org.apache.poi
  poi
  3.16-beta1

读取WORD文件方法

/**
   * 
   * @Title: getTextFromWord
   * @Description: 读取word
   * @param filePath
   *      文件路径
   * @return: String 读出的Word的内容
   */
  public static String getTextFromWord(String filePath) {
    String result = null;
    File file = new File(filePath);
    FileInputStream fis = null;
    try {
      fis = new FileInputStream(file);
      @SuppressWarnings("resource")
      WordExtractor wordExtractor = new WordExtractor(fis);
      result = wordExtractor.getText();
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } finally {
      if (fis != null) {
        try {
          fis.close();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
    }
    return result;
  }

读取PDF文件方法

/**
 * 
 * @Title: getTextFromPdf
 * @Description: 读取pdf文件内容
 * @param filePath
 * @return: 读出的pdf的内容
 */
public static String getTextFromPdf(String filePath) {
  String result = null;
  FileInputStream is = null;
  PDDocument document = null;
  try {
    is = new FileInputStream(filePath);
    PDFParser parser = new PDFParser(is);
    parser.parse();
    document = parser.getPDDocument();
    PDFTextStripper stripper = new PDFTextStripper();
    result = stripper.getText(document);
  } catch (FileNotFoundException e) {
    e.printStackTrace();
  } catch (IOException e) {
    e.printStackTrace();
  } finally {
    if (is != null) {
      try {
        is.close();
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
    if (document != null) {
      try {
        document.close();
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
  }
  return result;
}

希望本篇实例代码可以帮到您


网站标题:JAVA读取PDF、WORD文档实例代码
URL地址:http://bzwzjz.com/article/pdpjhs.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站制作 重庆网站建设 网站建设改版 成都定制网站建设 四川成都网站设计 温江网站设计 手机网站建设 成都网站建设公司 成都网站建设公司 成都网站设计公司 上市集团网站建设 四川成都网站建设 高端网站设计推广 重庆企业网站建设 品牌网站建设 成都网站建设 企业网站设计 成都网站建设公司 网站制作公司 成都网站建设 成都商城网站建设 成都网站设计