标题:【求助】我想用java读取Word 和pdf的文件
取消只看楼主
小霖
Rank: 1
等 级:新手上路
帖 子:20
专家分:2
注 册:2009-4-11
结帖率:100%
 问题点数:0 回复次数:0 
【求助】我想用java读取Word 和pdf的文件
【问题】网上看大都说用tm-extractors-0.4.jar包  ,此包已下,但我不知道放在那里才能用。

我读取Word文件的代码如下:
import
import
import org.textmining.text.extraction.WordExtractor;//这个说软件包不存在
public class WordReader {

 public static String readDoc(String doc) throws Exception {
  // 创建输入流读取doc文件
  FileInputStream in = new FileInputStream(new File(doc));
  WordExtractor extractor = null;//红字为NetBeans 提示找不到符号
  String text = null;
  // 创建WordExtractor
  extractor = new WordExtractor();
  // 对doc文件进行提取
  text = extractor.extractText(in);
  return text;
 }
 /**
  * @param args
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
        try{
         String text = WordReader.readDoc("C://abc.doc");
         System.out.println(text);
        }catch(Exception ex){
         ex.printStackTrace();
        }
 }
}
搜索更多相关主题的帖子: 文件 Word pdf java 
2009-11-05 22:45



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-291197-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.205849 second(s), 8 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved