标题:求助 c#编程把pdf格式的文件转换成txt的文件的代码
只看楼主
zxpp
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2008-6-5
 问题点数:0 回复次数:1 
求助 c#编程把pdf格式的文件转换成txt的文件的代码
求助哪个高手给小弟指点一下,小弟不胜感

[[it] 本帖最后由 zxpp 于 2008-6-5 13:42 编辑 [/it]]
搜索更多相关主题的帖子: pdf txt 文件 格式 
2008-06-05 08:52
bluesky2992
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2019-1-10
得分:0 
Spire.PDF 可以很好提取PDF文档中的文本保存成txt文件,参考如下代码,请从http://www.了解更多。

//实例化一个PdfDocument对象
PdfDocument doc = new PdfDocument();
//加载PDF文档
doc.LoadFromFile("测试文档.pdf");
//实例化一个StringBuilder 对象
StringBuilder content = new StringBuilder();
//提取PDF所有页面的文本
foreach (PdfPageBase page in doc.Pages)
{
    content.Append(page.ExtractText());
}
//将提取到的文本写为.txt格式并保存到本地路径
String fileName = "获取文本.txt";
File.WriteAllText(fileName, content.ToString());
2019-01-10 22:05



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-217728-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.539092 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved