标题:求c#数据抽取 编程思路
只看楼主
arong229
Rank: 1
等 级:新手上路
帖 子:4
专家分:0
注 册:2011-10-14
结帖率:100%
已结贴  问题点数:20 回复次数:6 
求c#数据抽取 编程思路
我要编一个从txt格式词典中按照要求抽取部分语句另存为一个txt文件的程序。没有思路啊···
要求是 有txt格式的英汉词典的词典X。
       txt词典的格式是;英文词条,词类,汉语译文,英汉汉对照短语例句(解释可能有多个,即多义词)
输出结果:(1)英汉词典数据库(txt格式)(英语,词类,汉语);
          (2)词典例句对应英汉双语语料库(txt格式);(英文句子,汉语译文句子)
程序功能:
可以任意打开一个原始文件,抽取相应的数据追加到相应的库中;



 ps:打开txt文件和另存文件这些简单,主要是抽取相应数据这一块。
     这些txt文件是unicode的。 我目前想法是利用语言的unicode编码按照一定的条件抽取。但不知接下里该怎么弄。

求各位大侠相助,小女子感激不尽啊···
搜索更多相关主题的帖子: 数据库 编程 英文句子 英汉词典 语料库 
2011-10-14 21:40
arong229
Rank: 1
等 级:新手上路
帖 子:4
专家分:0
注 册:2011-10-14
得分:0 
求关注··
2011-10-14 22:00
clhc
Rank: 6Rank: 6
等 级:侠之大者
帖 子:69
专家分:441
注 册:2011-10-11
得分:20 
不在意效率的话可以
程序代码:
            StreamReader sr = new StreamReader("D:\\test.txt", Encoding.Unicode);
            while (!sr.EndOfStream)
            {
                string s = sr.ReadLine();
                string[] items = s.Split(new char[] { '' }, StringSplitOptions.RemoveEmptyEntries);
                //数据都有了 下边你就可以自由处理了
            }

2011-10-14 22:11
arong229
Rank: 1
等 级:新手上路
帖 子:4
专家分:0
注 册:2011-10-14
得分:0 
我要的是编程思想啊···
2011-10-15 11:09
clhc
Rank: 6Rank: 6
等 级:侠之大者
帖 子:69
专家分:441
注 册:2011-10-11
得分:0 
回复 4楼 arong229
不晓得你的编程思想是什么概念。
既然你是txt的数据,那你只有一行一行的取数据 然后用“,”分隔 然后取相应位置的数据组织结果 除此还有其他办法吗?
2011-10-15 13:14
arong229
Rank: 1
等 级:新手上路
帖 子:4
专家分:0
注 册:2011-10-14
得分:0 
回复 4楼 arong229
主要是我的txt文件里面内容没有固定的格式 不能按行读取,给你看看我的txt文件就知道了  我没有说清楚 不好意思··
2011-10-17 17:53
satanjerk
Rank: 1
等 级:新手上路
帖 子:10
专家分:4
注 册:2009-5-30
得分:0 
多义词各个释义有明显标志位么?例如1,2,3数字标识?
单个词语中间有空格或者“,”分隔么?
总体来说只有分隔,循环读取输出吧...
2011-10-25 20:49



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-352477-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.048077 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved