标题:汉字词语切分
只看楼主
yangweiwei
Rank: 1
等 级:新手上路
帖 子:17
专家分:0
注 册:2008-10-11
 问题点数:0 回复次数:5 
汉字词语切分
要求从一个txt文件中读出汉字,统计其中的词语词频。我现在连汉字切分算法都不会,哪位大哥给个算法,有源程序最好了。谢谢了哈!
搜索更多相关主题的帖子: 切分 汉字 词语 
2008-10-25 14:58
ronaldowsy
Rank: 1
等 级:新手上路
帖 子:68
专家分:0
注 册:2008-10-20
得分:0 
#include <iostream>
using namespace std;
int main()
{
    char a[3][80];
    int i,j;
    int daxie=0,xiaoxie=0,number=0,space=0,other=0;
    for (i=0;i<3;i++)
    {
        cout<<"输入文字"<<i+1<<endl;
        gets(a[i]);
        for (j=0;j<80 && a[i][j]!='\0';j++)
        {
            if (a[i][j]>='A' && a[i][j]<='Z')
            {
                daxie++;
            }
                else if (a[i][j]>='a' && a[i][j]<='z')
                {
                     xiaoxie++;
                }
                else if (a[i][j]>='0' && a[i][j]<='9')
                {
                        number++;
                }
                else if (a[i][j]==' ')
                {
                      space++;
                }
                 else
                {
                      other++;
                }
        }
    }
    cout<<"大写字母有:"<<daxie<<endl;
    cout<<"小写字母有:"<<xiaoxie<<endl;
    cout<<"数字有:"<<number<<endl;
    cout<<"空格有:"<<space<<endl;
    cout<<"其他符号有:"<<other<<endl;
    return 0;
}
2008-10-25 17:22
ronaldowsy
Rank: 1
等 级:新手上路
帖 子:68
专家分:0
注 册:2008-10-20
得分:0 
如果你是要从一个TXT的文档中直接计算出的话,那就把cin那个地方自己改一下,改成你TXT所在的绝对路径就可以了
2008-10-25 17:23
yangweiwei
Rank: 1
等 级:新手上路
帖 子:17
专家分:0
注 册:2008-10-11
得分:0 
先谢谢ronaldowsy,不过你给的是英文字母的鉴别,我要的是能把一串汉字切分出一个一个的词,不是一个一个的字哦。
2008-10-26 19:57
vfdff
Rank: 6Rank: 6
等 级:侠之大者
威 望:8
帖 子:2172
专家分:425
注 册:2005-7-15
得分:0 
回复 4# yangweiwei 的帖子
一个一个的词 ??那要有个词库进行匹配吧??

~~~~~~~~~~~~~~~好好学习~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2008-10-27 01:02
yangweiwei
Rank: 1
等 级:新手上路
帖 子:17
专家分:0
注 册:2008-10-11
得分:0 
是的哦,可以先自己弄个小小的词库,先来个短点的文章,怎么分配?
2008-10-28 23:02



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-240498-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.612732 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved