搜索
编程论坛
→
开发语言
→
『 JAVA论坛 』
→ 共享一个不错的Lucene中文分词包!
标题:
共享一个不错的Lucene中文分词包!
只看楼主
atlantis
等 级:
新手上路
帖 子:2
专家分:0
注 册:2006-6-9
楼主
问题点数:0 回复次数:0
共享一个不错的Lucene中文分词包!
下载地址:http://www.jesoft.cn/posts/list/5.page
1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整
1.1
增加扩展词典的静态读取方法
1.0.1
修正无法识别生僻字的问题
1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法
搜索更多相关主题的帖子:
Lucene
中文
分词
2006-06-09 13:54
1
1/1页
1
参与讨论请移步原网站贴子:
https://bbs.bccn.net/thread-70863-1-1.html
关于我们
|
广告合作
|
编程中国
|
清除Cookies
|
TOP
|
手机版
编程中国
版权所有,并保留所有权利。
Powered by
Discuz
, Processed in 0.014319 second(s), 7 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved