2007-06-12, 04:04 PM
原文如下:
分词结果:
1.从结果来看,分词程序对数量词的把握不是很准
45万篇文章 = > 45 万 篇文章
约900万个词 = > 约 900 万个词
篇是量词,量词怎么和后面的名词分在一块呢?
2.
效果相当好 = > 效果 相 当好
不知道在词库中"相"的词性是什么,这里把"相"和"当"分开,却把"当"和"好"分在一块,
明显不是我们想要的结果.
引用:1. 全文检索,此次全文搭配数据库进行。测试中大概有 45万篇文章,约900万个词(是分好的词不是字)。
检索效果还不错,如果纯单词进行检索效果相当好。长句略慢。。。。
分词结果:
引用:1 . 全文检索 , 此次 全文 搭配 数据库 进行 。 测试 中 大概 有 45 万 篇文章 , 约 900 万个词 ( 是 分 好 的 词 不是 字 ) 。
检索 效果 还 不错 , 如果 纯 单词 进行 检索 效果 相 当好 。 长句 略 慢 。 。 。 。
1.从结果来看,分词程序对数量词的把握不是很准
45万篇文章 = > 45 万 篇文章
约900万个词 = > 约 900 万个词
篇是量词,量词怎么和后面的名词分在一块呢?
2.
效果相当好 = > 效果 相 当好
不知道在词库中"相"的词性是什么,这里把"相"和"当"分开,却把"当"和"好"分在一块,
明显不是我们想要的结果.