Hightman 论坛

完整版: Hightman您好,我的分词怎么不对啊
您当前正在浏览的是一个简化版本. 要观看完整版本, 请点这儿.
分页: 1 2
终于编译了,也设置成功,字典位置也很正确,可是分词却不对!!
No. WordString Attr Weight(times)
-------------------------------------------------
01. 权利 nr 7.00(2)
02. 陈凯歌 nr 3.50(1)
03. 包括导 nr 3.50(1)
04. 权人 nr 3.50(1)
05. 权归电 nr 3.50(1)
06. 成小 nr 3.50(1)
07. 成半个 nr 3.50(1)
08. 连环画 nr 3.50(1)
09. 权利人 nr 3.50(1)
10. 许可又 nr 3.50(1)


-------------------------------------------------
陈凯歌/nr 权人/nr 权归电/nr

包括导/nr 成小/nr 连环画/nr 成半个/nr

一个/mt 权利/nr 权利/nr 权利人/nr 许可又/nr

一九八零年/mt

这是怎么回事啊
词典不对!或词典加载失败,请给出你的代码及词典路径
$cws = scws_open("gbk");
scws_set_dict($cws, "./etc/dict.xdb");
scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT);
scws_set_rule($cws, "./etc/rules.ini");
词典没调用到,规则到是调用到了,
为什么我的词典没调用到啊!!!
我觉得不解!
改成这样,scws_open 本身是没有函数的,文档是正确的,但附带提供的 scws.php 写错了,所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来,
所以应该 显式的调用 scws_set_charset()

$cws = scws_open();
scws_set_charset($cws, "gbk");
scws_set_dict($cws, "./etc/dict.xdb");
scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT);
scws_set_rule($cws, "./etc/rules.ini");

---- 推荐采用类对像访问方式
$cws = scws_new("gbk");
$cws->set_dict('etc/dict.xdb');
$cws->add_dict('etc/s.txt', SCWS_XDICT_TXT);
$cws->set_rule('etc/rules.ini');
...
分页: 1 2
Reference URL's