Hightman 论坛

完整版: 分词初试,结果不对
您当前正在浏览的是一个简化版本. 要观看完整版本, 请点这儿.
分页: 1 2
你好,初次试用SCWS,照着官方的说明,安装比较顺利。

然后下载官方DEMO(源码另存为)来运行的时候,分词结果不对,不明其中原因。

DEMO:http://www.ftphp.com/scws/demo/v48.php

输入的文本也是官方DEMO一样的,分词结果如下:

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。

一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 等 创 作 人 员 , 这 些 创 作 人 员 对 他 们 的 创 作 是 有 版 权 的 。 不 经 过 制 片 人 授 权 , 其 他 人 不 能 对 电 影 做 拷 贝 、 发 行 、 反 映 , 不 能 通 过 网 络 来 传 播 , 既 不 能 把 电 影 改 编 成小 说 、 连环画 等 其 他 艺 术 形 式 发 表 , 也 不 能 把 一 部 几 个 小 时 才 能 放 完 的 电 影 改 编 成半个 小 时 就 能 放 完 的 短 片 。

著 作 权 和 版 权 在 我 国 是 同 一个 概 念 , 是 法 律 赋 予 作 品 创 作 者 的 专 有 权利 。 所 谓 专 有 权利就 是 没 有 经 过 权利人 许可又 不 是 法 律 规 定 的 例 外 , 要 使 用 这 个 作 品 , 就 必 须 经 过 作 者 授 权 , 没 有 授 权就 是 侵 权 。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

不知道我是哪里没有设置好,官方有没有注意事项,或更详尽的说明,谢谢
看上去你的分词程序并没有成功加载词典。

你最好按照安装说明进行操作,不必复制DEMO.PHP,毕竟你的安装路径可能和我不一样。要依据词典路径的
我是按照安装说明来做的

如果没有加载词典没有提示的吗,我再去试一下
终于OK了

我在UTF-8演示文件第77行,即“$cws->set_charset('utf8');”这一句后面再补上两句(参考GBK版本):
$cws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini');
$cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');

再次运行,分词正确了
不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GBK版本)
希望可以把不对的完整语句发出来。

是否在我们的网站测试页面也一样出现错误呢?谢谢
分页: 1 2
Reference URL's