logo for hightman@twomice
hightman.cn
Hightman is the same as twomice, 马明练, maminglian etc.
以自己为圆心, 兴趣爱好为长轴, 所知所觉为短轴的一个小扁椭圆.

These contents include, but aren't limited to: Internet Tech. Architecture Art. Personal Info.

Notice: 除特殊注明外, 本站均为原创, 如有转载请注明出处和作者, 谢谢!

Seekle Search

Relational Links

MySQL Fulltext 全文检索中文分词补丁
关于我的 MySQL FT 补丁

MySQL 从 3.23.x 起就在 MyISAM 表引擎中支持全文检索,不够一直没有较好的支持中文。我就在自己的简易分词基础上,在不影响 MySQL 的系统结构及其他功能的前提下,解决 MySQL 目前对中文全文检索无法正确支持的缺陷并优化 MySQL 对中文检索处理的性能。(目前本软件包支持根据词典进行简易的正向最大匹配分词、支持包括UTF-8、GBK、BIG5、EUC_TW ... 在内的字符集)该功能仅作用于 MyISAM 引擎的表,除此之外均不支持。

专项支持论坛已开放

支持的版本族及下载地址

1. MySQL-4.0.27 完整安装包:下载地址 安装说明 使用说明
2. MySQL-4.0.x 补丁安装包: 下载地址 安装说明
3. MySQL-5.1.11 中文分词插件:下载地址及安装说明 (5.1.13之后版本接口有小变动,需要自行修改才能用)

4. MySQL-5.1.30 结合 scws 的中文分词插件:下载地址及安装说明 (强烈推荐!!)

演示地址

1. http://www.hightman.cn/demo/s.php?q=%D6%D0%CE%C4 (BBS文章标题全文检索)
2. http://www.hightman.cn/demo/s.php?source (实现的源代码, 可参考实现方式)
3. http://www.dot66.net (一百五十万条原BBS精华区数据全文检索)

后话及授权声明

本软件补丁包秉承GNU(通用公共许可证)精神释出。这部分代码(支持中文等多字节字符集全文检索、分词)全部由本人(即 hightman)独立完成,本人保留一切权利。

未经同意严禁修改、移植代码、商业用途、分支发布等。若您采用本软件包架站或作相关的公益研讨交流服务, 希望您可以告诉我, 并尽可能保留一个到本站的链接及相关说明。

本改进软件包不包含任何恶意代码,由于本人水平及精力有限, Bug及错误之处可能会存在。由此升级修改引起的数据丢失等后果本人不承担任何责任。关于本软件的bug报告、疑问以及建议或改进优化代码请直接在论坛中汇报或联络。