<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/">
	<channel>
		<title><![CDATA[Hightman 论坛 - 所有版面]]></title>
		<link>http://www.hightman.cn/bbs/</link>
		<description><![CDATA[Hightman 论坛 - http://www.hightman.cn/bbs]]></description>
		<pubDate>Fri, 18 May 2012 17:10:21 +0800</pubDate>
		<generator>MyBB</generator>
		<item>
			<title><![CDATA[文本自动分类建议系统的代码是否可开放出来？]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4965</link>
			<pubDate>Sun, 22 Apr 2012 02:32:19 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4965</guid>
			<description><![CDATA[RT,小弟对原理很是好奇，不知道是怎么算出来。地址如下：<br />
<br />
<a href="http://www.ftphp.com/scws/demo/a.php" target="_blank">http://www.ftphp.com/scws/demo/a.php</a>]]></description>
			<content:encoded><![CDATA[RT,小弟对原理很是好奇，不知道是怎么算出来。地址如下：<br />
<br />
<a href="http://www.ftphp.com/scws/demo/a.php" target="_blank">http://www.ftphp.com/scws/demo/a.php</a>]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[狂赞！很难想像居然会有如此简单易用的分词技术]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4964</link>
			<pubDate>Sun, 22 Apr 2012 02:26:47 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4964</guid>
			<description><![CDATA[早就对分词技术做过很多研究，但是却从没发现简单易用的产品，哪怕是收费的。<br />
今天无意中发现了FTPHP的SCWS，安装试用了下，非常棒！关键MMD还是开源免费的，能够自定义各种功能。<br />
<br />
强烈支持并持续关注！]]></description>
			<content:encoded><![CDATA[早就对分词技术做过很多研究，但是却从没发现简单易用的产品，哪怕是收费的。<br />
今天无意中发现了FTPHP的SCWS，安装试用了下，非常棒！关键MMD还是开源免费的，能够自定义各种功能。<br />
<br />
强烈支持并持续关注！]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[关于中英文混合切词]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4938</link>
			<pubDate>Sun, 01 Apr 2012 17:11:49 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4938</guid>
			<description><![CDATA[比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌”<br />
在自定义词库里我添加了"Adidas/阿迪达斯"<br />
但结果是Adidas / 阿迪达斯<br />
请问能否判断是一个自定义的整词吗？就是说按我设置的词库来分]]></description>
			<content:encoded><![CDATA[比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌”<br />
在自定义词库里我添加了"Adidas/阿迪达斯"<br />
但结果是Adidas / 阿迪达斯<br />
请问能否判断是一个自定义的整词吗？就是说按我设置的词库来分]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[scws_get_tops函数的第二个参数无效]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4937</link>
			<pubDate>Sun, 01 Apr 2012 16:38:08 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4937</guid>
			<description><![CDATA[PHP5.3.8<br />
SCWS-1.2.0<br />
<br />
scws_get_tops 函数的第二个参数无效！<br />
<br />
demo:<br />
scws_get_tops(&#36;sh, 5); //输出后仍然是9个关键词。]]></description>
			<content:encoded><![CDATA[PHP5.3.8<br />
SCWS-1.2.0<br />
<br />
scws_get_tops 函数的第二个参数无效！<br />
<br />
demo:<br />
scws_get_tops(&#36;sh, 5); //输出后仍然是9个关键词。]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[scws-1.2.0 发布，支持 PHP5.4 新增用于多线程的 scws_fork()]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4932</link>
			<pubDate>Thu, 29 Mar 2012 12:32:27 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4932</guid>
			<description><![CDATA[2012-3-29: SCWS-1.2.0 Released.<br />
<br />
1) 修改 php 扩展代码以兼容支持 php 5.4.x<br />
2) 修正 php 扩展中 scws_get_tops 的 limit 参数不允许少于 10 的问题<br />
3) libscws 增加 scws_fork() 从既有的 scws 实例产生分支并共享词典/规则集，主要用于多线程开发。<br />
4) 新增部分版本的 win32 的 dll 扩展，详见<a href="http://www.ftphp.com/scws/download.php#dll" target="_blank">下载页面</a><br />
<br />
最新下载地址：<a href="http://www.ftphp.com/scws/download.php" target="_blank">http://www.ftphp.com/scws/download.php</a><br />
演示地址：<a href="http://www.ftphp.com/scws/demo.php" target="_blank">http://www.ftphp.com/scws/demo.php</a>]]></description>
			<content:encoded><![CDATA[2012-3-29: SCWS-1.2.0 Released.<br />
<br />
1) 修改 php 扩展代码以兼容支持 php 5.4.x<br />
2) 修正 php 扩展中 scws_get_tops 的 limit 参数不允许少于 10 的问题<br />
3) libscws 增加 scws_fork() 从既有的 scws 实例产生分支并共享词典/规则集，主要用于多线程开发。<br />
4) 新增部分版本的 win32 的 dll 扩展，详见<a href="http://www.ftphp.com/scws/download.php#dll" target="_blank">下载页面</a><br />
<br />
最新下载地址：<a href="http://www.ftphp.com/scws/download.php" target="_blank">http://www.ftphp.com/scws/download.php</a><br />
演示地址：<a href="http://www.ftphp.com/scws/demo.php" target="_blank">http://www.ftphp.com/scws/demo.php</a>]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[hm老大，英文词典的问题]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4927</link>
			<pubDate>Thu, 22 Mar 2012 13:01:52 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4927</guid>
			<description><![CDATA[我现在想做的是，在一个英文句子里提取其中词频比较高的名词。想到用自定义词典，自己整理英文词。但是发现一个问题。。比如hip pop这样也是一个名词，那现在自定义词典里肯定不能有空格的啊。老大能不能把这个也解决一下，这样的话，大家一起提供英文的词典，是不是就可以解决中英文混合分词了？？]]></description>
			<content:encoded><![CDATA[我现在想做的是，在一个英文句子里提取其中词频比较高的名词。想到用自定义词典，自己整理英文词。但是发现一个问题。。比如hip pop这样也是一个名词，那现在自定义词典里肯定不能有空格的啊。老大能不能把这个也解决一下，这样的话，大家一起提供英文的词典，是不是就可以解决中英文混合分词了？？]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[基于scws的自动分类建议系统源码能否提供]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4903</link>
			<pubDate>Mon, 12 Mar 2012 09:37:20 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4903</guid>
			<description><![CDATA[基于scws的自动分类建议系统源码能否开放，谢谢]]></description>
			<content:encoded><![CDATA[基于scws的自动分类建议系统源码能否开放，谢谢]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[get_tops 不能限制统计个数]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4893</link>
			<pubDate>Mon, 05 Mar 2012 17:44:28 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4893</guid>
			<description><![CDATA[get_tops  这个不管传入的limit是多少，总是提取前10个关键字，演示中的例子也是这个样子，请修正一下。]]></description>
			<content:encoded><![CDATA[get_tops  这个不管传入的limit是多少，总是提取前10个关键字，演示中的例子也是这个样子，请修正一下。]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[有non thread-safe的PHP扩展编译版本吗？]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4892</link>
			<pubDate>Mon, 05 Mar 2012 14:15:12 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4892</guid>
			<description><![CDATA[调用的时候报错php5ts.dll不存在，估计和thread-safety的模块有关，请问是否必须重新编译？我在windows上的测试环境是nginx+php，因为是cgi模式所以thread-safety没啥用。<br />
<br />
先感谢指教~]]></description>
			<content:encoded><![CDATA[调用的时候报错php5ts.dll不存在，估计和thread-safety的模块有关，请问是否必须重新编译？我在windows上的测试环境是nginx+php，因为是cgi模式所以thread-safety没啥用。<br />
<br />
先感谢指教~]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[SCWS是否可以提供Python扩展？]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4891</link>
			<pubDate>Mon, 05 Mar 2012 12:04:10 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4891</guid>
			<description><![CDATA[HI<br />
在一个项目中使用到了scws PHP的扩展，感觉scws在分词效率和准确率，以及在返回结果的可用性上，显著高于其它的扩展，想问一下，scws是否可以提供Python的扩展？]]></description>
			<content:encoded><![CDATA[HI<br />
在一个项目中使用到了scws PHP的扩展，感觉scws在分词效率和准确率，以及在返回结果的可用性上，显著高于其它的扩展，想问一下，scws是否可以提供Python的扩展？]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[[patch&#93; php-scws 扩展在 5.4.x 下的编译兼容补丁]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4890</link>
			<pubDate>Mon, 05 Mar 2012 11:24:32 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4890</guid>
			<description><![CDATA[近期 php5.4.x 已经正式发布，已有网友在使用并汇报说 scws 的 PHP 扩展无法编译通过。<br />
<br />
刚看了一下，因为 5.4.x 起 php 移除了 safe_mode 导致一些代码错误不通过编译，简单修改补丁如下，请大家先手动修改一下，稍后 scws-1.1.10 发布时会同步解决，并推出 5.4 的 win32 dll 文件。<br />
<br />
<div class="codeblock">
<div class="title">代码:<br />
</div><div class="body" dir="ltr"><code>Index: php_scws.c<br />
===================================================================<br />
RCS file: /home/cvsroot/scws/phpext/php_scws.c,v<br />
retrieving revision 1.13<br />
diff -c -r1.13 php_scws.c<br />
*** php_scws.c&nbsp;&nbsp;&nbsp;&nbsp;23 Dec 2011 07:05:26 -0000&nbsp;&nbsp;&nbsp;&nbsp;1.13<br />
--- php_scws.c&nbsp;&nbsp;&nbsp;&nbsp;5 Mar 2012 03:32:46 -0000<br />
***************<br />
*** 359,368 ****<br />
--- 359,370 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
***************<br />
*** 408,417 ****<br />
--- 410,421 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
***************<br />
*** 456,465 ****<br />
--- 460,471 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);</code></div></div>
]]></description>
			<content:encoded><![CDATA[近期 php5.4.x 已经正式发布，已有网友在使用并汇报说 scws 的 PHP 扩展无法编译通过。<br />
<br />
刚看了一下，因为 5.4.x 起 php 移除了 safe_mode 导致一些代码错误不通过编译，简单修改补丁如下，请大家先手动修改一下，稍后 scws-1.1.10 发布时会同步解决，并推出 5.4 的 win32 dll 文件。<br />
<br />
<div class="codeblock">
<div class="title">代码:<br />
</div><div class="body" dir="ltr"><code>Index: php_scws.c<br />
===================================================================<br />
RCS file: /home/cvsroot/scws/phpext/php_scws.c,v<br />
retrieving revision 1.13<br />
diff -c -r1.13 php_scws.c<br />
*** php_scws.c&nbsp;&nbsp;&nbsp;&nbsp;23 Dec 2011 07:05:26 -0000&nbsp;&nbsp;&nbsp;&nbsp;1.13<br />
--- php_scws.c&nbsp;&nbsp;&nbsp;&nbsp;5 Mar 2012 03:32:46 -0000<br />
***************<br />
*** 359,368 ****<br />
--- 359,370 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
***************<br />
*** 408,417 ****<br />
--- 410,421 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
***************<br />
*** 456,465 ****<br />
--- 460,471 ----<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (!(fullpath = expand_filepath(filepath, NULL TSRMLS_CC)))<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
+ #if PHP_API_VERSION &lt; 20100412<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (PG(safe_mode) &amp;&amp; (!php_checkuid(fullpath, NULL, CHECKUID_CHECK_FILE_AND_DIR))) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RETURN_FALSE;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}<br />
+ #endif<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (php_check_open_basedir(fullpath TSRMLS_CC)) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;efree(fullpath);</code></div></div>
]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[弱弱地提问下 SCWS分词能不能选择保留原文空格？]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4889</link>
			<pubDate>Mon, 05 Mar 2012 01:57:59 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4889</guid>
			<description><![CDATA[如题<br />
<br />
弱弱地提问下 SCWS分词能不能选择保留原文空格？]]></description>
			<content:encoded><![CDATA[如题<br />
<br />
弱弱地提问下 SCWS分词能不能选择保留原文空格？]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[求scws在linux下php5.3.*的教程]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4642</link>
			<pubDate>Wed, 15 Feb 2012 16:00:43 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4642</guid>
			<description><![CDATA[php5.2安装scws 按照教程一步步安装没有任何问题 怎么安装到5.3上问题都出来了<br />
<br />
希望斑竹出个5.3的安装教程<br />
<br />
<a href="http://www.ftphp.com/scws/docs.php#instscws" target="_blank">http://www.ftphp.com/scws/docs.php#instscws</a> 这个教程是不能安装成功的 <br />
<br />
我的环境是 centos 5.6   php5.3.9  scws1.1.7/scws1.1.9]]></description>
			<content:encoded><![CDATA[php5.2安装scws 按照教程一步步安装没有任何问题 怎么安装到5.3上问题都出来了<br />
<br />
希望斑竹出个5.3的安装教程<br />
<br />
<a href="http://www.ftphp.com/scws/docs.php#instscws" target="_blank">http://www.ftphp.com/scws/docs.php#instscws</a> 这个教程是不能安装成功的 <br />
<br />
我的环境是 centos 5.6   php5.3.9  scws1.1.7/scws1.1.9]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[中文分词]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4635</link>
			<pubDate>Mon, 13 Feb 2012 11:04:20 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4635</guid>
			<description><![CDATA[php版本不是thread safe版本的，该用什么支持分词呢？windows系统下，iis6.0+php5.3.10,求助啊...]]></description>
			<content:encoded><![CDATA[php版本不是thread safe版本的，该用什么支持分词呢？windows系统下，iis6.0+php5.3.10,求助啊...]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[请教关于文章标题分词]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4570</link>
			<pubDate>Sat, 04 Feb 2012 15:58:27 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4570</guid>
			<description><![CDATA[原始标题：<br />
未到入学年龄，复读与否两难抉择<br />
夸孩子也会起反作用<br />
怎样消除孩子的嫉妒<br />
<br />
<br />
分词后：<br />
未到 入学年龄 复读 与否 两难 抉择 <br />
夸 孩子 也会 起 反作用 <br />
怎样 消除 孩子 的 嫉妒 <br />
<br />
请问怎么去除分词中一个字的关键词。因为我不需要分词结果中有 一个字 的。<br />
麻烦高手过来看看。应该怎样解决。谢谢了。]]></description>
			<content:encoded><![CDATA[原始标题：<br />
未到入学年龄，复读与否两难抉择<br />
夸孩子也会起反作用<br />
怎样消除孩子的嫉妒<br />
<br />
<br />
分词后：<br />
未到 入学年龄 复读 与否 两难 抉择 <br />
夸 孩子 也会 起 反作用 <br />
怎样 消除 孩子 的 嫉妒 <br />
<br />
请问怎么去除分词中一个字的关键词。因为我不需要分词结果中有 一个字 的。<br />
麻烦高手过来看看。应该怎样解决。谢谢了。]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[营养成分查询不可用]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4547</link>
			<pubDate>Wed, 01 Feb 2012 15:23:07 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4547</guid>
			<description><![CDATA[<a href="http://www.wzz123.com/fcys.html" target="_blank">http://www.wzz123.com/fcys.html</a> 这个页面的营养成分查询没办法用啊，说是页面不存在，建议用 <a href="http://www.fancai.com/yingyang/" target="_blank">http://www.fancai.com/yingyang/</a> 代替]]></description>
			<content:encoded><![CDATA[<a href="http://www.wzz123.com/fcys.html" target="_blank">http://www.wzz123.com/fcys.html</a> 这个页面的营养成分查询没办法用啊，说是页面不存在，建议用 <a href="http://www.fancai.com/yingyang/" target="_blank">http://www.fancai.com/yingyang/</a> 代替]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[Creative movies]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=4539</link>
			<pubDate>Fri, 20 Jan 2012 19:28:04 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=4539</guid>
			<description><![CDATA[有趣的是，音乐和视频同步<br />
<br />
   <a href="http://youtu.be/DLq5DcQAd6k" target="_blank"><img src="http://images61.fotki.com/v218/photos/9/1855329/10345926/1-vi.jpg?1327010440" border="0" alt="[图片: 1-vi.jpg?1327010440&#93;" /></a>]]></description>
			<content:encoded><![CDATA[有趣的是，音乐和视频同步<br />
<br />
   <a href="http://youtu.be/DLq5DcQAd6k" target="_blank"><img src="http://images61.fotki.com/v218/photos/9/1855329/10345926/1-vi.jpg?1327010440" border="0" alt="[图片: 1-vi.jpg?1327010440]" /></a>]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[SCWS-1.1.9 没法分中文？]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=3966</link>
			<pubDate>Sat, 07 Jan 2012 12:25:02 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=3966</guid>
			<description><![CDATA[运行安装说明里的c例子<br />
<div class="codeblock phpcodeblock"><div class="title">PHP 代码:<br />
</div><div class="body"><div dir="ltr"><code><span style="color: #FF8000">#include&nbsp;&lt;scws.h&gt;<br />#include&nbsp;&lt;stdlib.h&gt;<br /></span><span style="color: #0000BB">main</span><span style="color: #007700">()<br />{<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_t&nbsp;s</span><span style="color: #007700">;<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_res_t&nbsp;res</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">;<br />&nbsp;&nbsp;</span><span style="color: #0000BB">char&nbsp;</span><span style="color: #007700">*</span><span style="color: #0000BB">text&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #DD0000">"Hello,&nbsp;我名字叫李那曲是一个中国人,&nbsp;我有时买Q币来玩,&nbsp;我还听说过C#语言"</span><span style="color: #007700">;<br /><br />&nbsp;&nbsp;if&nbsp;(!(</span><span style="color: #0000BB">s&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">scws_new</span><span style="color: #007700">()))&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">printf</span><span style="color: #007700">(</span><span style="color: #DD0000">"error,&nbsp;can't&nbsp;init&nbsp;the&nbsp;scws_t!&#092;n"</span><span style="color: #007700">);<br />&nbsp;&nbsp;&nbsp;&nbsp;exit(-</span><span style="color: #0000BB">1</span><span style="color: #007700">);<br />&nbsp;&nbsp;}<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_charset</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"gbk"</span><span style="color: #007700">);<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_dict</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"/usr/local/scws/etc/dict.xdb"</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">SCWS_XDICT_XDB</span><span style="color: #007700">);<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_rule</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"/usr/local/scws/etc/rules.ini"</span><span style="color: #007700">);<br /><br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_send_text</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">text</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">strlen</span><span style="color: #007700">(</span><span style="color: #0000BB">text</span><span style="color: #007700">));<br />&nbsp;&nbsp;while&nbsp;(</span><span style="color: #0000BB">res&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">scws_get_result</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">))<br />&nbsp;&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;while&nbsp;(</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">!=&nbsp;</span><span style="color: #0000BB">NULL</span><span style="color: #007700">)<br />&nbsp;&nbsp;&nbsp;&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">printf</span><span style="color: #007700">(</span><span style="color: #DD0000">"Word:&nbsp;%.*s/%s&nbsp;(IDF&nbsp;=&nbsp;%4.2f)&#092;n"</span><span style="color: #007700">,<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">len</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">text</span><span style="color: #007700">+</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">off</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">attr</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">idf</span><span style="color: #007700">);<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">next</span><span style="color: #007700">;<br />&nbsp;&nbsp;&nbsp;&nbsp;}<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">scws_free_result</span><span style="color: #007700">(</span><span style="color: #0000BB">res</span><span style="color: #007700">);<br />&nbsp;&nbsp;}<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_free</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">);<br />}&nbsp;<br /></span></code></div></div></div>
<br />
结果如下：<br />
&#36; ./test <br />
Word: Hello/en (IDF = 4.02)<br />
Word: ,/un (IDF = 0.00)<br />
Word: Q/en (IDF = 0.00)<br />
Word: ,/un (IDF = 0.00)<br />
Word: C#/nz (IDF = 9.50)<br />
<br />
中文没出来，是否我哪里没设对啊？<br />
我的系统是centos 6 64位的]]></description>
			<content:encoded><![CDATA[运行安装说明里的c例子<br />
<div class="codeblock phpcodeblock"><div class="title">PHP 代码:<br />
</div><div class="body"><div dir="ltr"><code><span style="color: #FF8000">#include&nbsp;&lt;scws.h&gt;<br />#include&nbsp;&lt;stdlib.h&gt;<br /></span><span style="color: #0000BB">main</span><span style="color: #007700">()<br />{<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_t&nbsp;s</span><span style="color: #007700">;<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_res_t&nbsp;res</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">;<br />&nbsp;&nbsp;</span><span style="color: #0000BB">char&nbsp;</span><span style="color: #007700">*</span><span style="color: #0000BB">text&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #DD0000">"Hello,&nbsp;我名字叫李那曲是一个中国人,&nbsp;我有时买Q币来玩,&nbsp;我还听说过C#语言"</span><span style="color: #007700">;<br /><br />&nbsp;&nbsp;if&nbsp;(!(</span><span style="color: #0000BB">s&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">scws_new</span><span style="color: #007700">()))&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">printf</span><span style="color: #007700">(</span><span style="color: #DD0000">"error,&nbsp;can't&nbsp;init&nbsp;the&nbsp;scws_t!&#092;n"</span><span style="color: #007700">);<br />&nbsp;&nbsp;&nbsp;&nbsp;exit(-</span><span style="color: #0000BB">1</span><span style="color: #007700">);<br />&nbsp;&nbsp;}<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_charset</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"gbk"</span><span style="color: #007700">);<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_dict</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"/usr/local/scws/etc/dict.xdb"</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">SCWS_XDICT_XDB</span><span style="color: #007700">);<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_set_rule</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #DD0000">"/usr/local/scws/etc/rules.ini"</span><span style="color: #007700">);<br /><br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_send_text</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">text</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">strlen</span><span style="color: #007700">(</span><span style="color: #0000BB">text</span><span style="color: #007700">));<br />&nbsp;&nbsp;while&nbsp;(</span><span style="color: #0000BB">res&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">scws_get_result</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">))<br />&nbsp;&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;while&nbsp;(</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">!=&nbsp;</span><span style="color: #0000BB">NULL</span><span style="color: #007700">)<br />&nbsp;&nbsp;&nbsp;&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">printf</span><span style="color: #007700">(</span><span style="color: #DD0000">"Word:&nbsp;%.*s/%s&nbsp;(IDF&nbsp;=&nbsp;%4.2f)&#092;n"</span><span style="color: #007700">,<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">len</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">text</span><span style="color: #007700">+</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">off</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">attr</span><span style="color: #007700">,&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">idf</span><span style="color: #007700">);<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">cur&nbsp;</span><span style="color: #007700">=&nbsp;</span><span style="color: #0000BB">cur</span><span style="color: #007700">-&gt;</span><span style="color: #0000BB">next</span><span style="color: #007700">;<br />&nbsp;&nbsp;&nbsp;&nbsp;}<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="color: #0000BB">scws_free_result</span><span style="color: #007700">(</span><span style="color: #0000BB">res</span><span style="color: #007700">);<br />&nbsp;&nbsp;}<br />&nbsp;&nbsp;</span><span style="color: #0000BB">scws_free</span><span style="color: #007700">(</span><span style="color: #0000BB">s</span><span style="color: #007700">);<br />}&nbsp;<br /></span></code></div></div></div>
<br />
结果如下：<br />
&#36; ./test <br />
Word: Hello/en (IDF = 4.02)<br />
Word: ,/un (IDF = 0.00)<br />
Word: Q/en (IDF = 0.00)<br />
Word: ,/un (IDF = 0.00)<br />
Word: C#/nz (IDF = 9.50)<br />
<br />
中文没出来，是否我哪里没设对啊？<br />
我的系统是centos 6 64位的]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[如何修正分词错误]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=3964</link>
			<pubDate>Fri, 06 Jan 2012 15:52:56 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=3964</guid>
			<description><![CDATA[问题<br />
①：分词出现错误是该如何修正呢？可否通过添加用户字典等方法来修正呢？<br />
<br />
现在时间分词为： 现在时/n 间/f<br />
<br />
期待分词结果：现在 时间<br />
<br />
②词性方面如何修正呢？<br />
例如，希望将，“了”的词性由 v 改为： e<br />
新建一个userdic辞书，然后添加：<br />
了      1.0     1.0     e<br />
<br />
通过：scws_add_dict(s, "/usr/local/scws/etc/userdict.utf8.xdb", SCWS_XDICT_XDB);<br />
 <br />
结果还是不对。]]></description>
			<content:encoded><![CDATA[问题<br />
①：分词出现错误是该如何修正呢？可否通过添加用户字典等方法来修正呢？<br />
<br />
现在时间分词为： 现在时/n 间/f<br />
<br />
期待分词结果：现在 时间<br />
<br />
②词性方面如何修正呢？<br />
例如，希望将，“了”的词性由 v 改为： e<br />
新建一个userdic辞书，然后添加：<br />
了      1.0     1.0     e<br />
<br />
通过：scws_add_dict(s, "/usr/local/scws/etc/userdict.utf8.xdb", SCWS_XDICT_XDB);<br />
 <br />
结果还是不对。]]></content:encoded>
		</item>
		<item>
			<title><![CDATA[这个不支持英文词典和中英文混合词典啊]]></title>
			<link>http://www.hightman.cn/bbs/showthread.php?tid=3954</link>
			<pubDate>Thu, 29 Dec 2011 16:49:36 +0800</pubDate>
			<guid isPermaLink="false">http://www.hightman.cn/bbs/showthread.php?tid=3954</guid>
			<description><![CDATA[很多应用不可能纯中文啊，总会掺杂一些英文啊中英混合啊。不支持自定义词典中使用英文会有很大局限性啊]]></description>
			<content:encoded><![CDATA[很多应用不可能纯中文啊，总会掺杂一些英文啊中英混合啊。不支持自定义词典中使用英文会有很大局限性啊]]></content:encoded>
		</item>
	</channel>
</rss>
