1> 本系统的全文检索是基于lucence开发的,用的分词器是JE-Analysis,效果还不错,当然也会有分词不准的地方,相比比较方便放心
2> 分词器它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语,这里说的无效词语是指英文中的"of"、 "the",中文中的 "的"、"地"等词语,这些词语在文章中大量出现,但是本身不包含什么关键信息,去掉有利于缩小索引文件、提高效率、提高命中率。
3> 假如文章的标题是纯英文没有空格分隔符,例如testgood,那搜索的时候只能完全匹配搜索,假如有空格符分开,例如test good,就可以搜索test或者good,数字也一样
4> 汉字搜索的话,最好以常用词组来搜索,总之一句话,存在数字或者英文以空格分开来实现全文检索
   
地址:河北省石家庄市裕翔街26号     邮政编码:050018     邮箱:webmaster@hebust.edu.cn     冀ICP备05002802号