大小:2.38MB更新时间:2009-08-20软件授权:国产软件
搜易是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。搜易非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过编写数据源插件,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。搜索API支持PHP、Python、Perl、Rudy和Java,搜索API非常简单,可以在若干个小时之内移植到新的语言上。具有以下特性:
索引快。高性能的建立索引(在当代CPU上,峰值性能可达到10MB/秒),500万数据索引耗时30分钟,索引即时压缩,分块存储,索引膨胀率低。数据变更即时,最长5分钟内能被检索,达到准实时搜索。
搜索快。高性能的搜索(500万数据,2-4GB索引,平均每次搜索响应时间小于0.1秒)。搜索磁盘读写量低,内存占用低。单机支持每天1000万次以上搜索。
海量数据。目前已知可以处理超过100GB的文本数据,在单一CPU的系统上可处理1000万文档。
功能全。支持分类检索、筛选;支持根据经纬度周边搜索;支持统计功能,统计不采用概率估算,统计值准确;支持多个全文检索字段(目前最多15个全文检索字段),可指定搜索字段;提供动态摘要,摘要精确清晰;支持停用词、同义词。
排序功能强大。支持最多5个排序字段,排序字段可是数据库字段,相关性权重,时间段。提供优秀的相关度算法,基于短语相似度和统计(TF/IDF)的复合方法。