一、产品概述
企业级搜索是面向企业内部信息和企业相关互联网信息的全文检索和智能分析系统。企业级搜索面向企业级用户,满足企业生产经营中需要的企业内外的各种介质、格式的信息,进行挖掘、处理、应用等服务。
企业级搜索引擎是讯星智达公司的核心产品之一,主要目标是为客户提供对单位现有信息资源的整合利用,挖掘出信息的价值。企业搜索通过对非结构化信息、异构信息的统一组织,提供了良好的企业信息服务能力。
二、适用领域
全文检索系统以先进的信息整合处理技术为核心,为政府及企业建设高性能信息检索平台,能够将分散的多种信息集中检索,让用户在一个检索界面即可获取到所需的各种相关信息,不论是内网的网页、办公的文档、行业的数据库,都能提供完美的检索解决方案。目标用户包括:政府机关、新闻出版单位、大中型企业、高校研究机构、以及大型图书馆。如图所示:
企业级搜索引擎适用领域
1. 各级政府机关部门,为政府部门提供内部办公文档的管理和快速获取,提供各种内部数据库的快速检索访问,提供政府相关信息和相关数据的服务;
2. 新闻出版单位信息存储,索引管理历史资讯信息库,便于查找历史文章,管理新闻才能考资讯库,整合内部办公信息;
3. 大中型企业内部信息,便于企业内部员工和不同分支机构,通过多关键词相似匹配和内容分类方式提供信息共享渠道,连通内部办公网络信息和业务信息;
4. 高校研究机构档案资料,整理分散的各类非结构化数据,实现内部机构的研究资料和档案资料管理,提供快速检索和查询方法;
5. 大型图书馆资料管理,整合原有的图书目录系统,实现图书内容简介的全文检索,为电子资料的使用提供帮助;
三、产品架构
企业级搜索引擎产品采用模块化封装,整个产品以异构数据处理和全文检索为中心,引入智能信息处理技术,形成有较高集成度的整体框架。产品部署简单,架构灵活可伸缩。企业级搜索引擎体系架构在全文检索系统基础上,进一步扩展了对企业内部信息获取能力,以及相应的权限管理等模块。总体架构如图所示:
企业级搜索产品架构
四、产品功能特点
系列搜索产品,由具备多年实际行业经验的领域资深专家精心设计而成。从系统分析设计及实现上都体现以用户为中心,力求核心技术一流,产品可用性程度高,实际满足用户的需求和使用方便性。具体包括:
u 严格的信息安全分级体系,保证信息可管理性
企业搜索在安全方面的要求远远高于互联网搜索。企业内部的各种信息内容带有明显的安全级别属性和部门归属属性。几乎每个企业都严格规定了什么样的信息可以给什么样的人阅读,某种信息归属哪个部门发布与存储。
针对企业内部信息系统中,不同的用户使用权限不同的这一特点, 企业搜索提供针对用户、对资源进行权限分级管理和控制能力,确保企业内部信息系统的安全。各种资源在接入系统时会要求设置安全级别,便于对用户访问行为进行控制。
u 可靠的安全保障手段,实现系统的授权访问管理
广泛采用了用户帐号权限控制、IP地址授权和过滤技术,保证对系统的接入安全。通过信息智能分析和过滤机制,设置敏感词表和禁查词表,对检索结果中的敏感信息提供安全管理。实现完善的日志记录机制,保证信息的访问和阅读有据可查,便于及时处理各种信息内容安全隐患。
u 良好的安全扩展体系,可方便的与内部系统对接
数据采集和获取过程中,通过安全的扩展体系,支持以授权方式访问内部信息系统、内部文档目录,保证安全的基础上,实现信息的共享服务。支持对内部某些信息系统的权限统一管理,实现系统间的权限映射。
u 智能化的信息定向信息下载
企业级搜索需要采集部分外部数据,但与互联网搜索引擎不同的是需要对信息进行定向抓取,保证数据的精度和效率。通过对企业信息的智能化分析,针对特定站点和特定主题词进行分析和抓取,形成企业希望的信息源。为企业内部的新闻阅读、专业领域资料采集提供帮助。
u 自适应异源异构数据库网关
针对企业内部各种信息系统,提供数据网关,实现对各种类型数据库的直接访问和内容获取,以元数据映射的方式,完成内部异构信息数据库的整合和统一。
u 多类型信息源的定制和管理
通过指定文件服务器、数据文档目录等方式,灵活管理数据来源,根据不同目录或来源划分为后续安全管理提供自动级别信息。根据内容来源,判断是否需要进行文档格式化分析,将数据库直接读取的结构化信息和半结构化网页信息通过分析模块和元数据描述进行统一。
u 强大的信息海量数据实时索引和管理功能
系统支持多种语种、多种编码管理,实现了高效的数据和索引压缩,超低空间膨胀;利用中文信息处理和优化的倒排文件加快信息索引速度,提高索引可用性。支持信息的及时索引,保证系统的及时性和有效性。
u 支持多服务器的多机服务架构模式
针对大型网站,提供多机分布式或双机互备的服务体系结构,通过把企业内部各种内容分布到不同服务器,可实现用户的应用层实现透明访问,支持松耦合自动切换的双机备份策略,提高系统的运行可靠性。
u 集成各类内容的智能化高查全率和查准率
通过简单关键词查找和信息的分级分类管理,实现信息的高效智能检索;跟踪用户访问提供可维护主题词表,可以根据主题词典进行扩展和相关检索,主题词典自动扩展检索;通过知识挖掘,可以支持拼音纠错检索、相关短语检索和相似性检索等功能。
u 完善的信息检索手段,支持高级检索
企业搜索引擎的检索服务不仅为用户提供丰富的功能,还为用户提供了经过分析的数据信息。除了支持标准搜索引擎所提供的全文检索之外,还支持多种特征检索。比如按日期检索、按关键词检索、按标题检索、按栏目检索、按名称检索等。
u 基于本地的统一管理接口,保障系统安全
产品采用统一管理界面,解决一般搜索引擎产品管理界面不友好的问题。通过图形化入口,对各个独立模块进行管理和操作控制。提供本地化的管理界面,避免Web模式检索的安全隐患。
u 运行参数配置灵活,一次配置自动运行
多种可选服务参数,帮助管理人员方便灵活的完成运行状态的控制;系统自动保存和获取相关运行参数,管理员在部署时一次性设置运行参数后,系统可自动运行服务,减少管理员日常维护的工作量。
u 系统与其它企业应用的有机集成
企业搜索与企业的各种生产数据、决策数据关系密切,往往需要通过特定的管理和组织实现企业内部的整体知识管理;搜索引擎通过配置和综合应用部署为企业提供技术支撑,形成高效的解决方案。
五、运行环境
系统部署环境最低要求如下:
Ø 硬件支持环境:P4
Ø 软件运行环境:
u 操作系统Windows 2000及其以上版本
u Linux 7.0以上版本及FreeBSD系统
Ø 应用服务器:Apache, Tomcat,IIS Server +.NET 等等
附:
中国企业信息情报中心:
中国企业家世纪论坛网络实验室下属:“搜索情报技术服务中心”我们技术团队主要由搜索引擎领域资深技术专家和专业管理市场人员组成。致力于全文检索技术、中文信息处理技术的研究与开发,拥有国内领先的搜索引擎系列产品。产品包括企业级搜索、行业垂直搜索引擎、站内搜索引擎、企业竞争情报(舆情监控)系统、网络信息雷达系统等自主知识产权软件系统。公司客户覆盖各个行业,拥有良好的企业品牌和声誉。 希望以自己的技术和产品为我们的客户带来长期的利益。以长期的技术积累为产品性能和质量保证,以专业化的服务队伍提供技术服务,以专业的销售队伍帮助企业打造属于您自己的搜索引擎技术解决方案。
自有核心技术
多线程分布式集群采集技术,形成高并发信息获取能力,多策略采集更新技术,保证信息的准确性和实效性。行业专题链接分析技术,提供行业信息源的主动发现,个性化下载配置功能,帮助用户实现系统性能最优化。面向行业优化的智能分词,实现定制性服务,智能化的文档分析技术,完成内码转换和内容提取。
针对行业领域自动训练,形成信息智能化自动分类。 强大的非结构化数据管理功能, 支持海量信息处理的分布式体系架构。 集成智能中文处理技术,提高查全率和查准率,完善的信息检索手段,支持高级检索 。 完善的系统管理,集成的统一管理接口,全面的信息搜索应用。 支持多种采集策略和高效的更新策略,保证信息的准确性和实效性。 多种配置功能,满足用户个性化需求。 自动内码转换和垃圾信息过滤 。 支持海量信息处理的分布式体系架构。
支持及售后服务:
现场解决客户疑难、提供技术培训、软件升级服务、定期巡检和维护、系统优化建议与实施、组织技术交流与研讨、并提供长期的技术咨询。
业务咨询和联系方式: 010-81622008 (黄耀波)
移动:15901222008 邮箱: 15901222008@139.com
QQ: 35070302 msn: yourb@msn.com