200808 奥运

当前位置:产品﹠服务首页 >> 信息化管理软件中心 >> 搜索技术 >> 网络信息雷达系统技术解决方案
网络信息雷达系统技术解决方案
2008-07-21 15:14:14  作者:  来源:全球英才  文字大小:【】【】【

 

        网络信息弥补了互联网搜索引擎在专业需求方面的欠缺,通过聚焦定制采集源保证网络信息的实时性和全面性,并可以实现本地化存储,智能处理及再发布功能。其基本目标是满足机构用户及时跟踪和监控互联网信息,从而建立即时信息资料库乃至提供增值信息服务的专业需求。

 

 产品架构

 

 

 产品功能   

  强大的信息实时监控和采集功能  

   可自行定制采集源和监控周期  

     管理人员可随需和方便地指定需要监控采集的目标站点或频道,并设定监控更新的时间周期,包括定点执行、更新隔离,还可设置为自动轮转不间断运行

   具备先进高效的采集技术和策略

    采用多线程并发搜索技术和智能更新策略,每次仅采集最新更新过的网页,全过程合理高效。

   可采集多语种动态网页,适用性强  

     不仅能够采集常见的静态网页,还可以采集多种特殊形式的网页,包括:通过引入日子变量,可精确定位带有日期特征的栏目及其页面;引入页码变量,可有效采集基于数据库发布的多页信息;预设用户名和密码,可采集需要授权认证的站点或频道;引入模板,可精确定位采集页面局部特定内容等等。另外,可将BIG5自动转换为GBK,实现多语种网页的采集、存储和管理。

   可采集网页元数据和多媒体内容  

     可完整地识别并记录每个网页的详细元数据信息,包括网页名称、大小、日期、标题、文字内容等,网页中的图片和表格信息可同时被采集。

 

    先进的自动过滤、分类和排重等智能信息处理功能  

    垃圾信息过滤

      可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取内容主体。

    基于内容的自动分类

      基于内同的自动分类技术,可对网页进行无需人工干预的自动分类,且准确率达到实用要求。同时提供分类个性训练工具,允许用户自行根据自己的分类需求和数据特点设定分类结构,训练学习生成特征模板,提高分类准确度,适用用户特定需求。

    基于内容的自动排重

     采用的排重技术,不是利用简单的规则判断,而是利用内容的相似性进行排重判断,相似阈值可调,准确性高,不会因为标题或内容的少许变化而产生漏判,即使把标题进行了改头换面,系统也会正确判定。 被检出的重复网页不会被即使清除,也可以作为主体网页的相似或者推荐网页进行显示,提供给用户参考。 

 

    灵活便捷的信息发布和检索  

    即时发布所采集信息  

      系统采集的信息可及时通过Web发布模块实时发布,界面以网页的形式展现,仅使用浏览器就可以查看和检索信息,非常方便易用。系统提供信息分类导航和检索功能,对于发布的信息,用户既可以查阅本地数据库中经过自动过滤的内容,也可以对照查阅原链接网页。

 

    可自动发布或人工按需发布  

      系统支持自动发布和人工发布两种方式,在自动发布方式下,采集到的网页将自动发布到网站上;在人工发布形势下,所采集的网页需要经过用户选择才能发布到网站上。

    可发布专题内容

     多系统支持自定制专题,用户可以通过定义关键词规则来建立专题,发布后专题中包含所采集到的满足条件的信息,方便用户跟踪特定主题的内容等。

 

 

        

附:

中国企业信息情报中心:

中国企业家世纪论坛网络实验室下属:搜索情报技术服务中心”我们技术团队主要由搜索引擎领域资深技术专家和专业管理市场人员组成。致力于全文检索技术、中文信息处理技术的研究与开发,拥有国内领先的搜索引擎系列产品。产品包括企业级搜索、行业垂直搜索引擎、站内搜索引擎、企业竞争情报舆情监控)系统、网络信息雷达系统等自主知识产权软件系统。公司客户覆盖各个行业,拥有良好的企业品牌和声誉。 希望以自己的技术和产品为我们的客户带来长期的利益。以长期的技术积累为产品性能和质量保证,以专业化的服务队伍提供技术服务,以专业的销售队伍帮助企业打造属于您自己的搜索引擎技术解决方案。

 

自有核心技术

多线程分布式集群采集技术,形成高并发信息获取能力,多策略采集更新技术,保证信息的准确性和实效性。行业专题链接分析技术,提供行业信息源的主动发现,个性化下载配置功能,帮助用户实现系统性能最优化。面向行业优化的智能分词,实现定制性服务,智能化的文档分析技术,完成内码转换和内容提取。

针对行业领域自动训练,形成信息智能化自动分类。 强大的非结构化数据管理功能, 支持海量信息处理的分布式体系架构。 集成智能中文处理技术,提高查全率和查准率,完善的信息检索手段,支持高级检索 完善的系统管理,集成的统一管理接口,全面的信息搜索应用。 支持多种采集策略和高效的更新策略,保证信息的准确性和实效性。 多种配置功能,满足用户个性化需求。 自动内码转换和垃圾信息过滤 支持海量信息处理的分布式体系架构。

 

   支持及售后服务:

现场解决客户疑难、提供技术培训、软件升级服务、定期巡检和维护、系统优化建议与实施、组织技术交流与研讨、并提供长期的技术咨询。

 

 业务咨询和联系方式:      01081622008 (黄耀波)      

                             移动:15901222008       邮箱: 15901222008@139.com 

                           QQ: 35070302               msn: yourb@msn.com