舆情监测系统招标

招标基本要求:

产品实用性强,功能设计要非常适合舆情工作需要,系统要能有效利用网络资源和硬件资源,要求生产商具有持续研发能力,具有良好的实施和售后服务能力;

1、要求产品形态为软硬一体化产品,为了完成对舆情监测工作的需要,需提供:1台舆情监控系统采集部分

产品能够利用搜索引擎技术、文本处理技术、知识管理方法,通过对互联网海量信息自动获取、提取、分类、聚类、主题监测、专题聚焦,实现用户对网络舆情监测和热点事件专题追踪等需求,形成舆情简报、专题分析等分析结果,为客户全面掌握舆情动态、实施舆论引导提供分析依据的网络情报、辅助决策系统。

2、支持国内的主流微博和境外指定网站

舆情采集系统实现对指定受监控信息源(新闻、论坛、博客、微博、贴吧、RSS、WAP、电子报、境外网站等)进行定时采集,可对采集时间密度、采集内容、采集方式进行配置管理;维护管理人员可方便指定采集的目标站点或页面。

3、稳定运行,系统完全可以实现7*24小时不间断无人值守的信息采集,系统具备自我恢复启动功能。真正满足舆情监控应用的需要。

配置简单:采集系统支持可视化向导的配置。同时支持定向采集和全网监控。

要求内置JavaScript/Jscript/VbScript等脚本引擎,可以解析和抽取复杂的脚本页面,以应对复杂的采集环境。支持增量采集和完全更新采集。

4、强大的贴吧、论坛采集功能。不但能够采集论坛主贴和所有的跟帖,而且要实时更新。能够采集点击数和回帖数(包括点击数回帖数不在最终的细览页面)。(提供截图)采集结果自动排重,结果排重支持URL的排重方式以及利用内容的相似性进行排重。内置全网采集功能,用户只需要指定所需要的的关键词,就可以轻松实现全网监控。支持HTTP压缩编码传输gzip/deflat,支持代理转换。降低对目标网站的采集压力。减少了被目标网站拒绝采集的概率。网页编码自动识别,支持多语言网页的采集,支持UTF-8、BIG5、GBK、等编码;分页内容重组,对于目标数据源的一篇文章在目标网站上分页显示,系统能自动对其进行重组。内置常用的采集网站,无需过多配置便可轻松实现对常用网站的采集监控。

5、网页智能抽取,采集软件能够自动从复杂的网页内容中通过统计算法,智能抽取出标题、正文、日期、来源和作者等元数据属性。智能抽取兼顾准确性和完整性。(提供截图)采集深度和广度随意控制

6、多线层、多任务、支持异步处理,合理利用系统资源

支持海量数据采集,可根据项目规模进行平行扩展 分析部分

舆情分析模型。舆情分析支持语义分析和舆情知识库。舆情规则支持与或非任意组合。 自动生成热点,计算舆情的热度。热度计算因子通过采集系统实时更新。

7、论坛跟帖实时分析,保证舆情应用中看到的跟帖数据和原网站同步。(提供截图)

要求系统能够对舆情信息进行正负面研判,以便自动发现负面信息,实现对敏感信息的有效监控。