乐思网络舆情监测系统
乐思网络舆情监测系统是基于全球领先的互联网采集监控技术而研发,具有发现快,信息全,分析准的优势。可让用户眼观六路耳听八方,在第一时间发现负面舆情。
一、 系统概述
乐思网络舆情监测系统是针对互联网这一新兴媒体,通过对海量网络舆论信息进行实时的自动舆情采集,舆情分析,舆情汇总,舆情监视,并识别其中的关键舆情信息,及时通知到相关人员,从而第一时间应急响应,为正确舆论导向及收集网友意见提供直接支持的一套信息化平台。
其业务流程如下图所示:
图1: 乐思网络舆情监测系统的业务流程
相比目前的人工舆情监测,其优势明显:
比较指标 |
人工监测 |
采用乐思网络舆情监测系统 |
目标网站 |
几十个 |
几百个到几千个几万个-采3453舆情4533集- |
人力成本 |
需分别登录各个网站,手工查阅,还要手工复制粘贴,疲于奔命 |
网络信息的获取工作完全由软件自动进行,监测人员只需在内网集中进行内容的浏览与分析 |
负面信息识别 |
需要逐条人工查看确认 |
在自动判别的基础上再人工确认 |
信息保存 |
零碎,不可避免会出错 -采3453舆情4533集- |
精确,全面,便于事后追踪 |
数据存储 |
Word文件,分散,很难管理 |
统一存放在大型关系数据库中,集中管理 |
监测报告 |
基于手工统计加估计,数据支持不充分 |
基于自动化的统计分析, |
监测效果 |
覆盖片面,不及时 |
覆盖全面,实时,几分钟到几十分钟 |
二、 实施后的利益
监测目标: 一切与本市本省相关的信息,特别是负面信息
后续处理: 人工与目标网站负责人交涉(要警惕某些所谓删贴公司乃骗子勒索公司),做好应对措施,在第一时间发布对应处理消息
实施后好处:
1. 可实时监测微信、微博,论坛,博客,新闻,搜索引擎中相关信息web2db knowlesys web2db
2. 可对重点QQ群的聊天内容进行监测
3. 可对重点首页进行定时截屏监测及特别页面证据保存
4. 对于新闻页面可以找出其所有转载页面web2db knowlesys web2db
5. 系统可自动对信息进行分类26禁止9盗用0
6. 系统可追踪某个专题或某个作者的所有相关信息
7. 监测人员可对信息进行挑选,再分类
8. 监测人员可以基于自己的工作结果轻松导出制作含有图表的舆情日报周报
最终目的:
♦ 可排除或缩小偶发负面信息给本省/市形象及本省/市领导带来的不利影响乐knowlesys思
♦ 可及时发现关于本市本省的舆情呼声,第一时间了解民意,在萌芽状态化解矛盾乐knowlesys思
三、 系统组成
乐思网络舆情监测系统由两个子系统组成:自动采集子系统(采集层)与分析浏览 子系统(分析层与呈现层)。其关系如下图所示:
图2:乐思网络舆情监测系统架构
乐思网络舆情监测系统的网络拓扑结构如下图所示,依据需要也可以分开在隔离的外网与内网中实施。
图3:网络拓扑结构
四、 自动采集子系统功能描述
自动采集子系统可以对任意目标网站进行自动采集。
例如:新华网、强国论坛、天涯社区、西祠社区、网易社区、新浪论坛、搜狐社区、凤凰网、百度贴吧、以及用户指定的其他动态网站。可以抽取所有新闻文章或主题帖或者最新主题帖内容,还可以抽取某个主题帖的所有回复帖或者最新回复帖的内容。即可指定某个目标网站进行监测,也可以不指定目标网站对于全球范围内网站进行监测,或者进行两者混合监测。既可以监测国内网站,也可以监测国外网站如Facebook, Twitter,BBC,CNN。
自动采集子系统还可以对基于应用程序的聊天室程序监测。
后端数据库支持任意的主流关系型数据库,如Oracle, IBM DB2, MS SQL Server, MySQL, Sybase以及文件型数据库Access等。
自动采集子系统的全方位监测功能如下图所示:
图4:自动采集子系统全方位监测
自动采集子系统具有以下几个显著特点:
1. 全球领先的自动采集功能
乐思软件的网络信息采集技术全球领先,支持对任意网页内任意数据的精确采集。乐思软件每天都为国内外用户针对各种各样的网站提供采集服务,没有高效稳定的采集平台是无法做到的。
2. 支持各种监测对象
可以实时监测微信,微博,新闻,论坛,博客,公共聊天室,搜索引擎,留言板,应用程序,报刊网站电子版等。
3. 无需配置直接监测几千个新闻网站
系统内置对全球范围内网站的监测配置,只需输入关键词,自动采集出文章标题与正文。
4. 强大的多语言统一处理功能26禁止9盗用0
可自动处理并保存中文,英文,法文,德文,日语,韩语,维文,阿拉伯语等多种语言。
5. 智能文章提取
对于文章类型网页,可以无需配置,直接自动提取文章正文与标题,以及作者发布日期等,自动去除广告,栏目,版权等无关的垃圾内容
6. 完美支持各种网页情况
支持当前流行的Web 2.0 AJAX动态网站
支持用户名与密码自动登录
支持表单查询
支持下一页自动浏览功能
支持多页面文章内容自动抽取与合并
可以自动下载正文内图片以及各类附件
可以选择保存原文快照以备查
支持多种互联网协议: HTTP、HTTPS、以及FTP
支持多种网络文件格式:HTML/XML/CSV/TEXT/RSS/ATOM
…
您知道吗?--我们的系统所提供的各种特性组合起来可以处理成千上万种网页或数据的不同情况
7. 自动去重功能
每次采集时,对于同一个URL,仅采集最新的没有采集过的文章内容或回复,对于已经采集过的内容,自动忽略。对于转载文章,可以选择自动去重。
8. 内置各种后期数据处理功能
数据从网页上获取后,可进一步精加工为各种更细粒度的字段数据或者合并整合,替换统计等. 例如关键词抽取,街道地址抽取,省市名称抽取,邮编抽取,电话号码抽取,传真号码抽取,电子邮件地址抽取,QQ/MSN/Skype抽取,URL抽取等。26禁止9盗用0
9. 可无人值守全天候自动采集
可定时运行,也可7×24小时运行,可设置采集时间间隔最短为1分钟。
10. 用户可以自行添加目标监测网站
利用系统提供的采集平台,用户可以很容易地对目标网站进行可视化分析,配置出采集任务文件,加入调度过程,从而可以任意修改,增加,移除监测目标。
五、 内容分析子系统功能描述
内容分析子系统抽取出内容的元信息,基于用户的关键词设置,对内容进行实时地自动分类自动聚类。
乐思研发的超高速关键词提取技术,在3万字的文章中查找1万个关键词的出现次数, 不超过6.9毫秒。
六、 界面呈现子系统功能描述
功能架构如下图所示:
图5: 界面呈现子系统功能架构
分析浏览
子系统具有以下显著特点:
1. 多人协同工作
不同用户浏览不同内容,执行不同操作,完成不同职责
2. 文章要素显示, 疑似负面信息自动提示
对于新闻文章与博客文章,可采集标题,正文,作者,发布时间,来源
对于关键词用高亮背景彩色显示
3. 帖子要素显示, 疑似负面信息自动提示
对于论坛帖子,可采集标题,正文,作者,发贴时间,查看次数,回复贴数, 发贴人IP
对于关键词用高亮背景彩色显示
4. 分类与编辑
对于采集后的信息内容,可以进行过滤,分类,备注,与编辑,便于后期管理与分析
5. 强大的搜索功能
既可以精确搜索也可以模糊搜索,既可以按分类搜索,也可按来源搜索
6. 支持人工采集
对于某些紧急或异常情况,可以人工输入采集到的信息
7. 反网站限制功能
可采集被国内屏蔽的国外网站,可采集限制了来源IP与访问频率的网站,可自动获取代理IP,无需设置
8. 短信通知功能
可以设定关键词,凡是采集内容出现了一个或多个关键词,就可以将该条记录发送给相关短信接收人员,便于无人值守实时监测。
9. 利用舆情分析引擎生成舆情报表
热点话题列表、发贴数量、评论数量、作者个数
敏感话题列表
自动摘要
自动关键词抽取
各类别趋势图表
新闻类报表: 标题、出处、发布时间、内容、点击次数、评论人、评论内容、评论数量等
论坛类报表: 帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等
七、 系统实施
系统主要应用于政府部门以及大中型企业的公关部门。
由于互联网的复杂性,乐思网络舆情监测系统实施起来需要客户的配合。
针对客户需求,我们提供如下系统实施服务:
编号 |
名称 |
内容 |
1 |
交钥匙工程 |
提供乐思网络舆情监测系统的整套软件与文档, |
2 |
培训 |
提供远程培训或上门培训服务 |
3 |
后续服务 |
定期提供目标网站更新后的配置参数文件 |
4 |
技术支持 |
通过电话、Email、QQ/MSN/Skype 回答用户的问题 |