下载此文档

舆情分析系统技术方案.docx


文档分类:通信/电子 | 页数:约26页 举报非法文档有奖
1/26
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/26 下载此文档
文档列表 文档介绍
舆情分析系统技术方案.docx舆情分析系统设计方案川省计算机研究院二0-0年八月目录1项目背景 12系统设计 32」系统架构 103系统功能设计 113」」主题检索 12331自动摘要 134关键技术 144」敏感识别技术 185系统安全防护 251项目背景舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源有:新闻评论、BBS、聊天室、博客、聚合新闻(RSS)O网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容易出现庸俗、灰色的言论。与国外相比,我国网络舆情还存在以下特殊情况:一是由于历史的原因,我国曾长期处于封闭状态,容易受到外来思想文化的冲击。二是目前我国正处于社会转型期,不可避免地存在诸多矛盾,容易使一些人出现情绪化冲动,以致不能明辨是非。三是少数社会管理者对于舆论****惯于回避或堵塞。因此,网络这把锋利的“双刃剑”在提供了下情上达的便捷方式的同时,也对我国政治安全和文化安全构成了严重威胁,具体表现在以下三个方面:一是西方国家利用网络对我国进行“西化”、“分化”,网上思想舆论阵地的争夺战日趋激烈。二是传统的政治斗争手段,在网上将以更高效的方式实现,利用网络串联、造谣、煽动将比在现实中容易得多,也隐蔽得多。三是通过网络,西方的观念、生活方式可以便捷地渗透进来。对于网络舆情的这些特点,社会管理者应当了然于心。对现实中出现的各种网络舆论,社会管理者应能做出及时反馈,防微杜渐,防患于未然。因此,必须利用现代信息技术对网络舆情予以分析,从而进行控制和引导。:数据采集、数据预处理、舆情分析和舆情发布,如图所示:舆情发布舆情分析步骤通过采集系统将用户关注的网站信息自动收集,然后通过预处理,得到网页正文内容,对其主题进行分析,最后将分析结果进行发布。221数据采集数据采集是通过遍历用户关注的网站列表,抓取其网站内容,并且根据其源文件生成下级URL列表,将列表中网页源文件抓取出来存入数据采集数据库中。工作流程图如下所示:_r 网站根域名 〉抓取主页面 解析源文件-T1URL列表一 —采集数据库抓取主页面数据采集工作流程图222数据预处理收集到的网页信息包含很多HTML标签等与正文内容无关的信息,因此需要对网页主题内容进行提取。网页主题内容的提取当前已经成为web信息处理中的研究热点。通过研究表明,通过提取主题信息可以减少一半的浏览时间。对于网页分类来讲,网页主题提取是数据与处理中的至关重要的环节。同传统的中文文本相比,网页结构要复杂得多,网页文档中除了主题信息外往往包含很多“噪音”内容,这些“噪音”内容包括广告信息、超链接、图片和flash等等。,生成向量空间模型,然后与预处理文本进行比对,,每台服务器都具有等价的地位,都可以单独对外提供服务

舆情分析系统技术方案 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数26
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sssmppp
  • 文件大小139 KB
  • 时间2019-11-18