下载此文档

网络信息资源的数据挖掘类型与应用研究.doc


文档分类:IT计算机 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
1 网络信息资源的数据挖掘类型与应用研究随着 的飞速发展, 网络信息资源急剧增长, 网络信息过载问题日益突出, 人们越来越多地关注如何开发和利用这些资源。然而, 目前中英文搜索引擎均存在查准率、查全率不高的现象, 这种现状无法适应用户对高质量的网络信息服务的需求; 同时, 电子商务以及各种网络信息服务迅速兴起, 原有的网络信息处理与组织技术无法赶上这样的发展趋势。网络信息挖掘就是在这样的环境下应运而生,并迅速成为网络信息检索、信息服务领域的热点之一。网络信息的数据挖掘不仅包括对网页内容本身的挖掘,也包括其链接模式, 以及用户访问、存取、浏览、发布、操作等操作行为、访问行为所产生的信息的挖掘。有效地研究、挖掘、利用网络信息可以增强网站的吸引力, 有的放矢地吸引用户群,更有效地利用网络资源。一、网络信息资源及其特点网络信息资源是指放置在英特网上能满足人们信息需求的信息集合。网络信息资源极其丰富, 包罗万象, 其内容涉及农业、生物、化学、数学、天文学、航天、气象、地理、计算机、医疗和保险、历史、法律、音乐和电影等几 2 乎所有专业领域, 是知识、信息的巨大集合, 是人类的资源宝库。网络信息资源是一种新型数字化资源,与传统文献相比有较大的差别。网络信息资源具有一下特点: 1、数量大, 类型多传播范围广。网络信息类型多样, 有文本、数据、图像、图形、声频、视频信息、多媒体信息等; 内容既有高质量的信息, 也有有害信息和虚假信息, 有个人信息也有在政府信息。最为特殊的是各种非正式信息被广泛生产与传播。 2、网络信息资源没有统一的管理机制, 信息安全缺乏保障。黑客攻击、计算机病毒和色情泛滥成为网络的三大痼疾。为防止有害信息耗费了大量的社会资源。 3 、网络信息资源分布零乱无序,信息更新快,寿命短,管理相对困难。信息发布自由, 来源广泛, 内容混杂, 质量不一,控制也比较困难。 4、以网站为信息活动的单位, 以网页为信息发布和收集的单元。 5 、信息利用水平取决于网站软硬件的技术水平和服务能力, 网络信息提供方式是以网站为基点并可在网站间灵活链接的信息服务网。 6、网络创造了多层次的信息交流模式, 全面反应了社会生活的各个领域,形成了百科全书式的知识网络和传播功能。二、数据挖掘的语言 3 数据挖掘语言有助于数据挖掘系统平台的标准化,推动数据挖掘应用的发展。数据挖掘语言根据功能和侧重点的不同, 可分为三种类型: 数据挖掘查询语言、数据挖掘建模语言、通用数据挖掘语言。(一)数据挖掘查询语言 DMQL 数据挖掘查询语言 DMQL 由数据挖掘原语组成。数据挖掘原语用来定义一个数据挖掘任务, 通过查询的方式实现与数据挖掘系统通信, 获得所需信息。数据挖掘查询语言 DMQ L 主要有五种基本的数据挖掘原语定义:任务相关数据原语、被挖掘的知识的种类原语、背景知识原语、兴趣度测量原语、被发现模式的表示和可视化原语。 DMQL 是基于这五种数据挖掘原语设计的查询式语言,类似于 SQL 语言的语法,因此很容易与 SQL 关系查询语言集成,很容易从关系数据库中挖掘知识信息。 MSQL 是另一个数据挖掘查询语言, 由 Imielinski 和 Virmani 提出。它使用了类似于 SQL 的语法和 SQL 原语,为了规范规则产生和规则选择,提出了被称作 GetRule 和 SelctRul

网络信息资源的数据挖掘类型与应用研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数6
  • 收藏数0 收藏
  • 顶次数0
  • 上传人apanghuang7
  • 文件大小76 KB
  • 时间2017-05-28