下载此文档

基于KPS的Web信息抽取MAS模型的研究与设计.pdf


文档分类:IT计算机 | 页数:约68页 举报非法文档有奖
1/ 68
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 68 下载此文档
文档列表 文档介绍
南昌大学
硕士学位论文
基于KPS的Web信息抽取MAS模型的研究与设计
姓名:钱君
申请学位级别:硕士
专业:计算机应用技术
指导教师:段隆振
20071224
摘要随着计算机技术、通讯技术的飞速发展和个人计算机的普及,作为一个全球网络。越来越融入到人们的生活、工作、学习、商务活动中。而在给我们带来便捷、快速、廉价、丰富的信息的同时,也给我们带来了一个问题。虾拼蟮男畔⒘亢陀没У男枨笾什搜现氐牟黄胶夂兔埽嗣很难在短时间内在海量的信息中找到自己真正感兴趣的数据,于是人们对高效率的信息获取技术的需求越来越迫切。畔⒊槿∠低常梢允谷嗣歉咝У鼗取真正感兴趣的信息,并可在此基础上进一步完成数据挖掘,信息检索等后续信息处理,为海量的畔⒌脑倮锰峁┝丝赡埽虼擞凶琶飨缘挠攀坪凸阔的应用前景,是当今多个领域的研究热点。低呈悄壳凹扑慊蒲Я煊蛑幸桓龇浅V匾!⒀芯炕钤镜哪谌荨系统特别适合复杂、难以预测、动态变化的问题的处理。固有的开放、分布、异构、复杂等特性为峁┏浞值挠τ没 6郃系统怯啥喔鯝协调合作所形成的问题求解网络。多低持械拿扛鯝都有它自己独立的局部知识库、目标和能力,之问能够协调相互之问的行为,通过协商解决冲突,通过合作达到共同的目标。在现有相关研究的基础上,本文提出~个基于,,的畔⒊槿〉亩郃系统P汀;贙的信息抽取方法集合了分别基于关键字、模式和样本的信息抽取技术的优点,有利于满足抽取高精度、高复杂度和高性能信息的要求。一个多低姒可以把问题由大化小,由复杂变简单,每个瓿梢桓鲂∧勘辏珹间通过协调和合作,共同完成复杂的畔⒋怼6ɑ贙的畔⒊槿方法与多低辰杏谢慕岷希梢源蟠蠼档蚖信息抽取的难度,提高信息抽取的精度,从而更大地满足用户的需求。关键词:畔⒊槿。琄,雌珹
伽琓,瓵狝.,、№,’.’,.瑆Ⅱ
,珹狝篧痙Ⅲ
导师签名:翟隆砺钨签字日期:加—己月即日签字日期:叼年忙月柙签字日期:劢刁年/胡鈡学位论文作者签名:钱磊学位论文独创性声明学位论文作者签名中:钱雹学位论文版权使用授权书为获得直昌盍堂或其他教育机构的学位或证书而使用过的材料。、使用学位论文盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位沦文全文数据库》,并通过网络向社会公众提供信息服务。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ
第乱研究背景随着计算机技术、通讯技术的飞速发展和个人计算机的普及,作为一个全球网络,越来越融入到人们的生活、工作、学习、商务活动中去。企业及个人通过建立网站或网页及时发布自己的信息、资源、需求,同时又通过网络来寻求帮助,获取信息。略作琖魑R桓鋈化信息空间,正越来越受到人们的重视,成为继书籍、报纸杂志、电视后的又一大信息载体。然而诟颐谴幢憬荨⒖焖佟⒘邸⒎岣坏男畔⒌耐保也给我们带来了一个问题。越来越多的企业和个人通过⒉夹畔ⅲ沟肳产生了严重的不平衡和矛盾,用户为了获取自己需要的一点点信息,可能需要花费几十分钟、几个小时、甚至更长时间来搜索、浏览网页,查找信息,一不小心就会淹没在信息的海洋中。上述问题的关键在于畔⒌姆⒉加脘蓝际峭ü贖騒语法的页面实现的,而或欠墙峁够虬虢峁够挠镅裕俏薹ū患扑机所理解,也无法像传统的数据库那样,提供结构化的、功能强大的、高效的查询语句。如何让计算机从菰粗谢袢∮没璧男畔ⅲ庹切畔⒊取的任务。畔⒊槿〖际醯暮诵氖鞘侗餒趁嬷幸男畔⒌悖⒔渥换为结构化、语义更为清晰的格式。成功的畔⒊槿∠低辰ò鸦チM涑随着需求的增加,近年来国内外涌现了多种信息抽取方法。在希琀文本信息仍然占主导地位,因此,面向内容的信息抽取方式一直是我们研究的重点。目前,此类抽取方式主要有三种:基于关键字的信息抽取、基于模式的信息抽取和基于样本的信息抽取。第一种抽取方法主要适用于抽取与关键字相关的简单信息,如某人的地址信息等;第二种抽取方法则主要依靠钠ヅ淅词迪郑槿」桃妆痪哂欣嗨平峁沟钠渌畔⑺扇牛欢谌种抽取方法则需要事先找到一个完美的样本页面,这一点在如今追求个性化的上的信息量以指数级的增长速度在增长,虾拼蟮男畔⒘亢陀没У男枨笾巨大的数据库。
本文工作本文结构页面风格背景下是很难做到的。而基于胂男畔⒊槿》椒ǎ梢约汕叭叩优点,大大降低信息抽取的难度,同

基于KPS的Web信息抽取MAS模型的研究与设计 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 68
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 durian
  • 文件大小 0 KB
  • 时间2014-04-23
最近更新