One-class问题研究及应用.pdf


文档分类:外语学习 | 页数:约117页 举报非法文档有奖
1/117
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/117
文档列表 文档介绍
中国科学院自动化研究所
博士学位论文
One-class问题研究及应用
姓名:齐红威
申请学位级别:博士
专业:模式识别与智能系统
指导教师:王珏
20040601
摘要有标签的样本集,前者指如何描述它包含的内在信息胍斐P畔⒒蛟胍粜畔相对应笳咧溉绻汛搜炯魑D勘昀啵绾斡肫渌形薰乩当然也包括掷嗟奈侍狻—侍獾难芯课蘼凼窃谀J绞侗鸹故窃沦文的主要内容包括:攀龇治鯰狢问题的研究内容及研究意义,并首次把猚问题分为猚描述问题和猚分类问题,并给苏饬街治侍獾那枋鑫侍獾哪P停夯诜讲畹男畔⒎纸饽P入了基于主成分分析的算法和基于主曲线的算法。霉善币斐J找婕觳夂退祷叭耸侗鸬奶卣魈崛×礁鍪笛檠橹ち薞型及其算法的有效性。胹方法研究猚分类和觳馕侍狻T诮玱侍獾最大边缘、软边缘和肀咴邓惴ā关键字:猚问题、非监督学****半监督学****信息描述、分类、统计****算法、股票市场、说话人识别、疶狢问题研究及应用:摘要猚问题包括枋鑫侍夂蚾猚分类问题,给定‘组没信息处理领域都具有重要意义。在应用。岢隽艘恢纸饩鰋琕,并为此模型引掷问题理解为一种函数估计问题的基础卜,首次定义了”一猚猳问题的泛化错误,进而定义了线性可分性和边缘,得到了求解状卧趏—掷辔侍庵幸氚爰喽窖暗乃枷耄醡恢职爰督的狢分类算法,此方法在易趣扪卖网站,的商品分类上取得了很好的效果。猙
猚琺.【甿,猄甌‘‘.甤:琖/瑃琣瑃’,.篤猙—,——琔猻,—,珻琒琒,
~社新虢例⋯⋯望灶儿一艿一区淮砸关于论文使用授权的说明独创性声明取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外规定,即:中国科学院自动化研究所有权保留送交论文的复印件,允许缩印或其他复制手段保存论文。本人声明所呈交的论文是我个人在导师指导下进行的研究工作及论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确地说明并表示了谢意。签名期本人完全了解中国科学院自动化研究所有关保留、使宦畚牡论文被查阅和借阅:可以公布论文的令部或部分内容,可以采用影А目
家誫厂,瑀侍庋芯考坝τ第一章概述:猚本文的背景:非监督学****数米评价远独立测试集Ⅳ琁,⋯,。,2馐匝测函数为对测试样本集旱牟馐源砦舐蔥,即损失函数的样本集,如描述它包含的内在信息胍斐P畔⒒蛟胍粜畔⑾喽杂或把此样本集内的样本作为目标类与其它所有无关类样本比灰舶╫分类的阚题。根据这蕊项任务的盆标不斟,可把前者称为基于描述的∞狢掷辔侍。虽然这两种猚问题的目标不同,‘种非监督下的函数估计的问题。为便于理找映射篟。呻,把输入的Ⅳ维随机向量Ⅸ映射到随机变量希勘晔和】,之间的筹异尽量小。如果抢肷⒌模敲创耸奔喽窖熬褪歉龇类问题。为衡量和涞牟钜欤梢远ㄒ宸歉旱乃鹗Х匠蘱厂,,那么此时监督学****的目标就是求解一最小化期望损失的映射甗,即下独立同分布抽得的样本集以簦琁#×渲蠬为样本个数。这种情况下,我们无法解析求得映射/‘,代之的策略是在样本集磊的意义蠼馐蛊谕鸫笞钚〉膄瑉。绻颐悄苊魅返亩ㄒ逡桓銎啦夂个数男阅埽敲凑飧鲅拔侍饩筒皇遣√—綬的学****方法及算法。奉文认为侍馐侵父ㄒ蛔槊挥斜昵问题虺莆狾—枋鑫侍,把后者称为基于分类的狢问题称为解,我们先从讨论非监督学****开始,尔后给出侍獾木咛逍问郊捌应用领域。机器学****可分为监督学****和非监督学****监督学****就是寻衠瑀浚实际问题下,;牧:戏植际俏粗5模氖谴英艉蛂的联合分布第一章概述:侍庋芯考坝τ一—.
在图卜校椒嫉哪康氖桥卸囊惶豕饣叨允莘植济求解映射篟“寸∥,使麓尽可能好的估汁男畔ⅲ馐欠羌喽窖然而,在非监督学****中,并没有一个指导学****的监督信息在这种情况下,我们可以把非监督学****理解为一个对Ⅳ的信息估计的问题,即的一个目标,可称之为信息保持性。当然,如果对,蛔鋈魏蜗拗频幕埃题的解将是平凡的,因为对淖詈霉兰凭褪莤本身。因此,对施加合理就是说尽可能采用简单的,’形式来估计S捎谛畔⒈3中院托畔⒚枋龀ざ信息保持性为代价的虼嗽诤未φ壑哉饬礁雒芤?辞蠼馕侍獾需要,而一般导致非监督学****问题病态性的原因是没有明确的定义一个判断折衷好坏的标准。例如,我们可以得到两个解,:和厶,且瘸有更好的信息保生的关键就是定义一个清晰的评测标准,此标准能评测疋和谛畔⒈3中院图卜屯疾可以帮助我们更清楚的理解非监督学****病态性产生的本质。的点映射到曲线上。在映射过程中,一个目标就是使通过数据集的曲线尽量的的限制条件是非监督学****的另一个目标,即采用尽可能短的信息描述长度,也之问存在矛盾,相对较长的信息描述长度,较短描述长度的信息描述是以损失持性能,而‘比,:具有更短的信息描述长度,在这种情况下,避免病态问题产信息描述长度两个目标下的总体性能。图卜√姆羌喽窖拔侍鈒:哪一

One-class问题研究及应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数117
  • 收藏数0 收藏
  • 顶次数0
  • 上传人779277932
  • 文件大小0 KB
  • 时间2011-06-03