下载此文档

主动式半监督学习算法及研究.pdf


文档分类:论文 | 页数:约55页 举报非法文档有奖
1/55
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/55 下载此文档
文档列表 文档介绍
烟台大学学位论文原创性声明和使用授权说明

原创性声明

本人郑重声明: 所呈交的学位论文,是本人在导师的指导下,独立进行研究工
作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体
已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已
在文中以明确方式标明。本声明的法律结果由本人承担。

论文作者签名: 日期: 年月日


学位论文使用授权说明

本人完全了解烟台大学关于收集、保存、使用学位论文的规定,即:
按照学校要求提交学位论文的印刷本和电子版本;
学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;
学校可以采用影印、缩印、数字化或其它复制手段保存论文;
在非保密的论文范围内,学校可以公布论文的部分或全部内容。

(保密论文在解密后遵守此规定)



论文作者签名: 导师签名:
日期: 年月日
烟台大学硕士学位论文
摘要
半监督学****是目前机器学****与数据挖掘的研究热点,通过较少的监督信息(如
标注样本点或成对约束信息)和大量的未标注数据提供的数据分布信息,能对数据
集内的点进行正确归类。大量研究表示,高质量的监督信息有助于聚类,而监督信
息的选择不当可能会造成聚类结果的下降,因此监督信息的选择得到人们的关注。
本文将半监督学****与主动式学****相结合,通过主动获取高质量的监督信息来改
善聚类的效果。主动式学****策略一方面通过获取具有最高信息量的点的类别,来加
快学****过程;另一方面,通过确认一些不确定性较高的成对约束信息,也能快速提
高归类效果。本文的工作大体分为三个部分:
首先,提出了一种混合约束的半监督最近邻学****算法,标注点和成对约束信息
以不同方式同时发挥作用,取得了较好的效果。在该算法中,标注点用于计算未标
注点与各类别已知数据集之间的距离,而成对约束信息控制未标注点的类别分配过
程。
其次,提出了基于邻域不一致性的主动式学****策略,包括数据点的学****和成对
约束的学****两个方面。在数据点的学****中,提出了两种学****策略,即基于
Citation-KNN 的打分策略和基于桥点的学****策略并与另外两种算法进行了对比;在
成对约束的学****中,提出了纠错式学****算法 ALEC。通过实际数据集上的实验验证
了以上学****策略的有效性。
最后,对大数据集给出了预处理方法,通过提取骨架的方式得到数据集的代表
点集合,在代表点集合上进行聚类后,对原数据集进行标注。初步实验表明,通过
对原始数据集的压缩,可以在保持 CRI 稳定的同时大幅降低聚类所需的时间。
关键词:半监督学****主动式学****学****策略
I
烟台大学硕士学位论文
Abstract
Semi-supervised learning is a hotspot in machine learning and data mining now. With
a small amount of priori knowledge (such as the labelled data or pairwise constraints) and
the distribution of a large number of unlabelled data, semi-supervised learning can make
the data points be classified correctly. Many studies indicate that priori knowledge can
help us to improve clustering performance, but at the same time, because of the improper
choice of supervisory information, it may cause a decline in clustering performance, so
the choice of supervisory information attracts a general attention.
In this dissertation, semi-supervised learning bined with active learning to
improve the clustering performance by improving the quality of supervisory information.
On one hand, the label

主动式半监督学习算法及研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数55
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2286107238
  • 文件大小0 KB
  • 时间2015-09-02
最近更新