下载此文档

基于SOM神经网络的聚类可视化方法研究.pdf


文档分类:IT计算机 | 页数:约36页 举报非法文档有奖
1/36
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/36 下载此文档
文档列表 文档介绍
东北师范大学
硕士学位论文
基于SOM神经网络的聚类可视化方法研究
姓名:齐志
申请学位级别:硕士
专业:计算机软件与理论
指导教师:杨志强;林和平
20090501
摘要随着数据库技术的成熟应用和的迅速发展,人们利用信息技术生产和搜集数据的能力大幅度提高,使得从大量数据中挖掘出有用的信息或知识成为一个迫切需要解决的问题。正是这种需求推动了数据挖掘的兴起和数据挖掘技术的发展。数据挖掘经常要面对一些有噪声、杂乱、非线性的数据,而神经网络具有良好的鲁棒性、自适应性、并行处理、分布存储和高度容错性等特点,因此神经网络非常适合解决数据挖掘的聚类分析是数据挖掘的一项重要功能,特别对高维数据的分析具有非常大的优势。自组织特征映射窬绮坏谑萃诰颉⒒餮啊⒛J椒掷嗪涂墒踊械玫了广泛的应用,同时可视化技术是进行生物数据挖掘的重要手段。本文以聚类算法为基础,总结和分析现有的数据可视化方法,对聚类结果可视化技术进行深入且细致的研究。并提出用非线性主成分分析妥宰橹成网络相结合的方法对生物信息学中基因表达数据进行聚类可视化分析。通过对实验结果的分析,表明这种方法有较高的聚类***仿剩糜诨虮泶锸莸木劾喾治鍪切兄行У摹关键词:数据挖掘;自组织特征映射神经网络;非线性主成分分析一些问题。聚类分析;可视化
.篋,,唱·,猟蒩.,.瑃,;;瓵瑆;;
学位论文作者签名:盟期:立兰心期:口掣,夕日氇指导教师签名:垡垫亟聋指导教师签名:绁壁£卫垒学位论文使用授权书独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编本学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ/\承担。学位论文作者签名:日期:日学位论文作者毕业后去向:工作单位:通讯地址:电话:邮编:、
第滦髀研究的背景和意义东北师范大学硕士学位论文越来越大,数据的种类也日益增多,特别是由于互联网的发展带来的海量的数据和信息。面对如此大规模的、并且存在着噪声的数据海洋,如何从中提取出隐含的、有意义的、对决策有用的信息或知识,进一步提高信息利用率,成为“信息时代酱饩龅囊桓问题。数据挖掘Ⅲ,又称为数据采掘、数据开采,相近的术语有数据库知识发现挖掘是指从大型数据库的数据中提取人们感兴趣的知识,而这些知识是隐含的、事先未知的、潜在的有用信息。原始数据可以是结构化的,如关系型数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,还可以是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。数据挖掘在数据库、人工智能、数理统计、可视化、并行计算等领域都有着广泛的研究前景,国内外许多研究工作者对该领域投入了极大的热忱。在数据挖掘中,聚类分析是一个具有挑战性的领域,聚类就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。相异度是根据描述对象的属性值来计算的。距离是经常采用的度量方式。聚类不同于分类,在分类模块中,对于目标数据库中存在哪些类是已知的,要做的就是将每条记录分别属于哪一类标记出来;而聚类所要划分的类是未知的,也就是在对目标数据库到底有多少类预先不知道的情况下,希望将所有的记录组成不同的类或者说“聚类”,并且使得在这种分类情况下,以某种度量为标准的相似性,在同一聚类之间最小化,在不同类之间最大化。由聚类所生成的簇是~组数据对象的集合。在数据挖掘中,多维数据的可视化分析已成为探测数据中隐藏信息的强有力工具。通过人机交互,可以充分利用人类的感知、联想能力以及领域知识,将图形所呈现出的数据结构特征及关联特征转换为可利用的、有用的信息。多维数据可视化比低维数据可我们知道图形是帮助人们思维和判断的重要手段,当数据只有一个或两个变量时,可以用通常的直角坐标在平面上作图。当数据有三个变量时,虽然也可以在三维坐标上作图,但已经感到很不方便。当变量多于三个时,由于笛卡儿坐标系最多只有三个坐标,因此已经不能用通常的方法作图了。而且在大型数据库中的多维数据集一般不含有空间语义,数据集的各维之间没有空间连贯性,这也很难用传统的二维或三维图形直接表示现代信

基于SOM神经网络的聚类可视化方法研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数36
  • 收藏数0 收藏
  • 顶次数0
  • 上传人banana
  • 文件大小0 KB
  • 时间2014-05-18