基于支持向量机的基因表达数据特征选取方法研究(可复制论文).pdf


文档分类:IT计算机 | 页数:约63页 举报非法文档有奖
1/ 63
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 63
文档列表 文档介绍
基于支持向量机的基因表达数据特征选取方法研究摘要微阵列基因表达数据通常包含少量样本和大量基因,对于这样高维的基因表达数据,已经迫切需要开发出一些新的有效的特征选取方法,从而选出少数和疾病最相关的信息基因,以减少计算开销和提高分类精度。目前已有不少特征选取方法应用于基因表达数据,比如顺序前进法、遗传算法、信噪比指标等。支持向量机琒且恢只谕臣蒲袄砺鄣男滦突器学习方法。它采用了结构风险最小化原则,能较好的解决小样本学习的问题,还采用核函数思想,把非线性空间的问题转换到线性空间,降低了算法的复杂度。’基因表达数据的特征基因选取和肿瘤样本分类问题是基因微阵列技术的挑战性课题之一。针对基于基因表达数据的肿瘤样本分类,本文从分类算法和特征基因选取方法两个方面进行了改进。通过一个典型的微阵列基因表达数据集,本文研究了信噪比方法、劾嗨惴ā⒅、序贯最小优化算法的理论及具体应用。改进的信噪比方法、劾嘟岷细慕男旁氡确椒ㄗ魑A街痔卣选取算法用于特征基因的选取,并以支持向量机作为分类器进行肿瘤样本的分类。在支持向量机训练方法中,采用了序贯最小优化算法和新的核函数一,并用劢徊嫜橹ぷ魑猄分类器算法的评价方法,目的是要实现样本分类精度和速度的提高。本文还利用软件对肿瘤样本进行分类训练。整个分类器的流程模型:首先,采用改进的信噪比方法或者甿结合改进的信噪比方法对原始白血病基因表达数据进行特征基因选取,降低样本维数;然后用最小一最大方法规范化特征选取后的数据:最后用支持向量机构造分类器,评价分类结果。实验结果表明本文提出的方法是可行的,具有一定的实际价值。关键词:基因表达数据支持向量机特征选取信噪比序贯最小优化作者:张小丹指导老师:吕建平
知识水坝***@pologoogle为您整理
,,,基于支持向量机的基因表达数据特征选取方法研究瑃,瑆...,.
知识水坝***@pologoogle为您整理
籺瑃.:基于支持向量机的基因表达数据特征选取方法研究甌篺,猰;琣琣畃
研究生签名:蚪日期:堕:三:;鱼期:叼,,,苏州大学学位论文独创性声明及使用授权的声明学位论文独创性声明学位论文使用授权声明内容。论文的公布ǹ授权苏州大学学位办办理。本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分研究生签名:导师签名:日
第一章绪论课题的提出及研究意义随着大规模基因表达谱技术的推广,人们利用基因芯片可以在一次实验中同时获得组织样本中成千上万个基因的表达水平。依据基因芯片测定基因表达谱数据,对基因表达谱数据进行特征基因的选择和提取,并利用特征基因建立有效的分类模型,在分子水平上对肿瘤类型进行分类研究是生物信息研究中的重要内容,受到广泛的关随着革命性的基因芯片技术的出现,人类基因组研究的重点向功能基因组转化,解读生物的遗传密码成为生物信息学的一项重要任务。当今大量的核酸/蛋白质序列、基因/蛋白质结构和功能数据、各种疾病相关数据以及生物文献数据等正飞速增长。在这些海量生物信息数据中,隐藏了有关人类的生长和进化,生理学和医学等重要信息。如何充分利用这些数据、解释这些数据、挖掘数据间潜在生物关系、预测有用的知识和信息,是计算机和生物学家面临的巨大挑战‘俊】【。分析由基因芯片技术产生的基因表达数据是当前生物信息学中的热点研究领域。目前分析这些数据的学习方法有很多,特征选择和提取方面,如信噪比,臣疲向搜索算法,后向搜索算法等:分类方面,如聚类算法,决策树,神经网络,贝叶斯网络,以及支持向量机等。热颂岢龅摹靶旁氡取敝副暧行У奶崛〕隽擞糜谥瘤样本分类的特征基因,甿聚类可以有效地分类出具有共表达的基因。由于支持向量机具有坚实的理论基础,并在很多领域得到了广泛的应用,表现出良好的推广性能,因此得到关注而成为研究热点。用支持向量机方法对基因表达数据进行分类预测【俊且恢钟星巴镜难芯糠较颉VС窒蛄炕魑R恢中滦说幕餮胺椒ǎ着成熟的理论基础,利用它对基因表达数据进行分类研究,可以提高对基因数据的分析能力,挖掘基因正常表达和非正常表达的数据变化范围、差异范围以及基因功能变化的关系,识别、掌握基因突变的规律以及为疾病诊

基于支持向量机的基因表达数据特征选取方法研究(可复制论文) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 63
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 mkt365
  • 文件大小 0 KB
  • 时间2013-11-12
最近更新