下载此文档

面向软件仓库挖掘的数据驱动特征构建方法.pdf


文档分类:IT计算机 | 页数:约62页 举报非法文档有奖
1/62
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/62 下载此文档
文档列表 文档介绍
硕士学位论文面向软件仓库挖掘的数据驱动特征构建方法 Data Driven Attribute Construction forMining Software Repositories 学号: 指导教师: 完成日期: 21217010 大连理工大学 Dalian University ofTechnology 万方数据一一大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目: 亘鱼这鲑佥鏖揎塑丝熬量墼邈鳖堑塑建左洼作者签名: 左鱼笼晷日期:—盗垦L年—厶月—兰日万方数据大连理工大学硕士学位论文摘要软件仓库挖掘是近几年软件工程研究中的重要领域。在软件仓库挖掘领域中,软件工程任务通常转换成为数据挖掘问题。领域特征作为联系软件工程任务数据与数据挖掘算法的关键内容,严重影响软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中构建有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。本文通过问卷调查的形式总结已有的软件仓库挖掘领域的特征构建方法,并在此基础上提出面向软件仓库挖掘的数据驱动特征构建方法,它是一种基于多名志愿者辅助的全新数据驱动特征构建方法。对于给定的软件工程任务,该方法从任务的数据集中选取部分数据(如源代码,缺陷报告等),同时招募若干志愿者依据这部分数据人工完成软件工程任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素。研究者通过分析这些因素,构建软件工程任务所需的领域特征。本文以软件仓库挖掘的典型任务缺陷报告摘要为案例对该方法进行深入分析,实验结果表明,该方法能够高效的发现领域特征,并提升数据挖掘算法在摘要任务上的预测效果。在此基础上,我们发现一系列影响该方法性能的因素,如志愿者数量对该方法产生积极的影响,随着志愿者数量的增加,该方法能够辅助研究者从多角度构建更丰富的特征。而领域知识并不是招募志愿者的硬性要求,大量的无领域知识志愿者可以弥补缺少有领域知识志愿者的不足。最后我们从内部效度和外部效度两个方面分析影响该方法有效性的因素,并逐一介绍解决方法以及未来研究方向。关键词:软件仓库挖掘;数据驱动方法;特征构建;缺陷报告摘要万方数据面向软件仓库挖掘的数据驱动特征构建方法 Data Driven Attribute Construction forMining Software Repositories Abstract Mining Software Repositories(MSR)is an important fieldinsoftware engineering in recent ,software tasksareusually transformed intodatamining problems for -specific attributesheavily impact thesolving ofsoftwaretasks,since they are thekey part toconnect software tasks and datamining ,no systematic investigation has been conducted on theissue ofconstructing attributes forspecific software tasks. Inthisstudy,we summarize attributeconstruction approach inMSR with asimple survey. Based onthe resultsofthesurvey,we propose the Data Driven Attribute Construction(DDAC) approach is a new attribute construction approach witllthehelp ofseveral agiven softwaretask,DDAC extracts asetofsoftwaredata(.,source code, bug reports,etc.)and employs some volunteers tomanually plish thissoftwar

面向软件仓库挖掘的数据驱动特征构建方法 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数62
  • 收藏数0 收藏
  • 顶次数0
  • 上传人薄荷牛奶
  • 文件大小8.93 MB
  • 时间2016-08-13