下载此文档

2016phm清华大学获奖总结.pdf


文档分类:行业资料 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
该【2016phm清华大学获奖总结 】是由【青山代下】上传分享,文档一共【11】页,该文档可以免费在线阅读,需要了解更多关于【2016phm清华大学获奖总结 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..年国际PHM数据竞赛总结(一)(2016年10月13日)编者的话:经过近4个月的努力,首次参加国际PHM协会数据竞赛的清华大学软件学院团队(PaHaMer)最终获得了第二名。比赛的“硝烟”已经散尽,但团队全体成员留给我们的相互协作、不懈进取团队合作精神,显著提高的学术水平和解决实际问题能力,以及宝贵的实战经验,是更为可贵的财富。一、比赛背景介绍PHM意为故障诊断与健康管理,即利用现代信息技术对设备健康状态进行评估,实现故障诊断、故障预测和剩余生命预测等。故障诊断与健康管理协会(PHMSociety)自2009年成立以来,致力于传播PHM知识、加强跨学科和跨国界合作、促进PHM发展成为一门工程学科。其下设期刊theInternationalJournalofPrognosticsandHealthManagement(IJPHM)采用快速却依旧严格的审稿制度,能够保证初次提交后8-12周时间内刊登,速度远快于与传统印刷期刊。除此之外,PHMSociety每年秋天都会举行年度会议,来自工业界、学术界和工商界的世界各地的研究学者,在会上展示成果,交流心得,共同探讨PHM的发展。与此同时,大会还会同步举办数据分析大赛,获胜者将被邀请到会上进行技术分享。自2009年第一届比赛举办以来,每年都会有来自世界各地的多支专业队伍参赛。比赛的题目通过不同领域的设备和运行状态,通过数据分析以预测出其健康状态或剩余寿命等结论。其历届比赛题目与获奖队伍见如表1所示(略)。:..(左)和王成同学(右)代表清华大学软件学院(PaHaMer)团队赴美国丹佛领奖二、本届比赛题目回顾本届比赛题目为,通过追踪化学机械抛光(CMP)系统组件的健康状态,采用物理模型和数据驱动相结合的方式,预测晶片在给定抛光过程中的去除速率。,采用机械摩擦和化学反应相结合的方式。CMP系统主要由以下几个部分组成:可旋转的抛光台,可更换的抛光垫,可旋转的晶片承载器,磨料释放器以及可移动的修整器。其工作原理如图1所示。在抛光过程中,晶片被加压于抛光垫,抛光液被释放于抛光垫上,晶片与抛光垫转动而产生相对运动,粗糙的抛光垫以及抛光液中的磨:..同时晶片与抛光液中的化学物质发生反应也进一步加速去除速率。抛光完成后,抛光垫可能会被修整器修整从而保证抛光垫的粗糙程度。抛光垫和修整器会随着使用时间的增长而发生退化,因此需要被及时更换。(资料图片):..比赛提供两类型数据:状态监测数据与测量结果数据。其中状态监测数据是每个抛光过程中各工况及开关量测量结果的时间序列形式数据,每个抛光过程对应多行,共计25列,其列名及含义如表2所示;测量结果数据是针对每个抛光过程,测量抛光前后晶片厚度差异人工计算得到,每个抛光过程对应1行,共计3列,其列名及含义如表3所示。对于训练数据,测量结果数据中去除率是已知的,而对于测试数据及最终测试集,去除率是未知的,这也是我们的预测目标。表2状态监测数据列号列名译名x1MACHINE_ID机器IDx2MACHINE_DATA机器位x3TIMESTAMP时间戳x4WAFER_ID晶片IDx5STAGE阶段x6CHAMBER舱室x7USAGE_OF_BACKING_FILM背膜消耗量x8USAGE_OF_DRESSER修整器消耗量x9USAGE_OF_POLISHING_TABLE抛光台消耗量x10USAGE_OF_DRESSER_TABLE修整器台消耗量x11PRESSURIZED_CHAMBER_PRESSURE加压舱压力x12MAIN_OUTER_AIR_BAG_PRESSURE主外压力x13CENTER_AIR_BAG_PRESSURE中心压力:..(MSE)进行评估,,计算方式如下::..是需要预测的抛光过程的总数,是预测结果,是实际平均去除率。而比赛最终结果由两部分组成:MSE的得分占90%,另外10%是对物理模型利用情况的得分。(略)(未完待续)三、解决方案我们首先基于物理模型对原始数据进行数据画像与分析,基于观察结果抽取特征,同时尝试例如聚类分析、K近邻、决策树和神经网络等机器学****建模方法,最终选择基于遗传算法的随机森林作为预测模型。,需要深入了解数据背后的物理含义。因此,我们与清华大学机械工程系摩擦学研究所进行合作,通过现场参观调研,阅读CMP模型文献,熟悉CMP系统的工作原理,并结合数据画像的结果,推测比赛CMP系统结构及数据采集方式。抛光头结构推测如图2所示。图3抛光头结构推测同时,通过对原始数据进行聚类分析和数据可视化,发现如下重要规律::..1抛光过程按照舱室组合可分为两类:Chamber1-2-3和Chamber4-5-6,两类在去除率存在明显差异,一类在150左右,一类50-100之间,因此推测存在粗抛和精抛两种类型的抛光过程。2)通过观察压力、磨料、舱室等三种状态监测数据,结合物理模型,可以将单个抛光过程划分为四个阶段:准备阶段、主抛光阶段、收尾阶段和后清洗阶段。各阶段对去除率影响不同,其中主抛光阶段对去除率起决定性作用。3)通过对多个抛光过程画像分析,发现在2829个抛光过程中存在1267个连续抛光过程,这些连续抛光过程有两个重要特点:(1)同一连续抛光过程中,加工模式设定一致,设备健康状态(如:抛光垫和修整器)近似,去除率相近;(2)同一连续抛光过程中,初始抛光过程的去除率相对较高。推测其物理机理是,连续抛光过程开始前,设备刚经历过离线修整,抛光垫性能状态最佳,因此去除率提高。基于数据画像和分析的结果,我们针对两类抛光过程进行特征提取。对第一类抛光过程,共提取48种特征,针对第二类抛光过程,由于状态监测数据存在大范围缺失,因此只提取了12种特征。提取方法包括两类,直接提取与二次提取,其中直接提取包括对压力、转速和磨料提取统计值(如平均值、中位数),使用设备消耗量的初始值评估设备健康状态;二次提取包括计算有效抛光时间、划分连续抛光过程等。,我们采用机器学****技术构建预测模型,从而实现对抛光过程去除率的预测。由于测试数据去除率未知,每周提交一次的评估次数有限,因此我们按照测试数据的分布规律从训练数据中随机采样,形成去除率已知的自测集。基于自测集评估模型,最开始我们尝试了决策树、神经网络和相似性聚类三种单一模型,其中神经网络效果最好,因此对其进行结构优化与参数调整。与此同时,又尝试了K近邻和支持向量机等方法,但预测效果未见提升。在对各模型进行测试评估时,采用遗传算法选择出适用于各模型的最优特征子集合,从而得到最优预测模型。:..但稳定性不够,因此采用集成学****技术,训练出多个神经网络模型并加权组合,预测准确率和稳定性都进一步提升。与此同时,受启发于集成学****我们尝试使用随机森林模型,发现其预测效果更为稳定且准确率更佳。,历次提交结果的MSE折线图如图3所示,从图中可以看出,我们(PaHaMer)的预测效果保持着稳定的提升,并且与来自辛辛那提大学的强劲对手Appocalypse不相上下。图4历次提交结果MSE折线图基于每周提交的测试反馈结果与自测结果,我们最终选择随机森林作为预测模型,同时采用遗传算法进行特征选择,不断优化模型,并在9月8日提交了最终预测结果。最终得分如下::..:第一名Apocalypse美国辛辛那提大学团队(表中第6位)第二名PaHaMer中国清华大学软件学院团队(表中第2位)第三名DataMotor中国上海交通大学团队(表中第10位)四、总结与展望参赛队伍人员列表(略。详见本网站“论坛与新闻”10月11日新闻稿):..PHM数据分析大赛,通过对历届题目解读,了解先进技术,不断积累,在比赛开始后的三个多月时间里,我们曾有过拍马领先的快乐,也经历过模型优化的瓶颈,最终取得了第二名的成绩,这是团队里每一个人共同奋斗的结果。参加本届比赛,我们获得了难得的锻炼机会,积累了实战经验,进一步加深了对故障监测和健康管理的认识,学会了如何用机器学****方法解决实际问题。:王成(研二)、张元嘉(研三)、李璇(直博二)、朱慧敏(研三)(续完)(供稿清华大学软件学院PaHaMer团队/编辑严进军):..6.(资料照片)化学机械抛光机图7.(资料照片)化学机械抛光机工作舱室内部

2016phm清华大学获奖总结 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人青山代下
  • 文件大小2.21 MB
  • 时间2024-04-14