第 34 卷,第 5 期光谱学与光谱分析畅 34 , 畅 5 , 1421‐1424
2 0 1 4 年 5 月 Vol No pp,2014
Spectroscopy and Spectral Analysis May
一种晚型天体光谱离群数据挖掘系统
蔡江辉,杨海峰,赵旭俊,张继福倡
太原科技大学计算机科学与技术学院,山西太原 030024
摘要探索海量的型恒星中具有磁活动、巨星等较特殊、稀有的天体,对于后续观测、银河系结构、演
M
化等科学研究具有重要的意义,针对型恒星光谱特征线出现在子空间中的局部偏离,设计并实现了晚型
M
恒星离群数据挖掘系统。首先采用稀疏因子和稀疏度系数度量样本在属性空间上的分布特征,并在此基础
上对型恒星光谱特征线进行离散化、降维等预处理,获得光谱子空间;然后采用微粒群算法搜索离群子
M
空间,并证认子空间内光谱是否离群;此外,选择型光谱特征线指数集为样本,实验分析了稀疏因
SDSS M
子和稀疏度系数的设置对离群结果的影响,并将离群挖掘结果与提供光谱型等参数对照,表明利用该
SDSS
系统实现晚型恒星光谱特征线局部离群数据挖掘是可行并有价值的。
关键词局部离群;光谱特征线;子空间
中图分类号: 311 文献标识码: DOI :10畅 3964/畅畅1000‐0593(2014)05‐1421‐04
TP A j issn
‐[7] , [8] , ( ‐
anizing map clustering PSO particle swarm op
引言)[9] 等。(2)特殊天体搜索。如等提出天体离
timization Zhang
群光谱的自动检测技术; 等的( ‐
Wei MCLOF Monte Carlo lo
近年来大型巡天项目( [1] , [2] 等)的不断)方法,可以发现 8(
SDSS LAMOST cal outlier factor SDSS DR sloan digital sky
实施,新观测技术的出现,获得了大量的大数据集, ‐ 8)中双星、碳星等稀有光谱[10] , 等
LAM survey data release Zhang
先导巡天发布光谱数据 48 万余条,包括恒星、星系、类基于概念格的天体光谱识别方法[11] 等。(3)相关性分析。
OST
星体以及一些未知类型的天体,其中型恒星、尤其是温度等采用( )挖掘参
M Graham MIC maximal information coefficient
低于 3500 的光谱 6 万余条[3] ,在这类海量恒星光谱数据集数空间特定参数间的相关性并采用获得
K Symbolic regression
中存在一些具有氢原子发射线、具有磁活动、巨星等特殊、相应函数关系式[12] ; 等通过构造加权( ‐
Cai FP frequent pat
奇异、稀有的天体,通过数据挖掘方法寻找这类天体,为此)树来提取特征线间的关联规则[13] 。因此,数据挖掘技术
tern
类天体的科学研究提供有价值的信息、为巡天后续观测提供在天文数据分析及处理中具有重要的应用价值。
依据,具有重要的意义。型恒星光谱有效温度较
《一种晚型天体光谱离群数据挖掘系统.》.pdf 来自淘豆网www.taodocs.com转载请标明出处.