基于时间序列分析股票上证指数走势
摘要:本文应用时间序列对上证指数历史数据进行研究分析,并建立预测模型,以研究2014年上证指数的变化规律。利用统计分析软件分别对其开盘价格进行分析,应用时间序列分析方法建立模型对上证指数作预测分析,以得出接近真实值的预测值,并对模型进行检验,证明有效后,对未来数据进行短期预测。
关键词:时间序列分析上证指数 ARIMA(p, d, q)模型预测
“炒股票”是人们日常生活中一种非常常见的活动,但是受多种不确定因素的影响,股票价格往往随时间的变化而变化,导致股市呈现出随机性和非线性的波动趋势,这无疑给投资者们带来巨大的投资风险。本文以上证指数的历史数据为研究对象,分析并对其建立ARIMA模型。对所建立的模型进行检验和参数估计,检验其适应性以找到更优化的模型。应用模型对上证指数数据进行分析和预测,对2014年的上证指数的趋势走向进行分析说明。
对于时间序列的预处理主要是对数据进行三个方面的分析,即直观分析,特征分析和相关分析。
(1)序列图直观检验
绘制原始数据(见表1)序列open的序列图,如图2-1所示:
从序列图直观分析,可以看出序列不符合零均值同方差的特征,初步判断序列不平稳。
。通过各种数据处理方法将数据的非平稳特性从序列中分离出来,将其转为平稳的时间序列。
对原序列open进行一阶差分,生成一阶差分序列open1,其序列图如图2-2所示:
图2-2 一阶差分序列时序图
Open1序列的时间序列图始终围绕一个常数值波动,因此可以认为该序列是平稳序列。
建立ARIMA模型
(1)模型的初步识别和定阶。由原始数据的分析与处理可知, 2013年9月1日至2014年4月14日上证指数的开盘价格数据时间序列是一个非平稳的时间序列,但是一阶差分后序列满足平稳性,故可以使用ARIMA(p, d, q)模型对其进行拟合。根据自相关图和偏相关图,可以看出,自相关系数和偏相关系数都是拖尾的,则open1为ARMA(p,q)序列。初步确定适合阶数p的取值为3、6,适合阶数q的取值也为3、6。ARIMA模型组合共有四组:ARIMA(3,1,3),ARIMA(3,1,6),ARIMA(6,1,3),ARIMA(6,1,6)。
(2)模型的适应性检验。即检验残差序列是否为白噪声序列。原假设是剩余序列是相互独立的白噪声序列,分别对各模型进行检验,结果显示F统计量均大于显著性水平,所以接受原假设,认为残差序列是白噪声序列,四组模型都通过了检验。
根据AIC准则,我们选择ARIMA(3,1,6)模型对open序列进行建模。ARIMA(3,1,6)模型的适应性检查,如图2-3所示:
图2-3 ARIMA(3,1,6)模型的适应性检查
从上图可以看出,ARIMA(3,1,6)模型的拟合曲线基本接近。
在进行模型预测的时候,用于对模型进行检验的数据是从2014年3月1日到4月1日的每天的上证指数开盘价格,如果模型的拟合效果比较好,可以认为这个模型是比较成功的;如果模型的拟合效果不是很好,
基于时间序列分析股票上证指数走势 来自淘豆网www.taodocs.com转载请标明出处.