下载此文档

金融数据挖掘.ppt


文档分类:IT计算机 | 页数:约29页 举报非法文档有奖
1/29
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/29 下载此文档
文档列表 文档介绍
金融市场的数据挖掘教材: 数据采掘入门与应用张尧庭编中国统计出版社参考教材: 1、数据挖掘——概念与技术 jiawei Han 著,范明译***出版社 2、多元统计数据分析——理论、方法、实例任若恩著国防工业出版社配套应用软件: 1、 Intelligent miner for data 2 、 SAS 第一章:概论一、何为数据挖掘( data mining ) 现代信息社会的特征:信息(数据)泛滥、知识缺乏, 如何从海量数据(广义的概念)中挖掘出决策有用信息? 数据挖掘是结合现代数学、统计学,机器学****人工智能、数据库管理、计算机图形学、软件工程等各领域的技术和知识, 1990 年代在西方国家出现的一种高新技术——从海量数据中挖掘出决策有用信息的技术。 1990 年代末,在对 100 名美国著名科学家的问卷调查中, 数据挖掘被列为 21世纪对人类发展影响最大、最有前途的 10 大技术的第三位。我国对数据挖掘技术的重视(开发与应用) 1、 863 、 963 项目; 2、国家及省重点科学领域; 3、国家统计局在全国组织数据挖掘培训( 2000 ); 4、企业特别是银行对数据挖掘技术的重视; 5、人民大学数据挖掘研究与应用中心。海量数据——沙漠,隐含的知识——金子, 数据挖掘——从沙漠中挖掘金子的技术。二、不同学科对数据挖掘技术的研究与开发 1 、理论研究——各种数据挖掘技术的理论基础、理论依据研究,从数学、统计学、人工智能、计算机图形学等不同领域; 2、挖掘技术研究,从统计学、人工智能、机器学****计算机图形学、软件工程等领域; 3 、数据管理策略研究,从数据库管理技术等领域; 4、数据挖掘技术的应用研究,其中数据挖掘技术在金融领域的应用是一个重要方面。三、几种相对比较成熟的数据挖掘技术数据挖掘是一门新兴的、正在不断发展中的技术,近年来,几类十分重要、且相对比较成熟的数据挖掘技术是: 1、分类与预测 2、特征化、比较与关联规则挖掘 3、聚类分析 4、序列发现本课程主要内容:几类数据挖掘技术的基本原理、数据挖掘方法、及这些挖掘技术在金融领域的应用。第二章:分类与预测一、分类与预测的概念 1、分类已知离散的、有限的几个类,判断或预测样本属于那个类。*某人否具有某种疾病*上市公司是否会陷入财务困境、是否会被外资并购*借款人是否会违约*这个客户是否为银行的潜在优质客户、是否会转向其他银行用y表示类变量, y取离散的几个值,分类就是判断或预测样本的 y究竟取什么值 2、预测预测是指对连续性变量的取值进行预测,如: *某个借款人的违约概率是多少*银行资产组合明天在 99% 置信度下的最大损失( VaR )有多大*如果某开放式基金因面临巨额赎回申请而不得不大量抛售某种证券,这种证券的价格会下跌多少分类——对离散型变量进行预测预测——对连续型变量进行预测二、分类案例教学——上市公司财务困境预测模型构建 1、要求: 将因财务状况异常而被特别处理的 ST公司界定为财务困境公司、非 ST公司界定为财务正常公司,利用上市公司的财务报表数据,建立上市公司财务困境预测模型(提前一年预测,即用第 t-2 年的数据预测企业在第 t年是否会陷入财务困境)。分类变量 y的取值 y=0 如果公司为财务困境公司 y=1 如果公司为财务正常公司 2、类似案例: *外资并购目标公司预测*防信用卡诈骗预警系统*银行客户关系管理*税务稽核 3、数据来源: CSMAR 数据库 1990-2004 资产负债表、损益表, 1990-1997 财务状况变动表 1998-2004 现金流量表 4、报表变动情况: 1994 年合并会计报表 1998 年资产减值准备 5 、研究所需数据①、预测变量选取——实践经验、其他文献使用的预测变量、采用技术手段(统计技术、数据挖掘技术)选取预测变量、在一定理论指导下构造新的预测变量; ②、样本数据的结构形式③、采集样本数据时应注意的问题*尽量采用跨年度数据*需要删除的数据*尽量不采用配对抽样④、随机构造的训练样本组与检验样本组(过度拟合现象)

金融数据挖掘 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数29
  • 收藏数0 收藏
  • 顶次数0
  • 上传人875845154
  • 文件大小0 KB
  • 时间2016-05-25