下载此文档

数据挖掘第三部分SPSSclementine11数据处理cindy.ppt


文档分类:IT计算机 | 页数:约73页 举报非法文档有奖
1/73
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/73 下载此文档
文档列表 文档介绍
该【数据挖掘第三部分SPSSclementine11数据处理cindy 】是由【小落意】上传分享,文档一共【73】页,该文档可以免费在线阅读,需要了解更多关于【数据挖掘第三部分SPSSclementine11数据处理cindy 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据挖掘第三部分SPSSclementine11数据处理cindy
培训内容
第一章合并多个数据源数据
第二章抽取样本,选择和缓存数据
第三章处理缺失数据
第四章处理日期
第五章处理时序数据
第六章文件操作
第七章效率
2
©2019SPSSInc.
第一章
合并多个数据源数据
3
©2019SPSSInc.
第一章合并多个数据源数据
内容:
使用追加节点串联包含相似字段的记录集的文件
使用合并节点把不同数据源的信息加入到现有数据源
使用超级节点简化数据流区域的内容
数据:
,,
4
©2019SPSSInc.
追加节点合并数据文件
不同组记录的相似信息有可能存储在不同数据文件
不同财政年度的银行帐目信息
不同学年的考试结果
不同部门的欺诈信息
不同周的事务办理数据
追加节点可以合并两个或者更多的数据源,可以分析和比较不同记录组的相似信息。
5
©2019SPSSInc.
文件读入
追加节点读取并下传来自同一数据源的所有记录直至该数据源不再有记录为止,然后读取下一个数据源的记录。
第一个读入的数据源的数据结构(记录和字段数目等)默认为输出数据的数据结构。
追加节点假定读入的数据源和最初输入源有相似的数据结构,根据不同数据文件的字段名合并数据。
6
©2019SPSSInc.
字段数目不同时的读入规则
如果一个输入的字段数目比最初数据源少,输入源记录缺失的字段用未定义值($null$)填补。
如果一个输入的字段数目比最初数据源多,默认为从流中过滤掉多余的字段,有一个选项可以允许输入所有数据集的字段,所有记录缺失的字段用未定义值($null$)填补。
7
©2019SPSSInc.
追加文件

确定选中“从文件读取字段名”

使用追加节点连接两个数据源节点
使用制表节点分别输出表格
8
©2019SPSSInc.
输入条目改变主数据集
9
©2019SPSSInc.
合并方法
按照顺序合并数据:如每一输入的第n个记录被合并生成第n个输出记录。只要任一记录缺少匹配的输入记录,则不会生成任何输出记录。
按照关键字段合并数据:如果某一关键字段值不止一次的出现,则返回所有可能的组合。
只包括匹配记录(内部合并)
包括匹配和不匹配记录(完全外部合并)
包括匹配和选中的不匹配记录(部分全外部合并)
包括第一个数据集中且不与其它数据集匹配的记录(反向合并)
合并相同的关键字段:每个输出字段都有不同的字段名
15
©2019SPSSInc.

数据挖掘第三部分SPSSclementine11数据处理cindy 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数73
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小落意
  • 文件大小2.21 MB
  • 时间2022-12-02