市场研究的数据分析方法
Chapter 15 Analysis Methods of Market
Research Data
教学内容(Teaching content)介绍以下五种数据分析方法在市场研究中的具体应用。
聚类分析(Cluster Analysis)
聚类分析的基本思想:
根据样本自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。
聚类分析的分类(classification of cluster analysis)
聚类分析
样品聚类(Q型聚类)
变量聚类(R型聚类)
样品聚类:对事件进行聚类,或是对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。
变量聚类:是当反映事物特征的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。
聚类分析的统计量(Statistics of Clustering Analysis)
设x1x2…xn为n个分类特征指标,xik表示第i个样品的第k个指标值。为了将样品(或变量)进行分类,首先需要引进表示样品之间相似程度的度量,称为聚类统计量。
常用的聚类统计量
匹配系数
距离
相似系数
当分类指标为类别标度量时,通常采用匹配系数作为聚类统计量。第个样品与第个样品的匹配系数其中
匹配系数越大,说明两样品越相似,越应该划为同一类。
当指标中有间隔标度变量时,匹配系数已不再适用,此时采用距离来进行度量,距离越小,相似程度越高,两样品越应该划为一类.
在实际问题中,对样品分类常用距离,对变量分类常用相似系数。相似系数可以分为夹角余弦与相关系数。
聚类分析的方法(Method of Cluster Analysis )
聚类分析的方法中应用最广泛的有两类:层次聚类法和迭代聚类法。层次聚类法又可分为两种:聚集法和分解法
聚类分析的方法
层次聚类法
迭代聚类法
聚集法
分解法
层次聚类法
聚集法的步骤
把每个案例各自看成一类
把距离最近的两类合并
重新计算类与类之间的距离
再把距离最近的两类合并
重复此过程直到所有案例归为一类
分解法和聚集法的过程相反,首先把所有的案例归为一类,然后把最不相似的案例分为两类,每一步增加一类,直到每个案例都自成一类为止。
迭代聚类法
层次聚类法在聚类过程中,当样本量很大时需要占用的计算机内存空间较大,并且耗时较长。、速度快的优点,适用于大样本的聚类分析。
迭代聚类法的优点
占计算机内存空间小
速度快
市场研究的最新数据分析方法 来自淘豆网www.taodocs.com转载请标明出处.