决策树算法实例.docx基于ID3算法的决策树对网络购物满意度的预测摘要:近年來,随着信息技术的不断发展壮人,尤其是人数据挖掘的理论和方法发展迅速,Q经在许多实际生产生活中得到应用。大数据挖掘的理论和方法对数据本身没有进行任何的假设,只是通过对数据本身的学****从而建立相应的模型。本文将基于决策树的ID3算法,对某购物网站网购服务评价的数据进行建模,将对买家网购满意度进行预测,以便丁•卖家更好地完善网购流程。关键词:大数据挖掘;决策树;ID3算法。0引言:伴随着信息科技技术的迅速发展,网络购物越來越受到人们的关注。这种足不出户的购物方式深受人们的喜爱,逐渐成为-•种潮流。在人们享受着方便、价格便宜、不受时间和地点限制带来的便捷的同时,网络购物的劣势也显现出来。买家通常要面临售后服务、卖家信用、网上支付风险等诸多问题。此时,买家满意度便成了衡最卖家服务质最的标准。建立买家网络购物满意度预测模型,冇利于规范网络购物过程中不健全的地力,使网络购物的环境得到净化。决策树算法利用的是一种归纳式的学****算法,目的在于从数据源屮推理和归纳出树形结构的决策树知识表现形式。而ID3算法作为决策树学****算法的主要内容,在处理实际问题上有着举足轻重的作用。ID3算法将信息爛这一概念与决策树算法相结合。ID3算法的核心是対决策树中各节点上的属性进行选择,将信息增益看作分裂属性的评判标准,先计算所有属性的信息增益,然后由信息增益人小來确定测试属性,将信息增益最人的属性作为测试屈性来对决策树进行划分。ID3算法对当前节点屮的属性进行评估,即选择最人信息增益的属性作为测试属性,节点再按照测试属性的属性取值情况进行节点划分,对于划分的节点递归地使用测试加性选取方法进行划分,进行到在全部的子集屮只有一-种类别的数据的吋候停止。木文将采川ID3算法对网络购物中买家满意度进行建模,从而达到预测网络购物中买家满意度的功能。1模型建立::为了更加方便地描述,木文采用评价网络购物中的满意度预测的实例,來详细地运用和解决机器学****中的决策树算法。具休如下:当经行了网络购物,在收到网购货物后要对木次网络购物的服务进行评价,满意或不满意。忖标变虽设定成二分类变量:满意(设置为0)或者不满意(设置为1)。相应的自变量由网购过程中产生的数据组成,比如产品质最、卖家服务态度、收货时长等。这里,给出一份某网站对网络购物满意度的调查情况,得到的数据如表1所示:表1:网络购物售后评价买家编号产品质量卖家服务态度收货时长(天)…•般•…,产品质量、卖家服务态度都为离散型变量,收货时长为连续型变量。满意度屮1为不满意、0为满意。:将所得数据分别在数据分裂加性的选择以及数据的树剪枝这两方面进行处理,用基于TD3算法的决策树对网络购物的满意度进疔预测:所谓分裂属性的选择,即应该选择产品质量、卖家服务态度两个离散变量和收货时长这个连续变量屮的哪一个变量作为决策树的第一个分支。ID3算法的核心方法是以信息增益的人小來依次选择分裂树义,即::根据香农定理可知,最人信息增益的变量将会被定为1D3算法屮树义的分支,拿网络购物满意
决策树算法实例 来自淘豆网www.taodocs.com转载请标明出处.