下载此文档

基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告.docx


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
该【基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告 】是由【niuwk】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告本研究旨在基于数据挖掘方法,提出一个商品房销售决策支持模型,用于辅助开发商、经纪人等销售人员做出更准确的销售决策。本中期报告总结了研究进展情况,包括数据采集、数据预处理、数据分析及模型构建等方面。一、数据采集通过网络爬虫技术,我们获取了一份包括房屋基本信息、房屋售价、房屋成交时间等数据的商品房销售数据集。数据集包含了2015年至2020年上半年北京市985所院校周边(5公里内)的商品房销售数据,包括二手房和新房,共计4348条记录,其中训练集为3478条,测试集为870条。二、数据预处理对数据进行了预处理,包括数据清洗、缺失值填充、特征选择等。数据清洗的过程中,我们剔除了重复记录、异常值和无法处理的空数据。在缺失值填充方面,我们采用均值填充法和中位数填充法来填充缺失值。在特征选择方面,我们采用相关系数法、卡方检验法和信息增益法等方法来筛选特征,并保留了与房价相关性最强的13个特征。三、数据分析对数据进行了统计分析和可视化分析,得到了数据的分布情况、相关性、异常值等信息。对于连续型属性,我们进行了箱线图和直方图分析,发现了数据中存在一些较为极端的异常值。我们对这些异常值进行了处理,采用了删除和均值填充的方法。对于离散型属性,我们进行了频率分析和条形图分析,找到了属性之间的关联性和区别性。四、模型构建我们尝试了多种数据挖掘模型,包括线性回归、决策树、随机森林和神经网络等。通过比较各个模型的精度和效率,我们最终选择了随机森林模型作为最终的商品房销售决策支持模型。随机森林模型具有较高的准确率和较好的预测效果,能够很好地处理多重共线性、非线性关系和特征交叉等问题。五、总结本中期报告介绍了基于数据挖掘方法的商品房销售决策支持模型的研究进展情况,包括数据采集、数据预处理、数据分析和模型构建等方面。未来,我们将进一步完善模型,尝试使用更多的算法优化预测精度,结合其他方法进行更深入的分析。

基于数据挖掘的商品房销售决策支持模型研究与实现的中期报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人niuwk
  • 文件大小10 KB
  • 时间2024-04-13