下载此文档

六款强大地开源大数据挖掘工具推荐.doc


文档分类:IT计算机 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
实用标准文案
: .
六款强大的开源数据挖掘工具推荐
当今这个大数据时代,数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现岀了指数级增长。
然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换
为可理解、可用的结构化形式。
在数据挖掘过程中,有大量的工具可供使用, 比如采用人工智能、机器学****以及其他技术等来提取数据。
以下为您推荐六款的数据挖掘工具:
1、WEKA
WEKA原生的非Java版本主要是为了分析农业领域数据而开发的。 该工具基于Java版本,是非常复杂的, 并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner相比优势在
于,它在GNU通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加 序列建模后,WEKA将会变得更强大,但目前不包括在内。
2、RapidMiner
该工具是用Java语言编写的,通过基于模板的框架提供先进的分析技术。 该款工具最大的好处就是,用户
无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具
榜上位列榜首。
另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等
功能。更厉害的是它还提供来自 WEKA (一种智能分析环境)和 R脚本的学****方案、模型和算法。
RapidMiner 分布在AGPL开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行
开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的 MediaWiki
lj^]| rapidminer
3、NLTK
当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK提供了一个语言处理工具,包括数据挖掘、机
器学****数据抓取、情感分析等各种语言处理任务。
而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它 是用Python语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
4、Orange
Python之所以受欢迎,是因为它简单易学并且功能强大。如果你是一个 Python开发者,当涉及到需要
找一个工作用的工具时,那么没有比 Orange更合适的了。它是一个基于 Python语言,功能强大的开源 工具,并且对初学者和专家级的大神均适用。
此外,你肯定会爱上这个工具的可视化编程和 Python脚本。它不仅有机器学****的组件,还附加有生物信

六款强大地开源大数据挖掘工具推荐 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息