下载此文档

麻省理工神科技:大数据分析自动化.docx


文档分类:高等教育 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
麻省理工神科技:大数据分析自动化
     
 
 
 
 
 
     
     
 
 
 
 
 
     
 
 
 
 
麻省理工神科技:大数据分析自动化
 
  在一个包含数据库中,举个例子,各种促销和每周的利润的开始和结束日期,其关键数据可能不是日期本身而是它们之间的跨度,或着不是总利润,但平均跨越这些跨度。
  
  这套取代人的直觉与算法的系统,优于906个人类团队中的615个团队。
  
  大数据分析包括寻找有某种预测能力的埋藏模式。但是,选择哪些数据的“特征”来进行分析通常需要靠人类的直觉。在一个包含数据库中,举个例子,各种促销和每周的利润的开始和结束日期,其关键数据可能不是日期本身而是它们之间的跨度,或着不是总利润,但平均跨越这些跨度。
  
  麻省理工学院的研究人员的目标是,用一个不仅能搜索模式也能设计特征的新系统把人类元素从大数据分析中剥离出来。为了测试他们系统的第一个原型,他们参加了三个数据科学竞赛,它与人类团队比赛,在不熟悉的数据集中找到预测模式。906个团队参与了三项比赛,研究人员的
“数据科学机器”先于615个团队完成。
  
  在三项比赛中,数据科学机器的预测的准确率是94%和96%。第三个数字则是一个更为温和的数字87%。人类的团队通常需要进行好几个月的预测算法,而数据科学机器产生它的每一个条目只花了2-12小时。
  
  “我们把数据科学机器视为人类智能的自然补充,”Kanter说,他在麻省理工的硕士论文是《数据科学机器的基础》。“有这么多的数据需要进行分析。现在它(机器)只是待在那里没有做任何事。因此,也许我们可以拿出一个至少让我们能够开始着手、让我们前进的解决方案。”
  
  项目之间
  
  Kanter和他的导师KalyanVeeramachaneni,麻省理工学院计算机科学和人工智能实验室的研究科学家(CSAIL),在他们的论文中描述了数据科学机器,Kanter将在下周的IEEE国际科学数据和先进分析会议上发表。
  
  Veeramachaneni统一领导计算机科学与人工智能实验室的所有成员组,在大数据分析的实际问题中采用机器学****技术,如依据风电场场址确定其发电能力或预测学生从在线课程中辍学的风险。
  
  “我们从解决一些工业数据科学问题的经验中观察到的是一个非常关键的步骤,称为特征工程,”Veeramachaneni说。“你要做的第一件事就是把你的数据从数据库或结构中提取出来,为了做这个,你必须得有很多想法。”
  
  例如,2个关键指标被用在预测辍学上:一个学生花多少时间解决一个问题集和一个学生相比他或她的同学花了多少时间在课程网站上。麻省理工学院的在线学****平台MITx不记录那些统计数字,但它可以从推断中收集数据。
  
  特色组成
  
  Kanter和Veeramachaneni使用了一些技巧来制定数据分析候选特征。一种是利用数据库设计中固有的结构关系。数据库通

麻省理工神科技:大数据分析自动化 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人科技星球
  • 文件大小219 KB
  • 时间2021-07-25