下载此文档

大数据技术.ppt


文档分类:IT计算机 | 页数:约16页 举报非法文档有奖
1/16
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/16 下载此文档
文档列表 文档介绍
大数据技术
张瑞芝
计算机科学与技术
16081200210009
Deep learning
Yann LeCun, Yoshua Bengio, Geoffrey Hinton
Supervised learning
Backpropagation to train multilayer architectures
Convolutional works
Image understanding with deep works
Distributed representations and language processing
Recurrent works
The future of deep learning
Supervised learning
监督学****是利用一组已知类别的样本调整分类器的参数,并使其达到所要求性能的过程,监督学****完成了从标记的训练数据来实现分类功能的机器学****任务。
传统的方法是通过手工方法来设计良好的特征提取器,这需要大量的工程技术和专业领域知识。深度学****的关键优势在于使用了通用的学****过程从数据中学到良好的特征,从而避免了传统方法中所需的人工工程。
Backpropagation to train multilayer architectures
通过反向传播算法来训练多层神经网络
反向传播算法(Backpropagation)是目前用来训练人工神经网络的最常用且最有效的算法。
Convolutional works
卷积神经网络是一种前馈神经网络,它包括卷积层和池化层,它的人工神经元可以响应一定覆盖范围内的周围单元,对大型图像的处理表现得很出色。
在BP神经网络中,每一层都是全连接的,这使训练变得困难。而CNN的卷积层每个节点与上一层某个区域通过卷积核连接,而与这块区域以外的区域无连接。但每个节点对应不同的卷积核导致训练量依然很大。N提出了权值共享概念,即同一个卷积层内,所有神经元的权值是相同的。
池化层夹在卷积层中间,其主要作用是逐步压缩减少数据和参数的数量,也在一定程度上减少过拟合现象。其功能是把上一层输入数据的某块区域压缩成一个值。
Image understanding with deep works
左图为人工智能专家李飞飞利用大数据来训练计算机视觉,N来教计算机理解图片。。
作为和大脑神经原理类似的卷积神经网络,进行训练是非常合适的选择。
Distributed representations and language processing
要将自然语言交给机器学****中的算法来处理,通常需要首先将语言数学化,词向量就是用来将语言中的词进行数学化的一种方式。
Distributed Representation的基本想法是:
通过训练将某种语言中的每一个词映射成一个固定长度的短向量,将所有这些向量放在一起形成一个词向量空间,而每一个向量则为该空间中的一个点,在这个空间上引入“距离”,则可以根据词之间的距离来判断它们之间的(词法、语义上的)相似性了。
下面的左、右两幅图中五个词在两个向量空间中的相对位置差不多,这说明两种不同语言对应向量空间的结构之间具有相似性,从而进一步说明了在词向量空间中利用距离刻画词之间相似性的合理性。
Recurrent works
在RNN中,输入层和来自序列中上一元素隐藏层的信号共同作用于当前的隐藏层
数据挖掘与医学数据资源开发利用
医学数据资料的状况
数据挖掘的应用
数据挖掘的方法以及具体应用
聚类分析(Clustering Analysis)
关联分析(Correlation Analysis)
决策树(Decision Tree)
结论

大数据技术 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数16
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2105194781
  • 文件大小2.21 MB
  • 时间2018-09-25