淘豆网
下载此文档放大查看缩小查看   1/35
下载文档 文档分类:经济/贸易/财会 > 稽查与征管/审计

大数据汇报(内部精华版).ppt


下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表
0/100
您的浏览器不支持进度条
更多>>该用户其他文档
下载所得到的文件列表
大数据汇报(内部精华版).ppt
文档介绍:
大数据从何而来,互联网技术发展现状?
什么是大数据、云计算与大数据有什么关系、大数据类型?
大数据如何获取、存储、处理、分析的技术?
大数据怎么用、未来发展趋势?
Question
互联网发展趋势
物物互联
人人互联
人物互联
*
*
风云变幻中……
*
*
1.大数据(Big Data)
所谓“大数据”(big data)指的是这样一种现象:一个公司日常运营所生成和积累用户行为数据“增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取、存储、检索、共享、分析和可视化等方面。”这些数据量是如此之大,已经不是以我们所熟悉G或T为单位来衡量,而是以P、E或Z为计量单位,所以称之为大数据。
大数据的4V特性
体量Volume
多样性Variety
价值密度Value
速度Velocity
非结构化数据的超大规模和增长
总数据量的80~90%
比结构化数据增长快10倍到50倍
是传统数据仓库的10倍到50倍
大数据的异构和多样性
很多不同形式(文本、图像、视频、机器数据)
无模式或者模式不明显
不连贯的语法或句义
大量的不相关信息
对未来趋势与模式的可预测分析
深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)
实时分析而非批量式分析
数据输入、处理与丢弃
立竿见影而非事后见效
2.什么是云计算?
云计算将计算任务分布在大量计算机构成的资源池上,是各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。
云计算的“云”就是存在于互联网上的服务器集群上的资源,它包括硬件资源(服务器、存储器、CPU等)和软件资源(如应用软件、集成开发环境等)本地计算机只需要通过互联网发送一个需求信息,远端就会有成千上万的计算机为你提供需要的资源并将结果返回本地计算机。
3.大数据类型:结构化与非结构化数据
数据模型:
结构化数据:二维表(关系型)
半结构化数据:树、图
非结构化数据:无
结构化数据:先有结构、再有数据
半结构化数据:先有数据,再有结构 内容来自淘豆网www.taodocs.com转载请标明出处.