100 个常用大数据词汇中英文对照表 A 聚合(Aggregation) –搜索、合并、显示数据的过程算法(Algorithms) –可以完成某种数据分析的数学公式分析法(Analytics) –用于发现数据的内在涵义异常检测(Anomaly detection) –在数据集中搜索与预期模式或行为不匹配的数据项。除了“ Anomalies ”, 用来表示异常的词有以下几种: outliers, exceptions, surprises, contaminants. 他们通常可提供关键的可执行信息匿名化(Anonymization) –使数据匿名,即移除所有与个人隐私相关的数据应用(Application) –实现某种特定功能的计算机软件人工智能(Artificial Intelligence) –研发智能机器和智能软件, 这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学****B 行为分析法(Behavioural Analytics) –这种分析法是根据用户的行为如“怎么做”, “为什么这么做”, 以及“做了什么”来得出结论, 而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式大数据科学家(Big Data Scientist) –能够设计大数据算法使得大数据变得有用的人大数据创业公司(Big data startup) –指研发最新大数据技术的新兴公司生物测定术(Biometrics) –根据个人的特征进行身份识别 B 字节(BB: Brontobytes) –约等于 1000 YB(Yottabytes) ,相当于未来数字化宇宙的大小。 1B 字节包含了 27 个 0! 商业智能(Business Intelligence) –是一系列理论、方法学和过程,使得数据更容易被理解 C 分类分析(Classification analysis) –从数据中获得重要的相关性信息的系统化过程; 这类数据也被称为元数据(meta data), 是描述数据的数据云计算(puting) –构建在网络上的分布式计算系统,数据是存储于机房外的( 即云端) 聚类分析(Clustering analysis) –它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类( 也叫作簇) 的过程。这种分析方法的目的在于分析数据间的差异和相似性冷数据存储(Cold data storage) –在低功耗服务器上存储那些几乎不被使用的旧数据。但这些数据检索起来将会很耗时对比分析(Comparative analysis) –在非常大的数据集中进行模式匹配时,进行一步步的对比和计算过程得到分析结果复杂结构的数据(Complex structured data) –由两个或多个复杂而相互关联部分组成的数据,这类数据不能简单地由结构化查询语言或工具(SQL) 解析计算机产生的数据(Computer generated data) –如日志文件这类由计算机生成的数据并发(Concurrency) –同时执行多个任务或运行多个进程相关性分析(Correlation analysis) –是一种数据分析方法,用于分析变量之间是否存在正相关,或者负相关客户关系管理(CRM: Customer Relationship Management) –用于管理销售
常用大数据词汇中英文对照表 来自淘豆网www.taodocs.com转载请标明出处.