关键词不能为空

当前您在: 主页 > 英语 >

常用大数据词汇中英文对照表

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-06 07:23
tags:

-

2021年2月6日发(作者:名流)


100


个常用大数据词汇中英文对照表





A





聚合


(Aggregation)




搜索、合并、显示数据的过程





算法


(Algorithms)




可以完成某种数据分析的数学公式





分析法


(Analytics)




用于发现数据的内在涵义





异常检测


(Anomaly detection)




在数据集 中搜索与预期模式或行为不匹配的数据项。


除了



Anomalies



,


用 来表示异常的词有以下几种:


outliers, exceptions, surprises, contaminants.


他们通常可提供关键的可执行信息





匿名化


(Anonymization)




使数据匿名,即移除所有与个人隐私相关的数据





应用


(Application)




实现某种特定功能的计算机软件





人工智能


(Artificial Intelligence)




研 发智能机器和智能软件,这些智能设备能够感知


周遭的环境,并根据要求作出相应的反应 ,甚至能自我学习





B





行为分析法


(Behavioural Analytics)




这种分析法是根据用户的行为如< /p>


“怎么做”



“为


什么这么做”



以及


“做了什么”< /p>


来得出结论,


而不是仅仅针对人物和时间的一门分析学科,


它着眼于数据中的人性化模式





大数据科学家


(Big Data Scientist)




能够设计大数据算法使得大数据变得有用的人





大数据创业公司


(Big data startup)




指研发最新大数据技术的新兴公司





生物测定术


(Biometrics)




根据个人的特征进行身份识别





B


字节



(BB: Brontobytes)




约等于


1000 YB(Yottabytes)


,相当于未来数字化宇宙的大


小。


1 B

< p>
字节包含了


27



0!




商业智能


(Business Intelligence)




是一系列理论、

< br>方法学和过程,


使得数据更容易被理


< br>




C





分类分析


(Classification analysis)




从数据中获得重要的相关性信息的系统化过程


;



类数据也被称为元数据


(meta data),


是描述数据的数据





云计算


(Cloud computing)




构建在网 络上的分布式计算系统,数据是存储于机房外的


(


即云端


)




聚类分析


(Clustering analysis)




它是将相似的对象聚合在一起,每 类相似的对象组合


成一个聚类


(


也叫作 簇


)


的过程。这种分析方法的目的在于分析数据间的差异和相似 性





冷数据存储


(Cold data storage)




在低功耗


服务器


上存储那些几乎不被使用的旧数据。


但这些数据检索起来 将会很耗时





对比分析


(Comparative analysis)




在非常大的数据集中进行模式匹配 时,进行一步步


的对比和计算过程得到分析结果





复杂结构的数据


(Complex structured data)




由两个或多个复杂而 相互关联部分组成的


数据,这类数据不能简单地由结构化查询语言或工具


(SQL)


解析





计算机产生的数据


(Computer generated data)




如日志文件这类由计算机生成的数据





并发


(Concurrency)




同时执行多个任务或运行多个进程





相关性分析


(Correlation analysis)




是一种数据分析方法,用于分析变 量之间是否存在


正相关,或者负相关





客户关系管理


(CRM: Customer Relationship Management)




用于管理销售、

< br>业务过程的


一种技术,大数据将影响公司的客户关系管理的策略

< br>




D





仪表板


(Dashboard)




使用算法分析数据,并将结果用图表方式显示于仪表板中





数据聚合工具


(Data aggregation tools)




将分散于众多数据 源的数据转化成一个全新数


据源的过程





数据分析师


(Data analyst)




从事数据分析、建模、清理、处理的专业人员





数据库


(Database)




一个以某种特定的技术来存储数据集合的仓库





数据库即服务


(Database-as-a- Service)




部署在云端的 数据库,即用即付,例如亚马逊


云服务


(AWS: Amazon Web Services)




数据库管理系统


(DBMS: Database Management System)




收集、存储数据,并提供数


据的访问





数据中心


(Data centre)




一个实体地点,放置了用来存储数 据的


服务器





数据清洗


(Data cleansing)




对数据进 行重新审查和校验的过程,目的在于删除重复信


息、纠正存在的错误,并提供数据一致性





数据管理员


(Data custodian)




负责维护数据存储所需技术环境的专业技术人员





数据道德准则


(Data ethical guidelines)




这些准 则有助于组织机构使其数据透明化,保


证数据的简洁、安全及隐私





数据订阅


(Data feed)




一种数据流,例如


Twitter


订阅和


RSS




数据集市


(Data marketplace)




进行数据集买卖的在线交易场所





数据挖掘


(Data mining)




从数据集中发掘特定模式或信息的过程





数据建模


(Data modelling)




使用数据建模技术来分析数据对象 ,以此洞悉数据的内在


涵义





数据集


(Data set)




大量数据的集合





数据虚拟化


(Data virtualization)




数据整合的过程,


以此获得更多的数据信息,


这个过


程通常会引入其他技术,例如数据库,应用程序,文件系统,网页技术,大数据技术等等





去身份识别


(De-identification)




也称为匿名化

(anonymization)



确保个人不会通过数据


被识别





判别分析


(Discriminant analysis)




将数据分类


;


按不同的分类方式,可将数据分配到不


同的群组,


类别或者目录。


是一种统计分析法,


可以对数据 中某些群组或集群的已知信息进


行分析,并从中获取分类规则。





分布式文件系统


(Distributed File System)




提供简化的,高 可用的方式来存储、分析、


处理数据的系统





文件存贮数据库


(Document Store Databases)




又称为文档数据库


(document-oriented


database),


为存储、管理、恢复文档数据而专门设 计的数据库,这类文档数据也称为半结构


化数据





E





探索性分析


(Exploratory analysis)




在没有标准的流程或方法的情况下 从数据中发掘


模式。是一种发掘数据和数据集主要特性的一种方法





E


字节


(EB: Exabytes)




约等于


1000 PB(petabytes),


约等于


1


百万



GB


。如今全球每天


所制造的新信息量 大约为


1 EB




提取


-


转换


-


加载


(ETL: Extract, Transform and Load)




是一种用于数据库或 者数据仓库


的处理过程。即从各种不同的数据源提取


(E)


数据,并转换


(T)


成能满足业务需要的数 据,最


后将其加载


(L)


到数据库





F





故障切换


(Failover)




当系统中某个服务器发生故障时,


能自动地将运行任务切换到另


一个可用服务器或节点上





容错设计


(Fault-tolerant design)




一个支持容错设计的系统应该能够 做到当某一部分


出现故障也能继续运行





G





游戏化


(Gamification)




在其他非游戏领域中运用游戏的思 维和机制,


这种方法可以以


一种十分友好的方式进行数据的创建 和侦测,非常有效。





图形数据库


(Graph Databases)




运用图形结构

(


例如,一组有限的有序对,或者某种实



)


来存储数据,这种图形存储结构包括边缘、属性和节点。它提供了相邻节点间 的自由索


引功能,也就是说,数据库中每个元素间都与其他相邻元素直接关联。





网格计算


(Grid computing)




将许多分布在不同地点的计算机连 接在一起,


用以处理某


个特定问题,通常是通过云将计算机相连 在一起。





H





Hadoop



< br>一个开源的分布式系统基础框架,


可用于开发分布式程序,


进行大数据的运


算与存储。





Hadoop


数据库


(HBase)




一个开源的、非关系型、分布式数 据库,与


Hadoop


框架共


同使用< /p>





HDFS




Hadoop

分布式文件系统


(Hadoop Distributed File Syste m);


是一个被设计成适合


运行在通用硬件

(commodity hardware)


上的分布式文件系统





高性能计算


(HPC: High-Performance- Computing)




使用超级 计算机来解决极其复杂的


计算问题





I





内存


数据库


(IMDB: In- memory)




一种数据库管理 系统,与普通数据库管理系统不同


之处在于,它用主存来存储数据,而非


硬盘


。其特点在于能高速地进行数据的处理和存取。





物联网


(Internet of Things)




在普通的设备中装上


传感器


,使这些设备能够在任何时间


任何地点与网络 相连。





J





法律上的数据一致性


(Juridical data compliance)




当你使 用的


云计算


解决方案,将你的


数据存储 于不同的国家或不同的大陆时,


就会与这个概念扯上关系了。


你 需要留意这些存储


在不同国家的数据是否符合当地的法律。





K





键值数据库


(KeyValue Databases)




数据的存储方式是使用一个特定的 键,


指向一个特


定的数据记录,


这种方 式使得数据的查找更加方便快捷。


键值数据库中所存的数据通常为编

程语言中基本数据类型的数据。





L





延迟


(Latency)




表示系统时间的延迟





遗留系统


(Legacy system)




是一种旧的应用 程序,


或是旧的技术,


或是旧的计算系统,

现在已经不再支持了。





负载均衡


(Load balancing)




将工作量分配到多台电脑或服务器 上,以获得最优结果和


最大的系统利用率。





位置信息


(Location data)




GPS


信息,即地理位置信息。





日志文件


(Log file)




由计算机系统自动生成的文件,记录系统的运行过程。





M





M2M


数 据


(Machine2Machine data)




两台或多台机器间交流与传输的内容





机器数据


(Machine data)




< br>传感器


或算法在机器上产生的数据


-


-


-


-


-


-


-


-



本文更新与2021-02-06 07:23,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/606351.html

常用大数据词汇中英文对照表的相关文章