分享|一文读懂大数据专业词汇!
一、当地数据库(LDB/LocalDataBase)
当地数据库是指驻留于运行客户应用措施的呆板的数据库。当地数据库位于当地磁盘或局域网。典范的当地数据库有Paradox、dBASE、FoxPro和ACCCSS。
二、数据收罗(DataAcquisition,DAQ)
数据收罗又称数据获取,将被测试工具的各类参量通过各类传感器做恰当转换后,再颠末信号调剂、采样、量化、编码、传输等步调转达到节制器的进程。
数据收罗的一样平常步调:①用传感器感觉各类物理量,并把它们转换成电信号;②通过A/D转换,模仿量的数据转酿成数字量的数据;③数据的记录,打印输出或存入磁盘文件。④出产厂商为该收罗体系体例的专用措施,常用于大型专用体系;⑤固化的收罗措施,常用于小型专用体系;⑥操作出产厂商提供的软件器材,用户自行体例的收罗措施,首要用于组合式体系。
三、数据模子(Datamodel)
数据模子是实际天下数据特性的抽象,用于描写一组数据的观念和界说。数据模子是数据库中数据的存储方法,是数据库体系的基本。在数据库中,数据的物理布局又称数据的存储布局,就是数据元素在计较机存储器中的暗示及其设置;数据的逻辑布局则是指数据元素之间的逻辑相关,它是数据在用户或措施员眼前的示意情势,数据的存储布局不必然与逻辑布局同等。
四、数据清算(DataCleansing)
数据清算是对观测、调查、尝试等研究勾当中所汇集到的资料举办检讨、归类编码和数字编码的进程,是数据统计说明的基本。
五、数据处理赏罚(DataHandling)
数据处理赏罚是指对数据(包罗数值的和非数值的)举办说明和加工的技能进程。也就是对数据的收罗、存储、检索、加工、调动和传输,将数据转换为信息的进程。
六、数据压缩(DataCompression)
数据压缩是指在不丢失有效信息的条件下,缩减数据量以镌汰数据的存储空间,进步其传输、存储和处理赏罚服从,或凭证必然的算法对数据举办从头组织,镌汰数据的冗余和存储的空间的一种技能要领。
七、数据规复(DataRecovery)
数据规复是指通过技妙本领,将生涯在台式机硬盘、条记本硬盘、处事器硬盘、移动硬盘、U盘等等装备上因为各类缘故起因导致损伤或丢失的数据举办急救和规复的技能。
八、数据集成(DataIntegration)
数据集成是把差异来历、名目、特点性子的数据在逻辑上或物理上有机地齐集,从而为企业提供全面的数据共享。数据集成维护了数据源整体上的数据同等性、进步信息共享操作的服从。
九、数据迁徙(DataMigration)
数据迁徙又称分级存储打点,是一种将离线存储与在线存储融合的技能。将高速、高容量的非在线存储装备作为磁盘装备的下一级装备,将磁盘中常用的数据按指定计策自动迁徙到磁带库等二级容量存储装备上。
当必要行使这些数据时,分级存储体系会自动将这些数据从下一级存储装备调回到上一级磁盘上。
十、数据冗余(DataRedundancy/RedundantData)
数据冗余是指统一个数据在体系中多次一再呈现。消除数据冗余的目标是为了停止更新时也许呈现的题目,以便保持数据的同等性。
十一、数据抽取(Datamining)
数据抽取是指从源数据源体系抽取目标数据源体系必要的数据的进程。
十二、收集数据抽取(Webdatamining)
收集数据抽取(Webdatamining),是指从收集中取得大量的又操作代价的数字化信息。首要包罗布局化数据抽取(StructuredDataExtraction)、信息集成(Informationintegreation)和概念发掘(Opinionmining)等。
布局化数据抽取的方针是从Web页面中抽取布局化数据。这些布局化数据每每存储在靠山数据库中,由网页按必然名目承载着展示给用户。譬喻论坛列表页面、Blog页面、搜刮引擎功效页面等。信息集成是针对布局化数据而言,其方针是将从差异网站中抽取出的数据同一化后集成入库。其要害题目是怎样从差异网站的数据表中辨认出意义沟通的数据并同一存储。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |