创建有效的大数据模型的6个技巧
数据建模是一门伟大的科学,涉及组织企业的数据以顺应营业流程的需求。它必要计划逻辑相关,以便数据可以彼此关联,并支持营业。然后将逻辑计划转换成物理模子,该物理模子由存储数据的存储装备、数据库和文件构成。 汗青上,企业已经行使像SQL这样的相关数据库技能来开拓数据模子,由于它很是得当将数据集密钥和数据范例机动地链接在一路,以支持营业流程的信息需求。 不幸的是,大数据此刻包括了很大比例的打点数据,并不能在相关数据库上运行。它运行在像NoSQL这样的非相关数据库上。这导致人们以为也许不必要大数据模子。 题目是,企业确实必要对大数据举办数据建模。 以下是大数据建模的六个提醒: 1.不要试图将传统的建模技能强加于大数据 传统的牢靠记录数据在其增添中不变且可猜测的,这使得建模相对轻易。对比之下,大数据的指数增添是不行猜测的,其无数情势和来历也是云云。当网站思量建模大数据时,建模事变应该齐集在构建开放和弹性数据接口上,由于人们永久不知道何时会呈现新的数据源或数据情势。这在传统的牢靠记录数据天下中并不是一个优先事项。 2.计一律个体系,而不是一个模式 在传统的数据规模中,相关数据库模式可以涵盖营业对其信息支持所需的数据之间的大大都相关和链接。大数据并非云云,它也许没稀有据库,可能也许行使像NoSQL这样的数据库,它不必要数据库模式。 正由于云云,大数据模子应该成立在体系上,而不是数据库上。大数据模子应包括的体系组件包罗营业信息需求、企业管理和安详、用于数据的物理存储、全部范例数据的集成、开放接口,以及处理赏罚各类差异数据范例的手段。 3.探求大数据建模器材 有贸易数据建模器材可以支持Hadoop以及像Tableau这样的大数据陈诉软件。在思量大数据器材和要领时,IT决定者应该包罗为大数据构建数据模子的手段,这是要求之一。 4.存眷对企业的营业至关重要的数据 企业天天城市输入大量的数据,而这些大数据大部门是无关紧急的。建设包括全部数据的模子是没故意义的。更好的要领是确定对企业来说至关重要的大数据,并对这些数据举办建模。 5.提供高质量的数据 假如组织专注于开拓数据的正确界说和完备的元数据来描写数据来自那里、其目标是什么等等,那么可以对大数据模子发生更好的数据模子和相关。可以更好地支持支持营业的数据模子。 6.探求数据的要害切入点 当今最常用的大数据载体之一就是地理位置,这取决于企业的营业和行业,尚有其他用户必要的大数据常用密钥。企业越可以或许辨认数据中的这些常用进口点,就越可以或许计划出支持企业要害信息会见路径的数据模子。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |