加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

如何高效地进行数据建模

发布时间:2019-09-28 03:32:24 所属栏目:教程 来源:John McDowall
导读:领略数据是节制任何企业的先决前提。但只有当这些常识可以或许被分享和撒播时,领略才是有效的。有用的数据建模应该是任何企业架构师的主要存眷点。 在我的上一篇文章中,我以为领略一个企业的数据是指导一个企业的焦点。但领略只是题目的一半。另一半是可以或许记

领略数据是节制任何企业的先决前提。但只有当这些常识可以或许被分享和撒播时,领略才是有效的。有用的数据建模应该是任何企业架构师的主要存眷点。

在我的上一篇文章中,我以为领略一个企业的数据是指导一个企业的焦点。但领略只是题目的一半。另一半是可以或许记录这种领略并与他人分享。

怎样高效地举办数据建模

假如没有对数据的配公道解,就谈不上跨体系或组织的共享数据。传统上,这是通过行使数据字典来完成的--这些文件旨在表明数据布局中每个字段的内容和名目。可悲的实际是,这些文档必需手动建设和更新,因此很少会举办更新。其功效是每每会呈现过期的、无用的文档和沮丧的架构师和开拓职员。但着实尚有更好的步伐。

正确完成建模

在已往的几十年里,数据建模的全力凡是齐集在相关数据建模或可扩展标志说话(XML)的建模上。只要数据存储在相关数据库中,相关数据建模就会很好,但除此之外,它很少会有其他的用途。并且XML也不能被靠得住地称为建模说话。XML是序列化数据的类型--即界说了怎样将数据写入文件。XML为结构数据的序列化提供了一种名目,但它不是一个真正的模子。

我所说的“模子”指的是以数学为基本的情势类型。现实上,这意味着是可以行使情势化要领举办验证的对象。普通地说,这意味着我们可以用数学运算来证明它是正确的,而且我们可以使验证进程自动化。而在XML模式中捕捉数据不切合此界说下的模子。但可以必定的是,我们可以行使软件来验证该XML名目是否精采,是否切合一些XML模式的文档。但这还不敷以真正地对数据举办建模。

无论是计较机照旧人,假如差异时领略数据的语法(布局)和语义(寄义),就无法领略数据。XML可以捕捉语法,但它不能生成捕捉语义。语义可以用XML名目编写,可是这些语义必需起首在一些矫正式的建模方案中被捕捉。换句话说,企业必要一个正式的本体。这种建模方案大多基于情势逻辑,凡是是民众逻辑或描写逻辑。

迄今为止,最常用的语义建模说话是基于描写逻辑的收集本体说话(OWL)。这意味着我们不只可以正式验证模子及其包括的数据,还可以通过对数据的推理来揣度新的究竟,而且我们可以证明这些揣度的正确性。由于OWL是本体建模的究竟上的尺度,以是我将把剩下的内容限定在OWL上。

可是等等!全部这些都不料味着你必要将你的数据存储为OWL。在你过于担忧怎样将存储名目强加给不甘心的开拓职员之前,先听我说完。

数据模子和数据存储

军事筹谋者有一句格言:“业余喜爱者担忧战术,而专业人士担忧后勤。”他们试图到达的焦点头脑是,假如你只是拟定了一个压倒仇人防止的战斗打算,那并没有什么用处,可是,你也不能只让你本身的队伍得到执行打算所需的燃料和弹药。同样的,我们也可以说实现者凡是会担忧存储,而架构师会担忧模子。没有来由必需以为数据模子是应该由特定体系行使的存储技能来抉择的。一个界说精采的模子可以通过无损进程转换成任何必要的存储名目。

凡是,我们会从存储办理方案开始,然后回到数据名目。可能多种名目。约莫20年前,当XML初次被引入时,它被誉为了通用的数据互换名目。在这种环境下,必要互换数据的各类体系可以回收它们当前的存储模式(凡是是相关数据库),并将数据转换成可扩展标志说话,以便与其他体系举办互换。其功效是企业和体系架构师会太过存眷于XML名目,而险些忽略了体系的预期成果或企业的整体互操纵性。

这个题目在国防部尤为严峻。该部分支持着一个名副着实的必要手工建设和维护的XML类型。每一个XML模式都是单独维护的,每次更新时,都必需搜查每个相干的类型是否有隐藏的影响(凡是是手动的)。除此之外,还必需在XML模式中为无法更新以切合新模式的体系举办配置。其功效是发生了一个紊乱的类型殽杂体,迫使人们必需把留意力齐集在使XML协同事变上,而不是齐集在XML应该促进的使命上。

与其从存储名目开始,然后确定如作甚信息互换来暗示它,还不如从与存储无关的数据模子(如OWL)开始,然后将其用作天生数据库模式和数据互换名目标基本。这不只可以让您专注于领略现有的数据(而不是一些开拓职员想的怎样将它塞进数据库),通过从基于模子来建设的多个数据暗示,可以最小化维护尾部。由于对企业数据的任何变动都只必要在主模子中手动变动,因而从该模子天生其他存储和互换模式时也可以确保这些模式之间的同等性。

企业数据建模

假如你存眷的只是企业,那么很明明,你对数据的存眷已经超过了整个企业,此刻你也许会以为对企业中的全部数据举办建模的远景是相合时人望而生畏的。但不关键怕,假如你足够警惕的话,这也可以成为一项你可以安详地委托给很多人的使命。

建设一个单一的企业数据模子凡是是徒劳的。对付一个群体来说,有太多的数据必要建模,有太多彼此竞争的好处团体试图将模子推向他们喜好的偏向,并僵持以为并没有其他要领可以或许得当他们。可是行使OWL开拓的本体是模块化的,这意味着你可以集成来自差异来历的多个模子。不是建设一个包围整个企业的单一模子,而是针对每个差异的好处团体(营业规模、开拓团队等)。可觉得它体谅的数据界说本身的本体。

不幸的是,这险些必定会导致数据模子的重叠,但对差异工具会有差异的建模。这个题目的办理方案是回收一个通用的上层本体,企业中的每个本体都应该从这个本体中派生出来。一个通用的上层本体不会阻止全部的互操纵性题目,可是有了一个好的上层本体,它会通过阻止完全谬妄的结构来束缚这些题目,好比将“位置”酿成一种“变乱”(不,嗣魅真的,我已经看到这种环境了)。

有很多候选的上层本体可用,它们中的大大都市试图将全部信息分成五到六个顶级种别。可是,这些本体中的大大国都市碰着这样的题目:有些本体所拥有的数据类并不得当他们的根基类,功效就会发生像将位置作为变乱范例这样的错误。在我的履历中,根基情势本体论(BFO)应该是个中最深图远虑的。在我行使BFO的几年中,我险些没有发明一个案例,个中所思量的数据会不切合BFO的类条理布局。

无论怎样,企业架构师必需在其特定情形中选择一个最有用的数据建模理念。不管你选择什么样的数据建模理念,请记着,你有任务捕捉企业中全部数据的语法和语义。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读