容器云存储的需求考量与方案选择
大数据、人工智能都必要数据来支撑,以是这块的数据存储量将会越来越大。好比天天的日记数据也许就有几十个G,几百个G,这些数据颠末洗濯处理赏罚说明,也许会带来新的代价增添点,也会带来越来越多的新营业创新。但跟着数据量的累积,也会给存储带来压力。以是差异的数据也许必要思量回收差异的存储方案。这也许有涉及到数据的管理题目了。长途卷有NFS、NAS、SAN、Ceph、GusterFS等产物可以选择,差异需求选择差异的产物。 镜像对存储的需求相对简朴,镜像凡是也是必要不绝的更新的。不外镜像必要思量差异情形镜像库的镜像存储。凡是环境下,镜像客栈可以非容器化陈设,相对来说主机存储资源打点起来会更利便。 中间件存储更多是由于中间件陈设时,差异中间件对存储的需求也许差异。最典范的好比Kafka,必要多块磁盘、文件体系行使XFS以及Mount 文件体系时行使noatime选项等以到达更好的机能。这就必要基于差异的组件来确定选择什么样的存储。不外在容器云上实现今朝还不是出格便利。可以思量非容器陈设。 五、无容器存储思绪 今朝提及容器云存储,各人城市想到Ceph或GlusterFS等。我们PoC测试的时辰也随大流测试了一下。各人都嗣魅这么配,以是我们也就这么配了。不外其后想想,我们mount存储卷,目标是为了数据耐久化,为了有状态应用。可是假如凭证云原生的理念,不是为了云而硬性迁云,也许不必要太多存储资源。尚有就是数据可以通过及时数据流方法收罗到数据中心或数据处理赏罚终端,让数据运转起来、流转起来,而不是仅仅存储起来,充实开拓数据的代价。甜睡和静止的数据无法带来代价,运转起来的数据才有代价,及时性越高的数据越有代价。这也是构建大数据平台大数据说明的代价。 从这个角度来说,我们可以让数据运转起来,不消都存储于磁盘,可能在容器云平台可以回收这种头脑,把数据从容器中抛出来,然后再进一步处理赏罚或存储。这样存储资源的行使也许就简朴多了。好比应用处事日记,可以直接从容器中把日记信息从日记文件或尺度输出中收罗到,然后扔到ES或Kafka等动静中间件。这个成果由容器云平台来提供,用户也就不必要体谅实现的细节。更重要的是,通过ES或Kafka可以及时举办数据的进一步处理赏罚,也停止数据在容器平台耐久化存储的一些题目。 这只是小我私人的一点设法,详细的也许更多照旧要思量数据在容器云平台的耐久化存储。响应的产物和技能,各人接头的也挺多,这里就不赘述。 六、容器云存储方案选择 回收留器云选择存储时,必要基于现实的营业需求来确定,深刻领略容器云平台是用来承载应用的,是为企业营业应用处事的。这也是我们在选择容器云产物时频频夸大的。我们回收留器云不是为了容器,而是为了营业应用,为了营业。差异营业对存储的需求差异。有安详性要求较量高的,也有可以容忍数据丢失的等。差异的营业需求,采纳的存储方案、存储产物就会差异,由于产物纷歧样,所支付的资金价钱是纷歧样的。 选择产物时还必要思量企业自身的技能气力,开源产物有开源产物的利益,商用产物也有商用产物的利益,对付像我们这样的金融公司来说,更多要思量的是数据的安详性,在回收开源产物时就会很审慎,后期处事是一个很重要身分。得有公司来兜底,哪怕多花些钱,买个心安。 其它还要思量是否有手段驾御选择产物或技能。开源产物对技能手段要求较量高,选择开源产物,最好有响应的技强职员储蓄。开源产物技能领先,版本迭代变革也较量快,必要有响应的人力去把控。假如做不到这点,选择商用产物是吻合的,固然本钱高点,但颠末尾浩瀚企业的技能验证。出格对传统企业来说,技能气力一时还较量难到达要求,无法把控产物,最好不要等闲行使开源的产物。 尚有也许必要思量容器云产物和架构方案,以及是否有IaaS层的技能支持,IaaS层回收的技能等方面。 七、存储、容器云和大数据 我们思量存储不只仅是容器云必要,大数据平台也必要,存储可以单独作为一块来思量,可以不绑在容器云项目上。综合容器云平台,大数据平台建树,同一来思量存储资源的建树,也许会更好些。我们的最终目标是能为容器云平台提供存储资源也就够了。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |