加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

谈谈关于NVMe和NVMe-oF的那些事

发布时间:2018-12-05 15:51:12 所属栏目:站长百科 来源:架构师技术联盟
导读:NVMe传输是一种抽象协议层,旨在提供靠得住的NVMe呼吁和数据传输。为了支持数据中心的收集存储,通过NVMe over Fabric实现NVMe尺度在PCIe总线上的扩展,以此来挑衅SCSI在SAN中的统治职位。NVMe over Fabric支持把NVMe映射到多个Fabrics传输选项,首要包罗FC

NVMe over fabric白皮书明晰列出了光纤通道作为一个NVMeover Fabrics选择,也描写了抱负的Fabrics必要具备靠得住的、以Credit为基本的流量节制和交付机制。然而,基于Credit的流程节制机制是FC、PCIe传输原外行段。在NVMe的白皮书中并没有把RDMA列为“抱负”NVMe overFabric的重要属性,也就是说RDMA除了只是一种实现NVMeFabric的要领外,没有什么出格的。

FC也提供零拷贝(Zero-Copy)技能支持DMA数据传输。RDMA通过从当地处事器转达Scatter-Gather List到长途处事器有用地将当地内存与长途处事器共享,使长途处事器可以直接读取或写入当地处事器的内存。更多关于NVMe over FC的内容,请参考“基于FC的NVMe或FC-NVMe尺度”和“Brocade为何以为FC是最好的Fabric”。

接下来,谈谈基于RDMA技能实现NVMe over fabric的Fabric技能,RDMA技能最早呈此刻Infiniband收集,用于HPC高机能计较集群的互联。基于InfiniBand的NVMe倾向于吸引必要极高带宽和低耽误的高机能计较事变负载。InfiniBand收集凡是用于后端存储体系内的通讯,而不是主机到存储器的通讯。与FC一样,InfiniBand是一个必要非凡硬件的无损收集,它具有诸如流量和拥塞节制以及处事质量(QoS)等利益。但与FC差异的是,InfiniBand穷乏发明处事自动将节点添加到布局中。关于更多RDMA常识,请读者参考文章“RDMA技能道理说明、主流实现比拟息争析”。

最后,谈谈NVMe/TCP协议选项(暂记为NVMe over TCP),在几年前,NVMe Express组织打算支持传输节制协议(TCP)的传输选项(差异于基于TCP的iWARP)。克日NVM Express Inc.历时16个月宣布了NVMe over TCP第一个版本。该Fabric尺度的呈现已经答复了是否满意承载NVMe协议尺度的Fabric即可作为NVMe over fabric的Fabric的题目。

可是TCP 协议会带来远高于当地PCIe会见的收集耽误,使得NVMe协议低耽误的方针遭到粉碎。在没有回收RDMA技能的条件下,NVMe/TCP是回收什么技能到达相同RDMA技能的传输结果呢?下面引用杨子夜(Intel存储软件工程师)概念,谈谈促使了NVMe/TCP的降生几个技能缘故起因:

1. NVMe假造化的呈现:在NVMe假造化实现的条件下,NVMe-oF target那端并不必然必要真实的NVMe 装备,可所以由漫衍式体系抽象假造出来的一个假造NVMe 装备,为此未必担任了物理NVMe装备的高机能的属性 。那么在这一条件下,行使低速的TCP协议也未尝不行。

2. 向后兼容性:NVMe-oF协议,在某种水平上但愿替代掉iSCSI 协议(iSCSI最初的协议是RFC3720,有许多扩展)。iSCSI协议只可以在以太网上运行,对付网卡没有太多需求,并不必要网卡必然支持RDMA。虽然假如能支持RDMA, 则可以行使iSER协议,举办数据传输的CPU 资源卸载。 可是NVMe-oF协议一开始没有TCP的支持。于是当用户从iSCSI向NVMe-oF 转型的时辰,许多已有的收集装备无法行使。这样会导致NVMe-oF协议的接管度降落。在用户不以机能为主要考量的条件下,显然已有NVMe-oF协议对硬件的要求,会给客户的转型造成障碍,使得用户数据中心的更新换代不能顺滑地举办。

3. TCP OffLoading:固然TCP协议在很洪流平上会低落机能,可是TCP也可以行使OffLoading,可能行使Smart NIC可能FPGA。那么隐藏的机能丧失可获得必然的补充。总的来说短期有机能丧失,恒久来讲协议对硬件的要求低落,机能可以改造。为此总的来讲,接管度会获得晋升。

4. 对比Software RoCE:在没有TCP Transport的时辰,用户在不具备RDMA网卡装备的时辰。假如要举办NVMe-oF的测试,必要通过Software RoCE,把收集装备模仿成一个具有RDMA成果的装备,然后举办响应的测试。其真实实现是通过内核的响应模块,现实UDP 包来封装模仿RDMA协议。有了TCP transport协议,则没有这么伟大,用户可以回收更靠得住的TCP协议来举办NVMe-oF的一些相干测试。 从测试陈设来讲越发简朴有用。

NVMe/TCP(NVMe over TCP)的协议,在必然水平上小心了iSCSI的协议,譬喻iSCSI数据读写的传输协议。这个不太不测,由于有些协议的指定参加者,也是iSCSI协议的指定参加者。其它iSCSI协议的某些部门确实写得很好。 可是NVMe/TCP对比iSCSI协议越发简朴,可以说是取其英华。

【编辑保举】

  1. 泽塔云:用超融合撑起软件界说数据中心的空想
  2. 假造化低落数据中心存储体系运维伟大度
  3. 以太网假造专用收集在当代数据中心的鼓起
  4. 浅谈数据中心VxLAN技能
  5. Java假造机布局:运行时数据区
【责任编辑:武晓燕 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读