7.5亿美元做代码转换？一个Facebook TransCoder AI就够了！

发布时间：2020-06-11 00:30:31 所属栏目：创业来源：站长网

导读：代码的迁徙和说话转换是一件很坚苦且昂贵的工作，澳大利亚联邦****就曾耗费5年时刻，淹灭7.5亿美元将其平台从COBOL转换为Java。而Facebook最近宣称，他们开拓的一种神经转换编译器（neural transcompiler），可以将一种高级编程说话（如C ++，Java和Python

代码的迁徙和说话转换是一件很坚苦且昂贵的工作，澳大利亚联邦****就曾耗费5年时刻，淹灭7.5亿美元将其平台从COBOL转换为Java。而Facebook最近宣称，他们开拓的一种神经转换编译器（neural transcompiler），可以将一种高级编程说话（如C ++，Java和Python）转换为另一种，服从飞起！

从 COBOL 到 Java，TransCoder能帮你省下7.5亿美元

差异的编程说话之间也可以自动转换了！

要知道，将现有的代码库迁徙到当代可能更有用的说话，如 Java 或 c + + ，必要能干源说话和方针说话，并且无论是款子照旧时刻淹灭都异常奋发。

澳洲联邦****在已往五年中耗费了约莫7.5亿美元将其平台从 COBOL 转换为 Java。

可是，Facebook最近开拓的神经转换编译器TransCoder让代码转换呈现了新的起色。该体系可以将代码从一个高级说话转换成另一个，好比 c + + 、 Java 和 Python。

这个体系是弱监视的，可以在没有标签的数据齐集探求早年未检测到的模式，只必要少量的人工监视。研究职员称，这比基于法则数据集的模子要高效得多。

7.5亿美元做代码转换？一个Facebook TransCoder AI就够了！

理论上，代码转换编译器可以或许提供许多的辅佐，闪开拓者无需从新从头写代码。但实践中，代码转换是一件很坚苦的工作，由于差异说话依靠于差异的语法准则，差异的平台api、尺度库函数和可变范例。

因此，TransCoder的面世，无疑是企业的福音。由于他们不必像澳洲联邦****那样，再去淹灭大量的时刻和款子去做代码转换的伟大事变，只必要选择Facebook，选择TransCoder，平台迁徙即可迎刃而解。

从Java到C++，TransCoder转换精确率超九成！

TransCoder是基于跨说话模子预实习去做的模子初始化，这样的实习不着眼于编程说话的范例，而仅仅将暗示沟通指令的代码段映射为沟通的暗示情势。

之以是TransCoder能举办跨说话模子的实习，是由于体系的标志道理着眼于跨说话之间的配合要害字，如「if」，「for」等，以及数字、数学运算符和呈此刻源代码中的英语字符串。这样反向翻译之后通过源-方针模子和并行实习的方针-源模子耦合，从而进步了实习的质量。

研究职员为了评估TransCoder的机能，从GeeksforGeeks中提取了852个C ++，Java和Python并行函数，操作这些差异说话的转换来测试函数语义是否精准，测试的功效如下：

7.5亿美元做代码转换？一个Facebook TransCoder AI就够了！

GeeksforGeeks是一个在线平台，用于网络编写代码时的题目，并提供多种编程说话的办理方案。

研究职员称，TransCoder在尝试进程中展示了对每种说话特有语法的领略手段，而且可以或许顺应小范畴的修改。尽量这个模子并不美满，可是机能优于已有的操作专家常识手动构建的框架。

从天然说话翻译到代码翻译，seq2seq再立新功

TransCoder行使了经典的序列到序列（seq2seq）模子，该模子由基于Transformer的编码器息争码器构成，seq2seq模子的甜头在于，你只必要有对应的输入输出即可，而不必要体谅是哪两种编程说话。

TransCoder模拟Lample等人中确定的无监视呆板翻译流程举办实习，包罗初始化，说话建模和反向翻译。

尝试表白以跨说话方法对整个模子（不只是单词暗示情势）举办预实习明显改进了无监视呆板翻译的结果，TransCoder遵循Lample和Conneau 的预实习计策，个中跨说话模子（XLM）在单说话的源代码数据集上，行使遮罩说话建模举办了预实习。

7.5亿美元做代码转换？一个Facebook TransCoder AI就够了！

TransCoder的转换道理

个中，跨说话本质来历于多种说话中的大量通用标志（锚点）。在英语-法语翻译的上下文中，锚点首要由数字、都市、人名等构成，而在编程说话中，这些定位点来自常见的要害字（for，while，if，try等），以及源代码中呈现的数字，运算符和英语字符串等。

seq2seq模子的编码器息争码器由预实习的XLM模子参数举办初始化。对付编码器而言，初始化很是简朴，由于它与XLM模子具有沟通的系统布局。可是解码用具有与attention机制有关的特殊参数，以是这部门回收了随机初始化。

XLM预实习应承seq2seq模子天生输入序列的高质量暗示。然而，解码器缺乏翻译手段，由于从未实习过解码器基于源暗示对序罗列办解码。为了办理这个题目，TransCoder操作降噪自编码(DAE)对序罗列办编码息争码，再对模子举办实习。

在测试时，模子可以对Python序罗列办编码，并行使C ++起始标记对其举办解码以天生C ++转换。C ++转换的质量取决于模子的「跨说话」机能：假如Python和C ++转换被编码器映射到沟通的暗示，则解码器将乐成天生对应的C ++代码。

现实上，仅XLM预实习和降噪自编码就足以天生翻译。可是，这些翻译的质量每每很低，由于该模子从未对编程说话实现的成果举办实习。TransCoder为了办理这个题目，行使了反向翻译，这是在弱监视的环境下操作单说话数据的最有用要领。

在无监视的环境下，源到方针模子与后向的方针到源模子是并行实习的。方针到源模子用于将方针序列翻译成源说话，从而发生与真实方针序列相对应的嘈杂源序列。然后以弱监视的方法实习源到方针模子，以前面天生的嘈杂源序列中重建方针序列，反之亦然，并行实习两个模子直到收敛。

作者简介

该论文一作Marie-Anne Lachaux，今朝是Facebook人工智能研究院NLP偏向研究员，巴黎高档电信学院计较机图像学学士，伦敦国王学院计较机图像学硕士，曾在达索体系（Dassault Systèmes）接受研究员。首要研究偏向为计较机视觉和图像辨认，计较机神经收集。

在达索接受研究员时代，Marie-Anne Lachaux首要偏向为拓扑优化研究。拓扑优化是计划机器零件的一种新要领，其目标是在保持机器机能的同时大量镌汰零件的质量。拓扑优化的实现要领是基于Visual Studio，c++和很多经典库，这为Marie-Anne Lachaux在Facebook开展NLP研究奠基了基本。

7.5亿美元做代码转换？一个Facebook TransCoder AI就够了！

此前，已经有许多基于深度进修的代码自动补全，结果也异常惊艳，而基于法则的代码转换也有不少项目，但大大都泛化手段不强，事实能写的法则有限。

TransCoder基于深度进修举办代码转换，无视了这些法则，直接端到端，对相干事变照旧有很大的开导，假如TransCoder精确率一连晋升，那算法模子工程化的事变量将大幅缩减，措施员的编码服从也将有质的奔腾。

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2021创业做什么好？低	香港虚拟主机，香港虚
《启航当风起时》起于	域名最网站至关重要如