加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 访谈 > 正文

Facebook Research开发用于音乐源分离的AI系统

发布时间:2020-03-20 23:17:43 所属栏目:访谈 来源:站长网
导读:Facebook Research最近宣布了Demucs,这是一种用于音乐源疏散的新型深度进修体系。按照人类对疏散后声音总体质量的评估,Demucs的机能优于先前报道的功效。 音乐源疏散是颠末大量研究的一种应用,称为盲源疏散。该进程包罗在不借助元信息的环境下从一组混

Facebook Research最近宣布了Demucs,这是一种用于音乐源疏散的新型深度进修体系。按照人类对疏散后声音总体质量的评估,Demucs的机能优于先前报道的功效。
 Facebook Research开拓用于音乐源疏散的AI体系

音乐源疏散是颠末大量研究的一种应用,称为盲源疏散。该进程包罗在不借助元信息的环境下从一组殽杂信号中疏散出一组源信号。对付音乐,各个构成部门也许包罗人声或其他乐器轨道。当空中交通牵制员开始在单个扬声器上听到多个航行员的殽杂声音时呈现题目时,源疏散规模起首受到了普及存眷。这导致英国科学家科林·切里(Colin Cherry)在1953年将这种效应称为“鸡尾酒会题目”。
 Facebook Research开拓用于音乐源疏散的AI体系

在源疏散规模的现有研究的敦促下,研究科学家于2000年月初开始行使AI疏散音乐中的声音。现在,短时傅立叶调动发生的频谱图(STFT)是最新音乐源疏散的焦点。这些体系在每个帧和每个源的幅度谱上发生一个掩码,而且通过在掩码频谱图上运行逆STFT的同时从头行使输入殽杂相位,来天生输出音频。

成立在频谱图说明基本上的体系在诸如中音钢琴或连奏小提琴之类的乐器的源疏散方面示意精彩,由于它们可以发生同等的频率和振铃。可是,这些体系很难断绝敲击声音,由于敲击乐器所发生的残留噪声会发生更宽的频率范畴,而且当与多个乐器的重叠相结适时,信息就会丢失,而且袒护操纵将使信息不再可逆。
 Facebook Research开拓用于音乐源疏散的AI体系

Demucs是一种深度进修模子,可直接对原始输入波形举办操纵并为每个源天生一个波形。U-net系统布局行使卷积编码器息争码器,该解码器息争码器基于跨步卷积较大的步幅。波形模子的事变方法与常见的计较机视觉模子相似,由于它们都行使神经收集在揣度更高级此外模式之前先检测根基模式。

基于频谱图的模子优于Wave-U-Net,后者是Demucs之前最先辈的基于波形的模子。Demucs成立在Wave-U-Net系统布局的基本上,具有可调解的超参数和较长的短期内存,应承收集处理赏罚整个数据序列,而不是单个数据点。

这些改造辅佐体系办理了一个声音高出另一个声音的题目,由于解码器足够智慧,可以添补柔和的音符。

人类在MusDB数据集上评估Demucs,并将其与其他最新的源疏散体系的功效举办较量。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读