人工智能可以把你糟糕的口哨声变成莫扎特的声音
想象一下一个人粗鲁地吹着夺宝奇兵电影主题曲的声音。然后,想象一台电脑听着这首歌的口哨版本,并模仿它——但以巴赫的风格,在风琴上。
Facebook一个部门的一小群研究人员创造了一个人工智能系统,该系统能够做到这一点——听一首歌的音频文件,然后用新的乐器模仿它。这是一个带有合成大脑的翻唱乐队。他们称之为“通用音乐翻译网络”,它可以从给定的音乐文件中吐出六种不同风格的音乐。
不仅仅是夺宝奇兵和巴赫。该系统可以把一首经典的、发自内心的歌曲,比如《永远在我心中》,变成莫扎特演奏的那首曲子的一个版本。“我们想模仿人类听音乐的能力,并通过吹口哨或演奏乐器来重复它,”利奥·沃尔夫说。他是一项描述这项工作的新研究的合著者之一。人工智能不是阅读音符——它只是把给定的音频文件转换成代码,然后解码成新版本。
沃尔夫补充道:“它在内部学习自己的表现形式,这是[音乐]音符的替代方案。“描述它的最佳方式是,它在不同的音乐领域以不同的风格创造了[的封面版本。”这些风格包括莫扎特、巴赫和贝多芬。研究人员将金属即兴片段放入系统,并推出了钢琴版本。
这项研究的指导者亚尼夫·泰格曼说,他们受到了一种叫做神经风格迁移的计算机视觉技术成功的启发。神经风格迁移是指用一种新的风格重新绘制图像,就像梵高画了你的照片一样。(一个名为Prisma的应用程序就是一个很好的例子)。泰格曼说:“我们基本上想给音乐带来同样的效果,这被许多人认为是一种通用语言。”
听起来很有趣——看看下面的视频,你会听到它是海顿的弦乐四重奏,并以莫扎特的风格覆盖,或者是贝多芬作为钢琴曲重复的非洲鼓。在不同的时刻,它感觉既优雅又粗糙:覆盖海顿的莫扎特交响乐比莫扎特版本的哨子夺宝奇兵主题好得多。描述这项研究的论文直言不讳地这样描述它:“被要求将一种乐器转换成另一种乐器,我们的网络与专业音乐家不相上下或略差。”
这一发展引起了谷歌人工智能研究员亚当·罗伯茨的注意,他致力于洋红色项目,该项目专注于机器学习、艺术和音乐。他在推特上写道 :“我听到的第一个令人信服的音乐风格转变。一定要看看非洲鼓和吹口哨的交响乐!”
当看到另一种语言的评论时,脸谱网已经使用人工智能来支持你在网站上看到的language-to-language翻译服务,但是它在一篇解释新研究的博客文章中说,它不打算用于“特定的产品或功能”研究人员将在Github上发布该项目背后的代码,供任何人使用。
詹妮尔·谢恩在博客aiweirdness.com上试验了一种叫做神经网络的人工智能,她以使用人工智能生成有趣的新材料而闻名,比如奇怪的情人节糖果心谚语。她说,如果有一种工具可以让普通人尝试这个功能,它可以帮助激发创造力。
“我真的希望他们能建立某种演示平台,让其他人可以使用这个工具,”她说。“看起来确实有很多艺术家能够利用这个工具做出一些非常酷的东西——现在对大多数人来说,使用人工智能工具、使用神经网络工具进行艺术创作和制作音乐的障碍有点太高了。”
人工智能可以把你糟糕的口哨声变成莫扎特的声音