人工智能可以把你糟糕的口哨声变成莫扎特的声音

AI资讯 2026-01-28 12:24:18 慕容清杰

想象一下一个人粗鲁地吹着夺宝奇兵电影主题曲的声音。然后，想象一台电脑听着这首歌的口哨版本，并模仿它——但以巴赫的风格，在风琴上。

Facebook一个部门的一小群研究人员创造了一个人工智能系统，该系统能够做到这一点——听一首歌的音频文件，然后用新的乐器模仿它。这是一个带有合成大脑的翻唱乐队。他们称之为“通用音乐翻译网络”，它可以从给定的音乐文件中吐出六种不同风格的音乐。

不仅仅是夺宝奇兵和巴赫。该系统可以把一首经典的、发自内心的歌曲，比如《永远在我心中》，变成莫扎特演奏的那首曲子的一个版本。“我们想模仿人类听音乐的能力，并通过吹口哨或演奏乐器来重复它，”利奥·沃尔夫说。他是一项描述这项工作的新研究的合著者之一。人工智能不是阅读音符——它只是把给定的音频文件转换成代码，然后解码成新版本。

沃尔夫补充道：“它在内部学习自己的表现形式，这是[音乐]音符的替代方案。“描述它的最佳方式是，它在不同的音乐领域以不同的风格创造了[的封面版本。”这些风格包括莫扎特、巴赫和贝多芬。研究人员将金属即兴片段放入系统，并推出了钢琴版本。

这项研究的指导者亚尼夫·泰格曼说，他们受到了一种叫做神经风格迁移的计算机视觉技术成功的启发。神经风格迁移是指用一种新的风格重新绘制图像，就像梵高画了你的照片一样。（一个名为Prisma的应用程序就是一个很好的例子）。泰格曼说：“我们基本上想给音乐带来同样的效果，这被许多人认为是一种通用语言。”

听起来很有趣——看看下面的视频，你会听到它是海顿的弦乐四重奏，并以莫扎特的风格覆盖，或者是贝多芬作为钢琴曲重复的非洲鼓。在不同的时刻，它感觉既优雅又粗糙：覆盖海顿的莫扎特交响乐比莫扎特版本的哨子夺宝奇兵主题好得多。描述这项研究的论文直言不讳地这样描述它：“被要求将一种乐器转换成另一种乐器，我们的网络与专业音乐家不相上下或略差。”

这一发展引起了谷歌人工智能研究员亚当·罗伯茨的注意，他致力于洋红色项目，该项目专注于机器学习、艺术和音乐。他在推特上写道：“我听到的第一个令人信服的音乐风格转变。一定要看看非洲鼓和吹口哨的交响乐！”

当看到另一种语言的评论时，脸谱网已经使用人工智能来支持你在网站上看到的language-to-language翻译服务，但是它在一篇解释新研究的博客文章中说，它不打算用于“特定的产品或功能”研究人员将在Github上发布该项目背后的代码，供任何人使用。

詹妮尔·谢恩在博客aiweirdness.com上试验了一种叫做神经网络的人工智能，她以使用人工智能生成有趣的新材料而闻名，比如奇怪的情人节糖果心谚语。她说，如果有一种工具可以让普通人尝试这个功能，它可以帮助激发创造力。

“我真的希望他们能建立某种演示平台，让其他人可以使用这个工具，”她说。“看起来确实有很多艺术家能够利用这个工具做出一些非常酷的东西——现在对大多数人来说，使用人工智能工具、使用神经网络工具进行艺术创作和制作音乐的障碍有点太高了。”