人工智能在这里掩盖你视频通话中狂吠的狗和尖叫的孩子

AI资讯 2026-01-28 12:21:05 水珍乐

当人们开始保持社交距离时，视频通话很快就成为人际交流的一种基本方式。这种工具与面对面会面不同，只是看到其他面孔就会让典型的纯音频电话会议感觉过时得无可救药。然而，现在，经过几个月的距离，视频通话的新鲜感已经消退，烦人的怪癖变得更加明显。背景中吠叫的狗不再像以前那么可爱了，任何在头脑风暴中用皱巴巴的袋子吃饭而没有静音麦克风的人都应该去复仇者联盟关押超级恶棍的大型监狱。

然而，现在，微软和谷歌等公司正在加大人工智能驱动的努力，以消除视频通话中烦人的背景噪音。事实上，谷歌刚刚开始向一些谷歌办公套件企业客户推出降噪功能，并将在未来几个月向更多用户推出。

https://youtu.be/1q61B8zdSV0/

本周，谷歌向Venture Beat演示了它正在开始实施的降噪技术。演示令人印象深刻。演讲者是谷歌办公套件产品管理总监谢尔盖·拉查佩拉，他会播放各种不同的声音，包括拍手、袋子起皱，甚至用金属六角钥匙敲击玻璃杯。当他打开降噪功能时，他的声音听起来有点低沉，但过一会儿就会消失。然而，更重要的是，分散注意力的声音几乎完全消失了。

Lachapella使用的是Blue Yeti麦克风，这是播客和主播相当常见的套件，但并不是硬件发挥了魔力。相反，谷歌依靠基于云的人工智能算法来分析音频，并在留下你的话的同时剔除令人不快的干扰。

这与我们通常在耳机术语中使用的“降噪”一词不同。在这种情况下，耳机会产生声波，在噪音试图到达你的耳朵时，它会在物理上抵消噪音。在谷歌的例子中——其他公司也在做同样的事情——机器人正在分析音频，并从信号中去除噪音，然后将其传输到你的耳机或扬声器。

谷歌对语音识别并不陌生。谷歌助手多年来一直在监听和解析单词，就在去年，该公司推出了惊人准确的实时转录功能，该功能可以实时以纯文本形式再现对话。谷歌利用这项技术开发了新的人工智能。通过降噪，计算发生在云端，而不是用户的设备上，因此它不会比资源密集型视频通话对本地处理器造成更大的负担。

当该功能发布给用户时，默认情况下会打开，这意味着有一天你可能会注意到背景声音消失了。如果你喜欢未经过滤的音频，你可以进入设置并关闭它。在某些情况下，你可能会想这样做。例如，唱歌可能会通过过滤器，而背景音乐可能不会。

https://youtu.be/57mZhr-Tir4/

谷歌并不是唯一一家试图清理视频通话音频的公司。早在4月份，微软就展示了一项类似的技术，旨在为其团队视频聊天功能服务。它使用了一个类似的概念：分析音频并过滤掉它无法识别为说话的声音。

与谷歌的计划一样，微软的噪音抑制将在未来几个月内推出。

与大多数人工智能驱动的技术一样，两家公司都预计，随着时间的推移，他们的系统在识别不需要的噪音方面会变得更好。如果有更广泛的数据集和更多的时间来了解它应该过滤什么和不应该过滤什么，最终会使它更有效。这很好，因为你那些痴迷芯片的同事可能不打算很快转向更安静的零食。