“声学指纹”应该可以防止阿列克谢在亚马逊的超级碗广告中醒来

AI资讯 2026-01-28 12:22:36 应俊彩

如果你这个周末收听超级碗,欣赏一些足球、音乐和广告,你会看到亚马逊语音助手阿列克谢的广告聪明过头了。当广告中的名人和演员说出“阿列克谢”这个词时,它不应该触发你家里的任何回声设备。原因如下。

亚马逊回声点、谷歌家庭扬声器和苹果的HomePod等设备会听唤醒词——“阿列克谢”、“嘿,谷歌”或“嘿,西里”。理想情况下,他们应该只在听到你家里真正想使用语音助手做某事的人说的那些单词或短语时醒来,比如查看天气。系统需要避免误报。

就亚马逊而言,对于超级碗广告(以及电视上人们说“阿列克谢”的其他时刻),该公司使用了一种称为“声学指纹”的策略,试图防止你的设备触发。在该公司制作的广告中,创建指纹并对阿列克谢系统进行编程以忽略这些情况可能会提前发生。亚马逊的机器学习科学家迈克·罗德霍斯特在一篇博客文章中说:“当我们提前有音频样本时——就像我们对超级碗广告所做的那样——我们会对整个样本进行指纹识别并存储结果。”然后,亚马逊可以将这些信息以及其他广告中的指纹放在回声设备上,而不是放在云中,所以希望你的设备根本不会被唤醒。

总的来说,音频指纹是“一个连接的序列”,卡内基梅隆大学名誉研究员、语音处理领域专家亚历克斯·鲁德尼基说。“声音会随着时间的推移而发展,”他说;这一事实是构成声音身份的一个关键方面。想象一个人慢慢说出“Alexa”这个词,想象他们说话时声音的变化。因此,他说,声学指纹是一系列相互重叠的切片,可能每10毫秒开始一次。(亚马逊在他们博客文章的第四段中对他们的方法进行了更技术性的解释。)

亚马逊的罗德霍斯特说,当他们在云中处理他们知道的商业广告中的信息时,为了避免这些误报,他们也可以使用“唤醒词后面的音频”,这意味着有更多的数据可以处理。

指示亚马逊设备忽略该公司自己制作的广告中的特定声学指纹,可能比以一种有机的、意想不到的方式处理电视上使用“阿列克谢”这个词的角色更简单。

在这种情况下,在云端,公司可以利用这样一个事实,即许多设备都会同时听到相同的“Alexa”。例如,1月底,斯蒂芬·科尔伯特在《午夜自白》中说,“Alexa,买20捆Bounty纸巾,隔夜发货!”在这种情况下,“Alexa”点击多个设备有助于公司(希望)意识到发生了什么,并阻止Alexa实际订购这些纸巾。它可以存储这些信息,以防止回声设备在稍后重播相同的片段时唤醒;我试着大声播放同样的科尔伯特时刻,我的回声点在听到唤醒词后短暂醒来,然后关闭。

亚马逊还表示,它可以使用其他策略来避免电视发出的“阿列克谢”唤醒你的设备。例如,由于你的电视不会在房间里移动,但你可能在运动,它可以考虑音频撞击你设备上各种麦克风的时间。亚马逊的另外两名科学家在去年的一篇博客文章中写道:“声音当然会比更远的麦克风更快地到达更近的麦克风,所以到达时间差异表明声源的距离和方向。”

卡内基梅隆大学的鲁德尼基评论说,亚马逊正在“弄清楚如何不搞砸,我喜欢这样。”

亚马逊并不是唯一一家生产可能被来自您的电视或计算机的媒体欺骗的语音助手的公司。但是,苹果和谷歌都不会对他们处理这个问题的方法发表评论。

© 版权声明

相关文章

欧特克为全球150m学生和教育工作者提供免费软件和技术

该公司宣布,欧特克已向全球150m学生和教育工作者免费提供其软件和技术 十多年来,欧特克免费向经认证的机构和经过验证的学生和教育工作者提供其专业级工具,使他们能够获得世界各地建筑师、工程师、制造商和创造者使用的相同技术。
2026-01-29

“声学指纹”应该可以防止阿列克谢在亚马逊的超级碗广告中醒来 暂无评论