Siri有了一个活泼的新声音。但这还不是最重要的。

AI资讯 2026-01-28 12:25:46 邢阳朋

你听说了吗?从你的iPhone说话的虚拟角色Siri现在听起来不一样了。作为苹果最新移动操作系统iOS11的一部分,新声音今天正式推出。她的新管道让她的声音音调更高、更年轻。她更活泼、更有风度。最重要的是,她听起来更有人情味。

她的最新声音是这样诞生的:有人大声朗读一本书,苹果公司录了下来。她的英语美国口音是由特定的人发出的,比如她的英国口音。苹果公司对这些录音的目标是收集听起来自然的单词和音素,或者组成我们单词的声音。从那里,苹果公司使用机器学习将这些音素编织在一起,使她的演讲听起来尽可能自然。通过专注于以正确的方式组合这些单词和声音,苹果公司希望创造一种正确强调音节的声音,这样她听起来就不会太做作。

为了更好地理解Siri新声音的特点,我把她说美式英语的片段发给了不列颠哥伦比亚大学语言学系助理教授莫莉·巴贝尔(Molly Babel)。(是的,她是一名语言专家,姓Babel,拼写就像“Tower of”。)巴贝尔让我录下Siri说的特定单词——其中包括意大利面、游泳池和靴子——以及一段语言学上众所周知的段落,其中包含过多的单词发音。它的开头是,“请打电话给斯特拉。”

她的反应?“当我听到她的一些元音时,我笑了一下,”巴贝尔说。“她是典型的加州人。”巴贝尔可以通过Siri在单词pool和boot中发出“oo”音的方式以及她发出其他元音的方式来判断。在相当于back-of-the-envelope计算的语言学中,巴贝尔将Siri的声音与口音档案中的类似扬声器进行了比较,并确认Siri听起来最像加州人。

巴贝尔指出,更重要的是,她的声音听起来高亢而有呼吸,这两个因素共同给人一种年轻的感觉。“她听起来真的很年轻,”她说,并补充说,她的声音最适合十八九岁或二十多岁的美国女性。

巴贝尔说,这种呼吸,这个术语指的是通过声带流动的空气量,让她听起来很健康。

我问她,人们希望从他们的设备发出的虚拟角色中听到什么样的声音——那些给我们提供天气和约会信息的声音。

“我确实认为她被设计成愿意取悦他人,”巴贝尔说。“老实说,这也许是我们对年轻女性不公平刻板印象的一部分。”你可以很容易地把声音换成男性的,这种声音从2013年开始在iPhone的环境中就有了。

“我们在设备中听到的口音很有吸引力,它很熟悉,听起来有点像我们,”她补充道。“这有助于对抗我们被轻视的感觉。”

但是效果好吗?

巴贝尔反映,最终,虚拟助手不应该只有易于理解的愉快声音;它还需要清楚地理解用户。借助iOS11,Siri可以口头将口语短语翻译成五种不同的语言。

翻译是一个有用的功能,但虚拟助手的主要目标是知道你的要求,并以正确的方式做出回应。如果你让Siri叫你优步,但她不明白“优步”这个词,并提示你在手机上的优步和Lyft应用程序之间进行选择,不管她的声音听起来像什么,你都会感到沮丧。(自苹果2011年首次推出语音助手以来,Siri的单词识别错误率大幅下降。)

卡内基梅隆大学(Carnegie Mellon University)的系统科学家蒂莫·鲍曼(Timo Baumann)也提出了这一点。他研究Siri等语音计算机系统。他也听了她的演讲。(巴贝尔和鲍曼都在iOS11仍处于测试阶段时听到了她的声音,直到今天正式发布。)

“在我看来,新声音实际上比旧声音更有个性,”鲍曼说。“旧声音更遥远。”例如,今年早些时候,当苹果首次公布数字助理的新音域时,他们演示了她用三种不同的语调说出“阳光”这个词——这是她试图听起来更人性化和自然的又一个例子。

语音电报能力中的自信和个性,这意味着当数字助理不可避免地丢球时,就像他们一样,语气和性能之间的不协调可能会更加明显。

鲍曼说:“这个声音似乎真的支持它所说的话。” “这意味着苹果必须小心,确保自己真的能做到。如果你用这种声音说一些愚蠢的话,听起来会更加愚蠢。”

至于巴贝尔对Siri听起来像加州人的看法,你可以随时问她来自哪里。如果你问了,她可能会告诉你:“就像盒子上写的那样…我是由加州的苹果公司设计的。”

© 版权声明

相关文章

欧特克为全球150m学生和教育工作者提供免费软件和技术

该公司宣布,欧特克已向全球150m学生和教育工作者免费提供其软件和技术 十多年来,欧特克免费向经认证的机构和经过验证的学生和教育工作者提供其专业级工具,使他们能够获得世界各地建筑师、工程师、制造商和创造者使用的相同技术。
2026-01-29

Siri有了一个活泼的新声音。但这还不是最重要的。 暂无评论