三星的新数字助理Bixby试图将语音识别推向真正的人工智能
在智能手机上使用语音命令并不是什么新鲜事,但是三星的新数字助理比克斯比超越了语音识别,融入了深度学习和扩展的视觉搜索,让它感觉更像是生活在你设备中的真正数字助理。
比克斯比立刻被拿来与苹果的Siri和谷歌的智能助理进行比较,但尽管我们通常认为它们只是简单的声音,三星称比克斯比有自己的基于卡片的视觉界面来传达信息。语音只是等式的一部分。其他方面是视觉(比如使用相机扫描二维码,根据封面找出一本书的价格,或者翻译文本)、提醒和推荐。比克斯比是这四个智能功能的总称。
三星专注于智能和物联网的高级主管斯里拉姆·索德拉在周三的银河S8和S8+发布会上向公众介绍了比克斯比。“比克斯比了解背景,”他说。“它知道你屏幕上发生了什么。”
例如,您可以要求它截屏您正在做的事情,然后将该图像发送给联系人。这种跨越多个应用程序和服务的复杂请求在过去被证明对数字助理来说是有问题的。
“我们说Bixby是一个智能用户交互界面,”三星服务战略副总裁Mok Oh在周一的新闻发布会上接受采访时说。
哦,吹捧比克斯比的完整性,这意味着如果一个应用程序支持比克斯比,你可以通过触摸做的任何事情也可以通过语音完成。例如,你可以让比克斯比把手机上的显示语言切换到另一种语言,比克斯比应该这样做。哦说,助手也“认知宽容”,所以它应该处理请求中的模糊性。
Oh接着强调了手机的照片应用程序Gallery,以及用户可以在其中完成的数千种不同的任务组合。用户可以通过无数种不同的方式命令裁剪或编辑图像,Bixby应该能够处理。
“在许多方面,我们应用了深度学习技术,”对比克斯比说。其中一个方面是比克斯比在处理请求后会给用户一个竖起大拇指或竖起大拇指的选项,让比克斯比知道它是怎么做的,并帮助它学习。“事实上,我们为此在整个技术堆栈的许多不同方面应用了学习,”他补充道。
https://www.youtube.com/watch?v=pfJVUd1gjT8
卡内基梅隆大学专注于语音研究的计算机科学研究教授亚历克斯·鲁德尼基说,对于像比克斯比这样的虚拟代理来说,竖起大拇指或竖起大拇指的功能至关重要。“你需要某种强化,基本上让系统能够学习——基本上理解用户想要什么和实际发生的事情之间的联系,”他说。“实际上,代理会犯很多错误。”
亚马逊的Alexa应用程序也有类似的功能,询问用户它是否做了他们想要的事情。
除了倾听能力,比克斯比还可以看到现实世界。使用S8的内置摄像头,比克斯比可以检测场景中的物体,并搜索有关该产品以及相关产品的信息。当然,它还允许你从三星的合作伙伴那里购买它们。这是Siri目前不提供的功能,谷歌助手提供了,通常结果喜忧参半,但这种增强现实风格的交互是人工智能作为个人助理的合乎逻辑的一步。
在视觉搜索方面,三星已经利用了各种合作伙伴公司,如亚马逊购物、Foursquare定位功能(Thodla举了一个例子,他拍了一张纽约标志性熨斗建筑的照片,并获得了相关信息,以及该地区的美食选择),以及谷歌翻译不同语言的标志。
哦说,最后,比克斯比还应该了解情境模式;如果你通常在下班开车回家时打电话,助手可能会接电话,然后建议你这样做。索德拉在设备发布时也提到了这一点,他说比克斯比可能会建议优步,如果它注意到你通常在某个时间打电话。
Bixby有自己的主屏幕,它用它了解到的典型用法信息来管理。来自各种应用程序的信息显示在卡片上,它认为最相关的信息被推到顶部。 因此,在早上它会优先考虑天气和电子邮件等内容,而在晚上它可能会将社交媒体推到首位。然而,随着Bixby从用户那里获得反馈,所有这些都是可变的。
Neura首席营销官克里斯·邦迪表示,一般来说,模式识别和态势感知(虚拟助手提出建议)将简单的语音识别和连接技能与人工智能区分开来。Neura制造了一个人工智能引擎,专注于个性化和识别用户生活中的背景和时刻。
三星的新数字助理Bixby试图将语音识别推向真正的人工智能