人工智能正在解决一个难题——给计算机一种嗅觉
这篇文章最初是在《对话》上发表的。
100多年前,亚历山大·格雷厄姆·贝尔要求《国家地理》的读者做一些大胆而新鲜的事情——“发现一门新科学”。他指出,基于声音和光测量的科学已经存在。但是没有气味科学。贝尔要求他的读者“测量气味”
如今,大多数人口袋里的智能手机提供了令人印象深刻的基于声光科学的内置功能:语音助手、面部识别和照片增强。气味科学没有提供任何可比的东西。但是这种情况正在改变,因为机器嗅觉(也称为“数字化嗅觉”)的进步终于响应了贝尔的行动号召。
由于人类嗅觉的复杂性,机器嗅觉的研究面临着巨大的挑战。人类的视觉主要依赖于视网膜中的受体细胞——杆和三种类型的锥体——而嗅觉是通过鼻子中大约400种受体细胞来体验的。
机器嗅觉从检测和识别空气中分子的传感器开始。这些传感器的作用与鼻子中的受体相同。
但是要对人有用,机器嗅觉需要更进一步。系统需要知道某个分子或一组分子对人类来说是什么味道。为此,机器嗅觉需要机器学习。
将机器学习应用于气味
机器学习,尤其是一种叫做深度学习的机器学习,是语音助手和面部识别应用程序等显著进步的核心。
机器学习也是气味数字化的关键,因为它可以学习将气味引起化合物的分子结构映射到文本气味描述符。机器学习模型学习人类倾向于使用的词——例如“甜”和“甜点”——来描述他们遇到特定的气味引起化合物时的经历,如香兰素。
然而,机器学习需要大型数据集。网络上有大量难以想象的音频、图像和视频内容,可以用来训练识别声音和图片的人工智能系统。但是机器嗅觉长期以来一直面临着数据短缺的问题,部分原因是大多数人无法像描述视觉和声音那样轻松、可识别地口头描述气味。如果无法访问网络规模的数据集,研究人员就无法训练真正强大的机器学习模型。
然而,事情在2015年开始发生变化,当时研究人员发起了梦嗅觉预测挑战。该竞赛公布了研究嗅觉的生物学家安德烈亚斯·凯勒和莱斯利·沃斯沙尔收集的数据,并邀请来自世界各地的团队提交他们的机器学习模型。这些模型必须根据气味引起的化合物的分子结构预测气味标签,如“甜”、“花”或“水果”。
表现最好的模型发表在2017年《科学》杂志的一篇论文中,一种名为随机森林的经典机器学习技术结合了多个决策树流程图的输出,结果成为赢家。
我是一名机器学习研究人员,长期以来一直对将机器学习应用于化学和精神病学感兴趣。DREAM挑战激起了我的兴趣。我还感受到了与嗅觉的个人联系。我的家族可以追溯到印度北部的小镇卡瑙伊,那里是印度的香水之都。此外,我父亲是一名化学家,他职业生涯的大部分时间都在分析地质样本。因此,机器嗅觉在香水、文化、化学和机器学习的交叉点上提供了一个不可抗拒的机会。
在DREAM挑战结束后,机器嗅觉的进展开始加速。在2019年冠状病毒病大流行期间,报告了许多嗅觉失明或嗅觉缺失的病例。嗅觉通常处于次要地位,但在公众意识中上升了。此外,一个研究项目,皮鲁菲项目,公开了更多更大的数据集。
深深地嗅着
到2019年,最大的数据集已经从梦想挑战中的不到500个分子增长到大约5000个分子。由Alexander Wiltschko领导的谷歌研究团队终于能够将深度学习革命带入机器嗅觉。 他们的模型基于一种叫做图神经网络的深度学习,在机器嗅觉方面建立了最先进的结果。Wiltschko现在是Osmo的创始人兼首席执行官,其使命是“给计算机一种嗅觉”
最近,Wiltschko和他的团队使用图形神经网络创建了一个“主气味图”,其中感知上相似的气味比不同的气味更接近彼此。这并不容易:分子结构的微小变化会导致嗅觉感知的巨大变化。相反,两个分子结构非常不同的分子闻起来几乎是一样的。
破解嗅觉密码的这种进展不仅在智力上令人兴奋,而且具有非常有前途的应用,包括个性化香水和香水、更好的驱虫剂、新型化学传感器、疾病的早期检测,以及更逼真的增强现实体验。机器嗅觉的未来看起来很光明。它也承诺闻起来很香。
人工智能正在解决一个难题——给计算机一种嗅觉