MIT开发SmellNet为嗅觉AI模型打地基
MIT 开发 SmellNet,为嗅觉 AI 模型打地基
在人工智能蓬勃发展的当下,视觉与语言处理领域已取得诸多令人瞩目的成果,图像识别精准度不断攀升,自然语言对话流畅度愈发逼真。然而,嗅觉这一人类重要感官对应的 AI 研究却长期停滞不前,犹如一片亟待开垦的荒芜之地。究其根源,缺乏大规模、高质量的真实世界气味数据集成为最大阻碍。如今,麻省理工学院(MIT)的研究团队挺身而出,带来了突破性的解决方案 ——SmellNet,为嗅觉 AI 模型筑牢了关键根基。
搭建嗅觉数据库 “大厦”
为构建 SmellNet,MIT 团队如同精心筹备一场浩大工程的建筑师,从设备到样本,每一步都细致规划。他们亲手打造了便携式 “电子鼻” 传感器套件,这个紧凑的装置宛如一个嗅觉敏锐的 “小怪兽”,集成了 7 种多通道气体传感器。其中,WSP2110 能精准捕捉挥发性有机物 VOCs,像空气中若有一丝苯、丙酮的踪迹都逃不过它的 “法眼”;BME680 更是 “多面手”,气体、压力、湿度、温度变化都能实时感知;多种 MQ-X 系列传感器对酒精、天然气、一氧化碳等常见气体敏感,MP503 则对氨、氢等特殊气体有独特的 “嗅觉”。凭借这些传感器,团队开启了对自然界气味的大规模采集之旅。
在物质选择上,团队挑选了 50 种极具代表性的常见物质,将其巧妙划分成坚果、香料、草本、水果和蔬菜五大类别。从杏仁、腰果等坚果的醇厚香气,到孜然、辣椒等香料的浓郁风味,再到薄荷、迷迭香等草本植物的清新气息,以及苹果、橙子等水果和西兰花、胡萝卜等蔬菜的独特气味,都被纳入采集范围。
数据采集过程严谨且规范,每种物质都要在受控环境中历经 6 次独立的 10 分钟传感会话,每次会话还特意安排在不同日期。这就如同对每一种物质的气味进行多维度 “画像”,不放过任何环境差异下的细微变化。传感器以 1Hz 的频率持续记录 12 通道的气体数据,每一条数据都被仔细标记上物质身份、采集时间等关键元数据,如同为每个气味数据点贴上独一无二的 “身份标签”。每次会话结束后,团队还会精心清理受控环境的空气,确保下一次采集不受干扰,就像在一张干净的画布上重新描绘气味的轮廓。最终,通过这般不懈努力,团队积累了约 18 万个时间步长的传感器读数,总计超过 50 小时的数据,一座前所未有的大规模真实世界气味数据库 “大厦”——SmellNet 拔地而起。
训练嗅觉 AI “智慧大脑”
手握 SmellNet 这一强大的数据 “武器”,MIT 团队开始训练能像人类一样仅凭气味识别物质的 AI 模型,这就如同要赋予 AI 一个聪慧灵敏的 “大脑”。开发过程中,他们面临着重重挑战。气味特征复杂未知,难以依靠手工提取特征,所以团队毅然选择基于学习的架构,像是非时序的线性分类器、神经网络,以及能捕捉时间序列特征的 LSTM、Transformer 等模型都被纳入考量。
由于人工采集限制,嗅觉传感器数据量有限且分辨率不高,为此团队引入预训练和对比学习方法。他们将采集到的气体传感器数据与高分辨率的气相色谱 - 质谱联用(GC - MS)分子数据相结合,利用对比学习让同一物质在不同数据模态下的嵌入表示在潜空间中对齐。打个比方,就像是让不同语言描述同一事物的表达在语义空间中找到共通之处,从而让 AI 能借助更丰富的离线表征来理解气味。同时,为应对气味数据对温度、湿度、气流等外部环境因素的高敏感性,团队设计了鲁棒的预处理和归一化策略,让模型学会在嘈杂环境中提取关键气味信息。
在模型训练目标设定上,团队采用了多管齐下的策略。监督学习让模型在 50 种物质的多分类任务中不断磨炼,通过最小化交叉熵损失来提升分类准确性;鲁棒训练则模拟各种不理想状况,如给传感器通道加入合成噪声、随机丢弃时间步,迫使模型学习更具泛化性的信号模式,就像让运动员在复杂多变的环境中训练,提升应对各种比赛场景的能力;跨模态学习(传感器 + GC - MS)进一步挖掘不同数据模态间的关联,让模型从多个维度理解气味本质。
嗅觉 AI 初露锋芒与未来展望
经过一系列精心设计与训练,MIT 团队的嗅觉 AI 模型开始崭露头角。在预录数据测试中,表现最佳的模型准确率高达 65.35%。在充满挑战的 50 类在线分类任务里,针对坚果和香料的分类也分别取得了 10.71% 和 25.38% 的准确率。尽管这些成果距离人类嗅觉识别能力还有差距,但在复杂的现实条件下,已展现出巨大潜力。例如在食品过敏原检测领域,模型有望成为食品安全的 “忠诚卫士”,精准嗅出蛋糕中隐藏的面筋或花生等过敏原;在制造过程监控中,它能实时察觉产品气味异常,为生产质量保驾护航。
然而,团队也清楚认识到,构建强大的嗅觉 AI 仍面临诸多技术挑战。未来,他们将聚焦于更丰富的特征学习,让模型能挖掘出气味更深层次的特征;研发边缘嗅觉模型,使其能在更广泛的设备上高效运行;提升模型对环境变化的鲁棒性,无论高温高湿还是通风不畅的环境,都能稳定发挥识别能力。随着这些技术难题的攻克,嗅觉 AI 有望在医疗保健领域大显身手,通过嗅出人体散发的特殊气味,实现疾病的早期筛查与诊断;在娱乐、电商等行业,为用户带来前所未有的沉浸式体验,如根据用户喜好 “嗅出” 心仪的香水、美食推荐。SmellNet 的诞生只是嗅觉 AI 征程的起点,在 MIT 团队及全球科研人员的不懈努力下,嗅觉 AI 必将为我们开启一个全新的感知世界。