似乎果蝇与计算机没有任何共同之处,但Salk研究所的新研究表明,两者以类似的方式识别新颖的信息。这项工作于2018年12月3日出现在美国国家科学院院刊(PNAS)上,不仅揭示了一个重要的神经生物学问题 - 生物体如何检测新的气味 - 而且还可以改进计算机科学中新奇检测的算法。
“当一只苍蝇闻到异味时,苍蝇需要迅速弄清楚它之前是否闻到过气味,以确定气味是否是新的以及它应该注意的东西,”Salk整合生物学助理教授Saket Navlakha说。实验室。 “在计算机科学中,这是一项称为新奇检测的重要任务。了解新颖性检测策略在两个领域的比较,可以为我们提供有关脑算法和计算的宝贵见解。”研究人员建议,他们的新框架可用于检测大型流媒体数据集(例如患者数据库或新闻报道)中的重复或异常。
2017年,Navlakha发现了大脑如何识别类似的气味。他发现将fly算法应用于计算机“相似性搜索”(例如那些建议购买的产品与您过去的购买类似)可以改善搜索结果。
新的PNAS研究基于另一篇论文[Hattori等人],该论文于2017年在Cell杂志上发表,描述了苍蝇如何发现全新的气味。当Navlakha阅读这项研究时,他对苍蝇似乎是如何使用一种类似于计算工具进行新奇检测的策略(称为Bloom过滤器)感到震惊。
当谷歌这样的搜索引擎抓取网络时,它需要知道它所遇到的网站之前是否被编入索引,这样就不会浪费时间再次索引同一网站。问题是Web上有数万亿个网站,并且将所有这些网站存储在内存中的计算成本很高。在20世纪70年代,麻省理工学院的Howard Bloom设计了一种数据结构,可以紧凑地存储大型项目数据库。 Bloom过滤器不是将每个项目全部存储在数据库中,而是使用每个项目仅使用几个空格来存储每个项目的小“指纹”。通过检查相同的指纹在数据库中是否出现两次,系统可以快速确定该项是重复的还是新的。
众所周知,果蝇会根据新的气味改变它们的行为。飞脑中的一个区域,称为蘑菇体,包含一系列处理嗅觉信息的神经元。当遇到新的气味时,这些神经元会发出“新奇警报”信号,因此苍蝇知道这种气味是新的,值得研究。然而,如果气味没有强烈的冲击力,则下次出现气味时,警报信号的强度会降低,并且苍蝇不会浪费时间调查气味。这是一个重要的计算,因为苍蝇只有在值得的时候才会注意某些东西。苍蝇的蘑菇体新奇信号是使用类似于Bloom过滤器的“数据指纹”的气味指纹生成的。
“机器学习的一个根本挑战是找到适合各种任务的数据表示,”加州大学圣地亚哥分校计算机科学与工程教授,新论文的第一作者Sanjoy Dasgupta说。 “苍蝇的嗅觉系统向我们展示了一种简单而巧妙的方法。”
通过分析 - 从计算机科学的角度 - 在细胞论文中确定的产生这种新颖信号的神经回路,Navlakha和Dasgupta发现果蝇为传统的布鲁姆过滤器引入了几个新的扭曲,他们的团队详细阐述了以数学方式定义。
第一个转折不仅仅涉及确定你之前是否闻到了完全相同的气味,而是你是否闻到了气味,或者与它非常相似的气味。这在大脑中很重要,因为你可能永远不会闻到两次完全相同的气味。第二个转折涉及确定你多久以前闻到的气味。如果已经很长时间了,那么气味的新颖性应该高于你最近闻到的气味。
基于果蝇的Bloom过滤器变体,该团队创建了一个新的算法框架来预测果蝇的新奇反应。他们在收集的研究数据上测试了他们的框架,因为苍蝇连续呈现出成对的气味。该团队的新颖性预测结果与蘑菇体神经元的实际新奇反应非常接近,这证实了它们的框架的准确性。 Navlakha的团队随后在几个机器学习数据集上测试了该框架,发现与其他类型的新奇检测过滤器相比,fly的Bloom过滤器提高了新颖性检测的准确性。
Navlakha补充道,“这项工作对我们来说特别令人兴奋的是,它代表了大脑中发现的第一个数据结构之一,以及大脑如何实际执行新奇检测的简单算法。”