Cell:如何识别千姿百态的面孔?

49
发表时间:2017-07-20 14:40

面部识别是通过一种非常简单的神经编码进行编码的,这种神经编码依赖于神经元在人脸空间中识别面部特征的能力,这一观点于201761日在线发表于国际著名学术杂志《Cell》杂志,该研究成果来自美国加州理工学院生物工程Doris Y. Tsao教授的一篇研究论文,其否定了一个长期存在的假设,即单个面部细胞对单个面孔进行编码。研究报道科学家已经了解灵长类动物大脑中的人脸识别编码系统。该研究组构建一个明确的面部选择细胞模型,并记录了由50个维度参数化现实面孔的脸部中侧和前内侧的细胞的反应。Tsao教授表示:我们数据揭示了一种非常简单的面部识别代码,它可以用于精确地解码人真实面部图像,并准确地预测神经环的比率。

blob.png

记录程序和刺激生成

该团队通过展示人脸定位器的刺激装置,利用f核磁共振成像在两个猴子身上做了六个面斑,记录单个cell,同时呈现16张真实的脸和80个无脸的对象。使用活动的外观模型来生成参数化的脸部刺激。

blob.png

该课题组提取了一组200个形状描述符和200个外观描述符,分别对形状和外观描述符进行了主成分分析(PCA),以提取出数据库中最大可变性的特征维度. 保留first 25 PCs的外形和first 25 PCs的外观,产生了一个50(50-d)面空间,每个点都代表一张脸。

blob.png

为了给记录产生刺激,面部刺激呈现150 ms交错,并且2000个相同的刺激三到五倍的呈现给每个细胞单元。共记录了205个细胞(2只猴子)

blob.png

面部补丁ML / MFAM携带互补的面部特征信

为了量化神经调优脸部50个维度空间,每个神经元的反应是用来计算 “spike-triggered”(STA)刺激。

blob.png

比较了每个神经元的形状或外形的灵敏度:形状偏好指数计算是基于STA的形状和外观尺寸的向量长度。大多数ML / MF细胞表现出更强的调优形状尺寸,而AM细胞则表现出相反的趋势。

blob.png

线性回归解码面部特征

展示同一组2000个刺激的猴子并用leave-one-out方法来训练和测试该模型。通过线性回归法确定了反应特征值的转换。如果大脑使用类似的解码方法,还需要同时使用神经元。利用特征值的百分比变化解释量化解码质量的线性模型。外观特性的解码质量优于AM神经元形状特征,而ML / MF神经元则正好相反。通过结合预测特性值所在的50个维度,可以重建猴子的脸。

blob.png

为了量化整体解码模型的准确性,该团队随机选择大量面部刺激组,并比较其50-d特征向量以重建某脸部的特征向量集,准确地解码真实面孔信息。由此可见,该团队已经完成一个基本测试——全面了解面孔在大脑中的编码。

blob.png

Freiwald Tsao表示,人脸补丁AM的一个显著特点是视图不变性:AM神经元对独立于头部取向的个体身份的图像有选择性的反应。科研人员记录了来自于46AM细胞对侧面空间刺激的反应。并使用线性回归解码侧面和正面面孔的特征值。结果表明,尽管只用了46个细胞,却可以预测脸部。一个简单的模型可以通过不同的视角来观察AM细胞对面部图像的反应。

blob.png

该团队揭示了灵长类动物大脑中真实的面部特征的编码。研究表明只需要200个补丁ml/mfAM细胞解码人类面部特征或可成功。此外,还揭示了隐藏在面部识别的有效代码背后的机制:将面向量的线性投影映射到一个特殊的轴上——“STA’’ axis”。即使是之前被认为反应非常少的细胞也会有这种特性。利用轴的编码,可以预测面部细胞的环率来响应任意靠近noise ceiling的脸。

blob.png

赫贝点评:

当人们看人面照片时,大脑会立刻识别出照片上的人是谁,或你之前是否见过。神经学家一直试图弄清大脑是如何识别和感知人脸的,Doris Tsao团队为大家解开了谜底,即神经编码可以识别面部特征。这无疑是一项突破性的科研成果。未来的工作需要通过大脑皮层阐明度规坐标系统来测量一般对象,以及发生于大脑皮层明确对象的识别机制。该成果不仅对神经编码研究意义重大,还可能应用于人工智能领域。


分享到:
杭州赫贝科技有限公司
HANGZHOU HIBIO TECHNOLOGY CO.,LTD.

联系我们 CONTACT US
陈经理
杭州赫贝科技有限公司
电话:18858109033 传真:0571-28313071
邮箱:jihua@hi-bio.cn 地址:杭州市余杭区智溢路136号2幢3-4层
临安新场地:浙江省杭州市临安区锦南街道九州街88号天目医药港C座1-2层