Cell：如何识别千姿百态的面孔？

发表时间：2017-07-20 14:40

面部识别是通过一种非常简单的神经编码进行编码的，这种神经编码依赖于神经元在人脸空间中识别面部特征的能力，这一观点于2017年6月1日在线发表于国际著名学术杂志《Cell》杂志，该研究成果来自美国加州理工学院生物工程Doris Y. Tsao教授的一篇研究论文，其否定了一个长期存在的假设，即单个面部细胞对单个面孔进行编码。研究报道科学家已经了解灵长类动物大脑中的人脸识别编码系统。该研究组构建一个明确的面部选择细胞模型，并记录了由50个维度参数化现实面孔的脸部中侧和前内侧的细胞的反应。Tsao教授表示：我们数据揭示了一种非常简单的面部识别代码，它可以用于精确地解码人真实面部图像，并准确地预测神经环的比率。

记录程序和刺激生成

该团队通过展示人脸定位器的刺激装置，利用f核磁共振成像在两个猴子身上做了六个面斑，记录单个cell，同时呈现16张真实的脸和80个无脸的对象。使用“活动的外观模型”来生成参数化的脸部刺激。

该课题组提取了一组200个形状描述符和200个外观描述符，分别对形状和外观描述符进行了主成分分析(PCA)，以提取出数据库中最大可变性的特征维度. 保留first 25 PCs的外形和first 25 PCs的外观，产生了一个50维(50-d)面空间，每个点都代表一张脸。

为了给记录产生刺激，面部刺激呈现150 ms交错，并且2000个相同的刺激三到五倍的呈现给每个细胞单元。共记录了205个细胞（2只猴子）。

面部补丁ML / MF和AM携带互补的面部特征信

为了量化神经调优脸部50个维度空间，每个神经元的反应是用来计算 “spike-triggered”(STA)刺激。

比较了每个神经元的形状或外形的灵敏度：“形状偏好指数”计算是基于STA的形状和外观尺寸的向量长度。大多数ML / MF细胞表现出更强的调优形状尺寸，而AM细胞则表现出相反的趋势。

线性回归解码面部特征

展示同一组2000个刺激的猴子并用leave-one-out方法来训练和测试该模型。通过线性回归法确定了反应特征值的转换。如果大脑使用类似的解码方法，还需要同时使用神经元。利用特征值的百分比变化解释量化解码质量的线性模型。外观特性的解码质量优于AM神经元形状特征，而ML / MF神经元则正好相反。通过结合预测特性值所在的50个维度，可以重建猴子的脸。

为了量化整体解码模型的准确性，该团队随机选择大量面部刺激组，并比较其50-d特征向量以重建某脸部的特征向量集，准确地解码真实面孔信息。由此可见，该团队已经完成一个基本测试——全面了解面孔在大脑中的编码。

Freiwald 和Tsao表示，人脸补丁AM的一个显著特点是视图不变性：AM神经元对独立于头部取向的个体身份的图像有选择性的反应。科研人员记录了来自于46个AM细胞对侧面空间刺激的反应。并使用线性回归解码侧面和正面面孔的特征值。结果表明，尽管只用了46个细胞，却可以预测脸部。一个简单的模型可以通过不同的视角来观察AM细胞对面部图像的反应。

该团队揭示了灵长类动物大脑中真实的面部特征的编码。研究表明只需要200个补丁ml/mf和AM细胞解码人类面部特征或可成功。此外，还揭示了隐藏在面部识别的有效代码背后的机制：将面向量的线性投影映射到一个特殊的轴上——“STA’’ axis”。即使是之前被认为反应非常少的细胞也会有这种特性。利用轴的编码，可以预测面部细胞的环率来响应任意靠近noise ceiling的脸。

赫贝点评：

当人们看人面照片时，大脑会立刻识别出照片上的人是谁，或你之前是否见过。神经学家一直试图弄清大脑是如何识别和感知人脸的，Doris Tsao团队为大家解开了谜底，即神经编码可以识别面部特征。这无疑是一项突破性的科研成果。未来的工作需要通过大脑皮层阐明度规坐标系统来测量一般对象，以及发生于大脑皮层明确对象的识别机制。该成果不仅对神经编码研究意义重大，还可能应用于人工智能领域。

分享到：

杭州赫贝科技有限公司

HANGZHOU HIBIO TECHNOLOGY CO.,LTD.

联系我们 CONTACT US

陈经理

杭州赫贝科技有限公司

电话：18858109033 传真：0571-28313071

邮箱：jihua@hi-bio.cn 地址：杭州市余杭区智溢路136号2幢3-4层

临安新场地：浙江省杭州市临安区锦南街道九州街88号天目医药港C座1-2层