联系 投稿

廊新网-主流媒体,廊坊城市门户

斯坦福学者研究计算机看脸识同性恋:准确率最高91%

2017-09-09 18:00:07     来源:人民网

  斯坦福学者研究计算机看脸识同性恋:准确率最高为91%

  澎湃新闻记者 虞涵棋 王心馨

  斯坦福大学的迈克尔·科辛斯基(Michal Kosinski)和王轶伦发现,通过从3万多张人脸图像中提取出来的特征,计算机识别出同性恋男性的准确率最高可达到91%,同性恋女性则为83%。论文认为,与产前激素理论一致,同性恋男性的长相更“女性化”,下巴更窄,鼻子更长,额头更大,同性恋女性则相反。

  这篇题为《深度神经网络基于人脸图像判断性取向比人类更准确》的论文于9月7日发表在《人格与社会心理学杂志》(Journal of Personality and Social Psychology)上后,引发了媒体和社交网络的热议。

  英国《卫报》担心,这项技术会导致青少年“自测”,夫妻“互测”,而在对同性恋处以死刑的国家,这项技术更可能沦为杀人工具。

  不过,在作者看来,他们的研究是针对人脸识别技术和互联网隐私问题的警告,是对未来可能成真的技术滥用的演示。作者在文章中呼吁,政府和企业应制定相关法规,发展相关技术,降低同性恋群体的隐私风险。

异性恋(左)、同性恋(中)男女的复合面部图像,最右为异性恋(绿色)、同性恋(红色)男女的平均面部标记

  异性恋(左)、同性恋(中)男女的复合面部图像,最右为异性恋(绿色)、同性恋(红色)男女的平均面部标记

  论文的摘要写道:“我们发现人脸中包含的有关性取向的信息远比人脑能够感知到的多。我们用深度神经网络从35326张面部图像中提取特征。我们将这些特征输入逻辑回归算法,对性取向进行分类。给定单张面部图像,分类器能以81%的概率区别同性恋和异性恋男性,女性则为71%。人类的判断准确率则要低得多:男性61%,女性54%。给定同一个人的5张面部图像,算法的准确率可以相应提高到91%和83%。分类器利用的面部特征,有鼻子形状等固定特征,也有打扮风格等临时特征。同性恋男性和女性倾向于具备性别非典型的面部形态、表情和打扮风格,这与产前激素暴露影响性取向的理论相符合。而性别分类模型检测同性恋男性的准确率为 57%,同性恋女性的准确率为 58%。这些发现提高了我们对性取向起源以及人类认知缺陷的理解。此外,公司与政府越来越多地使用计算机视觉算法探测人的内在特征,我们的研究揭示出同性恋的隐私与安全正在面临威胁。”

  算法准确率:男性91%,女性83%

  研究者从美国交友网站上获取了公开资料,包括36630名男性的130741张照片和38593名女性的170360张照片,年龄在18岁到40岁之间。他们的性取向则是通过意向伴侣性别获悉的。

  随后,研究者将这些照片中的人脸用Face++软件进行了处理,剔除了一些照片。接着,他们人工筛选这些照片是否是成年白人,性别与网络资料是否相符。最后,他们随即剔除了一些照片,以平衡异性恋和同性恋的人数,留下的样本包含同性恋和异性恋男性各3947名,同性恋和异性恋女性各3441名。

对美国交友网站上获取的公开照片进行处理

对美国交友网站上获取的公开照片进行处理

  研究者使用一个名为VGG-Face的深度神经网络提取图像的特征,并以此训练逻辑回归模型。实验结果显示,给定单张面部图像,分类器能以81%的概率区别同性恋和异性恋男性,女性则为71%。给定同一个人的5张面部图像,算法的准确率可以相应提高到91%和83%。

给定个体男性(蓝色)、女性(红色)1至5张照片,算法的准确率提高

给定个体男性(蓝色)、女性(红色)1至5张照片,算法的准确率提高

  符合产前激素理论:同性恋男性更“女性化”?

  在引言部分,作者说明,他们选择研究性取向的一个重要原因是“广为接受的性取向的产前激素理论(PHT),预测了外表与性取向的关系”。

  论文写道,根据产前激素理论,男性胚胎过少地暴露在雄性激素中,或女性胚胎过多地暴露在雄性激素中,都可能造成性取向异化。然而,雄性激素同样与两性面部分化有关,产前激素理论预测同性恋人群倾向于具备性别上不典型的面部形态。即,同性恋男性面部应该更女性化,同性恋女性面部应该更男性化。

  研究者通过分类器识别的位点集合成了计算机认为“最像同性恋”和“最不像同性恋”的人脸。论文认为,计算机识别结果与产前激素理论相符合,同性恋长相在性别上更不典型。平均来讲,同性恋男性的下巴更窄,鼻子更长,额头更大;同性恋女性则相反。

颜色越红的区域,在算法中越重要

颜色越红的区域,在算法中越重要

  为了进一步检验“同性恋长相更不具备性别典型性”这一假设,研究者还通过一个准确率98%的性别分类器试图区别同性恋和异性恋,发现在男性身上的准确率为 57%,在女性身上的准确率为 58%。论文写到:“数据显示,男性面部的女性化程度与同性恋概率呈正相关,女性则相反。”

  研究的几点局限性

  不过,在论文的讨论部分,作者强调研究结论不应被读者误读。首先,同性恋长相更不具备性别典型性,不代表所有的同性恋男性长相都女性化,也不代表所有同性恋女性长相都不女性化。

  其次,不应误读91%这个实验中的数值。在美国的同性恋比例大约为6%到7%的情况下,分类器需要大幅牺牲准确率,才能覆盖大量的样本。

  论文也自我指出了研究的几点限制:样本限于白人、没有排除双性恋,以及无法排除长相“更同性恋”的人更容易“出柜”这一点。

  作者也抛出了其他几个有趣的问题,比如同性恋男性更少留胡子,主要是生理原因(毛发稀少)还是品味原因?分类器识别男性比女性更准确,是否意味着女性的性取向更具流动性?

  看脸识罪犯、识贫富、识同性恋:科学相面术?