一项最新研究表明,专业人员在人脸识别上的表现仍优于机器,但将两者结合起来可以取得近乎完美的结果。
受过专业培训的法医鉴定人员对人脸识别的结果可用于呈堂证供,该研究首次对这些专业人士与最新人脸识别技术的识别准确度进行了评估与对比,新南威尔士大学的David White说道,他是本研究课题的负责人之一。
“以前进行的研究主要集中于普通人在人脸识别方面的准确度,”White博士指出。 “我们首次将专业人员的表现作为基准来衡量最先进的深度学习算法的表现。”
该研究的成果已经发表于《美国国家科学院院刊》。White博士说,他希望他们的发现能够帮助相关机构在人脸识别方面做出更优的决策判断。
例如,澳大利亚政府正计划建立一个全国性的人脸识别数据库,该数据库可以将驾照上的图像与来自闭路电视等系统的图像相匹配。
“人脸识别的准确度在很大程度上决定了我们能否生活在一个安全公正的社会中,” White博士说。
“我认为,最先进的算法与最专业的人类相结合有可能使社会更公正,更安全。”
在具有挑战性的场景中测试人脸识别的准确度
法医鉴定人员通常接受了专业的培训,能够对脸部进行详细评估——例如,通过仔细研究泪腺形态特征等细微之处——以便在法庭上提供证据。
为了评估人类能力的极限,研究人员在取得当事人同意后,使用他们的图像设计了20个富有挑战性的场景。
在研究过程中,他们测试了三组人群:来自世界各地的50名专业法医鉴定人员;30名接受过培训,能将闭路电视中的图像与大头照进行比较的法医审查人员;还有13名未接受过相关培训,但具有出色的人脸识别能力的“超级识别人员”。
法医专家可以使用他们在工作中使用过的任何方法,在三个月时间内完成任务。令人欣慰的是,三个组所有人员的表现都大大胜过没有任何脸部识别经验的普通人,如学生或指纹鉴定人员。
“我们当然希望情况会如此,但确认这一点还是很有必要的,”White博士说道。“在一些需要确定涉案人员出现的管辖区域的案件中,脸部识别方面的判断往往是生死攸关的。”
在相同情景下,研究人员还对2015年到2017年间开发的四种深度学习算法进行了测试,这些算法可根据细节识别出数百万张面孔。
尽管早期开发的算法表现平平,并不比没有接受过训练的普通人好多少,但2017年开发的两种算法,其表现达到了法医鉴定人员组的平均水平。“可以说,深度学习算法现在几乎能与最专业的人类媲美,”White博士说。
但若在真实环境中识别人脸,他们的表现如何呢?
未参与该研究的一位英国人脸识别专家Anna Bobak指出,该研究结果表明,将受过专业训练的法医鉴定人员的技巧与算法相结合可以最大化地优化脸部图像识别结果。
“研究数据表明,结合最新算法和超级识别人员或法医鉴定人员可以获得接近完美的识别结果,”这位来自斯特林大学的Bobak博士说。
研究中使用的图像是在经当事人员许可后,正对着当事人脸部拍摄的。
Bobak博士指出,能够识别证件上高质量图像的技术有很多,但在真实环境下进行人脸识别仍是个不小的挑战。
她说:“在复杂的环境中进行实时人脸识别更具挑战性,因为人们在不断移动,图像可能并非在最佳角度或位置拍摄的,质量会低得多。”
“观测不同组别的人群和算法在这种真实情况下的表现会相当有趣。” White博士也同意这个观点。“当遇到这些或其他具有挑战性的情况时,我认为,要想避免经常出现错误判断,达到较高的准确度,人类和算法都还有很长的路要走。”他说。
最终决策判断权在于人类
然而,昆士兰大学的生物统计学专家Brian Lovell认为,算法的表现优于大多数人类。
“很多大型数据库上运行的人脸识别系统其识别准确率高达99%,尤其是在检查护照时,而人类通常难以达到这么高的准确度,”Lovell教授说。
然而,算法只能缩小可选择的范围。 我们仍要靠人类来做出最终判断。
虽然在该研究中一些法医鉴定人员的表现远远优于算法,但其他人的表现并不比未受过训练的一组更好。
“测试中出现的差异表明,人们在识别准确度和表现上的差异来自于审核证据的一类人,”White博士说。“同目前一样,这些人脸识别系统的准确性最终需交由人类确定,因此人们应该认真思考让什么样的人来承担这样重要的任务。”
研究结果表明,先天能力和后天培训都有助于提高判断的准确度,并且,这种先天能力可以通过对人们进行预先筛选来确定。
“筛选过程和培训都必须经过慎重考虑,以确保那些非常有价值的技术不会出现重大错误判断。”White博士及其同事之前所做的一个研究表明,在澳大利亚护照办公室工作的人员在人脸识别方面并不比普通学生更出色。
不过,他表示,自该研究之后护照办公室采取了一些措施,如招聘时使用标准化考试,对工作人员进行培训和以小组为单位工作等,工作人员的表现有了明显改善。
根据《网络安全法》实名制要求,请绑定手机号后发表评论