毫无疑问,人脸识别已经成为手机厂商日益重视的功能模块。
不论是vivo今年发布的旗舰机X21,还是OPPO的主打款 Find X,更不用提 iPhone X 在2017年问世时基于3D视觉感知的 Face ID ,与人脸识别相关的应用模块已明显成为趋势。
从具体的应用来说,诸如屏幕解锁、人脸支付、人像捕捉、美颜修图等功能背后,均由 3D 的视觉方案来支撑。
什么是 3D 的视觉方案?
如钛媒体作者 Kiwi_s在介绍 OPPO的3D 视觉方案中谈到的:如果我们把手机比喻为眼睛,那么在传统识别技术中,手机这双“眼睛”看到的都是一个平面的世界,而3D视觉技术,则让手机从平面视觉升级为立体视觉,从而对人脸识别的速度、精度实现质的提升。
目前行业中三种主流的3D视觉方案为:双目立体视觉方案、3D结构光方案、TOF方案。
在三种不同的3D视觉方案中,它们各自都有鲜明的优缺点和不同的使用场景。其中,双目方案属于被动采集,而3D结构光和TOF技术则为主动采集方案,满足了3D视觉上拍摄距离不同的应用场景细分。
被称为国内“视觉识别 AI 四小龙”之一的旷视科技,就是为这些手机厂商提供人脸识别方案的幕后关键角色。
今年6月,旷视率先为OPPO、vivo提供基于安卓系统的3D视觉感知技术支持,并于近期发布业内首个“软硬一体”的移动端3D感知全栈解决方案。
根据旷视的官方披露,所谓全栈方案,就是从算法创新、应用开发、设备制造到解决方案,形成完整的产业闭环,具体来说,在旷视发布的软硬一体移动端智能3D产品解决方案中,最上面一层是3D应用层,往下依次至AI算法、解决方案,最后到摄像、传感等硬件设备制造上。
“手机3D视觉领域虽然已有多种类型的应用案例出来,但该领域包含算法和模组的软硬一体整体解决方案仍是缺位的,旷视科技正在尝试一种从上往下的整合方案。”旷视科技云事业部高级副总裁吴文昊介绍称。
把一个全新的生态通过整合形成更具效率的角色分配,这件事并不容易,不过,旷视之所以成为这条产业链的“攒局者”,当中的深层原因一方面来自手机 AI 落地本身的难度;另一方面是来自行业客户的需求。
从行业总体来说,在手机人脸识别背后的视觉感知技术方案,目前仍属于起步阶段。
苹果就曾在人脸识别方案的落地遭遇过巨大挑战,苹果原本计划在2016年便推出Face ID技术,并在当时已量产了4万台 iPhone X 用以验证方案。但鲜为人知的是,由于苹果并不是一家做算法的公司,相关的底层技术、算法并不完善,出于对用户体验的考量,苹果不得不推迟一年用以测试,到2017年才发布搭载Face ID的新一代iPhone。
产业链角色的分散,是手机端 AI 方案落地面临的第一个难点。吴文昊谈到了旷视与手机客户讨论项目的场景:开会时有十多家厂商参与,他们既来自世界各地,又分属产业内传感器、模组、光电等不同环节,每一家都如同一个孤立的零部件,整个产业无法得到串联。
“大家相互分散,很多做硬件的不懂软件,做软件的对硬件把控也不足,而最后的落地又需要应用去驱动。”吴文昊对钛媒体说,他以刷脸支付举例,当中识别人脸的精度、支付安全标准、对活体工攻击的能力防范,这些问题都需要应用场景来反推验证,并由产业链上的各个角色配合完成。
按照人脸识别在手机落地需要的 AI 方案,旷视也联合多家合作伙伴,搭建了软硬一体的移动端产品矩阵,具体为:
- 3D 应用:旷视研发的3D人脸识别解锁和3D人像光效应用已经实现了规模化,同时在安全支付、3D 美颜、3D 整形等领域均有所涉猎,根据旷视透露,下一步将投入到AR游戏、虚拟试穿等应用。
- 3D 算法:在AI+3D的底层算法研发方面,旷视专注于识别和重建两个大类。识别即机器感知、理解世界的能力;重建即把识别出的物体进行三维重建,是开发针对人、针对物的3D视觉应用核心所在,旷视目前已与Bellus 3D、Altizure等3D视觉企业开展了联合研发合作。
- 解决方案:旷视根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,整合结构光、TOF、双目等不同的摄像、传感系统架构,设计出基于双摄、三摄、深摄的解决方案。
- 硬件模组:移动端3D产业链最下面一层是硬件制造,包含摄像头、传感器、芯片等硬件模组的研发。结构光、TOF和双目方案涉及到高清摄像头、IR投射器、IR接收器、激光发光器等设备的搭配组合,旷视目前已经与艾迈斯半导体等3D硬件模组厂商展开合作。
可以看出,旷视在全栈方案的四层中主要涉及3D 应用层与算法,而在旷视不太擅长的硬件及解决方案中,则采取了与三维技术集成商珠科创新、光场应用服务商叠镜数字、传感器服务商艾迈斯半导体等合作伙伴共同开发的方式;此外,旷视还宣布将联合主要芯片厂商合作研发算法适配性更强的芯片,进一步优化手机3D应用能力。
随着手机厂商对 3D 视觉识别技术的青睐,旷视在产业链上明显的抱团动作,实则也是用“生态”形成壁垒的一种方式。而在AI 服务手机场景的战场上,旷视的另一位竞争对手商汤科技也同样动作频频。
今年5月,商汤实现了从2D人脸识别向3D结构光人脸识别的升级,这一技术已搭载于最新发布的小米8透明探索版,商汤科技联合创始人、研究院院长王晓刚在接受界面新闻采访时,也谈到了对生态链的看法。
“苹果、三星这样的厂商是软硬一体,可以提供整体的方案;国内的手机公司和技术提供方是分开的,这就需要两边更好地结合,才能和外国厂商抗衡。”
而在具体的合作方面,商汤科技的做法是,在头部厂商落地方案之后,再把相关的技术标准化,形成类似SDK的整合,然后提供给更加长尾的客户。之后,商汤科技还会逐渐形成一个平台,来提供更加综合性的服务。
这样来看,商汤主打技术产品化形成的“平台”,旷视则专注于搭建“生态”后成为软硬一体的服务商。对于如何构建自己的门槛,旷视科技云事业部高级副总裁吴文昊表示:“没有哪一种策略是不能通过时间与金钱完成的。但重要的是,首先愿不愿意做改变,这是一个定位的问题;其次才是改变的决心和能力。”(本文首发钛媒体,作者/苏建勋)
根据《网络安全法》实名制要求,请绑定手机号后发表评论