从工业革命、电气革命、数字革命到智能时代,我们已经步入了人类赋予机器智慧的新时代。过去一年,全面屏、人脸解锁和屏下指纹已然成为手机圈中最热的三大技术,然而当差异化越来越小之时,又驱动着新的创新技术诞生,而AI正成为各大手机厂商新的竞争点,人工智能一跃而起成为手机圈中的“香饽饽”。
纵观当下,人工智能被广泛应用于机器人、语音识别、图像识别等领域,移动互联网时代信息传播效率的飞速提升让人们真正看到了 AI 技术改变人类未来生活方式的可能性。
在人工智能大赛道中,人脸识别是其中发展较为成熟的应用领域。同时,人脸识别是符合国家政策趋势、惠及民生的领域,国家863计划、国家科技支撑计划、自然科学基金都会拔出了专款资助人脸识别的相关研究。在国家政策的支持和完善下,人脸识别技术将会被推向更广阔的日常领域。
如今,“刷脸”已经成了人们生活中的日常事务,从移动支付、解锁手机到学校、公司、小区门禁等,都运用到了人脸识别技术。人脸识别技术产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。
人脸识别在手机端行业中,掀起了人脸识别解锁技术热潮,各大手机厂商也蜂拥挤入,其中最有影响力的便是iPhone X的Face ID。面对日益激烈的行业竞争,如何在强敌林立之下找到自身的立足之地,创新、突破技术显得尤为重要,在这一点上,旷视科技Face++凭借其核心的人脸识别技术 ,成为行业中的“佼佼者”。
峰会现场
日前,由手机报在线(http://www.shoujibao.cn/)举办的AI手机产业峰会在深圳圆满落幕。据了解,旷视科技Face++副总裁敖翔莅临本次峰会,并以“手机人脸识别的新进展”为主题,深入讲述了公司的跨模态人脸识别和人像光效两大技术。
跨模态人脸识别技术
跨模态人脸识别技术在生活中已得到真实应用,在最近的 vivo X21的发布会上,vivo X21为提升人脸解锁的性能和场景宽度选择,再度与旷视科技Face++合作,并在原有的人脸识别解锁方案上增加了景深技术和近红外技术,实现了2PD全像素双核单摄红外人脸解锁。
vivo X21在摄像头方面,其前置摄像头类似红外发射器,可做到全天候刷脸,晚上一点光线都没有的情况下也可以刷脸。此外,在红外方面,传统的红外方案是一个红外发射器、一个红外接收器,还有一个主摄像头。据敖翔介绍,旷视为vivo提供了一个更大胆、更厉害的方案,即一个发射器和一个主摄像头,主摄像头可以感受红外,基本上是全通的摄像头。敖翔表示,相比传统的红外方案,这项方案具有三个明显优势:
1、方案易用,只有一个发射器和一个主摄像头,模组结构简单、利于集成。
2、用户体验非常好,不受光线影响,任何光线环境下都可以解锁,良好的用户体验也将使vivo X21具有更大的市场优势。
3、硬件成本优势,体现在传感器较少,本身有前置摄像头。但这一点既是优势,然而也存在很大的风险。
而事实上,这个方案的实现非常困难,如何将红外的人脸识别和RGB人脸识别相融合,并且做到无缝转换和融合,这是难点所在。
旷视科技 副总裁 敖翔(现场图)
风险点在于IR数据存量少。对Face++来说,RGB识别不是问题,其RGB的图像数据很多,里面有几千万张脸,就算是现场采集人脸也可以采集到几万、几十万张。但就IR识别而言,对整个行业来说存量的IR数据很少,且IR每个镜头不一样,所以用特定模组采,采的IR数据就很少。在IR数据特别少的情形下,同时做RGB识别,又做IR识别,这是一个挑战,尤其对做人脸识别这种非常精密的识别来说是非常大的挑战。
Face++成功地将跨模态人脸识别技术运用到vivo X21上,这是在手机产业界上非常完美的一次运用,旷视科技采用神经网络里面一种流行的办法——Domain Transfer Learning域迁移学习,从而解决了该项技术上的难题,可以说是学术界的重大技术突破。
如何实现跨模态人脸识别技术
对于如何实现跨模态人脸识别技术,敖翔做出了深入阐述:“首先需要做的是RGB训练。根据现有的模型和高精度人脸识别网络结构,从中获取参数;接下来,将网络直接平移过去做新的网络,所有的参数保留,这相当于给RGB信号做预训练,从而得到大量数值化参数,再用少量红外数据去微调网络,经过巧妙的网络设计和训练技巧,进而得到高精度红外和红外相对比的算法。”
据了解,旷视在手机解锁上应用的算法有两种,一个是RGB识别算法,一个是红外的识别算法。最重要的是做两个融合,由于摄像头在白天识别的时候,光线很好,但是晚上光线比较弱,IR和RGB信号比重是平滑改变的,这就决定了二者必须揉在一起做。上述两个步骤完成之后,通过将RGB和IR的数据进行混合训练,对RGB和IR的信息进行融合。所有步骤的完成就叫跨模态识别。
跨模态人脸识别技不但可以忽略环境的影响,达成全天候的人脸识别,其抗攻击性能也比传统红外方案更好,在RGB识别算法和红外识别算法相结合的基础上,最后结合旷视自研的ShuffleNet 模型,进一步优化了神经网络结构。据敖翔透露,在今年的论文中将会就跨模态人脸识别技术作出更全面、系统的阐释。
人像光效技术
在去年的iPhone 发布会上,苹果推出了一个新的摄像功能——人像光效。
简单来说,人像光效技术就是通过一系列软硬件配合的技术,让我们能够在拍摄人像或者后期编辑时利用算法,为照片添加上逼真的光影效果,比如自然光、摄影室灯光、轮廓光等。用苹果的广告语是这么说的:人像光效,随身携带的灯光师。
据了解,iPhone X的人像光效技术主要是用于它自己高端的iPhone上,用在iPhoneX或者双摄镜头上。
旷视Face++让安卓机实现人像光效技术
任何一项技术的实现都不会是一蹴而就的,人像光效技术也是如此。旷视为客户定制的光效技术由人脸关键点检测、面部三维光效渲染、T 区高光提亮、背景保护等20 多项技术组合而成,“因为人脸有太多的信息需要去识别,识别越多的信息就约有利于人的面部美化”。敖翔同样也道出人像光效技术研发关键所在:“人像光效的关键在于三维面部重建。”
据了解,旷视在人像光效技术的运用上,不强求一定采用3D Camera。对此,敖翔作出了解释:“因为人的面部有很强的鲜艳知识被识别的人脸可以在电脑里重构出来,并且可以做到一模一样。虽然3D Camera可以做到更加准确,但人的知识自主性决定了整个3D重建并不一定完全依赖3D Camera。旷视的人像光效技术可以对二维的图像做出3D重建,且重建并不需要花太多时间,在人脸的程度上,利用结构光捕捉、神经网络的深度威力去猜人脸部的凹凸系统,进而生成深度图。”
对比之下,苹果的人像光效技术主要是双摄镜头,因此其对双摄硬件有更强的依赖,而旷视的人像光效技术更具有广泛性,对摄像头依赖程度较低能够支持不同平台和机型,并可同时满足前置或后置的单摄/双摄应用需求,更加适合多元化的市场需求。
通过旷视科技副总裁敖翔的解说,加深了我们对跨模态人脸识别技术和人像光效的了解,这两项技术也是人工智能领域的历史性突破,旷视科技用AI为行业增加了新的动力,也赋予了行业未来更多可能。而对于旷视科技Face++来说,做到这些只是基础,在未来,他们将会做得更好、更细致,会有更好的成绩,我们拭目以待!