行业资讯-手机报

因为手机商开始「刷脸」,人脸识别公司迎来了春天

孙然 2017-11-18 09:26
刷脸解锁技术 人脸识别公司 阅读(4614)
导语今年,包括Face++在内计算机视觉公司都迎来了一个商业路径上的转折点——Iphone X使用Face ID,手机刷脸解锁的商用化直接促使印奇决定折回手机行业。或许对于手机厂商,刷脸解锁只是新增了一项功能,但对于人脸识别公司的商业化却是开闸式的好消息。
因为手机商开始「刷脸」,人脸识别公司迎来了春天
 
   苹果大概没想到,IPhone X让一群计算机视觉公司兴奋了一把。
 
  「新商业NEO100」是36氪品牌全面向新商业升级而制作的一个特别栏目。
 
  旨在传播那些推动中国商业向前的创新公司、人物和观点。我们认为,以移动互联网、人工智能为代表的“科技”,和以风险投资为代表的“资本”共同推动了中国商业的发展,新商业已成为中国商业的新主流形态,并必将在未来扮演更加重要的角色。
 
  文 | 孙然
 
  Face++最近一次被大规模报道,是因为10月底拿到4.6亿美金的C轮融资,刷新了同是计算机视觉公司的商汤科技在7月份创下的世界级AI融资记录。根据一位公司高管不久前透露的数据,这家成立6年的AI公司目前的估值已经超过20亿美金。
 
  无论创始人印奇,还是Face++本身都还年轻,不过在AI这趟创业潮里,它已经淌过了一连串的坑,诸如怎么选合适的场景,放下消费级先做企业级市场、一群技术出身的Phd怎么能有点工程师思维等等……
 
  2011年成立后,像很多创业者一样,Face++一头扎进最热闹的消费级市场。那时候公司做了很多场景上的尝试,做游戏、做APP,不过起色并不大,因为市场、特别是普通消费者对这种非常前沿的技术还缺乏感知,没有释放出需求。
 
  两年试水后印奇想明白了一件事:做AI创业技术、产品和数据缺一不可,这意味着此前专注做软件的Face++必须自己做硬件。为此他专门跑到哥伦比亚大学读了个智能传感器方向的学位。2015年他回到公司时,Face++选定的路已经很清晰了,暂时放弃消费端,先做企业级市场,首先专注在金融和城市(安防)领域。靠这两块业务Face++的人脸识别云平台目前每天有2000万次调用量。
 
  今年,包括Face++在内计算机视觉公司都迎来了一个商业路径上的转折点——Iphone X使用Face ID,手机刷脸解锁的商用化直接促使印奇决定折回手机行业。
 
  或许对于手机厂商,刷脸解锁只是新增了一项功能,但对于人脸识别公司的商业化却是开闸式的好消息。
 
  为什么同属人工智能技术的人脸识别,比起语音识别行业在用户接受度上晚了一大截,很简单,就是此前没有找到消费端的高频场景,首先在to B和to G的领域摸索。变现压力大的一批,已经通过卖SDK赚了一笔钱。
 
  但印奇一直压着步子不肯走SDK模式,因为觉得这种模式能赚快钱,但是形成不了数据回流就意味着做不出门槛。Face++把所有业务部署在云上。
 
  到了今年,印奇觉得实现盈亏平衡的节点到了。
 
  Face++在中关村的办公室里贴着一块标语,大意是今年的目标是赚一块钱。这其实是印奇借鉴阿里早年间曾用过的KPI。
 
  “明年三月底我们会突破1000人,我们在科研人员上投入巨大,问题是是否创造了跟他们匹配的商业价值和用户价值,最好的验证就是利润。如果你的技术和场景不能给用户带来足够的价值,合作方可能会被写入你的战略合作名单,但实际或许一毛钱都不付给你。”
 
  印奇提出了AI行业的关注者最关心的问题——对于一个内外行都在看热闹,缺乏衡量标准的行业,如何判断一家AI公司的商业价值?
 
因为手机商开始「刷脸」,人脸识别公司迎来了春天
 
  以下是36氪与印奇的对话中的关键内容:
 
  手机成了刷脸公司最大的兴奋剂
 
  问:刷脸解锁技术被用在手机这种最刚需的消费电子产品上,这对于计算机视觉公司有多大意义?
 
  印奇:我们做的很多计算机视觉和人脸的应用其实都偏2B,或者是在垂直行业的场景下,所以用户教育强度没有那么大。当进入日常使用的设备(手机)里面,大家会对刷脸有更强的感知。这意味着Face ID的新时代的到来。
 
  我们在很多行业内做人脸和图像的识别,但当真正在设备里做到人的识别,才能是心真正的线上线下数据的打通。举个例子,未来我们定义Face ID,用面部信息作为身份账号体系来打通各种场景,吃饭、买东西都需要刷脸,这时终端设备的打通是决定性的,最后他们都是一套系统。这样的打通会让刷脸这件事真正成为一个基础设施级的服务。
 
  问:如果这套体系未来打通了,那Face++在整个链条中扮演什么样的角色?你会是能握住数据资源的人吗?
 
  印奇:第一数据会属于用户,第二数据肯定是属于最终端的、离客户最近的角色,比如手机厂商。当数据在个人设备的维度上,它其实会非常复杂和严格。这个数据存在那里,其实就是一把钥匙,它可以把很多产品串联起来。
 
  问:所以谁来扮演串联者的角色?
 
  印奇:未来我们希望自己是最重要的基础设施的技术产品的提供商,同时,我们可能在一两个场景,也是数据的运营商。做一个类比,我们就像是金融行业卖刷卡器和Pos机的,但是谁是Visa,谁是Master(无所谓)。数据打通后面的系统,可能有好几个体系都会有,而每个体系,可能它的场景是不一样,有的可能偏重线下的消费,有的偏重零售,有的偏重金融。
 
  问:2015年Face++和支付宝合作了刷脸支付,当时马云亲自占台,那是早期一般消费者对刷脸最深的一次感知,那次尝试过程对于Face++后来考虑商业化,有什么经验?
 
  印奇:跟支付宝合作落地是真正开启刷脸的节点。那之后我们开始进入商业化的快车道,我们开始明确地把商业模式定义成深度落地到场景行业中,真正提供一套完整的解决方案,而不只是做技术。未来只是单纯号称自己做技术、做平台的公司是没有任何生命力的,一定要去跟场景去生根,跟数据去连接,当时支付宝是我们的第一步。
 
  问:和2015年在支付宝内做人脸级别相比,如今技术方向和成熟度上有什么变化?
 
  印奇:第一点是更准,当年技术的性能(出错率)大概在千万之一到万分之一之间。现在的错误率是十万分之一到百万分之一,提了一到两个数量级;第二是更快,支付宝解锁,(短时间内)你只用一次,可能觉得几秒钟是可以的,但是手机解锁是在毫秒这个单位,一拿起手机就已经解锁了,这个体验才更好,所以必须要更快;第三是更小,早期用支付宝很多识别技术都得在云端,计算力才能满足。现在在本地端就可以完成,真个计算消耗更小。
 
  问:未来在消费者端,人脸识别技术会在哪些场景最先落地?
 
  印奇:我觉得有一个大概念和一个小概念。大概念的逻辑里面,跟大家生活最相关的,其实就是所谓的城市智能。城市里有很多的安防摄像头、传感器、包括你手机的摄像头,行车记录仪,里面传输的数据息息相关,你会发现环境智能后整个城市运转的效率会越来越快。
 
  那么在细分场景,一个是跟大家最相关的就是住宅和办公场所。你会发现以后不用带门卡和钥匙,进门就刷脸,从小区门到单元门、电梯,所有这些门的场景都可以通过摄像头被人脸识别技术复古,会非常方便。
 
  第二个是零售场景,在这里未来刷脸支付会显而易见,不仅结算环节会刷脸,未来整个消费过程中很多东西会特别智能化,比如你不用带会员卡,但是你会享受最好的会员体验,因为通过人脸识别商店对你的信息非常了解,可以提供个性化服务。比如无人便利店,你会发现结账时你真的是拿着东西就走。
 
  问:你觉得人脸识别在to C领域的爆点会在什么时候、以什么形式出现?
 
  印奇:我认为等到AR眼镜的成熟。现在有几个问题没有解决,第一电池没有解决,第二它的显示的方式没有解决,这导致目前AR眼镜不会太大规模爆发,只可能在一些垂直的2B的应用场景下会有所应用的。
 
  说不清水平的AI行业,究竟如何分出高下?
 
  问:你说过一个观点,“AI行业内有很大误区,就是认为技术的差距好像不是那么大了”,具体而言现在公司间的技术差距是什么程度?
 
  印奇:我觉得技术差距还是有的,从两个维度来看这个问题:第一,过去几年我们在人脸识别这个单点做了非常大的努力,但这个技术商业化的过程中,手机上用的跟金融上用的不一样,中国人用的跟外国人用的不一样,所以这个技术的精进非常重要,这里有非常多的技术细节和非常强的研发能力,而且是一个持续的过程。即使大家现在觉得人脸识别技术已经很成熟了,也是如此。
 
  第二,人工智能技术其实还在快速发展和研究中,壁垒还是足够高的。技术接近是在几个大公司之间,并不是像APP一样全民都可以做这个东西。
 
  问:人脸识别技术的现在的成熟度和门槛究竟有多高?face++现在做到什么程度?
 
  印奇:如果看人脸识别的单点技术,(准确率)是十发十中,但是现在大家优化的是体验,比如识别时拿手机对着你的时间长短。未来刷脸会成为很基础的技术服务,每天都高频使用,这时候一点点体验的提升都非常重要。准确度上包括我们在内,行业内领先水平能做到95%,人脸、人、车和文字是我们认为的四大核心内容。除了这四个以外的领域的技术,我认为都在60分上下。
 
  问:现在几家人脸识别底层技术服务商切入的AI+垂直的领域都差不多,比如最热的安防和金融,差异化在哪里?
 
  印奇:衡量人工智能公司的水平,要从技术和场景两个维度考虑。技术上我们的核心是深度学习这里面最重要的技术是工程化,或者叫系统化。深度学习也就是现在的算法研发,无论市面上99%的公司吹的多凶,你可以理解为它还是一个手工作坊式的研发体系,这里有几个PHD做一个东西,三五成群做一个技术点。但是这是一种非常落后的技术生产体系。Face++在过去的六年坚定地以系统代替人的逻辑,现在整个研发体系是一个流水线作业,每一个算法的研发都是在一个大系统上研发。
 
  简单说,比如研发分成几个部分,第一部分是数据的产生和收集,我们有一套非常好的系统从互联网上扒取各种数据,并从线下采集。然后把数据自动化的存到一个数据库,每天都在建立自己的数据图谱。第二个环节是数据清洗,我们都是用自己的系统清洗,可能有人工参与,但也是半自动的。第三个环节就是把数据根据我们的场景定义送到机器学习的框架里训练。机器会自己学习,最终产生一个最好的算法。然后算法会被移植到不同的平台上,它的生产就像工厂的流水线。
 
  虽然每个环节都有人的参与,但是的人参与越来越少。我们几乎是唯一一家真的把这套系统打通的中国AI公司。
 
  问:这套自动化的生产体系能带来多大程度的效率提升?
 
  印奇:第我们产生算法的效率很高。举个例子,一个深度学习的工程师,真正用在训练算法的时间可能只占整个的工作时间的10%都不到,都在做数据清理,各种准备环节。真正做高尖端的机器学习的时间只有10%。第二是人才,我们只招聘最优秀的科研工程师来搭建系统,而不是让他们在流水线上干那些实际的工作,这样我们跟别人效率的差异会进一步拉开。
 
  做AI+垂直行业,技术服务商究竟应该做多深?
 
  问:很多平台型的AI公司目前通过输出API或SDK接口的模式变现,但你似乎并不看好。
 
  印奇:很多平台型公司号称输出技术,但其实99%都是SDK,不是API。因为SDK多容易,是个特别简单的变现方式,但是丝毫没有长期的壁垒性和可持续性,最重要的一点是没有数据的闭环,没有任何的在线化和数据直流。难做的产品形态是云计算,我们通过刷脸给互联网金融和其他行业做身份认证,都是云服务。
 
  问:在垂直行业中往深推产品,哪些你们选择自己做?哪些采用合作或者外包模式?
 
  印奇:平台技术公司如果每个行业都做得很浅,那肯定会被行业里最专注的一家取代。我们会做得多深?拿安防来举个例子,我们提供全面的解决方案,从传感器的硬件,对整个的云的基础服务,到上面的应用,这整个闭环,我们都是要提供完整的服务的。
 
  问:作为平台公司连Saas层面都要自己做?
 
  印奇:我认为Saas是一个非常有误导性的概念,其实Saas有非常多的层次,比如Office可以是Saas对吧,但是在它上面又有小平台。我们本身如果做Saas就只做office,那office上很很多应用一定是用生态去做的。我就做几个核心应用,如果没有核心应用,别人怎么证明你下面的Paas是有价值的。就像为什么买Windows,因为它有Office。
 
  问:Face++给很多人的印象是技术服务商,但其实你们自己做了很多硬件。
 
  印奇:我们认为真正要做AI,就需要把算法、业务软件和新的智能硬件这三者东西放在一个维度上去定义你的新产品。创立Face++ 后我中途去哥大读了两年博士才回来全职创业,学的就是智能传感器的硬件,因为我们原来都是做软件的。现在大部分公司都说自己不做硬件,未来一两年说不定他们又做了,这是能做硬件就是个很高的壁垒。我们从来不讲深度学习是差异化,算法技术、软件技术和云计算大数据能力与硬件的结合才是真正的技术差异化。
 
  问:语音似乎一直比计算机视觉热,两个领域的商业化路径又什么可比性吗?
 
  印奇:我觉得挺像,第一阶段都是先从to B,面向开发者开始,做SDK或者芯片。第二阶段开始有一些to C 的尝试,但是一般都不成功,然后就转到to B的,to B里真正优秀的AI公司,最后都会深扎到几个行业里,一边做到这个行业的领先位置,一边不忘对to C的尝试。
 
  问:你目前最大的担忧是什么?
 
  印奇:我的担扰是在这个行业里的非良性竞争。我们都想尽快回到这个商业价值本身,但中国有太多以AI为标签的公司,其中很多公司的商业化的路径的方向都是错的,仍然可以在资本市场获得追捧,原因是大家对人工智能这个大方向其实都缺乏判断力。不像传统线上线下的生意,有一个非常量化的数字去衡量谁更好,AI这个领域是一套非常复杂的系统,商业化落地周期又长,很多公司都会说自己是行业第一。在大家都没有判断力的时候,又有很多人涌进来,其实就给这个市场造成了混乱,甚至出现非良性竞争,这会导致这个行业的发展本质陷入停滞。
分享到
下一篇:拿下高通前 博通完成55亿美元收购网络设备厂商博科