多数人认识商汤,都从“融资”开始。
5月31日,人工智能平台公司商汤科技SenseTime宣布完成C+轮6.2亿美元融资,在洋洋洒洒超过10家投资机构的名单中,既包括了厚朴投资、银湖投资、老虎基金、富达国际等财务领投方,也有高通创投、保利资本、世茂集团等作为战略投资人参与。
截至目前,商汤科技总融资额超过16亿美元,估值超过45亿美金。
去年7月,商汤 B 轮融资4.1亿美元,媒体报道其为“全球人工智能领域单轮融资最高纪录”。今年4月,商汤公布 C 轮6亿美元融资,在刷新融资纪录的同时,领投方也被证实为此前传言的阿里巴巴集团。
为了重塑 AI 底层框架,商汤建立起自己的超算中心,每年在采购 GPU 上的花费就超过上亿元。根据《财经天下》周刊报道,商汤公司的150位博士研究员,几乎每日都要在算法平台上进行数据训练迭代,单次花费就要至少50万元。
在完成技术积累后,商汤在战略上的新目标有了变化,是成为一家“能赚钱的公司”。
今年4月底,商汤一口气发布六款新产品,包括两款智能安防产品 SenseFace 3.0 平台与 SenseFoundry 方舟城市级视觉开放平台、两款AR生态产品 SenseAR 增强现实感绘制平台和 SenseAR 开发者平台、智能汽车产品SenseDrive DMS 驾驶员监控系统、以及 SenseMedia 智能图片视频审核平台。
从初期围绕视觉计算推出智能拍照、相机美颜,到如今在智慧城市(智慧安防、智慧商业、智慧楼宇)、手机、AR、自动驾驶等领域的广泛应用,商汤已从一家“人脸识别公司”扩展为包括更多产品体系的 AI 平台。
清晰的产品线,为商汤增加了多条“造血”管道,直接指向其公司的营收预期。
根据商汤官方透露的数据,自成立以来,商汤年营收平均增长率达到 400%。2017 年,公司实现正向盈利,营收在 1 亿美金左右。而目前商汤营收主要来自于四个方向:智慧城市、汽车、手机以及新型业务(其中智慧城市领域占比最大,超过 30%)。
从组建团队到实现商业化,商汤仅用了三年多。商汤联合创始人、CEO 徐立在公司快速发展过程中总结出两方面经验:
一方面,在公司内部,商汤采取了“1(基础研究)+1(产业结合)+X(行业伙伴)”模式。具体来说,一方面横向对安防、金融、零售等行业实现覆盖,另一方面通过合作伙伴在纵向产业里做深。按照徐立的说法,商汤过去是“SDK 级别”的赋能,现在是平台级别的开放。
外部环境上,中国政府对 AI 产业的扶持与鼓励,让智慧城市、金融、自动驾驶等场景的 AI 应用得以在政策上获得开放;中国市场的互联网用户规模与互联网场景长期积累的数据量,为其 AI 系统的验证与进化提供了土壤。
“未来五年到十年,中国的AI发展路线和欧美不一样。”徐立对钛媒体表示,“欧美将专注在 AI 基础研究技术的突破,他们的发展是阶跃式的;而中国是连续的,会在一些垂直行业、应用形成很好的结合。这恰恰是一个机会。”
掌握“大脑”
成立三年多,商汤累积融资额已超过10亿美元,但每年也在用数以亿计的速度消耗资本,有人认为,规模化的投入让商汤从 AI 技术到应用均构建起壁垒,也有声音指出:“商汤在烧钱”。
“很多人会误解我们,为什么商汤需要那么多机器(指超算中心),很多公司用开源系统也能做人脸识别。”徐立对钛媒体解释道。“其实,商汤是在造大脑”。
徐立所说的“造大脑”,即重塑一个 AI 开发平台。从表象来看,这种做法无异于重复造车轮——不论是20年前就开源的LINUX,还是2015年 Google 开放的 TensorFlow,已经成为全球 AI 开发者的标配。
为什么商汤一定要掌握自己的大脑?
“AI 的核心在于,第一要有造脑的工具。造脑的工具如果都是别人的,造脑的能力和脑容量就受到了限制。第二是造脑的专业知识。即使有了工具,也需要有一个团队知道怎么去造脑。所以这两点是AI领域的核心差异化。”徐立说。
这样的结论源于商汤遭遇的现实局限。两年前,谷歌开源的 TensorFlow 仅支持一台服务器并行训练四张 GPU 卡片,但当时商汤的需求是要支持200台机器的训练,如果单纯依靠谷歌等开源系统进行创新,唯一的办法就是等待谷歌推出下一代“多机多卡”技术。
产品能力的提升则是商汤“造脑”后带来的直观收益。以商汤发布的智慧城市产品 SenseFoundry方舟城市级视觉开放平台为例,在企业客户不断添加业务数据后,商汤的“自循环生态系统”会利用数据对深度网络神经进行训练,最终实现人脸识别错误率能够降低到10的负11次方,但如果仅使用 Tensorflow ,准确率会降低近千倍。这种产品能力的巨大差异将直接影响安防行业客户的获取。
底层算法能够带来的时间窗口是商汤掌握大脑的另一点原因。
一个可以被参考的案例是美国 AI 初创公司 DeepMind,从 2014 年被谷歌收购,到 2016年其研发的AlphaGo 大败韩国棋手李世乭,在美国,类似的算法更迭几乎每十八个月就会导致 AI 性能的倍数级提升,这就给算法本身带来足够的时间窗口去布局。
而在用算法形成门槛后,AI 多元化就成为系统可以实现的目标。拿人脸识别来说,AI 公司已经将其从美颜拉长腿,逐渐拓展至交通安防、城市管理等更多场景,这种应用落地的方式又能为算法提供更多数据,让机器提升计算能力。
打个比方,大多数人的童年都学习过音乐和美术,即使成年后不从事相关工作,但幼年的学习在思维方式上训练了大脑。这个故事套用到“ AI 大脑”上,所谓的美颜、拉长腿、人脸识别就好比是“音乐、美术”等学科工具,只有先自主掌握大脑,再通过应用训练,大脑才能发挥作用。
“数据只是教材书本,大脑聪不聪明,直接决定了AI 系统的能力。”徐立对钛媒体说。
技术红线
从智慧城市、手机、AR再到自动驾驶,从底层算法到落地产品,商汤在四年时间不断延伸业务触角。
而已有的市场上,安防行业前有海康、大华等传统龙头,后有以“AI+安防”起家的依图;移动端的竞争者则包括了对手机市场虎视眈眈的旷视科技......随着产品线的扩展,商汤面临敌人或竞争者会越来越来多。
徐立并不这么认为:“你看到这个行业大家都在做,但各家算法的性能差距很大。”
这种由算法形成的壁垒落地在产品层面,徐立谈到了商汤可以实现的两个行业“唯一”。
一个是通过深度学习,为手机厂商提供AI双摄方案。传统双摄技术对硬件要求比较高,手机厂商需要使用一个支架将双摄像头框在一起,才能实现摄像头配准(对齐)的效果,这个支架成本在2美金左右。而商汤提供的AI双摄技术,是业内唯一不需要支架即可实现的,在减轻成本的同时完成更好的拍摄效果。以 oppo、vivo 、华为、小米等厂商各自超过8000万的年出货量来看,商汤的算法可以为它们每年省去超过1亿的成本。
另一点是为手机厂商提供整体的视觉识别应用服务。根据徐立透露,相较于部分厂商提供的单点式美颜、人脸解锁技术,商汤是业内唯一一家可以提供成像、感知、识别、理解一整套视觉内容解决方案的厂商。这一方面可以实现产品间的交叉销售,另一方面,算法涉及的诸如成像、图片增强、超分辨率等应用之间可以在深度学习引擎下相互促进准确率。
不只是商汤,利用算法以及技术壁垒在行业形成壁垒,几乎成为国内头部 AI 创业公司进行商业化落地的终极目标。
最初,商汤、旷视、依图、云从从图像视觉识别起家,初期均涉猎安防。而随着公司发展,曾经的“图像 AI 四小龙”也在具体业务中展现出差异化:旷视注重泛安防、手机等移动端应用;依图凭借“AI+医疗”拿到了 C 轮融资;云从正大力挖掘金融、银行客户。
事实上,类似的突破空间几乎存在于各个行业,徐立称这种行业需要的、但AI 系统尚未达到的能力为“技术红线”,谁能在某一领域率先突破技术红线,就能迅速占领市场份额。
以商汤与映客的合作为例,根据映客直播总监姜春生的介绍,通过商汤的视觉识别解决方案,映客的调帧时长延长了85%,识别时间缩短了31%。
在直播平台,调帧时长延长就意味着手机可以在更少的 CPU 损耗下采集更多的图像,特别是用户使用非 ios 系统的情况下,根据姜春生透露,商汤的方案让手机CPU消耗可降低25.6%;而在视觉识别层面,映客提供得主播“伸手要礼物”等手势互动,也因为AI 技术让虚拟礼物图像与主播的手势贴合得更为紧密。
同时,商汤、旷视等 AI 公司都在与今日头条、快手等平台合作,后者每年需招募上千人的团队,以审核平台可能出现的色情、暴力等非法信息。
对此,徐立坦陈,当下 AI 行业在内容审核方面的准确率还没有达到人的标准,即没有高过“技术红线”,这也意味着,在一定期限内,哪家公司的算法可以在精准度上超越人类,就能对市场占有率产生重大影响。
嵌入产业
我们可以用模块化的组织来理解商汤。
技术上,商汤通过自建“大脑”(超算中心)形成更先进的算法;产品中,基于“大脑”衍生的多条线业务得以产生数据,并进一步训练底层的算法引擎——这样的技术壁垒也符合商汤创始团队的科学家背景,可在产品诞生后,如何“接地气”地卖出去,成为商汤面临的又一挑战。
“卖项目”还是“卖产品”成为摆在商汤面前的第一道选择。
根据数据统计机构 IDC 分析,2018年国内智慧城市(包括视频监控、出入口控制楼宇对讲等智能安防项目)市场规模达2万亿,在这样的市场需求环境下,“接单”并不难。AI 企业在掌握一定人脸识别技术后,也能按照项目制的方式,为政府、事业单位、社区等机构进行安防系统升级。
不过,单纯的“项目制”固然能为公司带来收入,但受限于投入的人力成本等原因,这类外包公司式的生意很难规模化,如果想突破人力成本带来的局限,就必须在了解行业需求后,针对共性需求提炼出标准化、可以大规模量产的产品,用产品能力替代人力花费的成本。
“我们必须完成可以量产的产品,不然就只能做项目,所以商汤一定是在项目和产品之间来迭代——拿到项目,找到共性,转化产品、扩大规模。”徐立对钛媒体表示。
找到产业上下游的合作伙伴,则是商汤提升产品黏性的另一种方式。
去年11月,国际通信巨头高通集团(Qualcomm Incorporated )对商汤进行战略投资,双方均未披露具体金额,但彼时高通正在加速 5G 技术的终端布局,对提升芯片的 AI 计算性能有着较大需求,这与商汤在算法侧的优势相契合。
“高通每年的芯片出货量有十亿,手机厂商很难有能力去消化这些高端芯片,但商汤具备从 OEM、手机厂商提炼出来的的 AI 应用能力,加上高通有计算硬件,就可以把人脸识别、物体追踪、AR 游戏等功能落地进智能手机内。”徐立说。
不止是高通,新的投资方也在引导商汤进入一个陌生领域。2017年8月,苏宁第一家无人店“苏宁体育Biu”开业,当中无人值守环境下的商品识别、用户定位、“刷脸”付款等技术均由商汤提供,这也为苏宁之后对商汤的投资埋下了伏笔。
除此之外,商汤也在以“投资人”的角色补足产品以及覆盖领域上的短板。去年12月,商汤与当代置业等机构共同领投了地产行业 VR 项目51VR,后者可以利用 VR/AR 设备对地产物业、自动驾驶等环境进行模拟体验,据报道,商汤目前计划投资的领域还包括游戏、AI芯片、医疗、物联网、手机以及移动互联网。(本文首发钛媒体,作者/苏建勋)
根据《网络安全法》实名制要求,请绑定手机号后发表评论