AI最好的落地场景是什么?
如果放在两三年前,安防、AIoT一定是最佳答案,这点翻翻AI公司的财报就能看出来。
然而随着新能源汽车渗透率不断提高,竞争的重心开始向智能化倾斜,“汽车”也被纳入到上述答案之中。甚至在旷视科技智驾业务总裁刘伟看来,智能汽车是AI到目前为止最大的落地场景,“没有之一”。
作为一家以算法起家的AI公司,旷视被外界更为熟知的也是其智能手机、智慧城市、智慧物流业务。而现在,它的自动驾驶业务正在浮出水面。
最近,刘伟就对钛媒体App介绍了自动驾驶业务的最新进展:一个是以视觉为主的智驾方案,另一个是基于大模型的座舱智能交互方案。
现在宣布入局自动驾驶,坦白讲时间点并不算早,甚至看起来有点晚,毕竟像商汤这样的AI企业早就大张旗鼓地进行过布局。对于这一疑问,刘伟解释道,“当时诸如基于RV的传统算法,是不可能解决高阶智能驾驶问题的。直到以视觉为主的BEV出现之后,才真的打开了一扇窗。”
BEV是Bird's Eye View(视觉为中心的鸟瞰图)的简写,也称作“上帝视角”,是一种端到端的,由神经网络将图像信息从图像空间转换到BEV空间的技术。BEV并非新技术,直到2021年特斯拉引入BEV后才引发了业界的广泛关注。
旷视也正是在这一年开始沿着这一方向发力,经过两年的技术研发,旷视自动驾驶业务的定位逐渐清晰,那就是要做智能汽车的AI解决方案提供商,要面向主流车型打造用得起的高阶智驾方案。
入局自动驾驶,定位Tier 1.5
旷视入局自动驾驶还有一个基础前提是:市场对智能驾驶的需求足够强。
据工信部相关数据显示,2021年中国L2级辅助驾驶乘用车新车市场渗透率达到23.5%,2022年上半年其渗透率增加至30%,并且渗透率还在持续不断提升。有机构预测,到2025年,中国L2级以上智能汽车的销量将突破1000万台,渗透率将达到50%。
水足够大,才能容纳更多的鱼,也才能让小鱼有机会长成大鱼。
大水之中,迫切寻找疆域边界的主要有三类企业:
第一类便是主机厂。在2021年上汽董事长陈虹提出“灵魂论”之后,“全栈自研”俨然已经成为车企“技术主权”的代名词,像特斯拉、蔚来、小鹏、理想都极力推崇自研。
不过,这也引起了另外两类企业的不同看法。比如,地平线副总裁李星宇就说,全栈自研是个奢侈品,从历史来看,真正拥有全栈能力并在商业上取得成功的公司绝对是少数,也是不可复制的极少数;华为余承东则明确表示,规模和资金实力不够的车企在智能化上全栈自研就是死路一条。
刘伟在沟通中也表示,在跟主机厂沟通的过程中能够明显感觉到对全栈自研的认知在发生变化,变得更加理性。“主机厂商追求的是全栈可控,而不是全栈自研,这个思路已经在发生变化了。”
地平线所代表的正是第二类Tier1和Tier2企业。
华为和旷视则属于自动驾驶技术公司范畴。这也是涉及企业最多的类型,既有创业之初便瞄准自动驾驶技术的创企,也有百度、华为这样的互联网大厂,还有从AI领域切入进来的企业。这类企业大多是以软件切入,提供自动驾驶系统、解决方案。
在智能汽车领域,“智能”一般指两种:舱内的智能和舱外的智能。旷视的自动驾驶产品也主要是围绕这两个方向进行,一个是以视觉为主的智驾方案,另一个是基于大模型的座舱智能交互方案。目前,旷视的重点还是在智驾方案上。
旷视虽然也是以自身擅长的视觉算法为主,提供端到端的软件解决方案,但同时也会布局芯片和传感器在内的硬件。之所以自研这些硬件,主要还是强调传感器、芯片和算法之间的协同,而在数据和域控上,旷视还是会选择跟主机厂和Tier 1去合作。因此,在刘伟看来,旷视的定位更像一家Tier 1.5。
传统的汽车供应链,是一个自底向上的线性供应模式,从Tier 2到Tier 1再到OEM整车厂。而现在随着产业链的细分、交叉与耦合,Tier 1.5也就意味着,身段更加灵活,可上可下。向上支持主机厂的智能驾驶应用自定义,向下集成和整合Tier2的资源。
三个版本,聚焦“降本”
目前的智能汽车行业,L2以下的方案基本上已经成为标配。现在的重点则是在L2到L3之间,也就是经常提到的NOA。
根据使用场景不同,NOA有两个细分方向:高速NOA和城市NOA。从2022年开始,高速NOA快速发展并向城市场景延伸。西部证券在之前的一份研报中甚至提到,2023年或许是“城市NOA元年”。
各家车企也纷纷拿出城市NOA落地进度计划表:小鹏是50城、理想是100城、长城汽车也是100城。
但问题是车企想要推广落地更多城市,但用户实实在在使用城市NOA费用并不低。像特斯拉FSD的选装价格达到了6.4万元;华为ADS2.0高级包买断费用为3.6万元,包年订阅为7200元,包月订阅为720元;蔚来汽车NOP+订阅费用为每月360元。
智驾系统的高成本恰恰是智能驾驶普及最大的“拦路虎”,再加上今年国内车市爆发激烈价格战,已经逐级传导至上游,产业链上下游整体面临相较于往年更严苛的降本要求。
这也意味着接下来的城市NOA市场竞争重点是如何在保证性能的前提下让更多用户用得起。“黑科技最终就要服务于两个目标:一个是降低成本,一个是提升体验。”刘伟说道。
作为技术方案提供商,旷视的降本思路是什么?
刘伟给出了三个关键词:强视觉、去高精地图、去RTK。
“现在激光雷达虽然变得越来越便宜,但事实上,半固态的激光雷达的售价已经逼近其BOM成本,继续降价的空间已经非常小了。如果采用很多激光雷达的方案,成本肯定还是无法降下来。选择视觉路径就是为了降低成本和提升性能。”
强视觉的路径之下,旷视采取的是实时建图的方式,只用导航地图,不用高精地图。并且将RTK(Real - time kinematic)定位也去掉。“这两个都去掉,每年又能节省几百元的成本。”
降本的第二条思路就是:统一算法框架。
一般来说,主机厂的车型众多,有旗舰车型,也会有入门级车型。每种车型采用的配置方案都各不相同,更可能是来自不同供应商,采用不同的芯片平台等等。主机厂的供应商方案矩阵复杂就导致车辆量产的时候,节奏、质量、成本都很难控制。
旷视强调的“统一算法框架”,就是指无论高中低的不同配置方案都采用统一的算法框架。“我们现在的算法框架在进行数据训练的时候,从5V到11V的方案,所有数据都是混在一起来训练的。因此,这个模型用于具体车型的时候可能需要再做一些微调,但基础的模型能力已经具备。”
同时,旷视还配合高中低不同算力Pin-to-Pin系列芯片,实现了硬件的域控可以是同一套的。也就是,客户需要适配高算力的时候,就换一个高算力的芯片;如果需要适配低算力的时候,就换一个低算力的芯片。只要更换芯片即可,其它都可以不变。
在旷视的观点中,“算法平台化”和“硬件平台化”,在最理想的状态下,可以帮助一个主机厂实现从硬件、芯片到算法的完全平台化。而这会降低管理和维护多家供应商的消耗成本,从而让量产成本大幅降低。
目前,旷视的解决方案分为三个配置:标准版、专业版和旗舰版,全部面向L2+。其中,标准版和专业版的方案中都不带激光雷达,成本相对较低,主要服务于10万-30万的车型。据介绍,专业版方案正在做量产交付。
在选择主机厂合作时,旷视的思路很清晰,不见得要大而全地覆盖所有主机厂,而是要能跟少数几家销量非常大的主机厂有深度的战略合作。
大模型,打开想象力
随着汽车智能化竞争的进一步加剧,大模型被业界寄予厚望。华泰证券在最近的一份报告中就指出,AI大模型的引入,从行业整体层面可以加速高级别辅助驾驶的量产落地。
事实真如人们预期一般吗?刘伟表示,大模型在车上的落地,座舱可能成为一个非常大的落地场景。
在智能座舱部分,目前车内主要使用的交互形式是“命令式交互”,用户通过语音给车机发出一道指令,它按照你的指令完成任务,但这种方式可以很好满足用户的基础需求,而大模型的加入则会推动座舱交互朝着“决策交互”的方向发展。并且,由于大模型是多模态的,未来的感知能力也会更加多元。
至于在智能驾驶上的价值,刘伟则认为,从目前来看最直接的价值则是体现在工具链优化部分。
如何理解?以数据标注为例,众所周知海量的数据是无人驾驶的基础,行业通常采用大量的数据去训练自动驾驶算法,以求让自动驾驶模型成为见多识广的“老司机”。在通过真实数据、虚拟仿真等方式收集到数据之后,下一步就是对数据进行识别、标注。
但人工标注成本高、效率低,而自动标注就是AI大模型赋能智能驾驶最直接的应用,能大幅降低数据标注的成本。
除此之外,刘伟认为,大模型还直接影响到了旷视对于Transformer框架的认知,打开了想象空间。
目前旷视在端到端的自动驾驶模型上已经实现了“感知、建图、跟踪、预测”四合一的模型,但这里面并不包括“规控”。而规控主要负责车辆行驶过程中的决策部分,直接关系到车辆行驶的安全性,其重要性可见一斑。
过去,在旷视看来,“规控”是不太可能加入进去模型里面的。但是,随着大模型的演进,旷视认为未来可能会是一个“大一统”的大模型。完成这一模型后,环环之间信息传递的衰减就会大幅度的削减,提升整个感知的上限。
或许,随着通用人工智能时代的加速到来,AI玩家持续发力,汽车行业的智能化转型会以前所未有的速度驶来。
从2021年正式建立团队开始,目前旷视的自动驾驶部门规模已达数百人,其中约三分之二是算法研发团队,大概三分之一是工程交付团队。旷视能否凭借着多年的AI实力在内卷的自动驾驶市场中占得一席之地,值得期待。而刘伟显然充满信心,“希望2025年的时候,我们能做到行业前三。”(本文首发钛媒体App)
根据《网络安全法》实名制要求,请绑定手机号后发表评论