2024T-EDGE文章详情顶部

智驾科技CEO周圣砚:特斯拉FSD即将入华,留给本土车厂的时间不多了

华为和蔚小理都在争的BEV,能够颠覆自动驾驶战局吗?

图片来源:智驾科技官方

图片来源:智驾科技官方

要说2023年自动驾驶战场上最激烈的争夺是什么?那肯定有城市NOA一席之地。

在高速落地之后,自动驾驶向城市场景延伸,但高速场景相对简单,城市场景更为复杂,感知任务规模也大幅增加,因此基于Transformer的BEV技术就成为了当下的热门选择。

入局其中的既有造车新势力中的小鹏、蔚来、理想,传统车企中的比亚迪,还有百度、华为、毫末智行、智驾科技MAXIEYE等一票科技公司。

“自动驾驶的底层技术由BEV+Transformer进行重构,而底层算法重构后的自动驾驶将由原来的工程和算法驱动逐渐变为数据智能驱动。”智驾科技MAXIEYE创始人兼CEO周圣砚对钛媒体App说道。

热闹的另一面,周圣砚也直言行业内存在很多兜售劣币的现象。“一些我们自认为本应该优秀的公司在用基于图像检测框架的传统CNN这种落后的技术包装无图方案”“以场景识别的方式在过AEB的法规”“很多宣称BEV技术的供应商拿着高精度地图的底图在给客户做Demo,甚至有些还拿到了定点”。 

BEV落地之争

BEV是很早就提出的算法,全称是Bird's Eye View,中文叫做“鸟瞰图”或“上帝视角”。核心就是将传统自动驾驶2D图像视角加测距的感知方式,转换为在鸟瞰图视角下的3D感知。

这个算法与传统的方式有何不同呢?在实现自动驾驶的技术过程中,是把目标从图像中提取出来转换为能够用于做规控的结果的过程,要实现这一结果的第一步是目标的提取环节,会用到深度学习,也就是我们常见到的CNN卷积网络,而接下来的所有环节,都是用工程师的经验和数学推理以及一些模型约束,最终得到一个上帝视角下的目标以及该目标的一些属性。 而BEV就是将要解决的问题直接定义在我们最终希望它呈现的上帝视角下,用AI的方式,端到端的获取。

在周圣砚看来,这么做的好处就是将一切的问题都交给了深度学习,方法论变得高效而直接,精度也因为拿掉了经验过程而变得更加精确。“本质上就是能让深度学习做的事情就不要让工程师去做了。”

使用深度学习算法实现了从2D到BEV视角的转换之后,技术又再进一步发展,2021年特斯拉提出了大模型Transforme加BEV的模型。

Transformer是一种基于注意力机制(Attention)的神经网络模型,由Google在2017年提出。特斯拉提出之后,也迅速引起了国内公司的追捧。

众多车企以及智驾供应商都开始尝试BEV+Transformer,车企里的代表有蔚来、理想、小鹏;自动驾驶技术供应商里面的有百度、毫末、地平线、小马、轻舟等。

前不久,智驾科技也在历时三年后发布了BEV平台架构——青云Hyperspace,并面向行业开放BEV感知标准件,以及发布轻地图NOA量产方案和行泊合一高阶域控产品。

“BEV是自动驾驶空间定义的创新,Transformer是AI的模型创新。”周圣砚解释说。

那么,两者加在一起之后会出现什么效果呢?周圣砚举例称,在行车过程中地上会有车道线和护栏所形成的影子,但地上的影子所形成的高亮的区域和车道线在图像上的特征并没有本质区别,因为CNN只能提取局部信息,而局部信息是不足以判断出到底是影子还是车道线。而Transformer可以跨越空间以及时间序列去提取特征,因此就能够通过训练提取出了影子和太阳的关系。

NOA“无图”的关键 

落地场景的变化直接催化了自动驾驶技术路线的改变,车企们的城市NOA功能在不同城市推送正是BEV+Transformer落地的最直观的检验。

然而,在落地的过程中,从年初争论到年尾的一个话题就是:到底去不去高精地图?

BEV带来的第一个变化,是让自动驾驶配置开始缩减。理论上来说,BEV可以实时生成语义地图,进而替代高精度地图。但实际上,很多公司不一定能搞定。

“我们看到很多宣称BEV技术的供应商,拿着高精度地图的底图,在给客户做Demo。”周圣砚告诉钛媒体App。

那么,无图方案的关键点在哪里呢?在他看来,基于高精度地图方案的NOA系统,道路拓扑关系的获取来自于高精度地图,对车端实时感知并没有提出太多要求,而车端所需要做的只是高精度定位,准确的定位对于有效的利用高精度地图输出的道路拓扑关系至关重要。而无图方案,这种道路拓扑的关系检测全部交给了BEV的感知系统,所以能否做无图的关键就在于感知系统是否可以及时且准确的检测道路拓扑关系。

在周圣砚看来,“真无图等于目中有图,敢于把自己目中有图的拓扑结果呈现给客户和用户的玩家,才具备真无图的能力。”

不过,值得注意的是,行业里所谈到的“无图”只是去掉了高精地图,城市NOA还是要用到图,只是这张图需要通过海量车主众包出来。

因此,就出现了类似“记忆行车”的产品出现,也有车企叫“通勤模式”、“AI代驾”。2023年3月,小鹏首次提出了这一概念。随后,车企、自动驾驶公司纷纷跟进。

周圣砚认为,这是一条可以通向城市NOA的闭环逻辑。他表示,记忆共享就等于城市NOA,因此,在商业上记忆行车是高频使用场景,在技术上记忆行车相比于城市NOA又稍微简单一些,商业和技术合理化统一。

在智驾科技提供的“记忆行车”产品中,技术分为了三个阶段:首次行车,再次记图,三次激活。“我们将最大化的保证在90%以上的场景下可以达到三次即可激活记忆行车。”

首次行车时,青云BEV感知算法将记录行车过程中的BEV特征,由于对特征做了轻量化处理,因此这些特征完全可以存储在本地域控制器上。

第二步是记图阶段,调用上次记录的BEV特征,用于提示当前BEV,将产生一个接近于真值的BEV拓扑结果。同时,系统将对高精度道路拓扑进行路线记忆。

当用户第三次行驶该路线时,记忆行车功能将可被激活。

不过,钛媒体App曾经在《自动驾驶奔向“通勤模式”,是捷径还是妥协?》中提到过,在有图和无图之中构建一个中间地带,“通勤模式”给中国自动驾驶量产玩家们提供了一条当下就能“进城”的捷径。然而,从实际情况来看,通勤模式不仅存在自己独有的挑战,城市NOA真正的难题靠通勤模式也未必能避开。

只是,从这几年自动驾驶行业的发展来看,抓紧落地跑起来才能活下去,尤其是对于自动驾驶技术解决方案商们来说。同时,技术研发的脚步也不能落下,在周圣砚的计划中,做完高速无图NOA和城市记忆行车后,下一个就推进端到端研发。“特斯拉的FSD即将进入中国,留给本土车厂的时间不多了。”

(本文首发钛媒体App,作者|韩敬娴,编辑|张敏)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

AWARDS-文章详情右上

扫描下载App