华为的激光雷达和特斯拉的视觉算法，谁才是自动驾驶的未来？-钛媒体官方网站

激光雷达和视觉算法应该是相辅相成的关系，激光雷达可以大幅提升视觉算法的精度，降低视觉处理对于超高精度算法的依赖，但目前高成本制约了更多的激光雷达出现在整车上；而视觉算法在未来的自动驾驶领域依然是主流的核心技术之一，它的应用广泛性暂时是激光雷达这样的产品无法替代的。

图片来源@视觉中国

钛媒体注：本文来源于微信公众号腾讯科技（ID：qqtech），作者 | 张抗抗（清华大学动力工程与工程热物理博士），钛媒体经授权发布。

近期，华为在上海车展展示了一项接近L4级别的无人驾驶技术，引发了一连串的技术讨论。

华为的这套方案，是通过自研的激光雷达算法实现了接近L4级别的自动驾驶，同时华为也宣称要将96线激光雷达的成本降低到200美金以内。

从目前的情况看，以特斯拉、百度Apollo为代表的视觉算法派坚持认为激光雷达是成本高，技术发展慢的产物，并不如视觉算法的价值高。但华为、小鹏这样的公司则认为，激光雷达是比视觉算法更好的技术。

哪一种方案最靠谱？目前激光雷达发展到了一个怎样的水平？希望这篇文章能给你答案。

激光雷达在全视角覆盖和定位中的应用展示（图片源于WAYMO）

“激光雷达”派和“视觉算法”派先进性的争论，由来已久

激光雷达是和视觉算法谁才是智能驾驶的未来，这个争论由来已久。作为电动车领域“乔布斯式”的人物，马斯克曾在2019年抛出“只有傻瓜才会用激光雷达”的惊天言论，他可能是发动激光雷达和视觉算法口水战的始作俑者。

但在我们展开讨论这个问题之前，首先要明确关键的一点是：我们这里讨论的激光雷达，并非独立存在的，它是由激光雷达所组成的一整套车辆周边数据采集系统，采用激光雷达的方案并不意味着抛弃视觉算法，而是在原视觉算法方案的基础上增加了激光雷达的应用。

例如“视觉派”特斯拉的感知系统是由1个毫米波雷达、12个超声波雷达和8个摄像头组成。而在已公布的“激光雷达派”量产车型中，极狐αS的感知系统由3颗激光雷达、6颗毫米波雷达、12颗超声波雷达、13颗摄像头以及高精地图组成，小鹏P5的感知系统则是由2个激光雷达，12个超声波传感器、5个毫米波雷达、13个高感知摄像头和高精地图组成。

由此可见，“激光雷达派”不仅增加了全新的激光雷达传感器和高精地图，而且在传统的视觉传感器上，数量也比“视觉派”车型多。

因此，“激光雷达”派和“视觉算法”派谁才是自动驾驶的未来这个问题，更严谨的问法应该是：仅依靠视觉算法的方案，与以激光雷达和视觉多传感器融合的方案，各自的优势与劣势是什么？

从现有的情况我们会发现，仅仅依靠视觉算法的方案的优势是成本较低，但它对于算法的要求非常高，而当前的算法水平远达不到人类要求的水平。

而以激光雷达和视觉多传感器融合的方案，其优势是可以更好地处理corner case（边界情况），但它对算力的要求很高，而且硬件成本也并不低。

其实视觉算法的识别准确率已经很高了，只是它对极低概率的corner case 的能力实在有限。这是正常的情况，即便是人类依靠双眼，有时候也会因为眼睛的可视范围、眼花等问题导致交通事故的产生。

而在原视觉系统中增加激光雷达，则可以大大减少这类corner case的概率。即便是有一天视觉算法的水平达到了人类驾驶员的水平，增加激光雷达依然可以进一步降低事故概率，要考虑的仅仅只是成本收益问题 —— 如果激光雷达足够便宜，就相当于支出一份保险费来降低事故率。

在未来，激光雷达和视觉算法之间的市场竞争依旧会存在，同时成本收益问题仍旧是需要考虑的一个重要方面。不同应用场景下对感知系统的要求不同，技术的选择也会有差别。

例如基本的L2辅助驾驶功能和2020年较为高阶的高速领航驾驶功能（特斯拉NOA、蔚来NOP、小鹏NGP），仅依靠毫米波雷达及视觉就可以完好地运行，而在2022年大家重点关注的城市领航驾驶功能设计中，激光雷达就成了必备品。

以未来3-5年的时间点来看，激光雷达成本将会大幅降低，但依然会有一定的成本，这意味着同一个车型可以选择不同等级的自动辅助驾驶系统，车型的价格也不同，消费者可以根据自己的需求选装激光雷达。

换而言之，从目前我们定义的最先进的自动辅助驾驶技术来看，未来几年带有激光雷达的方案会成为主流，但从装载车型的绝对数量上来看，带激光雷达的方案还是一个相对小众的选择。

对于在技术上已经相对成熟的视觉算法，激光雷达当下的技术水平究竟如何？

特斯拉在目前电动汽车市场上的成功，从一个侧面反映了在当下的市场、政策和用户需求的前提下，视觉算法已经是一套相当成熟的解决方案。通过摄像头和毫米波/超声波雷达的配合，特斯拉可以实现L2级别的ADAS（高级自动辅助驾驶）功能。但是因为受限于芯片算力、逻辑算法等因素，视觉算法实际上很难再进一步。

而对于激光雷达来说，它还属于“半上车”的状态，之所以技术发展的如此缓慢，这与激光雷达本身存在的历史问题不无关系。如果要理清这个问题，我们先要从ADAS技术领域入手，在充分考虑其应用场景与成本的背景下做出评判。

WAYMO自动驾驶汽车当时所搭载的机械式激光雷达（图片源于WAYMO）

早期无人驾驶开发的车型多采用的是机械旋转式激光雷达，可以对周围环境进行360°的水平视场扫描，而半固态与固态激光雷达往往只能做到最高120°的水平视场扫描。

从绝对指标来看，360°肯定要优于120°，但这并不能说明机械旋转式激光雷达的技术水平更高，因为考虑到成本、安装位置、可靠性与寿命等因素，将机械旋转式激光雷达应用到量产车上的难度，会远大于固态与半固态激光雷达。

因此，从ADAS技术领域来关注激光雷达的技术水平，一个更好的角度是观察那些实装到量产车上的产品，例如采用华为激光雷达方案的极狐αS与采用大疆Livox方案的小鹏P5。

左：采用华为激光雷达方案的极狐αS 右：采用大疆Livox方案的小鹏P5（图片源于官网）

可以肯定的是，未来几年是激光雷达的快速提升性能、降低成本的几年。

从ADAS技术领域来评价激光雷达，不仅要关注其绝对性能的指标，更应该结合应用场景、感知系统的角度来评价，这样才会更具现实意义。

从这个意义来说，像华为、大疆这种既做全套解决方案，又做激光雷达零部件的厂家，能更好地发挥有限性能激光雷达的潜力，在未来的行业中有更具优势。

除此之外，关于当前的ADAS技术领域，上述提及的激光雷达和摄像头其实都属于感知系统的一部分，而感知系统通常还包括了毫米波雷达、超声波雷达、高精定位系统与高精地图。

一套完整的ADAS除了感知系统之外，还应该包括决策系统与执行系统。要理解这些系统，我们可以回想一下平时咱们是怎么开车的：

第一是眼睛的环境感知方面：车道的位置，前方是否有车辆行驶，红灯和绿灯的交换，这些工作都是由超广角、快速对焦、无级调光圈、双目即时测距、损伤自修复的超高性能仿生摄像头——眼睛来完成的。

更为重要的是，此仿生摄像头自带极强的人工智能处理器，自动完成图像处理(例如剔除毛细血管的遮挡、插帧补全盲点像素等)、对象识别（例如红绿灯、车道）、轨迹预测(前方的车辆即将转弯)等功能之后，将信息上报给“上层意识”。

另外是大脑的行为决策：通过环境感知的信息来判断车辆需要执行的控制策略，例如前方车辆停止，需要紧急刹车等。还要提到的是，像“今天走不走高速”的路径规划也属于广义的决策功能。

还有事手脚的控制执行：在收到大脑的决策指令后，驾驶员的神经、四肢，以油门刹车与方向盘作为人车交互的两大媒介，与整个汽车系统一起承担车辆控制的功能。所以目前来看，AD AS系统中最难、最关键的还是感知系统。

成本控制，视觉算法和激光雷达最大的分水岭

极光雷达上车难，难在成本控制。按照公开资料显示，特斯拉目前所运用在其车型上的单目摄像头成本在150~600元之间，更复杂的三目摄像头成本也不过千元以内。

览沃科技在CES2020上发布的激光雷达产品（图片源于览沃科技官网）

激光雷达的价格，在最近5年也呈现一个明显的下降趋势，但是相比摄像头来说，依然贵得多。去年8月，大疆旗下的览沃科技发布了在年初CES2020上带来的激光雷达新品的行货版本，其中Livox Horizon激光雷达，定价6499元，另一款长量程的Livox泰览 Tele－15，价格则是8999 元。而这辆产品，在全球市场的定价分别是999美元和1499美元。

激光雷达的成本价格高，成为了阻碍其“上车”的原罪。

2020年，华为研制出了属于自己的96线激光雷达，其宣称要在未来将成本降低至200美金以内，这也是华为尚未实现的一个目标，而制定这个目标的依据主要是以下5点：

(1) 量产导致成本的降低

(2) 技术的进步促使了成本降低

(3) 针对应用场景开发特定性能的产品以降低成本

(4) 提供更好的系统开发环境以降低主机厂的研发成本，相当于变相降低了激光雷达成本

(5) 华为提供整套方案，激光雷达让出的利润可以在整套方案中挣回来，其实也相当于降低了成本

虽然目前的成本问题并未得到有效解决，但如今已经有先行者开始将激光雷达正式应用到上市的汽车上。

目前明确表示已搭载激光雷达的、即将上市的车有3款：蔚来ET7、小鹏P5 、极狐αS。这些车在交付的时候，只能说是“硬件支持L3、L4级自动驾驶”，但并不能“立刻实现L3、L4级自动驾驶”。

这么看来，在厂家能够真正实现L3、L4级自动驾驶之前，车上的激光雷达是不是暂时用不上了呢？其实并非如此，因为激光雷达不仅对L3、L4有用，也能显著提升L2辅助驾驶的功能体验。

为什么激光雷达会让人更放心呢？

这要从它的原理讲起：一条激光，穿过去的时候是直的，相当于数字扫点，理论上把所有周围的点扫一遍之后，就能清楚地知道周围环境是什么样。

激光雷达的扫描示意图（图片源于velodyne lidar）

与激光雷达不同，摄像头的采集的是像素信息，其实就和人眼看到的范围差不多。

而与人不同的是，人眼配备了超强的智能处理器（大脑），可以在毫不费力的情况下识别出环境中的车道、车辆、行人等，对车辆来说，像素信息只是无意义的海量数字，必须经过抽象、重构等复杂过程，依赖超强智能才能达到人类的识别效果。

也就是说，如果不配备激光雷达，要想通过智能算法弥补感知能力地缺陷，需要多付出10倍的努力。

再打个比方，咱们人类驾驶员在开车的时候，偶尔也就看花眼的时候，比如将近处的物体识别成了远处的 —— 这就是大脑在处理像素信息的时候产生了视错觉。但如果给每个像素点都标上距离信息（相当于配备了激光雷达），那就绝不可能产生这种视错觉了。同时，除了上面提到的场景之外，激光雷达对于强光变换、弯道巡航、夜间行车、狭窄通行等场景下的L2功能体验提升都会很有帮助。

因此在目前的技术环境下，激光雷达和视觉算法并不应该是相互对立的关系，也没有激光雷达的解决方案一定比视觉算法解决方案更好这样的说法。

对于激光雷达来说，尽管它在目前还有比较多的问题亟待解决，但很显然行业内已经有了共识，在未来的几年内，L3-5的自动驾驶系统中，激光雷达将成为必不可少的组成部分。

相对于计算机视觉技术，激光雷达技术优点是安全性上会更高。这也是行业主动推动激光雷达在更高级别的自动驾驶中，成为主流的主要动力。