“2022毫末三大战役稳健收官。”毫末智行董事长张凯在第七届 HAOMO AI DAY上说。
张凯所指的“三大战役”,是毫末面向 2022 年提出的“数据智能技术之战”、“智能驾驶城市场景之战”、“末端物流自动配送车的规模之战”。
在此届大会上,毫末智行也交出了 2022 年的成绩单,具体来看:
- 2022 年毫末三代 HPilot 产品已搭载至魏牌、坦克、欧拉、长城炮等近 20 款车型,辅助驾驶用户行驶里程突破 2500 万公里;
- 目前毫末城市 NOH 软件封版达到交付状态;
- 末端物流自动配送车已初步完成商业闭环,交付超 1000 台,小魔驼配送订单量突破 13 万单;
- MANA 学习时长超 42 万小时。
对于 2023 年自动驾驶行业的发展预测,张凯表示:“2023 年,智能驾驶下半场的竞争将进入加速期,高阶智能驾驶产品商业应用将迎来大规模落地。”
基于这一基础判断,张凯从行业、技术、产品、人才等方面对 2023 年自动驾驶行业发展做出十大预测。
- 行业层面,2023 年自动驾驶将全面进入 3.0 时代;高级别智能驾驶将成为中端车型标配;全新一代芯片、传感器进入市场,自动驾驶生态呈现更丰富多样性。
- 技术层面,大模型在数据合成、知识提取等方面的能力将助力自动驾驶迭代速度实现量级提升;自动驾驶系统比拼将由功能竞争转变为通勤效率竞争;超算中心会成为自动驾驶企业的入门配置。
- 产品层面,城市导航辅助驾驶进入重感知阶段,大规模量产交付大幕拉开;智能驾驶的用户体验将从尝鲜转变为用户依赖;末端物流自动配送车整体成本降至 10 万元以内,将进一步改善生产关系。
- 人才领域,张凯判断 AI 自动驾驶领域激烈的人才竞争将会延续到 2023 年。
面对接下来一年所要迎接的趋势和机遇,张凯提出毫末智行要打响“2023 年四大战役”,包括“智能驾驶装机量王者之战”、MANA 大模型巅峰之战”、“城市 NOH 百城大战”、“末端物流自动配送商业之战”。
张凯表示,“智能驾驶装机量王者之战”是重中之重,毫末智行将完成多平台、数十款车型、数十个项目的异步并行开发,通过智能驾驶流程化开发和标准化交付,进一步推进未来搭载毫末辅助驾驶产品的乘用车达百万量级的目标。
“MANA 大模型巅峰之战”是指毫末将在智算中心助推下,将大模型的应用落地进行到底。“城市 NOH 百城大战”则是将毫末城市 NOH 有序落地到国内 100 个城市。至于“末端物流自动配送商业之战”,张凯表示毫末智行将继续坚持 5S 合作服务模式,实现产品和解决方案落地,加速无人配送行业应用进程。
相较于去年提出的“三大战役”可以看到,毫末智行对于辅助驾驶在城市场景和车端的应用落地有了更具体、更明确的目标规划。
所谓的智算中心则是在此次 HAOMO AI DAY 上,毫末智行还发布了和火山引擎联合打造的智算中心“雪湖·绿洲”(MANA OASIS)。
毫末智行CEO顾维灏表示,“在 MANA OASIS 加持下,毫末将冲刺进入自动驾驶 3.0 时代。”
按照毫末智行方面的说法,MANA OASIS 是中国自动驾驶行业最大智算中心,每秒浮点运算达到 67 亿亿次,存储带宽每秒 2T,通信带宽每秒 800G。
有了 MANA OASIS 的加持,毫末智行亮相了 MANA 五大模型,包括视觉自监督大模型、3D 重建大模型、多模态互监督大模型、动态环境大模型以及人驾自监督认知大模型。
在顾维灏看来,为了更低成本、更高效获取更多高价值数据,需要解决从离散帧自动化扩充到 Clips 形态的问题。由此,毫末首先利用海量 videoclip,通过视频自监督方式,预训练出一个大模型,用利用部分人工标注的Clip数据进行Finetune(微调),训练检测跟踪模型,使得模型具备自动标注的能力。
然后,将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成 Clip,其中10%是标注帧,90% 是未标注帧,再将这些 Clip 输入到模型,完成对 90% 未标注帧的自动标注,进而使视频自监督大模型实现 4D Clip 标注 100% 的自动转化,同时降低 98% 的 Clip 标注成本。
3D 重建大模型则是用更低成本解决数据分布问题。面对“完全从真实数据中积累的 corner case 困难且昂贵”的行业难题,毫末智行将三维重建 NeRF 技术应用在自动驾驶场景重建和数据生成中,它通过改变视角、光照、纹理材质的方法,生成高真实感数据,实现以低成本获取 normal case,生成各种高成本 corner case。
多模态互监督大模型则致力于精准识别异形障碍物。其引入了激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达。通用结构的检测,补充已有的语义障碍物检测,以提升自动驾驶系统在城市复杂工况下的通过率。
动态环境大模型则进一步使用重感知技术,降低对高精地图依赖。毫末智行认为,解决了路口问题实际就解决了大部分城市 NOH 问题。
基于此,毫末智行在 BEV(鸟瞰图)的 feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将 BEV 特征解码为结构化的拓扑点序列,实现车道拓扑预测,提升车辆感知能力。
至于人驾自监督认知大模型,则是致力于让汽车掌握高水平司机的开车技法。据顾维灏介绍,毫末先引入了用户真实的接管数据,同时用 RLHF(从人类反馈中强化学习)思路先训练一个reward model(奖励模型)来挑选出更好的驾驶决策。
需要指出的是,尽管毫末在数据利用上下足了功夫,但从现有的数据积累来看——毫末用户辅助驾驶行驶里程2500万公里;作为对比,特斯拉 FSD Beta 行驶里程已经超 1 亿公里——毫末 NOH 还需要更多的装机量以积累数据。
小结
事实上,在过去的 2022 年,无论是毫末智行,还是主攻 L4 级自动驾驶的公司,如文远知行、小马智行、驭势科技、元戎启行、轻舟智航等,都在着重布局前装量产的辅助驾驶功能,毫末的竞争对象已不再局限于小鹏、特斯拉等车企。
如果说 2022 年只是燃起了城市辅助驾驶之战的硝烟,那么 2023 年将是量产应用的关键占位期。
对毫末而言,背靠长城这棵大树,其城市 NOH 已上车 20 余款车型,取得了阶段性成果。然而,随着越来越多竞争者进入城市辅助驾驶这一角斗场,毫末显然还未迎来喘息时刻。
(本文首发钛媒体App,作者|肖漫,编辑|张敏)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这么智能又安全的车,看着都有点心动了
太赞了啊,看着就特别想拥有的豪车。