Coatue重磅报告解读：空间大模型与通用机器人-钛媒体官方网站

Coatue重磅报告解读：空间大模型与通用机器人

AlphaEngineer

2024.07.19 08:01

· 来自湖南

全文3080字

00:00 / 08:42

钛度号

Coatue认为，AI机器人是一股颠覆性的力量，有望成为人类历史上最大的科技浪潮之一，值得高度重视。

文｜AlphaEngineer，作者 | 费斌杰

全球顶级对冲基金Coatue近日发布了一篇关于“具身智能”的重磅报告，题为《The Path to General-Purpose Robots》。

Coatue认为，AI机器人是一股颠覆性的力量，有望成为人类历史上最大的科技浪潮之一，值得高度重视。

这篇报告亮点很多，不仅细致分析了现阶段AI机器人面临的挑战，同时也对行业发展做出了合理展望，从投资的角度给出了专业意见。无论你是科技投资人、AI从业者、还是对机器人感兴趣的朋友，都值得一读。

下面我给大家解读一下这篇大报告。

理想很丰满，现实很骨感

机器人行业也许是Demo与现实差距最大的行业之一。

Demo视频中是这样的：

现实则是另一种画风：

1961年，第一台工业机器人诞生于GM，用于汽车生产流水线。

经过50多年的发展，机器人的形态变得越来越多样，功能场景也丰富了起来，有扫地机器人、四足机器人、人型机器人等。

纵观历史，机器人渗透率其实是线性提升的。

以工业机器人为例，每万名制造业员工对应机器人的数量从2013年的53台增长到2022年的151台，CAGR达到12%。

虽然机器人行业整体发展稳中向好，但是具体公司的的表现并不尽如人意。

机器人公司普遍存在商业化困难的问题，加之前期资本开支巨大，22-23年大量机器人公司破产倒闭。

空间智能，让通用机器人成为可能

上一代机器人更多是执行某些单一任务的，比如扫地机器人只负责扫地，农业无人机只负责灌溉农田，工业机器人只负责机械焊接等。

但是随着AI泛化智能的涌现，下一代机器人有望成为“通用机器人”，胜任各式各样的任务与环境。

正如大语言模型让语言推理成为现实，空间大模型有望打破第四面墙，让AI真正理解物理世界，从而与之交互。

机器人面临的核心挑战：缺乏训练数据

对人类来说很简单的任务，对机器人来说可能并不容易。

Coatue举了三个具体例子。

灵巧性：

空间感知能力：

平衡恢复能力：

为了克服这些问题，需要用海量数据进行训练，使机器人变得更加智能。

但是机器人是一个非常新的领域，严重缺乏训练数据的积累。

对比不同模态下的最大数据集，文本模态约15T tokens，图片模态有6B图文配对数据，视频模态有2.6B视听特征数据。

然而机器人模态只有240万个数据片段，相比其他模态而言，数据积累远远不够。

机器人训练数据的四种采集方式

既然数据是机器人发展的核心瓶颈，那么有什么方法可以快速积累机器人训练数据呢？

近年来，这方面的研究层出不穷，逐渐形成了四种流派。

机器人数据采集方法1：远程操作（Teleoperation）

顾名思义，由实验人员操作机械手柄，远程控制机器人做出相同动作，以此来积累数据。

机器人数据采集方法2：AR

在一项名为《Explainable Human-Robot Training and Cooperation with Augmented Reality》的研究中，研究人员通过AR（增强现实）技术让人机交互过程具备更强的可解释性，从而进行数据积累。

机器人数据采集方法3：仿真

通过海量算力进行模拟运算，计算得出海量机器人训练数据集。

仿真可能是目前最有可能做到规模化数据生成的路径，背后需要巨大的算力支持。

目前Nvidia的Jim Fan团队采取的就是这条技术路径。

机器人数据采集方法4：视频学习

通过多模态大模型，直接让机器人通过视频学习人类动作，从而积累训练数据。

机器人成本与人类工资的黄金交叉

随着GPU成本的下降，大模型训练的成本大幅降低。

过去一年中，Azure云平台上的A100显卡租赁价格从6美金/小时下降到1.5美金/小时，降幅达到75%。

硬件成本同样在快速降低，20年L3 LiDAR传感器的成本在7400美金左右，现在已经腰斩到3200美金。

机器人成本不断下降的同时，人类的薪酬水平却在稳步提升。

可以想见，在不久的将来，二者终将迎来金叉。

Coatue认为26-27年人型机器人的成本就会降低到人类平均薪酬以下，这无疑会对全球劳动力市场造成重大冲击。

硅基生命进化进行时：更快的速度，更高的灵巧性

作为硅基生命的代表，机器人在很多场合的能力表现已经超过了人类。

比如宇树的H1机器人行走速度达到3.3米/秒，而人类平均行走速度只有1.42米/秒。

除了行走速度之外，机器人动作的灵巧性也在快速提升。

马斯克表示，今年新的Optimus机器人将有22个自由度。

随着大量AI机器人公司的涌现，硅基生命的进化速度会越来越快。

类比无人驾驶，L4人型机器人即将到来

在自主性方面，人型机器人与无人驾驶汽车类似，可以分为L1到L5。

无人驾驶汽车从L1到L2花了大约20年，而从L2到现在的L4只用了不到10年。

人型机器人从L1到L2用了大约50年，从L2到L4预计只需要不到5年。

机器人的“ChatGPT时刻”即将到来？

大模型发展如火如荼，大家都在期待着机器人领域迎来自己的“ChatGPT时刻”。

纵观过去20年，真正称得上科技领域的“WOW!时刻”的只有三次，分别是07年的iPhone、22年的ChatGPT、以及24年的无人驾驶。

这些“WOW!时刻”有着一些共同特征。

首先，它们都在day 1带来了激动人心的use case，并通过口耳相传形成病毒式传播。

其次，应用成本达到拐点，使得技术能够向市场大众普及，构成正向的商业模型。

第三，开发者社区增长迅猛，围绕核心技术及产品形成商业生态。

Coatue预测，机器人并不会迎来所谓的“ChatGPT时刻”，因为它尚不具备以上几点特征。

相反，Coatue认为机器人的普及，会经历由浅入深的三个阶段，走出一条独特的发展路径。

第一阶段：Seeing，人们通过电影、小说等媒介对机器人形成初步模糊的了解。

第二阶段：Experiencing，指消费者直接享受机器人提供的服务，而非自己拥有机器人，类似B2B2C的模式。比如你在咖啡厅享用一杯机器人拉花的咖啡，就属于这个阶段。

第三阶段：Owning，即每个用户自己拥有一台或多台机器人。

Coatue还预测了人型机器人能力的成长曲线。

对于家庭人型机器人，能力成长路径依次为：扫地 -> 做饭 -> 管家-> 保姆。

对于户外人型机器人，应用场景成长路径依次为：仓库 -> 门店 -> 消防-> 手术。

投融资火热，机器人生态渐成

随着奇点的不断逼近，AI机器人公司的投融资越来越火热。

围绕AI机器人，一个完整的生态圈正在形成，包括机器人开发工具、机器人训练数据集、机器人运维、空间大模型、机器人生产制造等。

Wintel，还是围墙花园？

类似PC时代，AI机器人正在形成Wintel-like以及Walled Garden这两种典型的商业模式。

Neuralink的脑机接口、SpaceX的卫星通信、Tesla的无人驾驶、xAI的大语言模型、Optimus的人型机器人，马斯克的这盘大棋正在逐渐浮出水面，越来越清晰。

作为AI时代极少数拥有机器人全栈能力的公司，Optimus的发展值得期待。

13篇资讯

8粉丝

AlphaEngineer

费斌杰北京市青联委员熵简科技CEO

最近资讯

本文系作者 AlphaEngineer 授权钛媒体发表，并经钛媒体编辑，转载请注明出处、作者和本文链接。
本内容来源于钛媒体钛度号，文章内容仅供参考、交流、学习，不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现，点击这里投稿。创业或融资寻求报道，点击这里。

714人已赞赏 >

敬原创，有钛度，得赞赏

发表评论

给小编加鸡腿🍗

爱了爱了😁

挺有深度的，不错

紧跟时事，赞一个👍🏻👍🏻

真不错，收藏了

写的很不错，关注了

都没有那么简单

这么厉害的吗

学到了学到了

商场如战场，竞争激烈啊

行业发展都是有周期的

企业的发展都不是一番风顺的

说的好有道理😄

内容值得人们反思

数据还是很详细的

内容很精彩，夸一夸

又学到了很多知识

内容很详细👍🏻

小编辛苦了

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

哈哈哈哈哈就是我
求报告
回复 2024.07.23 · via iphone

快报

14:28

香港财政司：市场对稳定币需求料将进一步增加，金管局在相关条例生效后将尽快处理牌照申请

13:44

中国驻伊朗大使馆：领事办证窗口将于6月15日起暂停对外办公

13:40

下周（6月16日-22日）市场大事预告

13:23

匈牙利总理：美无权限制匈牙利对华贸易

13:22

中信证券：展望下半年，房地产发展新模式将更有针对性地缓解结构性供需错配

13:07

北京地铁开通JCB运通拍卡过闸，首次全网覆盖五大卡组织

12:47

三晖电气：与左邻永佳合资布局虚拟电厂、数字能耗管理

12:08

浙江152条航线因大风已停航108条

12:02

中文在线：《罗小黑战记》与泡泡玛特旗下共鸣GONG开启联名企划

11:59

6月15日新闻联播速览20条

11:56

阿斯利康全球肿瘤业务Dato-DXd及肺癌事业部负责人赖明隆已决定离职

11:26

诗人郑愁予去世，他曾写下“我达达的马蹄是美丽的错误”

11:24

25家A股上市公司本周披露并购重组最新公告

11:23

埃及航空取消飞往贝鲁特、安曼等地航班

10:48

四川宜宾市珙县发生4.8级地震，震源深度10千米

10:39

伊朗领空将关闭至16日凌晨，客运以铁路和公路为主

10:27

深圳有望试点红筹股二次上市，相关上市规则正在制定

09:53

中信证券：中东冲突可能成为行情结构转变的诱因

09:40

罗永浩数字人在百度电商首次开播

09:23

以色列特拉维夫股市回升转涨

11

2

10

微信分享

扫描下载App