近期,一款名为Mobile ALOHA的机器人因其出色的烹饪和家务技能在网络上迅速走红。
视频中的机器人外观较为基础,主要由两只机械臂、提供运算能力的主机以及底部移动平台构成。从整体上看,这款机器人尚处于初级阶段,更像是一个粗糙的“原型机”。与我们在科幻作品中看到的“机器人管家”相比,它还有很大的提升空间。尽管如此,这款机器人的潜力却不容小觑。
此前也有不少服务机器人展示过烹饪、搀扶、地面清洁等能力,为何说Mobile ALOHA的潜力很大呢?主要原因是它拥有便宜且开源这两个特点。换句话说,只要你花费32000美元(约23万元)且动手与学习能力足够强的话,就能自己在家复刻一台具备这些技能的机器人。
这个由斯坦福三人团队研发的通用机器人Mobile ALOHA,可以通过模仿学习,执行各种复杂的任务。同时在操控层面,除了可以自主操作外,还可以支持全身远程操控。
人类的“机器梦”何时才能圆?
从机器人发展的整体方向来看,可以被简单划分为专用机器人和通用机器人两类,前者主要聚焦于提升单一场景的生产、干活效率。在日常生活中,人们或多或少都会接触到此类产品,像智能工厂里应用的各类机械臂,家里用于清洁地面的扫地机器人、酒店中用于派送物品的送货机器人等,都可以划分为专用机器人。
通用机器人与之相比则拥有更广泛的适用性,尤其是在“为人提供服务”的层面,通用机器人的一大结构特点就是更具“拟人化”特征。因为它的最大用途就是代替用户去完成一部分日常工作,像做家务、做饭等等,所以很多科技公司以及研究机构在产品设计之初,就会将“人形机器人”作为未来持续投入的发展方向。
世界上第一个全尺寸人形“智能”机器人WABOT-1诞生于1972年,但早期的电机、驱动程序、算力都很难满足机器人的应用需求,WABOT-1只是一个形态上具备类人特征的产物。2009年,波士顿动力开始研发PETMAN人形机器人,此后又推出了不断迭代的Atlas,在整个21世纪10年代,它就是受关注度最高的人形机器人产品。
2022年,随着特斯拉首次展示Optimus机器人,这台能走路、能挥手能举重甚至可以组装另一个“自己”的机器人再次刷新了大众对于人形机器人发展速度的认知。
除了国外企业,近两年国内科技企业也在加速布局人形机器赛道,像蒂艾斯科技的exrobots、优必选发布的WALKER X机器人、小米推出的CyberOne等等。但以上这些机器人都存在一个问题,就是它们只属于“未来”,特斯拉预计2030年才会将Optimus完成大规模量产并推向市场。
而Mobile ALOHA的出现,则开启了普通人与机器人接触的低门槛通道,斯坦福团队除了在网页中展示了Mobile ALOHA所能实现的能力以外,也完整开源了机器人的软硬件所涉及到的各类参数、资料内容,比如机器人使用的硬件以及具体的参数信息。
具备学习能力的“机器人保姆”
Mobile ALOHA配备有2个腕部摄像头,和1个顶部摄像头,并配有移动电源和本地计算模块,在其自主执行时只使用2个ViperX 300。两只手臂的最低/最高高度分别为65厘米/200厘米,并可以从底座向四周最长能够伸出100厘米。
算力方面,从视频中可以看到,Mobile ALOHA的“大脑”其实是一台笔记本电脑,根据官方公布的资料,其配置为英特尔第十二代酷睿处理器i7-12800H,显卡则采用了英伟达RTX3070ti,这套配置放在2024年的市场来看,意味着只需要一台8000元左右的游戏本,就能满足Mobile ALOHA的算力需求。
为了让机器人具备更大的活动范围,研发团队在组建Mobile ALOHA时选择了将AgileX Tracer AGV(Tracer)作为了移动底座,这原本是一个专为仓库物流设计的移动平台,其移动速度可以达到1.6m/s、最大有效载荷为100kg,由于全套资料均为开源,因此在组建过程中,其他人也可以根据自身需求对方案做进一步的DIY。
除了硬件以外,Mobile ALOHA还通过加入数据和视觉的学习能力,也就是当下比较流行的“大模型”人工智能。Mobile ALOHA的学习能力由两部分组成,包括静态ALOHA数据集以及基于视觉识别或手动操控获得“模仿能力”。
目前已经开源的静态ALOHA数据集总共有825个演示任务,包括密封袋子、拿起叉子、包装糖果、撕纸巾、打开带盖塑料杯、玩乒乓球、使用咖啡机、翻转铅笔、固定魔术贴电缆、装上电池和操作螺丝刀等等。
演示中,研究人员每个任务只用了50个演示就可以让Mobile ALOHA机器人开始学会做这件事,比如连续9次擦拭洒在桌子上的葡萄酒,连续5次乘坐电梯。最终呈现的整体效果还是不错的,Mobile ALOHA完成了从备菜烹饪到最后清扫收拾的所有环节。
钛媒体App注意到在烹饪环节,Mobile ALOHA除了可以执行切菜的固定动作以外,也学会了颠勺、摆盘等操作。在收拾的过程中,它既能够挪动对椅子这样体积较大且笨重的家具,同时也能够对盘子这样体积小且光滑的物品的抓握与清洁,说明作为通用机器人其场景应用空间还是很大的。
那么对于整个机器人产业来说,Mobile ALOHA也有很大意义,首先是作为开源项目,自然会吸引到很多企业以它为基础蓝本开始探索类似机器人的商业落地能力,并且随着零部件从目前的单独采购变为规模化供应,成品的成本将会进一步降低,进而推动机器人的普及化。
同时,Mobile ALOHA也指明了当机械组件不断成熟后,依靠大模型人工智能为机器人赋予的学习能力,能够让机器人的应用潜力得到更快的释放。
此前斯坦福大学机器人实验室主任、计算机科学教授,IEEE会士,国际机器人研究基金会主席Oussama Khatib就曾表示:“机器人面临新的环境和新的挑战之一便是复杂的环境带来的学习成本问题,如今机器人要面对的是从工厂当中走出来,进入到实际复杂的人类环境,因此它需要具备人类的智慧。”
而大模型人工智能与日渐成熟的机器人零部件供应体系,显然让“机器人走入普通家庭为大众服务”的进程得到了加速。(本文首发钛媒体App,作者/邓剑云,编辑/钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这个工作简直是机器人和人工智能的悲哀,应用和技术都没有太多创新
不知道几时可以大规模量产
本质上用了一个六自由度机构取代了过去三自由度机构系统,把原本简单的问题复杂化了,就只能用一些模仿学习来拔高身价
等什么?上链接啊!
据说,团队将软,硬件已全部开源? 机器臂的时代真的来了…
这种不行,本质是过拟合,换一个厨房就不行,或者厨房放点菜可能就不行了,不能做到真正的智能,只是一预设行为