揭秘人形机器人“学校”:一个动作练习5万次,骨骼之上塑“血肉”

  澎湃新闻   2025-04-04 12:20:43

机器人能爬山、自己系围巾、领跑马拉松……今年以来,你有没有被人形机器人的“酷炫”一次次刷新认知?

2025年7月,位于上海张江模力社区的国家地方共建人形机器人创新中心具身智能训练场(以下简称国地中心)将正式投入运行,这是全国首个异构人形机器人训练场,也是国内人形机器人种类最多的地方。

近日,澎湃新闻记者实地探访国地中心,这里聚集了10余家企业,有着百余台人形机器人和类人形机器人,但实际的训练景象并不像想象中那样“酷炫”——不管是人还是机器人,多数时候看似重复一个训练动作,细节不同、日夜操练。

工作人员调试展厅中的人形机器人。澎湃新闻记者 张呈君 摄

“对于人形机器人来说,一个动作练习5万次,这个动作才不是独立的数据,而是机器人学会‘思考’的开始,或者说‘蝶变’的开始。”国地中心市场体系总监杨正叶告诉记者,如果说过去业内实现了人形机器人“骨骼骨架”的活化,那么今年,随着越来越多的“开源”以及上下游产业的实质加入,“在骨骼上增加血肉,可能今年会有一个很大的突破”。

“一个动作,一名采集员每天要做600次”

走进国地中心,首先映入眼帘的,是数据采集员坐在电脑面前,两手交替训练机器人做抓的动作,电脑屏幕上,一个虚拟的人形机器人双臂“复刻”数据采集员的动作,不断练习如何“抓”。

数据采集员训练机器人做“抓”的动作。澎湃新闻记者 张呈君 摄

生成数据、采集数据、扩增数据、分析数据,是国地中心最基础的工作。“一个动作,一名采集员每天要做600次。”采集员告诉澎湃新闻记者,对人类而言,“抓”这个动作很简单,但对机器人学习而言,“抓”的物体的大小形状、放置角度等,哪怕有微小的不同,都会生成不同的数据。

国地中心总经理许彬介绍,该中心的建设旨在牵引和促进人形机器人行业的发展,解决行业内的一些共性问题,包括共性技术的研发、生态的构建、典型产品的开发、重大应用场景的落地等。“你可以理解为这里是做AI的基础设施。”许彬说,自2025年1月21日投入试用以来,国地中心具身智能训练场成为全国首个异构人形机器人训练场,是眼下国内人形机器人种类最多的地方。

所谓“异构人形机器人”,指的是具有不同结构和功能模块的人形机器人。许彬进一步解释道,由不同厂家研发的人形机器人,其关节的数量、电机的功耗性能等都不尽相同,“不同的机器人生成不同的数据,它是没有泛用性的。我们之所以组建异构人形机器人训练场,是为了让规模化的数据集可以共享共用,为整个产业赋能。”

人形机器人正在进行足球“训练”。澎湃新闻记者 张呈君 摄

澎湃新闻记者看到,在面积约5000平方米的训练场里,有至少10家企业、100多台大小不一的机器人同时进行着不同场景、不同工种的训练,主要聚焦十大场景,包括工业、家庭生活、旅游服务等——分解为具体的动作,就是叠衣服、取物搬物、货架整理、危险场景大型仪器的清理等。在这里,不管是人还是机器人,每天都在练习:抓拿取放、清洁洞眼,即便是趣味性最强的踢足球机器人,也是在两个机器人“对战”的场景中练习前跑、后退、卧倒,后翻起身,进球后振臂……

“每一个数据都是不一样的,当一个动作练习5万次时,同一类型就有了泛化能力。”杨正叶说,以上文提到的“抓”为例,让机器人去“抓”一个此前没有见过的物体,比如一袋感冒冲剂,它会首先从数据库中寻找匹配的抓取方式,如果数据库中的抓法不行,再去调用其他的抓取方式。这时候,就是机器人自己在定义“感冒冲剂”的类型,并将抓取成功的数据录入数据库。从这一步开始,机器人的学习和自我更新能力就会呈几何倍增长。

杨正叶透露,严格来说,训练基地目前还在调试、整改,一天约能生产2万-3万条数据。待到整改结束,预计今年7月将完全投入使用,届时一天约能产生5万条数据,预计年内就能突破1000万条真机数据的收集。

正在接受“训练”的机器人。澎湃新闻记者邹娟 摄

“以后还会形成一个数据交易的平台。比如有的厂商有家电场景的数据,别的厂商有临床康养的数据,双方采集的数据进行交换,就能减少重复投入,效率就大大提升。”杨正叶说,这些异构机器人的训练数据,还会同时“喂料”形成一个通用的具身智能大模型。未来在这个“超级大脑”的指挥下,不同厂商、不同形态的机器人能够高效协作、共同升级。

用智能适应环境,而不是让环境适应机器

4月1日, 2025上海长江半程马拉松近日在上海崇明岛鸣枪,经过升级的青龙人形机器人成为“流量担当”,不仅在开跑时领跑,在颁奖仪式上挥手致意获奖选手,还在展台区与观众进行了互动。

出现在2025上海长江半程马拉松现场的青龙人形机器人。“上海经信委”微信公众号 图

青龙机器人的出生也自带“流量”:全球首台全尺寸通用人形机器人公版机“青龙”在2024世界人工智能大会上亮相,它身高185厘米,体重80千克,因高度拟人的躯干设计和高颜值,在外观上与人类“形似”。它有43个主动自由度的仿生构型,能够以1米/秒的速度快速行走,并具备抗冲击干扰等高机动能力。此外,依托“朱雀”具身大脑和“玄武”小脑模型,它可以支持快速行走、敏捷避障、稳健上下坡和抗冲击干扰等四大运动功能,在智能和行为上与人类“神似”。

但在外再“高光”,回到训练基地的“青龙”同样逃不过不断“重复”的学习,进行数据采集工作。“全尺寸的机器人,意味着它开发的难度更大。我们现在的机器人都是电控的,最大的瓶颈就是电机的功率。”杨正叶解释道,体格越大、重量越大,对电机的负荷就越大。同时,小型机器人的数据要迁移到全尺寸机器人上,也会产生很多技术问题。

国家和地方共建人形机器人创新中心,展厅内的人形机器人。澎湃新闻记者 张呈君 摄

全尺寸通用人形机器人研发的初衷,便是代替人“打工”,比如重体力活、危险场景等。“我们研究它的核心诉求,是想通过具身智能的算法,研究出一个类似于人的肢体,它具备泛化的技能,当它要解决一些问题的时候,不再需要让环境来适应机器,而是可以用智能适应环境。也因为此,青龙机器人都是按照人的姿态形体设计。”杨正叶说。

此外,“青龙”不仅是一款人形机器人,还是一款开源机器人。开源,意味着很多机器人研发团队可以更快入门,从没有接触过应用开发到使用应用,缩短完成算法研究的过程。杨正叶表示,也希望这些分布在各个行业的企业,能够逐步把行业相关的技术迁移到机器人分析身上,加快机器人的发展步伐。

国地中心总经理许彬表示,从这个角度来说,“青龙”是国家队在造机器人,它给全国的人形机器人做一个基础的底座,共性技术的参考和支撑,核心目标是赋能整个人形机器人产业的发展。

骨骼之上塑“血肉”

杨正叶所说的“开源”,正在实现。

3月21日,国地中心联合上海大学、清华大学,共同发布具身智能仿真平台“格物”。作为一款面向未来机器人研发的高性能仿真环境, “格物”采用了模型自动化适配、自适应课程学习、前馈引导的强化学习、虚实贯通和在线学习等关键技术;支持行走、奔跑、跳跃等多模式运动,还能够进行极限化测试。

“正是前面无数次的重复和数据集的不断生成,使得现在要开发一款新机器人,完全不用从婴儿期一点一点开始。我们把现有的关于走跑跳抓取等技能都预置在了‘技能库’里,导入后,机器人的仿真‘发育’速度将变得非常快。新的研究在底座的基础上再进行二次开发,成本会节约很多,起点也会高很多。”杨正叶说。

数据采集员训练机器人。 澎湃新闻记者邹娟 摄

2025年,也被誉为人形机器人量产的元年。随着DeepSeek的发布,机器人大模型“大脑”的训练成本、推理成本都大幅降低,这让研发人员看到了人形机器人发展更多的可能。

“今年明显感觉到,进入这个行业上下游的企业在迅速增多。”杨正叶分享称,他近日正和一家做传感器的公司在洽谈,“虽然之前大家也都很关注人形机器人的信息,但更多仅仅是关注,还没有聚焦他们的技术研发。人形机器人关联的行业众多,有了行业聚焦和技术资金的投入,才会有更多新突破。”

“过去我们让人形机器人走了起来,相当于它有了活的骨骼骨架,怎么来丰富框架?在骨骼上面增加血肉,可能今年会有一个很大的突破。”杨正叶说。

白浪 设计

责编:周秋红

一审:胡泽汇

二审:唐能

三审:赵雨杉

来源:澎湃新闻

我要问