
据 Z Finance 获悉,在公共具身灵敏操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games(以下简称Benjie's Olympics)中,来自中国的企业星动纪元凭借自研VLA具身模子,一举斩获该赛事剥橘子、开锁、翻袜子三项任务公共第一。
这不仅是中国企业初次在该赛事中登顶,更要津的是,它在三项中枢任务中,以显耀上风打败了被誉为"公共最强具身大脑公司之一"的Physical Intelligence(简称PI)。要知说念,此前各项具身智能赛事中PI身影的出现并非主动参与了赛事,而是第三方拿PI开源模子打的收成,而本次Benjie's Olympics是PI惟一参与的具身赛事,参赛模子为最新闭源模子PI*0.6,亦然具身智能范畴公认的最强模子。
伸开剩余85%星动纪元与PI在剥橘子、开锁、翻袜子任务中的收成对比
具身灵敏操作奥林匹克,公共最难的具身赛事
Benjie's Olympics由前Google资深机器东说念主内行Benjie Holson发起,初心是无情真的能揣摸机器东说念主中枢价值的评判体系——即“炫技饰演” 走向 “实用落地”。该比赛被科学好意思国东说念主杂志(Scientific American)以为是机器东说念主终极挑战,直击具身智能的中枢命题——莫拉维克悖论:东说念主类习以为常的平日感知与动作(如叠衣裳、用钥匙开锁等),对机器东说念主而言是极高难度的挑战。
赛事按难度等第分为金牌任务、银牌任务和铜牌任务,唯有每项任务获取第一,才能摘得对应的奖牌。赛事汇聚了PI 、Sunday Robotics等公共顶尖具身智能公司,这亦然PI惟一主动参与的赛事,其参赛所用的闭源模子(π*0.6),代表了PI大脑智力的最高水准,赛事驱散响应了面前具身智能范畴的最高水平。
三项任务大幅卓越 PI,刷新公共第一记录
近期,Benjie's Olympics认真晓谕星动纪元在剥橘子、开锁、翻袜子三大中枢任务中,均以显耀上风卓越前记录保捏者PI。
Benjie's Olympics公布, 星动纪元获两项金牌难度任务(剥橘子、开锁)第一
Benjie's Olympics公布,星动纪元获银牌难度任务(翻袜子)第一
剥橘子(金牌难度任务):「首个无器用纯手剥,比PI 速率快35%」
任务难点:要求机器东说念主精确分袂果皮与果肉的轻飘视觉特征,及时追踪剥制经过中的果皮形变,要求视觉感知有极高的鲁棒性。
PI 收成:借助削皮刀器用,2分46秒完成。
星动纪元收成:首个罢了通盘无器用纯手剥操作的团队,纯手剥1分47秒完成,速率莳植35%。
任务难点:要求机器东说念主精确分袂果皮与果肉的轻飘视觉特征,及时追踪剥制经过中的果皮形变,要求视觉感知有极高的鲁棒性。
PI 收成:借助削皮刀器用,2分46秒完成。
星动纪元收成:首个罢了通盘无器用纯手剥操作的团队,纯手剥1分47秒完成,速率莳植35%。
开锁(金牌难度任务):「比PI 速率快25%」
PI 收成:66秒完成
星动纪元收成:49秒完成,速率莳植25%
PI 收成:66秒完成
星动纪元收成:49秒完成,速率莳植25%
翻袜子(银牌难度任务):「比PI 样本量少32%,速率快30%」
任务难点:行为锻真金不怕火模子家用泛化智力的中枢标杆,该任务是柔性物体操作、样本泛化、效用明锐的典型场景,袜子翻转经过中会发生复杂、无规章的形变,开云体育app要求机器东说念主及时追踪形变,精确分袂袜子的表里侧、启齿位置,对视觉感知、柔性物体追踪智力要求极高。
PI 收成:1分33秒完成,176个样本
星动纪元收成:比PI速率莳植30%,120个样本,样本使用量少32%
任务难点:行为锻真金不怕火模子家用泛化智力的中枢标杆,该任务是柔性物体操作、样本泛化、效用明锐的典型场景,袜子翻转经过中会发生复杂、无规章的形变,要求机器东说念主及时追踪形变,精确分袂袜子的表里侧、启齿位置,对视觉感知、柔性物体追踪智力要求极高。
PI 收成:1分33秒完成,176个样本
星动纪元收成:比PI速率莳植30%,120个样本,样本使用量少32%
这次,星动纪元行为惟一上榜的中国具身智能企业,在Benjie's Olympics中斩获三项任务公共第一并刷新宇宙记录,这亦然星动纪元在具身模子智力上的又一紧迫效用。
星动纪元,具身智能界的张雪飞车
2月底,星动纪元陈建宇团队才活着界模子巨擘测评WorldArena榜单中卓越谷歌、英伟达斩获具身任务公共第一。
衔尾这次,星动纪元1个月拿下4项公共第一,若是长期追踪星动纪元,说一句具身智能界的 “张雪飞车”不为过。两者齐是:长期冬眠、本领打底、低调深耕、须臾爆发、碾压海外一线、以中国力量登顶公共。
在这之前,星动纪元的具身大脑在盘考范式、本领引颈和愚弄落地上一经取得:
中国惟一,公共1/4:ERA-42已罢了全尺寸东说念主形机器东说念主全身及五指灵敏手精确禁止;其余三个为Figure Helix,特斯拉Grok及英伟达GR00T。
公共首提分频VLA:2024年9月, 推出HiRT快慢分层架构,通过latent向量相连70亿参数宇宙模子与4000万参数本质模子;2024年10月到2025年3月,PI、Figure、Google、NVIDIA 接踵发布分频VLA。
公共首个会通宇宙模子的具身大脑:2024年12月,发布会通宇宙模子的VLA算法框架VPP(Video Prediction Policy,现已开源),将具身智能可用数据膨胀至海量互联网视频数据,机器东说念主得以意会“物理宇宙”,边念念边作念。
2025年10月,清华陈建宇团队衔尾斯坦福Chelsea Finn团队(PI联创)无情可控生成宇宙模子 “Ctrl-World” —— 让机器东说念主在 “念念象空间” 中完成任务预演、政策评估与自我迭代,将机器东说念主在生疏场景下流任务平均见效用莳植了44.7%。
2026年2月,清华陈建宇(星动纪元创举东说念主)团队和斯坦福Chelsea Finn(PI 创举东说念主) 团队基于Ctrl-World (两个团队的首个互助效用),再度联袂,衔尾无情了VLAW 框架,初次罢了了VLA 政策与动作要求宇宙模子的协同迭代优化,让两者造成一个「彼此促进的闭环」:
VLA 政策集聚的真实交互数据,反过来用于莳植宇宙模子的物理保真度;
宇宙模子生成的高质料杜撰数据开云体育app,再用于捏续强化VLA 政策自身。
VLA 政策集聚的真实交互数据,反过来用于莳植宇宙模子的物理保真度;
宇宙模子生成的高质料杜撰数据,再用于捏续强化VLA 政策自身。
发布于:浙江省雅博体育app下载中国官网入口