近日,具身智能领域接连传出两则引人注目的消息:国内初创公司千寻智能(SpiritAI)自主研发的具身基座模型Spiritv1.6,在被誉为“具身智能奥林匹克”的RoboArena评测中夺得全球第一,同时公司完成15亿元A+轮融资,三个月内累计融资近50亿元。这两大里程碑折射出当前具身智能赛道的几个关键趋势。
RoboArena由UCBerkeley、斯坦福大学和英伟达等联合发起,其创新之处在于摒弃了传统单一实验室的封闭评测,转而采用,全球分布式硬件网络——在数十所高校的标准机器人平台上进行跨环境测试;双盲A/B对决,评测员不知晓模型来源,仅依据实际任务表现打分;动态Elo评级,借鉴竞技体育算法,强调真实环境中的泛化能力而非静态指标。
在这一高门槛、高透明度的评测体系下,Spiritv1.6综合得分位列全球第一,超越了英伟达Cosmos3和PhysicalIntelligence的Pi0.5。这是中国具身模型首次在该榜单中登顶,标志着国内团队在多任务泛化、真实物理环境操作等核心能力上已具备国际领先水平。
从公开对比视频看,Spiritv1.6在翻盖、精细抓取、多步骤连续任务中表现出更完整的动作闭环和更强的环境适应性。这背后是千寻智能对算法工程化和模型迭代节奏的极致把控——从Spiritv1.5到v1.6,半年内完成两次跨越式升级,展现了系统化、工业化研发范式的优势。
数据基础设施成为核心竞争力:百万小时真实交互筑起护城河具身智能的泛化能力高度依赖于高质量、大规模的真实世界交互数据。千寻智能在2026年将累积100万小时级的真实操作数据,涵盖长尾场景和多模态样本。这种“数据金字塔”式的基础设施,为Spiritv1.6提供了持续燃料,也成为其区别于多数仍依赖仿真或小样本训练的竞争对手的关键壁垒。
行业共识正在形成:算法创新固然重要,但如果没有足够的数据密度和场景纯度,模型在真实环境中的鲁棒性将大打折扣。千寻智能在数据采集、标注和回流机制上的重投入,正体现出对具身智能“数据驱动”本质的深刻理解。
千寻智能通过与行业大厂的深度协作,快速跑通了“场景沉淀数据、数据迭代模型、模型反哺产业”的闭环。这种模式的核心优势在于:每一次商业部署都产生真实世界的操作数据,反哺模型升级;模型能力的提升又拓展了可落地的任务复杂度,形成正向飞轮;先发合作伙伴关系构筑了生态壁垒,后续竞争者难以快速复制。
回顾过去两年,具身智能赛道经历了从算法demo到仿真评测,再到真实世界竞技的演进。下一阶段的竞争将围绕以下维度展开:模型泛化能力,能否在未见过的环境、物体、任务中稳定执行;数据基础设施,是否拥有规模化、高质量的真实交互数据采集与回流能力;商业化落地速度,能否在有限场景中率先创造经济价值,形成自我造血;资本与产业资源整合,融资不仅是资金,更是场景、渠道和生态位的绑定。
具身智能的国际竞争正在从“论文竞赛”转向“真实世界比武”,而中国团队已在这场新奥林匹克中占据一席之地。未来12个月,随着更多模型发布和商业订单落地,具身智能赛道的马太效应或将进一步加剧。(王珊珊)
客户端
媒体矩阵
企业邮箱