在台北GTC大会期间,英伟达发布了Cosmos 3——全球首个完全开源的全能物理AI世界模型,能够以领先精度原生理解和生成文本、图像、视频、环境声音和动作。
为什么重要
过去Cosmos系列由多个专用模型整合而成,需分别运行才能完成推理、生成、动作流程。Cosmos 3基于Transformer混合架构,首次解决了物理AI的根本挑战:在训练数据有限、仿真堆栈分散的条件下,让机器人和自动驾驶汽车也能在现实世界稳定工作。英伟达CEO黄仁勋表示,得益于多模态推理语言、视觉和世界模型的突破,物理AI的爆发式增长指日可待,Cosmos 3将使开发者在构建机器人和自动驾驶汽车方面实现代际飞跃。
核心数据
世界生成准确率在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench测试中均排名第一;动作策略方面在RoboLab和RoboArena测试中排名第一。训练和评估周期从数月缩短到数天。
后续布局
英伟达宣布推出Isaac GR00T人形机器人参考设计,2026年底由宇树推出,也将与美欧韩人形机器人制造商合作。用户名单包括思灵机器人、斗山机器人、LG电子、三星、Skild AI、理想汽车等。同时成立Cosmos联盟,成员包括思灵机器人、德国黑森林实验室、Runway、Skild AI等,旨在推进下一代世界模型发展。
券商认为,物理AI对应制造与物流产业重塑空间约50万亿美元,市场规模基准6万亿美元,当前仍面临数据成本高、物理定律难等挑战,世界模型和空间智能将为其提供感知和认知三维世界的基座。
编注:信源为财联社热门报道,材料侧重产品发布与技术性能数据,提及券商估算市场规模但未涉及具体公司业绩。