【网通社快报】英伟达发布全开源物理AI大模型Cosmos3，支持多模态生成并显著缩短训练周期

汽车 > 汽车资讯 > 正文

【网通社快报】英伟达发布全开源物理AI大模型Cosmos3，支持多模态生成并显著缩短训练周期

网通社

下载客户端
独家抢先看

2026年06月01日 14:23:00 来自北京

英伟达于6月1日发布Cosmos3，一款面向物理人工智能的开放世界基础大模型。该模型采用混合Transformer架构，结合推理Transformer与专精生成类Transformer，基于包含数十亿条文本、图像、视频、音效及动作轨迹样本的多模态物理AI数据集训练而成。Cosmos3原生支持文本、图像、视频、环境音效和动作内容的理解与生成，具备业界领先的物理仿真精度，可将物理AI的训练与评估周期从数月缩短至数日。在主流物理AI评测基准中，其世界生成精度、动作策略能力和视觉理解能力均位列第一。该模型提供多个版本：Cosmos3Super适用于机器人与自动驾驶模型的二次训练；Cosmos3Nano可在数秒内完成高质量视频解析与动作推理；主打边缘端实时推理的Cosmos3Edge即将上线。英伟达同时发起宇宙联盟（CosmosCoalition），联合全球世界模型研发团队与AI开发者，共同推进下一代世界模型技术发展。开发者可将Cosmos3作为多模态图文大模型、世界模型/视频基础模型或世界动作模型的主干网络使用。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

【网通社快报】英伟达发布全开源物理AI大模型Cosmos3，支持多模态生成并显著缩短训练周期

亲爱的凤凰网用户:

第三方浏览器推荐: