【网通社快报】小米开源XiaomiOneVL框架，统一VLA与世界模型实现自动驾驶推理速度与精度突破

汽车 > 汽车资讯 > 正文

【网通社快报】小米开源XiaomiOneVL框架，统一VLA与世界模型实现自动驾驶推理速度与精度突破

网通社

下载客户端
独家抢先看

2026年05月13日 17:34:00 来自北京

5月13日，小米正式发布并开源XiaomiOneVL一步式潜空间语言视觉推理框架。该框架首次将视觉语言动作（VLA）、世界模型和潜空间推理等技术路线统一于同一架构中，在自动驾驶领域的感知、推理与规划任务中实现性能提升。XiaomiOneVL在ROADWork、Impromptu和Alpamayo-R1三项主流基准上达到当前最优（SOTA）水平，并在NAVSIM基准上表现优异。其推理精度超越显式思维链（CoT）方法，推理速度与“仅答案”预测的潜空间CoT方案相当。该框架支持语言与视觉双维度可解释性，可同时以文字说明决策原因并以预测画面展示未来场景。小米已开源XiaomiOneVL的模型权重、训练与推理代码，并公开技术报告及项目主页供业界使用。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

关闭

亲爱的凤凰网用户:

您当前使用的浏览器版本过低，导致网站不能正常访问，建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器下载

360安全浏览器下载