汽车 > 汽车资讯 > 正文

【网通社快报】小米发布XiaomiOneVL自动驾驶框架并开源代码

网通社

下载客户端
独家抢先看

2026年05月13日 20:44:00 来自北京

小米近日发布XiaomiOneVL，该框架为一步式潜空间语言视觉推理系统，首次在行业内统一了视觉语言动作模型（VLA）、世界模型和潜空间推理等技术路线。XiaomiOneVL通过“语言推理+视觉未来预测”的双重监督机制，将可解释性与对未来场景的预测能力整合进潜空间推理过程，在推理精度上超越显式思维链（CoT）方法，同时在推理速度上与仅输出答案的潜空间CoT方案相当。该框架基于三项关键技术：模型使用“内部语言”进行思考、具备预测未来画面的能力、并将整个推理过程压缩至单步完成，旨在提升自动驾驶系统对当前场景及未来时空因果关系的理解能力，以支持更高质量的决策。小米已全面开源XiaomiOneVL的模型权重及训练、推理代码，向全球开发者和研究人员开放，以促进自动驾驶大模型的技术迭代与发展。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

【网通社快报】小米发布XiaomiOneVL自动驾驶框架并开源代码

亲爱的凤凰网用户:

第三方浏览器推荐: