


小米于5月13日正式发布并开源自动驾驶模型XiaomiOneVL,该模型采用一步式潜空间语言视觉推理框架。小米创始人、董事长兼CEO雷军表示,XiaomiOneVL在业内首次通过潜空间推理,将视觉语言动作模型(VLA)与世界模型整合至同一套框架中。该模型在推理、规划等多个主流基准测试中,刷新了潜空间推理方法的性能上限。据官方介绍,XiaomiOneVL在融合XLA模型强大推理能力的基础上,显著提升了推理速度与精度。其潜空间推理方案在精度上优于显式思维链(CoT)方法,在速度上与“仅答案”预测的潜空间CoT方案相当。小米已全面开源XiaomiOneVL的模型权重及训练、推理代码,并开放技术报告、项目主页和代码仓库供全球开发者与研究人员使用。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”