


作者|一休
出品|汽车大观
AI浪潮正在深度重塑智能电动汽车的产品形态和用户体验——这一点,在本届北京车展上体现得尤为明显。
展厅里最热闹的不再是哪台车外观更帅,而是谁家的智驾能应对更复杂的物理场景、谁家的座舱能真正帮你把事情办了、谁家的架构把座舱和智驾融合在了一颗芯片上。
物理AI、小龙虾Claw Agent、舱驾融合——这三条线,串起了2026北京车展最值得看的技术前沿。
物理AI,平息VLA、WA之争
2024年,头部车企集体上车端到端方案,当时遵循的核心路线是模仿学习——让神经网络直接从海量驾驶数据中学习“输入图像→输出轨迹”。其优势很直接:省掉规则模块、端到端一体化、数据驱动迭代快,但问题同样明显:传统端到端系统本质上是一个黑箱映射,知其然而不知其所以然,只知道“训练数据里这么开的”,而不知道“为什么要这么开”。其结果就是见过的场景能处理,没见过的长尾场景泛化能力很差——面对训练集之外的复杂情况,端到端只能靠概率猜了。
针对端到端的推理短板,2025年行业分化出两大方向——VLA和世界行为模型。VLA在大语言模型基础上引入多模态能力和动作输出,对复杂场景的理解能力远超传统端到端模型,但VLA对三维空间几何和物理运动规律的隐式物理推理仍然薄弱。世界行为模型跳过语言中间层,直接在三维空间做建模和预测,对空间关系和运动预测有天然优势,但其场景语义理解不如VLA——因为它更擅长底层物理推演(“物体会怎么动”),而缺乏高层语义推理与社会规则理解(“应该怎么反应”)。
VLA缺物理直觉的深度,世界模型缺语义理解的广度,各自只填补了端到端的一部分短板。2026年北京车展前后涌现的物理AI方案,其核心价值正是将这两条路径的优势融合,志在全面打通迈向Road AGI的路。
北京车展上,一众智驾方案供应商纷纷发布物理AI上车的消息,并非是在强蹭AI圈的概念,而是旨在以“物理AI”这一主线,平息VLA与世界行为模型孰优孰劣的争论。VLA和世界行为模型都是手段,而非目的,真正的目的在于,克服自动驾驶系统在真实物理世界中稳定、安全、实时、舒适、高效运行的真正挑战。
物理AI的核心动作,不是沿VLA或世界行为模型单线深挖,而是把两者的优势融合。它的核心特征,是在决策链中同时融入对语义规则的逻辑理解与对物理规律的因果推演:VLA提供“红灯停、礼让行人”的社会常识与高层推理,世界行为模型提供“减速多少能平稳停下、湿滑路面刹车距离会延长”的物理直觉。两者协同,让系统不仅知道“该怎么做”,更理解“为什么这样做可行”。
本届北京车展成了物理AI方案的集中展示场。轻舟智航发布了基于“世界模型+强化学习”架构的物理AI模型,宣布战略重心全面转向通用物理AI。卓驭科技展示了其面向高阶智驾的物理AI解决方案,宣布要“智能一切移动”。
千里科技凭借AI技术全栈加持,带来了超高含模量的物理AI方案G-ASD 4.0,具备面向L4级的高等级自动驾驶能力。
大家同时强调“物理AI”,说明这不是一家之言,而是行业共识。当自动驾驶的竞争从比拼数据驱动的“模仿”能力,升维至构建对物理世界的“内在理解”时,行业的游戏规则已经被重写了。
自动驾驶通过物理AI给“大脑”升级物理世界理解及推理能力的同时,座舱侧也在经历一次深刻的形态升级——这次变化的远不止交互方式,更是整个服务供给与组织的逻辑。
座舱,变身小龙虾
过去几年,座舱最大的变化是人机交互方式的跃迁——从触屏点击进化到语音对话、手势控制的自然交互,大模型的加入让座舱终于能听懂人话了。但是,服务的供给方式却没有跟上交互的进化。用户依然需要面对一个个独立的App“信息孤岛”,像一个项目经理那样主动规划并主导流程,消耗宝贵的认知资源,在不同APP之间充当信息搬运工和流程调度员。
行业正在发生的转变,正是座舱功能形态从零散App堆叠,转向“任务拆解+服务编排”的Agent模式。在端云结合的全模态大模型听懂你的话、甚至结合车内视觉(如看到后排孩子睡着了)分析清楚您有什么需求后,后半段的服务编排与执行就由Claw Agent框架接手了:把“找一家适合家庭聚餐、附近有充电桩的餐厅”这样的诉求,拆解成查找餐厅、规划路线、查询充电桩状态等一系列原子操作,并调度对应的服务接口自动完成。
而且,过去,在没有Claw执行框架的情况下,座舱AI主要局限于车内闭环——控制车窗、空调、导航,本质上都是围绕车辆本身展开的服务。“小龙虾”这类Agent框架的意义在于把服务的边界打开了:点外卖、订餐厅、买电影票、查天气安排出行……座舱的能力边界从车内延伸到了车外。
这正是Claw Agent模式与App堆叠模式的根本差异:不仅提供一站式服务闭环,更将座舱的能力边界从车内延伸至车外,消费者们终于可以无缝连接移动互联网时代打造的各类丰富服务了。
北京车展,龙虾遍地,这注定不是一个玩家独占的赛道,而是多家入局、百花齐放的格局。除了地平线的KaKaClaw咖咖虾、中科创达的AquaClaw,更加值得一提的是BAT。
腾讯座舱智能体已全面覆盖日常通勤与导航、本地与长途出游、手车互联及娱乐休闲等高频出行场景;阿里巴巴聚焦于打通本地生活、支付与导航,构建车内消费与服务的完整闭环;火山引擎则凭借其Agentic AI架构,为座舱打造“感知-推理-执行-记忆-学习”一体化的汽车智能体方案,其豆包座舱助手方案已覆盖超700万辆量产车,成为座舱Agent化的重要推动力量。华为在乾崑技术发布会上展示了新一代小艺智能体,同样展现了超强的一站式主动场景服务能力。
虽然最终的座舱Agent未必会收敛到OpenClaw这种小龙虾的形态上,架构格局未定,但方向是明确的:座舱的下半场竞争,比的不再是谁的语音识别更准,而是谁能让Agent真正“办得成事”,且办得流畅、可靠。
不过,执行框架要真正跑起来,就必须能调用车辆的底层能力——而这些能力目前分散在座舱域和驾驶域两套独立架构里。座舱域和自动驾驶域之间,横亘着一道高墙,车企通过舱驾一体要拆的,就是这堵墙。
舱驾一体,不止省钱
在当前主流架构下,座舱域一颗芯片,驾驶域另一颗芯片——两套硬件、两套OS、两套硬件,两套软件栈,其代价是巨大的。首先是算力的浪费,两颗芯片各自留下了冗余,但算力峰值很少同时出现;其次是数据孤岛,智驾感知到的实时路况,座舱的SR界面需要经过复杂的跨域通信才能调用;最后是BOM成本的叠加,需要使用两颗芯片、两套外围电路、两套散热,车企的账越算越肉疼。
舱驾融合的本质,是将座舱和智驾统一到单个计算平台上(如地平线星空6P、黑芝麻武当C1296、高通SA8775P),通过硬件虚拟化和安全隔离技术,同时承载座舱、智驾任务,算力按实际负载动态分配。
这带来的不只是硬件成本的大幅优化(地平线称其星空方案可降低单车成本1500-4000元),更关键的是打开了实时协作的可能性。SR实景导航、语音直接控制驾驶行为、将自动驾驶作为一种基础能力嵌入各种场景里,这些在分离架构下“能做但不好做”的事情,在融合架构下变得简单多了,因为跨域数据通信从需要经过复杂网络传输,变成了在单芯片内部通过共享内存的超高速交换。
目前,高通、英伟达、TI、瑞萨、黑芝麻智能、联发科技等全球主流芯片企业都在抢滩舱驾融合。跨域融合SoC从算力层面奠定了基础,单SoC舱驾融合方案正从技术验证迈向规模化量产。高通的骁龙Ride Flex(SA8775P)方案已经通过极狐阿尔法T5等车型实现了量产上车,证明了技术路线的可行性。黑芝麻智能的武当C1296芯片也已在东风天元智舱Plus平台上实现量产,成为首个本土舱驾一体量产芯片。地平线也刚刚发布了面向舱驾融合的“星空”芯片,已获得十余家车企合作意向,并将于今年第三季度实现上车部署。
写在最后
本届北京车展的主题是“领时代 智未来”。这六个字,放在以前可能只是一句漂亮的slogan,但在2026年这个节点来看,更像是一个已然发生的事实描述。
物理AI让本土自动驾驶不再只是跟在特斯拉后面抄作业,而是开始在“世界模型+强化学习”的路线上定义自己的认知方向。小龙虾Claw Agent让座舱让座舱彻底告别了需要用户在多个割裂应用间手动操作、消耗宝贵注意力的旧模式,转而通过“复杂任务拆解+服务编排”,成为能主动搞定一连串事情的智能出行管家。
舱驾融合让中国芯片公司有了在高性能车规计算平台上与国际巨头同台叫板的底气,从跟随者变为定义者。
以前,是中国车企盯着国外的技术前沿努力追赶,现在,轮到海外同行来北京车展上观摩中国的方案了。技术创新的策源地,正在发生静默的迁移。棋至中盘,但这盘棋的执棋者,换了。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”