VLA自动驾驶范式可以分成基于模仿学习和基于模拟器强化学习两类基于模仿学习的VLA自动驾驶范式(上图a所示)优势:可以借助VLM模型出色的视觉信息及关联语义对复杂场景进行理解和分析,完成自动驾驶中的感知及决策任务劣势:驾驶场景复杂多样,模仿学习易受限于数据集中所记录的行为,难以应对未录入数据集的新状况或特殊情形基于模拟器强化学习的VLA自动驾驶范式(上图b所示)优势:与仅能复制专家行为的模仿学习不同,强化学习使模型能够在模拟器的反馈循环中主动探索驾驶行为,并通过不断迭代优化,最终生成更安全、更稳定、更舒适的驾驶轨迹劣势:仿真环境虽然可以尽可能地模拟真实世界,但两者之间仍然存在差异。导致模型在模...