随着自动驾驶的快速发展,现代交通系统即将迎来不同等级的智能网联汽车与传统人类驾驶汽车长期共存的混合交通发展阶段。近日,清华大学车辆国重李克强院士团队与厦门大学郭景华团队合作共同为网联自动驾驶系统的发展和推广提供了一种可扩展、通用的解决方案。
网联自动驾驶下混合交通带来了多种挑战。传统人类驾驶汽车受人类驾驶行为影响,其行为具有高度不可预测性,直接影响混合交通流的稳定性与运行效率。此外,C-V2X 无线通信固有的随机时延和数据丢包等特征会显著降低智能网联汽车的控制精度,导致车速匹配偏差或车距失控。这些问题叠加导致混合车辆队列的道路通行能力、能耗效率与行驶安全性难以协同提升,成为制约网联自动驾驶系统从技术研发走向实际落地的瓶颈。
为解决上述问题,研究团队基于“车-路-云”系统提出了一种通信延迟下知识引导型自学习混合车辆队列控制框架。云计算平台作为智能网联汽车“神经中枢”,提供高性能计算资源,并支持复杂控制算法的实时决策,通过弹性存储空间存储多个神经网络模型,实现模型快速加载与调用。自学习混合车辆队列控制框架将混合交通场景划分为多个通用的“CV-HVs-CV”结构,有效降低系统复杂度。此外,该控制框架不仅考虑了传统人类驾驶汽车的不可预测行为,而且能适应交通场景和随机通信延迟的变化,增强了混合车辆队列系统在不同场景下的自主性、稳定性和鲁棒性,填补了现有技术在复杂混合交通场景下的空白。

图1 基于车-路-云的混合车辆队列控制框架

图2 知识引导型自学习控制框架的算法流程
图3 随机通信时延下混合车辆队列性能指标

图4 人类驾驶汽车存在换道行为时混合车辆队列的位置响应曲线 (a-c为CVDS-IDM控制的响应曲线;d-f 为DDPG控制的响应曲线;g-i 为PPO控制的响应曲线;j-l为本文提出控制构架的响应曲线。)
团队创新性地构建知识-机器学习集成形式,将运动波模型和Newell跟驰模型的物理模型知识和多车通信拓扑结构融入混合车辆队列的自学习控制过程,提升了模型的泛化能力、可解释性和可信度。针对通信时延难题,扩展SAC的状态表征维度,将历史时刻的控制指令纳入SAC的状态表示中,建立动态控制模型切换机制,实现了随机通信时延下混合车辆队列的强鲁棒、高可靠控制。
研究团队开展了随机通信时延波动、CV渗透率变化、车辆换道/汇入场景等多种复杂工况的系列测试验证与分析,结果表明,该研究提出的控制框架在交通稳定性、驾驶舒适性、能源消耗以及交通波动抑制等四大核心性能指标方面均优于现有方法,实现车辆换道、汇入/驶出场景零碰撞,为车-路-云一体化技术规模化落地提供充分的性能支撑。
相关成果以“通信时延下知识引导型自学习混合车辆队列控制框架”(Knowledge-guided self-learning control strategy for mixed vehicle platoons with delays)为题,于8月19日发表于《自然·通讯》(Nature Communications) 上。
该研究由清华大学车辆国重与厦门大学共同完成,厦门大学王靖瑶副教授为论文第一作者,中国工程院院士、清华大学车辆国重李克强教授与厦门大学郭景华副教授为论文的共同通讯作者。该研究得到国家自然科学基金委、科技部等的支持。
论文链接
复制链接至浏览器或点击“阅读原文”访问:https://www.nature.com/articles/s41467-025-62597-x



