教学

杨殿阁教授团队与集成电路学院任天令教授团队在Nature子刊合作发表高水平研究成果,助力解决自动驾驶长尾场景难题

随着自动驾驶技术不断走向落地实战,车辆在真实路况中常遭遇极端天气、拥堵的道路、复杂交叉路口等边缘场景,这类长尾问题对感知系统的实时性、适应性与能效提出了极高要求。现有基于传统架构的感知系统往往难以兼顾响应速度与动态调整能力,亟需在信息处理范式层面实现突破。


图1. 注意力启发器件结构;适应性时空信息处理流程;利用注意力数值,动态调整时间和空间信息的响应强度

图2. 注意力启发器件在各计算模式下的特性曲线

车辆国重团队在强化学习领域取得重要进展

近日,清华大学智能绿色车辆与交通全国重点实验室李克强院士、李升波教授团队在强化学习算法设计领域取得重要进展。团队针对工业对象的智能决策与控制需求,推出了DSAC(Distributional Soft Actor Critic)系列强化学习算法,解决了已有方法值函数学习不准、策略性能低下的难题,并于典型基准测试任务中取得了国际领先的SOTA性能。第一代DSAC算法发表于IEEE Transactions on Neural Networks and Learning Systems(2022),第二代发表于IEEE Transactions on Pattern Analysis and Machine Intelligence(2025)。