潜空间规划中,梯度下降优化器频繁失效——它陷入高度非凸的损失曲面,无法找到可行路径。

《Temporal Straightening for Latent Planning》Y Wang, O Bounou, G Zhou, R Balestriero… (2026)


潜空间规划中,梯度下降优化器频繁失效——它陷入高度非凸的损失曲面,无法找到可行路径。根源在于预训练视觉编码器(如DINOv2)产生的潜轨迹极度弯曲,导致欧氏距离与真实测地距离严重脱节,梯度信号因此失去方向性。

本文的核心洞见是:把潜空间的几何曲率问题看作优化条件数问题。由此,在训练时对相邻潜状态速度向量施加余弦相似度惩罚这一关键操作,迫使编码器学出局部线性的轨迹流形——理论上可将规划Hessian的条件数从随视界指数爆炸压缩至近线性增长,梯度下降因此得以稳定收敛。

这项工作真正留下的遗产是:表示空间的几何形状是潜规划的一等公民,而非事后调优项。它为后来者打开的新门是:用轻量级曲率正则替代昂贵的搜索算法(CEM/MPPI),使梯度规划在目标到达任务上成功率提升20–60%。但尚未跨过的门槛是:理论保证仅在线性动力学下严格成立,长视界规划中预测误差的累积漂移问题仍悬而未决。

arxiv.org/abs/2603.12231

##






















































分类