光流 | 从像素位移到语义理解:光流算法研究综述

张开发
2026/4/18 20:20:18 15 分钟阅读

分享文章

光流 | 从像素位移到语义理解:光流算法研究综述
文章目录摘要1 引言2 光流问题的数学基础2.1 光流基本方程与孔径问题2.2 问题的数学本质3 传统光流算法3.1 变分法:Horn-Schunck算法3.2 局部微分法:Lucas-Kanade算法3.3 其他传统方法及性能对比4 基于深度学习的光流算法4.1 范式转换:从手工设计到端到端学习4.2 奠基之作:FlowNet与FlowNet 2.04.3 经典框架:PWC-Net4.4 范式革新:RAFT及其影响5 最新研究进展(2025-2026)5.1 退化感知光流:扩散模型的引入5.2 事件相机光流:超越传统帧率极限5.3 面向鲁棒性的基准与框架6 数据集与评估方法6.1 主流光流数据集6.2 新兴基准与评估趋势6.3 评价指标体系7 应用场景8 挑战与展望9 结语参考文献发表于2026年4月18日,四川摘要光流估计作为计算机视觉领域的基础性底层任务,通过计算连续帧间像素的位移场为高级视觉理解提供关键的运动信息。本文系统梳理了光流算法从经典变分方法到深度学习范式的发展脉络,重点分析了以Horn-Schunck和Lucas-Kanade为代表的传统方法的理论基础与局限性,以及以FlowNet、PWC-Net和RAFT为里程碑的深度学习方法的演进逻辑。研究表明,深度学习通过端到端特征学习和迭代优化机制,在Sintel、KITTI等主流基准上实现了相对于传统方法30%以上的精度提升,但仍在运动模糊、大位移、遮挡和真实世界退化等场景中面临严峻挑战。近年来,基于扩散模型的退化感知光流、事件相机光流等新范式正在重新定义这一领域的研究边界。本文进一步梳理了光流评估体系与主流数据集,总结了自动驾驶、视频分析、流体测量等典型应用场景,并对未来发展方向进行了展望。关键词:光流估计;深度学习;RAFT;事件相机;计算机视觉1 引言光流(Optical Flow)描述了三维空间中的物体运动在二维图像平面上的投影,是理解动态场景中“什么在运动”以及“如何运动”的核心视觉信息。Gibson于1950年首次提出了光流的概念框架,但直到1981年Horn和Schunck提出第一个可计算密集光流场的变分框架后,这一理论才真正走向实用。光流计算之所以重要,在于它为大量中高层视觉任务提供了不可替代的底层输入:在运动分割中,光流是区分前景运动物体与静态背景的关键依据;在三维重建中,光流携带了恢复场景深度结构的几何约束;在目标跟踪和动作识别中,光流提供

更多文章