北京大学查红彬:基于数据流处理的SLAM技术

嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。

 

 

人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会,百度为支持单位,读芯术、PaperWeekly为合作自媒体。“AI未来说·青年学术论坛”第七期“自动驾驶”专场已于2019年7月22日下午在中科院举行。北京大学查红彬教授为大家带来报告《基于数据流处理的SLAM技术》。

 

查红彬,北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、三维物体识别等方面取得了一系列成果。出版学术期刊及国际会议论文300多篇,其中包括IEEET- PAMI,IJCV, IEEE T-VCG, IEEE T-RA, IEEE T-SMC,ACM T-IST, JMLR, PR 等国际期刊以及ICCV,ECCV, CVPR, CHI, ICML,AAAI,ICRA等国际学术会议论文90余篇。

 

报告内容:近年来,随着自动驾驶、机器人导航与移动终端传感计算等应用的快速发展,SLAM(Simultaneous Localization and Mapping:即时定位与地图构建)技术再度成为计算机视觉与虚拟现实领域的研究热点。传统的SLAM技术充分利用多视点几何与SfM(Structure from Motion)等领域的高效算法,并通过与深度传感器、惯性传感器等下一代传感设备的数据融合,在传感器轨迹计算精度与三维场景重建质量方面取得了显著的进步。但在实际应用中,仍存在重建误差积累严重、计算成本高昂等问题,影响了机器系统的在线响应速度以及对复杂环境的自适应能力。针对这些问题,我们应最大限度地利用传感数据的时空一致性与三维地图的几何不变性,在现有多视点几何计算的基础上,强化SLAM算法的系统性与泛化能力,进一步改善其基本性能。该报告的主要内容包括:(1)引入数据流计算的基本概念,充分挖掘密集采样传感数据内在的时空连续性,以加强SLAM算法的预测能力;(2)构建基于时域变化的增量算法,并利用地图全局特征的约束以及传感数据的实时反馈作用,实现传感器轨迹的高效计算与三维地图的递进式构建;(3)尝试各类机器学习算法在SLAM问题中的应用,以探讨建立自监督SLAM在线学习技术的新途径。

 

基于数据流处理的SLAM技术

 

查红彬老师首先介绍了移动传感器中的定位(Location)和地图构建(Mapping)两大任务,定位是关于传感器运动轨迹求解的问题,地图构建是关于环境在线三维重建的问题。两者之间紧密耦合、相辅相成、是移动视觉系统的基础。

 

接着讲了SLAM研究的发展史:SLAM(as a new idea proposed, 1986) → mono-SLAM (Monocular SLAM, 2007) → MSCKF (Multi-State Constraint Kalman Filter, 2011) → LSD-SLAM (Large-Scale Direct Monocular SLAM, 2013) → ORB-SLAM (Oriented FAST and Rotated BRIEF SLAM, Graph-based visual SLAM, 2016) → DSO (Direct Sparse Odometry, 2018)。由SLAM的发展史,可以看出其发展趋势:从更好地使用多视点间的显式几何关系,到融合不同传感器的性能。现有的系统在特定环境中能取得较好的结果。

 

然后介绍了当前SLAM存在的一些问题:1)很少关注时间连续性,如轻视SLAM固有的时空连续性,因而造成了系统累积误差大以及特征跟踪鲁棒性差等问题;2)过度依赖于像素的对应关系,没有很好地使用结构化的约束信息,纹理缺失情况下性能很差;3)重复和冗余的计算量大,对于硬件的要求很高。由此导致了SLAM算法的许多系统性问题:1)需要精心设计的手工干预和特别的策略;2)需要使用各种优化方法以应对不同的实际条件;3)对于不同的场景泛化能力很差。

 

紧接着讲解了基于数据流的SLAM的工作过程:从流(Flow)到预测(Predictor),再到地图构建(Mapping),最后到学习(Learning),并通过具体案例进行了详细讲解。传感器数据流具有以下特点:1)序列数据的运动连续性;2)输入数据时空一致性的显式表达;3)遵循物理规律的常规模式;4)使不可预测的状态变化变得可预测。预测器是高性能SLAM系统的引擎,它是一个迭代式的状态推理过程:一个生成式模型。同时,地图是环境空间的一个不变量表达方式,能为SLAM系统的预测提供正则化约束。因此,机器学习方法是一个系统的解决方案,在学习的过程中,既可以使用监督学习的途径来实现参数的优化与估计,更重要的是可以利用自监督学习和在线学习方法,构建一个增量式的SLAM学习系统。

 

最后,查红彬老师介绍了自己团队所研究的与SLAM相关的方法,如:动态模型方法(Dynamics Model)、基于线流方法(Line Flow)、循环神经网络学习方法(RNN Learning)以及基于概率的地图表达方法(Probabilistic Map Representation)等,其相关工作的研究目标是实现SLAM的非监督在线学习。更多精彩内容请关注视频分享。

收藏 评论(0)
分享到: