跳转至

ALITA: 用于自动驾驶的大规模增量数据集

0. 引言

位置识别与闭环检测是自动驾驶系统中的关键任务,但现有方法基本都是在特定场景下进行评估,这样很难评价现有方法在大规模、长期、变视角环境下的准确性、鲁棒性和泛化能力,即很难判断其在实际应用中的性能。而收集符合要求的实际大规模场景数据集需要复杂、昂贵以及能够长期运行的采集平台,本文将为大家分享一个用于自动驾驶的大规模增量数据集,该数据集可以用于实际场景的性能评估。数据集,以及用于数据处理和本地评估的 Python-API 已经开源。

1. 论文信息

标题:ALITA: A Large-scale Incremental Dataset for Long-term Autonomy

作者:Peng Yin, Shiqi Zhao, Ruohai Ge, Ivan Cisneros, Ruijie Fu, Ji Zhang, Howie Choset, Sebastian Scherer

来源:2022 Robotics

原文链接:https://arxiv.org/abs/2205.10737

数据集链接:https://github.com/MetaSLAM/ALITA

2. 摘要

对于长期自动驾驶,大多数位置识别方法主要是在简化场景或模拟数据集上进行评估,这不能为评估当前同时定位和地图创建 (SLAM) 的就绪性提供坚实的证据。在本文中,我们提出了一个长期位置识别数据集,用于大规模动态环境下的移动定位。该数据集包括一个校园尺度的轨迹和一个城市尺度的轨迹: 1)校园轨迹关注长期属性,我们在 10 个轨迹上记录激光雷达设备和全景相机,每个轨迹在不同照明条件下重复记录 8 次。2)城市轨道聚焦于大范围的属性,我们将激光雷达设备安装在车辆上,穿越 120 公里的轨迹,包括开放的街道、居民区、自然地形等。它们包括 200 小时的城市环境中各种场景的原始数据。在每个轨迹上提供两个轨迹的地面真实位置,这是从全球定位系统获得的,具有附加的基于一般 ICP 的点云细化。为了简化评估过程,我们还使用 Python-API 提供了一组地点识别指标,用于快速加载数据集并评估不同方法的识别性能。该数据集旨在寻找具有高位置识别准确性和鲁棒性的方法,并为真正的机器人系统提供长期自主性。

3. 数据集分析

作者提出了一个用于大规模环境下长期位置识别的数据集 iData,数据集的目标是长期定位这一挑战任务,该数据集包含两个轨迹分支:

1 城市数据集,它记录了城市尺度中总共 50 条车辆轨迹和 120 公里轨迹的激光雷达数据输入,每个轨迹至少在一个交叉点与其他轨迹重叠,并且在数据集中有 158 个重叠。采集地点位于宾夕法尼亚州匹兹堡市。

2 校园数据集,分别在不同的照明和视点下,在 10 个不同的轨迹上收集了 8 次重复的全景视觉输入和激光雷达输入,全长约 36 公里。采集地点位于卡耐基梅隆大学 (CMU) 校园区域。

图 1 所示是数据集的可视化结果,表 1 所示是不同数据集的比较结果。

图 1 iDATA 数据集

包括使用 Velodyne-16 和 Xsens MTI-300 IMU 采集的城市和校园数据集。城市数据集包含 5 个区域 (以绿色、黄色、红色、纱色和蓝色着色),涵盖街区、住宅区、公园和商业建筑。校园数据集以紫色显示,涵盖了卡内基梅隆大学的主校区

表 1 不同地图合并方法的比较

P-Cam 代表针孔摄像机,360Cam 代表全景摄像机。Temporal 表示数据记录的时间窗口,Perspective 表示视点是固定还是变化

大多数数据集都是针对短期、固定条件或视点位置识别任务,难以评估在现实世界中长期、大规模应用中的定位性能。与现有数据集相比,作者提出的城市数据集覆盖了大规模变化的 3D 场景,并且可以应用于不同视点差异下的评估,涵盖了长期动态对象、照明和视点差异。作者提出的城市和校园数据集都为准确的位置识别提供了事实依据,有助于对不同方法进行评估。此外,该城市数据集已在 ICRA 2022 中使用 General Place Recognition Competition 对当前新的 3D 位置识别方法进行基准测试。

4. 采集平台

4.1 硬件设置

作者的数据采集平台包含一台 Velodyne-16 激光雷达扫描仪、Xsens MTI-300 惯性测量单元和一台 Nvidia Jetson TX2 板载计算机。对于城市数据集,作者将平台安装在移动车辆的顶部,并与 GNSS 定位系统同步运行,以记录城市规模环境的地面真实位置。如图 2 所示是作者用于校园数据集采集的平台,基础平台与城市数据集相同。此外,作者在激光雷达设备的顶部安装额外的全景相机和实感 VIO 设备 (T265),进而提供时间同步的激光雷达输入和 360° 全景视觉输入。

图 2 数据采集平台

4.2 数据集格式

作者提出的城市数据集由 4 种类型的数据组成,主要描述如下:

1 全局地图:全局地图被处理以包含以点云数据 (PCD) 文件格式提供的每个轨迹的 3D 结构。

2 轨迹:每个轨迹主要通过 LOAM 生成并通过交互式 SLAM 进行优化,文件格式为 TXT。

3 子地图:每个全局地图沿着对应的轨迹分成若干子地图,一个子地图的大小为 50m*50m,每两个子地图之间的距离约为 2m。子地图数据以点云数据 (PCD) 文件格式提供。

4 真实位姿:对于每个子地图,相应的真实位姿包含位置和姿态信息。作者使用 NumPy 进行数据处理,并以标准二进制 (NPY) 文件格式提供。

作者提出的校园数据集由 4 种类型的数据组成,主要描述如下:

1 全局地图:全局地图被处理以包含以点云数据 (PCD) 文件格式提供的每个轨迹的 3D 结构。

2 里程计:里程计由壤 LOAM 生成并以 TXT 文件格式提供。

3 相对里程计:相对里程计由交互式 SLAM 处理,以生成其他序列相对于参考序列的相对位置。该数据以 TXT 文件格式提供。

4 全景图片:对于里程计中的每一帧位姿,相应的全景图片以 PNG 文件格式提供。

5. 总结

在 2022 Robotics 论文 "ALITA: A Large-scale Incremental Dataset for Long-term Autonomy" 中,作者提出了 iDATA 数据集,旨在实现大规模环境下的长期位置识别任务。该数据集将有助于处理光照和视点变化的位置识别研究,以及基于激光雷达图像 (全景) 融合的机器人研究。此外,由于提出的 iDATA 数据集在轨迹之间提供了丰富的重叠,该数据集也可用于地图合并系统。


本文总阅读量96