一文多图搞懂KITTI检测数据集下载使用(附网盘链接)
文章目录
- 前言
- 1 下载
- 2 说明
- 2.1 devkit_object
- 2.2 data_object_calib
- 2.3 data_object_label_2
- 2.4 data_object_image_2
- 2.5 data_object_velodyne
- 3 使用
- 相关传送门
前言
KITTI 是自动驾驶领域最著名的数据集,本文不做科普,只讲干货!!!话不多说,进入正题,看完本文,你将得到网盘下载地址,数据集使用说明,足够你复现别人的工作,进而开展自己的工作!
1 下载
如下图,大家根据自己工作的需要,自行选择要下载的内容,别急,马上送上网盘链接
本文的最大福利来啦,以上数据集的网盘链接分享给大家,拿走不谢,好心人点个赞即可。
链接:https://pan.baidu.com/s/1oc1hzIEer3MNeV6gHR2OTA
提取码:qifd
2 说明
本节给大家解读一下我们下载的数据。
2.1 devkit_object
目录结构如下
devkit_object ├── cpp ├── mapping ├── matlab └── readme.txt这是 KITTI 官方提供的开发套件以及使用说明,本文将取其精华,去其糟粕。
2.2 data_object_calib
目录结构如下
data_object_calib ├── testing │ └── calib └── training└── calib这些文件夹分别存放着训练集以及测试集每个样本的标定数据,其中测试集7518个,训练集7481个。
每个样本的标定文件如下图所示,此处坐标系转换理论详见【点云处理】坐标系转换。
官方的 readme 也给出了说明:
To project a point from Velodyne coordinates into the left color image,
you can use this formula: x = P2 * R0_rect * Tr_velo_to_cam * y
For the right color image: x = P3 * R0_rect * Tr_velo_to_cam * y
显然,从雷达坐标系转到 2 号相机坐标系用到了 R(3x3的旋转矩阵) 以及 T(3x1的平移矩阵)。
2.3 data_object_label_2
目录结构如下
data_object_label_2 ├── training└── label_2这是标注文件,是的,你没看错,只有训练集的标注,没有测试集的,原因你懂的。
下图是某样本的标注文件,这里具体含义官方也给了说明:
注意:这里的 DontCare 标签代表没有标注的目标,原因可能是距离太远已经超出激光雷达的检测范围了,没有意义。此外,在 2D 与 3D Detection Benchmark 中只针对 Car,Pedestrain, Cyclist 这三类。
2.4 data_object_image_2
目录结构如下
data_object_image_2 |── testing │ └── image_2 └── training └── image_2这是 RGB 数据,分为测试集与训练集。
2.5 data_object_velodyne
这是激光雷达点云数据,点云数据被保存为二进制文件,每个点包含 3 个坐标和反射率信息,即 (x,y,z,r)。
3 使用
这必须依据你的工作需要,合理安排数据组织形式,这里提供一个 3D 检测工作 F-PointNet 的数据组织形式。
data/kitti ├── testing │ ├── calib │ ├── image_2 │ └── velodyne └── training├── calib├── image_2├── label_2└── velodyne相关传送门
计算机视觉工程师的万里长征路(附完整学习资料)
陌生人,祝你数据集玩得愉快,效果都是 SOTA,点个赞再走呗。
总结
以上是生活随笔为你收集整理的一文多图搞懂KITTI检测数据集下载使用(附网盘链接)的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 麻省理工科技评论:AI预言的七宗罪(上)
- 下一篇: 官宣!麻省理工学院官方线上课程之机器学习