0%

data

Market-1501

参考链接http://blog.fangchengjin.cn/reid-market-1501.html
https://github.com/RSL-NEU/person-reid-benchmark

  • 6个摄像头
  • 1501个人,其中751个人、12936张图片用于训练,750个人、19732张图片用于测试,
  • 3368张查询图片

目录说明

  • bounding_box_test
    • 19732张测试图片
    • 0000_c1s1_000151_01.jpg
    • 前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
    • DPM检测出的
    • gallery样本
  • bounding_box_train
    • 12936张训练图片
    • 0002_c1s1_000451_03.jpg
    • train样本
  • query
    • 3368张图片,与test的750人对应 但是是人工绘制的 与bounding_box_test中的图片略微有所不同 与gt_bbox中的图片是一样的
    • 0001_c1s1_001051_00.jpg
    • 为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
    • query样本
  • gt_bbox
    • 25259张图片 手工绘制 包含1501个行人
    • 0001_c1s1_001051_00.jpg
    • 手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box
  • gt_query 是对3368张图片的查询图片的判定,好坏,
    • 0001_c1s1_001051_00_good.mat
    • matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)

命名规则

以 0001_c1s1_000151_01.jpg 为例
1) 0001 表示每个人的标签编号,从0001到1501;
2) c1 表示第一个摄像头(camera1),共有6个摄像头;
3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
5) 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

DukeMTMC-reID

DukeMTMC是多目标多摄像机行人跟踪数据集,8个摄像头,2700多个人物,DukeMTMC-reID是DukeMTMC的行人重识别子集,并且提供了人工标注的bounding box。
从视频中每 120 帧采样一张图像,得到了 36,411 张图像。一共有 1,404 个人出现在大于两个摄像头下,有 408 个人 (distractor ID) 只出现在一个摄像头下


目录结构

  • bounding_box_test
    • 0002_c1_f0044158.jpg
    • 用于测试集的 702 人
    • 包含 17,661 张图像(随机采样,702 ID + 408 distractor ID)
  • bounding_box_train
    • 0001_c2_f0046182.jpg
    • 用于训练集的 702 人
    • 包含 16,522 张图像(随机采样)
  • query
    • 0005_c2_f0046985.jpg
    • 为测试集中的 702 人在每个摄像头中随机选择一张图像作为 query,共有 2,228 张图像


命名规则

0001_c2_f0046182.jpg
1) 0001 表示每个人的标签编号;
2) c2 表示来自第二个摄像头(camera2),共有 8 个摄像头;
3) f0046182 表示来自第二个摄像头的第 46182 帧。


CUHK03

CUHK03是第一个足以进行深度学习的大规模行人重识别数据集,该数据集的图像采集于香港中文大学(CUHK)校园。数据以”cuhk-03.mat”的 MAT 文件格式存储,含有 1467 个不同的人物,由 5 对摄像头采集。
参考链接http://blog.fangchengjin.cn/reid-cuhk03.html


目录结构

  • detected - 5 * 1 cell 由机器标注,每个 cell 中包含一对摄像头组采集的照片,每个摄像头组由 M x 10 cells 组成,M 为行人索引,前 5 列和后 5 列分别来自同一组的不同摄像头。cell 内每个元素为一幅 H x W x 3 的行人框图像(uint8 数据类型),个别图像可能空缺,为空集。
    • 843*10 cell 摄像头组pair 1
    • 440*10 cell 摄像头组pair 2
    • 77*10 cell 摄像头组pair 3
    • 58*10 cell 摄像头组pair 4
    • 49*10 cell摄像头组pair 5
  • labeled - 5 * 1 cell 行人框由人工标注,格式和内容和”detected”相同。
    • 843*10 cell
    • 440*10 cell
    • 77*10 cell
    • 58*10 cell
    • 49*10 cell
  • testsets - 20*1 cell 测试协议,由 20 个 100 x 2 double 类型矩阵组成 (重复二十次)
    • 100*2 double matrix 100 行代表 100 个测试样本,第 1 列为摄像头 pair 索引,第 2 列为行人索引