DAVIS, Youtube-VOS
1. DAVIS
数据集
DAVIS:
davis2016:单目标或者连着的多个目标,train:30个视频,val:20个视频
davis2017:多目标分割,train:60个视频,val:30个视频
davis2017:无监督和半监督
davis只给了训练集的数据和真值、验证集的数据和真值、测试集的数据。
可以在验证集上给出评估结果,测试集的结果需要上官网评测。
指标:
Region Similarity $\mathcal{J}$
$\mathcal{J}=\frac{M\cap G}{M\cup G}$
Contour Accuracy $\mathcal{F}$
$\mathcal{F}=\frac{2P_c R_c}{P_c+R_c}$
$P_c = \frac{fg_boundary*gt_dil}{np.sum(fg_boundary)}$
$R_c = \frac{gt_boundary*fg_dil}{np.sum(gt_boundary)}$
mean:一个序列所有帧(半监督VOS给出的第一帧,即groundtruth帧忽略) J \mathcal{J} J值加起来求算数平均,最终结果是所有序列的平均值。越高越好
Recall:仅统计一个序列 J \mathcal{J} J值超过一定阈值(如0.5)的帧,加起来求算数平均,最终结果是所有序列的平均值。越高越好
decay:前四分之一的$\mathcal{J}$值的平均值(半监督VOS忽略groundtruth帧)减去后四分之一 $\mathcal{J}$的平均值,越低越好。
Temporal stability $\mathcal{T}$:官方给的代码没有实现,在davis2017中已经弃用。
mean:均值,越低越好
speed
方法
自 2016 年以来使用的两种主要方法:MaskTrack 和 OSVOS.
|方法|||