- 课程回放
- 无监督行人重识别的研究背景
- 联合GAN和对比学习的无监督行人重识别框架GCL
- 利用行人间的对比编码减少伪标签干扰
- 行人重识别的未来展望
在行人重识别领域,大多高精度的行人重识别算法以有监督方法为主,而有监督行人重识别对带标签的数据集有很大程度的依赖。
当前,学术界最大的行人重识别数据集SYSU-30k约有3千万张图片,3万个行人身份类别,但由于该公开数据集获取图像的场景有限,即使利用SYSU-30k训练出来的模型仍无法泛化到大型无标签数据集和新领域。同时,标注如此海量的数据集耗费了巨大的人工成本和时间周期。因此,不依赖标注数据的无监督行人重识别方法受到了工业界和学术界越来越多的关注。
主流的无监督行人重识别方法主要分为3类:基于聚类的伪标签法、领域转换和基于跟踪的方法。其中:
第一类是基于聚类的伪标签法。这种方法首先用聚类算法对无标签的目标域图像特征进行聚类,从而生成伪标签,再用该伪标签监督神经网络在目标域上的学习。该方法的精度很大程度上与伪标签的质量有关,所以要尽可能保证伪标签的准确性。
第二类是领域转换法。这种方法是通过一个GAN模型,将目标域的风格转换到源域,利用源域的模型进行预测。但当源域和目标域的风格相差较大时,利用GAN进行风格迁移的效果会很差。
第三类基于跟踪的方法。这种方法需要一个较好的多目标跟踪模块,先在图像中运用多目标跟踪算法,提取到的每个被跟踪目标的轨迹,做一个单独的ID,之后再通过度量学习来训练模型。该方法理论上也依靠伪标签,只是这里的伪标签是通过跟踪得来的。
这些方法虽然有效,但都存在一些缺陷:要么严重依赖伪标签,要么对源域和目标域间的风格差异有需求,要么依赖于外部模块的准确性。在「目标检测与识别专题讲座」第3讲和第4讲中,智东西公开课邀请到法国国家信息与自动化研究所陈浩博士和悉尼大学唐诗翔博士,分别针对无监督行人重识别中的伪标签依赖问题和生成不准确问题进行探讨、讲解。
11月26日晚7点,陈浩博士将以主题为《基于对比学习的无监督行人重识别》,详细讲解2种基于对比学习的无监督行人重识别方法,这两种方法可以有效减少伪标签依赖,最后将对行人重识别未来发展给出自己的看法和思考。
陈浩是法国国家信息与自动化研究所在读博士,师从Francois Bremond教授。他本科毕业于武汉大学,博士期间主要围绕行人重识别进行无监督学习、无监督域适应、对比学习等方面的研究。