Chen et al. - 2021 - Jigsaw Clustering for Unsupervised Visual Representation Learning

2022/08/24 posted in 笔记
Tags: #Unsupervised

About

Jigsaw Clustering for Unsupervised Visual Representation Learning

基于拼图聚类的无监督视觉表征学习

CVPR 2021 Oral

Pengguang Chen：香港中文大学

Shu Liu：香港中文大学Ph.D / Smartmore思谋科技

Jiaya Jia*：香港中文大学科学技术学院教授 / 微软亚洲研究所（香港）/ Smartmore思谋科技

香港中文大学、 Smartmore思谋科技

特征提取：可以为任意特征提取框架

以ResNet-50为例，其特征图为7x7
解耦模块（无参）：将提取出的特征分成 \(n \times m \times m\) 条，对应图像的patches

通过双线性插值（bilinear interpolation）将特征图补成8x8大小

然后使用平均池化来降采样特征图得到 \(n \times m \times m\) 条维度为 \(\hat{c}\) 的向量
MLP：用于聚类任务

将每条向量嵌入长度为c的两层多层感知机
FC：用于定位

同时使用一个全连接层作为分类器来得到 logits

对比实验（linear evaluation）
- 拼图任务：JigPuz
- 聚类方法：DeepCluster、SeLa
- 对抗学习：SimCLR、MoCo
半监督学习
- 1%标签 / 10%标签
迁移学习
- 目标检测：[COCO]
- 图像分类：[CIFAR-10\CIFAR100]

：我们的方法训练的模型可以在训练过程中以单批方式学习图像内和图像间的信息。我们的方法在很大程度上超过了以前的单批方法，并且只用一半的训练批次就取得了与双批方法相当的结果。我们的方法自然适用于其他任务。

：我们的工作表明，耐人寻味的是，单批方法有可能与双批方法持平，甚至超过双批方法。我们相信这条路线值得进一步研究。可以预期会有新的应用。