感觉最近的每天都在见证历史,上海现在也开始全面放开了,很多高校都已经开始遣返了。小伙伴们都回到家了吗?
上周周末太懒了,就没有更新论文,今天周一来补上。
这篇文章讲的就是基于本监督方法来学习表情识别。我们先总体概括一下:我们希望深度学习模型具有很好的嵌入表示能力,因此我们训练一个WideResNet模型,其嵌入层后直接连接全连接层进行分类。
类心的计算可以看做是嵌入向量取平均。我们希望样本嵌入在训练过程中向特征空间(嵌入)中相应的类中心移动,因此引入中心损失,其定义如下:
但是该损失有局限性,可能会出现多个类心重叠的情况,且可能会使得模型学习到一些偏差,而我们希望某个类中的样本嵌入离自己的类心近,离其他类心远,因此我们提出一种归一化嵌入,通过支持对归属类质心的小距离和对其他类质心的大距离来修改损失。
定义如下:
采用模糊C均值算法的方法
为了防止网络记忆数据,我们正则化训练权重衰减(即惩罚模型参数的L2范数)。此外,在上一阶段,还提出几种提高效率的技术
Classical data augmentation
数据增强就是传统的数据增强
Label guessing
Sharpening
MixUP
完整的算法流程如下:
下面是一些结果展示