Weekly-211114

本文最后更新于:November 14, 2021 pm

本周学习汇报

DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort(CVPR2021oral)[1]
EditGAN: High-Precision Semantic Image Editing(NeurlPS2021)[2]
分支限界法与堆排序的大作业

1. DatasetGAN:标注图像的生成

1.1 Motivation

  • 现如今深度学习网络模型需要大量的数据标注;
  • 对语义分割任务而言,数据标注耗时严重;
  • 目的:通过少数标记的样本生成大量高质量的标注数据集。
  • 标注数据生成模型:使用大量标注数据对模型进行训练,如StyleGAN。而本文则利用少量人工标注样本去生成高质量语义标签。
  • 半监督学习:可用于对数据集的扩充。常用的adversarial loss只学习生成图像的语义而没有探索图像本身的语义。依赖卷积和残差结构的decoder,将中间层的特征映射到一个segmentation map,而本文则直接对解缠的特征向量(styleGAN)进行直接解释,逐像素进行操作。
  • 对比学习:使用对抗损失,测量样本对之间的相似度,学习图像的特征表示空间。本文用GAN特征图的语义信息,代替对比损失。

1.3 Method

图1-1 DatasetGAN整体流程

图1-2 DatasetGAN网络结构
  • 方法重点:获得高维latent space的语义信息;
  • 应用:语义分割、关键点预测;

1.4 Result

图1-3 DatasetGAN实验结果

2. EditGAN:高精度语义图像编辑

2.1 Motivation

  • 其他研究:大多数基于GAN的图像编辑方法通常需要用于训练的语义分割标注的大规模数据集,并且仅提供高级控制,或仅在不同图像之间进行插值。
  • 本文目的:提供高质量、高精度的语义图像编辑,允许用户修改一些细节来对图像进行编辑。
  • 图像编辑:基于GAN的图像编辑方法*6,详见论文页3。
  • GAN与潜空间图像映射:DatasetGAN与SemanticGAN的半监督学习。

2.3 Method

图2-1 EditGAN整体流程

图2-2 EditGAN的latent space编辑
  • Background:StyleGAN2;
  • 方法重点:侧重于encoder与优化器的设计,使图像在GAN的潜空间内更好地得到编辑;

2.4 Result

图2-3 DatasetGAN实验结果

3. 其他

  • 工程数学:矩阵的满秩分解、正交三角分解、奇异值分解、极分解、谱分解;
  • 网络安全:Hash函数的应用,消息认证与数字签名;
  • 高级算法分析:近似算法与多项式近似方案,0/1背包问题的大作业;
  • 高级机器学习:特征选择与稀疏学习;
  • 高级人机交互技术: Increasing Electrical Muscle Stimulation’s Dexterity by means of Back of the Hand Actuation;
  • 科技论文写作(蹭课):IMRAD、论文类型、写作技巧、写作工具等;

4. 下周计划

  1. 阅读NeurlPS的几篇论文。
  2. 准备人机交互与网络安全的论文的课堂展示。
  3. 继续阅读相关论文及代码。

参考: