Weekly-211114

本文最后更新于：November 14, 2021 pm

本周学习汇报

DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort(CVPR2021oral)^[1]

EditGAN: High-Precision Semantic Image Editing(NeurlPS2021)^[2]

分支限界法与堆排序的大作业

1. DatasetGAN:标注图像的生成

1.1 Motivation

现如今深度学习网络模型需要大量的数据标注；
对语义分割任务而言，数据标注耗时严重；
目的：通过少数标记的样本生成大量高质量的标注数据集。

标注数据生成模型：使用大量标注数据对模型进行训练，如StyleGAN。而本文则利用少量人工标注样本去生成高质量语义标签。
半监督学习：可用于对数据集的扩充。常用的adversarial loss只学习生成图像的语义而没有探索图像本身的语义。依赖卷积和残差结构的decoder，将中间层的特征映射到一个segmentation map，而本文则直接对解缠的特征向量(styleGAN)进行直接解释，逐像素进行操作。
对比学习：使用对抗损失，测量样本对之间的相似度，学习图像的特征表示空间。本文用GAN特征图的语义信息，代替对比损失。

1.3 Method

图1-1 DatasetGAN整体流程

图1-2 DatasetGAN网络结构

方法重点：获得高维latent space的语义信息；
应用：语义分割、关键点预测；

1.4 Result

图1-3 DatasetGAN实验结果

2. EditGAN:高精度语义图像编辑

2.1 Motivation

其他研究：大多数基于GAN的图像编辑方法通常需要用于训练的语义分割标注的大规模数据集，并且仅提供高级控制，或仅在不同图像之间进行插值。
本文目的：提供高质量、高精度的语义图像编辑，允许用户修改一些细节来对图像进行编辑。

图像编辑：基于GAN的图像编辑方法*6，详见论文页3。
GAN与潜空间图像映射：DatasetGAN与SemanticGAN的半监督学习。

2.3 Method

图2-1 EditGAN整体流程

图2-2 EditGAN的latent space编辑

Background：StyleGAN2；
方法重点：侧重于encoder与优化器的设计，使图像在GAN的潜空间内更好地得到编辑；

2.4 Result

图2-3 DatasetGAN实验结果

3. 其他

工程数学：矩阵的满秩分解、正交三角分解、奇异值分解、极分解、谱分解；
网络安全：Hash函数的应用，消息认证与数字签名；
高级算法分析：近似算法与多项式近似方案，0/1背包问题的大作业；
高级机器学习：特征选择与稀疏学习；
高级人机交互技术： Increasing Electrical Muscle Stimulation’s Dexterity by means of Back of the Hand Actuation；
科技论文写作(蹭课)：IMRAD、论文类型、写作技巧、写作工具等；

4. 下周计划

阅读NeurlPS的几篇论文。
准备人机交互与网络安全的论文的课堂展示。
继续阅读相关论文及代码。

参考：

Weekly Note

GAN semantic task

Weekly-211121 Previous

hexo博客的图表及ppt嵌入 Next

本周学习汇报

1. DatasetGAN:标注图像的生成

1.1 Motivation

1.2 Related Work

1.3 Method

1.4 Result

2. EditGAN:高精度语义图像编辑

2.1 Motivation

2.2 Related Work

2.3 Method

2.4 Result

3. 其他

4. 下周计划

参考：