关于连续域的图像生成问题——LSC-GAN

（Image-to-image问题）

1.Motivation

当前I2I工作主要在离散域上进行操作（如CycleGAN、StarGAN），而缺少对连续域的研究，不同域之间的相关性常常被忽略，生成图像的多样性不佳，而实际上，标签映射的特定属性往往不是分散的，它们往往被描述为一个连续的数值。本文旨在建立一个模型，实现图像的连续域之间的转换。

StarGANv2的基础上进行

图3-1 LSC-GAN流程
（我的一些理解：）

图a：表示两种图像生成的方式，label-based与reference-based。其中s代表样式代码(style code)，与域的风格有关。生成器G则根据s与输入图像进行训练，style code会有参数共享。
图b：yt表示一个连续域的一部分，yi与yj不重叠，yt通过一个多分支网络结构F学习到域中心的特征，也就是ct，代表yt这个域区间内最普遍的特征，ct与R输入M中，即学习label-based图像生成对应的样式sl；ct与reference image输入E中，即学习reference-based图像生成对应样式sr。
图c：Y与O代表两个模块，分别学习相反过程的域的特征的转换，输入和输出均为code，也就是图b由F学到的ct。
生成器：就是一个Auto-encoder，用AdaIN的方式将style code输入到G中。
判别器：判断图像来源于哪一个域，区分图像是否真实。

总的来说，文章的创新点在于连续域的提出，并且大部分工作在于域的特征的一些提取与处理，以更好地得到图像的多样性。

首先定义：

$\overrightarrow{c}_{t}=\mathrm{O}^{y_{t}-y_{i}}\left(c_{i}\right) \quad \overleftarrow{c}_{t}=\mathrm{Y}^{y_{i}-y_{t}}\left(c_{i}\right)$

连续域一致性：
$L_{c d c}=\left\{\begin{array}{ll} \left|c_{t}-\vec{c}_{t}\right| & y_{t}-y_{i}>0 \\ \left|c_{t}-\overleftarrow{c}_{t}\right| & y_{t}-y_{i}<0 \\ 0 & y_{t}-y_{i}=0 \end{array}\right.$
三元组损失：
$L_{t a m}=\left\{\begin{array}{ll} \max _{j}\left(d\left(\vec{c}_{t}, c_{t}\right)-d\left(\vec{c}_{t}, c_{j}\right)+m, 0\right) & y_{t}-y_{i}>0 \\ \max _{j}\left(d\left(\overleftarrow{c}_{t}, c_{t}\right)-d\left(\overleftarrow{c}_{t}, c_{j}\right)+m, 0\right) & y_{t}-y_{i}<0 \\ 0 & y_{t}-y_{i}=0 \end{array}\right.$
Cycle连续一致损失：
$L_{c c c}=\left\{\begin{array}{ll} \left|c_{i}-\mathrm{Y}^{y_{t}-y_{i}}\left(\vec{c}_{t}\right)\right| & y_{t}-y_{i}>0 \\ \left|c_{i}-\mathrm{O}^{y_{i}-y_{t}}\left(\overleftarrow{c}_{t}\right)\right| & y_{t}-y_{i}<0 \\ 0 & y_{t}-y_{i}=0 \end{array}\right.$
总体优化函数：
$\begin{array}{l} L_{\mathrm{EDG}}=L_{S t a r} \\ L_{\mathrm{FMYO}}=L_{S t a r}+\lambda_{c d c} L_{c d c}+\lambda_{t a m} L_{t a m}+\lambda_{c c c} L_{c c c} \end{array}$

Daily Note

GAN I2I