Unrolled GAN의 경우, GAN이 가지는 실제 데이터 분포의 여러 mode 중 하나의 mode에만 과하게 치중되는 현상을 보완하고자 등장한 방법인 것 같습니다.
그런데, generator에서 데이터 분포의 하나의 모드에만 집중되어 z 샘플링의 x space로의 매핑되는 문제가
어떻게 discriminator의 값을 kth step까지 바꿔준다고 해결되는 건지 잘 이해가 되지 않습니다.
모드 collapse의 문제가 어떻게 optimal한 discriminator를 찾아주면 해결되는 건가요??
덧붙여, surrogate function에서의 \theta_D의 경우, SGD의 파라미터 update과정에서 -lr이 아닌 +lr로 그 부분만 바뀌는 것처럼 보이는데,
이렇게 부여하면 기존의 \theta_D에 GD*lr만큼 더해지는 걸로 봐도 되는 걸까요?
optimal discriminator의 파라미터를 도출하는 과정에서 이처럼 정의할 수 있는 근거는 뭔가요??
comment