로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 심화3

임시 이미지 KAIST 산업및시스템공학과 문일철 교수님
http://kooc.kaist.ac.kr/aiml-adv3/forum/136311
좋아요 119 수강생 520

Unrolled GAN의 경우, GAN이 가지는 실제 데이터 분포의 여러 mode 중 하나의 mode에만 과하게 치중되는 현상을 보완하고자 등장한 방법인 것 같습니다.

그런데, generator에서 데이터 분포의 하나의 모드에만 집중되어 z 샘플링의 x space로의 매핑되는 문제가

어떻게 discriminator의 값을 kth step까지 바꿔준다고 해결되는 건지 잘 이해가 되지 않습니다.

모드 collapse의 문제가 어떻게 optimal한 discriminator를 찾아주면 해결되는 건가요??


덧붙여, surrogate function에서의 \theta_D의 경우, SGD의 파라미터 update과정에서 -lr이 아닌 +lr로 그 부분만 바뀌는 것처럼 보이는데, 

이렇게 부여하면 기존의 \theta_D에 GD*lr만큼 더해지는 걸로 봐도 되는 걸까요? 

optimal discriminator의 파라미터를 도출하는 과정에서 이처럼 정의할 수 있는 근거는 뭔가요??