로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 개론 II

임시 이미지 KAIST 산업및시스템공학과 문일철 교수
http://kooc.kaist.ac.kr/machinelearning2__17/forum/75204
좋아요 1110 수강생 5461

안녕하세요.

1. parameter inference라는게 무엇인지 모르겠습니다. MLE, EM알고리즘 등 parameter를 구하는 것은 전부다 parameter inference라고 하는건가요?

2. 본 장의 주요 목적이 무엇인지 잘 모르겠습니다.

2-1. EM 알고리즘을 사용할 수도 있는데 왜 다른 방법을 쓰는지, 즉 차이가 무엇인지 잘 모르겠습니다. PRML 10장 근사추정에서는 Z에 대한 사후확률분포 P(Z|X)를 계산하기 어려운 경우가 많으므로 이를 근사적으로 해결해야하며, MCMC등을 쓴다고 나와있는데 이 내용이 본 질문과 연관된 내용일까요?

2-2. PRML에서 나온 내용이 맞다면, parameter를 근사하기 위해 본 샘플링기반의 기법들을 쓰는 것일텐데, 본 교제에서 베이지안 네트워크의 확률을 이미 다 알고있는데, 이를 저희가 다시 구하는 이유는 무엇인가요? 즉, 'Z에 대한 확률분포를 구하기 위해 이러한 sampling을 진행한다'로 저는 이해를 했는데, 이런 샘플링을 진행하기 위해서는 어차피 파라미터에 대한 정보를 알고 있어야 샘플링이 가능한거아닌가요? 그렇다면 왜 파라미터에 대한 정보를 그대로 쓰지 않는지, 이를 통해 다시 inference하는게 어떤 의미가 있는지 궁금합니다.

2-3. 5 page 역시 마찬가지입니다. 파이나 뮤 등은 저희가 이미 알고있는데 (GMM을 통해 학습), 이를 다시 구하는 이유가 무엇인가요? EM알고리즘을 통해 얻어낸 파라미터를 통해 분포를 그리는것과 무엇이 다른가요?