로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 개론 II

임시 이미지 KAIST 산업및시스템공학과 문일철 교수
http://kooc.kaist.ac.kr/machinelearning2__17/forum/66442
좋아요 1110 수강생 5461

안녕하세요.

본 파트는 이전시간에 살펴본 확률분포의 parameter를 구하기 위해 MLE를 사용한 것으로 보이는데요. 근데, 가우시안이나 베르누이, 이항분포 등의 parameter를 구할 때는 Lagrange method를 사용하지 않았습니다. multinomial과 다른 분포의 차이가 무엇이기 때문에 이런 차이점을 보이는 것인가요?

그리고 clustering에 대한 전반적인 질문을 드리고 싶습니다.

1. clustering을 이용하여 labeling을 할 수 있을까요? 실제로 task를 하다보면 클래스가 없는 경우가 많이 발생하는데, 이 때 clustering을 이용할 수 있는지, 아니라면 적절한 접근법이 무엇인지 궁금합니다.

2. 만약 1이 가능하다면, label 정보가 맞는지 어떻게 알 수 있나요? 예를 들어, 영화 리뷰데이터를 토대로 2개짜리 클러스터를 만들었습니다. 저는 이 두개가 긍/부정 데이터이길 기대하나, 실제론 그러지 않을 수도 있을 것 같습니다. 혹은, 10개의 클러스터를 토대로 클러스터링을 수행했습니다. 이 10개는 영화 장르가 되면 좋겠지만, 실제론 그렇지 않을 수도 있을 것 같습니다. 이처럼 만약에 특수한 집단 혹은 일종의 클래스가 되는 클러스터를 얻고 싶다면 어떻게 해야될까요?

3. clustering의 해석은 어떻게 되나요? 위의 예시를 토대로, 영화 리뷰 데이터에 대해서 각 클러스터를 어떻게 이해하면 좋을까요? 영화 장르의 군집? 영화 감성 분석의 결과? 아니면 단순하게 비슷한 리뷰들?

4. 클러스터를 얻으면 무엇을 할 수 있을까요? 예를 들어 고객들의 정보를 이용하여 고객을 클러스터로 만들었다고 하겠습니다. 여기서 무엇을 얻을 수 있을까요? 클러스터링 과정 이후에 어떠한 분석이 수행되는지 궁금합니다.