로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

로그인 / 회원가입

강화학습 1

KAIST 산업및시스템공학과 신하용 교수님

URL복사 밴드 페이스북 트위터

강화학습 1

강화학습 1

http://kooc.kaist.ac.kr/reinforcement

좋아요 123 수강생 602

하위 메뉴

강의
1. 강화학습이란?
2. 강화학습의 특징과 사례
3. 동적 시스템
4. 강화학습 구성요소
5. Quiz 1
1. Markov Chain
2. Markov Reward Process
3. Markov Decision Process
4. Quiz 2
1. Dynamic programming?
2. Policy evaluation
3. Optimal policy
4. Asynchronous DP
5. Quiz 3
1. Monte Carlo method 개요
2. Stochastic approximation
3. MC policy evaluation
4. MC control
5. Quiz 4
1. TD learning 개요
2. TD control
3. Q learning
4. Double Q learning
5. Quiz 5
1. n-step return
2. TD(λ) policy evaluation
3. Eligibility trace와 TD control
4. Q(λ) algorithm
5. Quiz 6
1. Value function approximation 개요
2. Features for VFA
3. Application of VFA : Cartpole
4. Linear VFA for Cartpole
5. Quiz 7
토론

검색 폼

제목을 입력하세요.

토론

MDP vs MRP
Markov Decision Process

백정 2024.04.13

추천

1

댓글

1
파이썬 프로그램 문의
Markov Chain

조덕희 2022.11.07

추천

0

댓글

1
안녕하세요, 훌륭한 수업 너무 잘 듣고있습니다. 그런데 필기할 렉쳐노트가 있으면 좋겠습니다.

dyd 2022.07.28

추천

0

댓글

1
강의자료 문의

케이준치킨 2022.04.20

추천

0

댓글

1
강의자료는 없나요?

고독남 2022.03.04

추천

0

댓글

1
다른 강의 영상이 업로드 되어있는 것 같습니다.
동적 시스템

jhp 2022.01.19

추천

0

댓글

1

1

이 사이트는 edwith의 온라인강좌 플랫폼을 사용하고 있습니다. 지식나눔과 배움의 기회에 참여하세요. Powered by