로그인 바로가기
하위 메뉴 바로가기
본문 바로가기
검색
로그인 / 회원가입
강화학습 1
KAIST 산업및시스템공학과 신하용 교수님
공유하기
URL복사
밴드
페이스북
트위터
강화학습 1
강화학습 1
http://kooc.kaist.ac.kr/reinforcement
좋아요
123
수강생
602
전체 메뉴 열기
하위 메뉴
강의
강좌 전체목록보기
1. Introduction
강화학습이란?
강화학습의 특징과 사례
동적 시스템
강화학습 구성요소
Quiz 1
2. Markov Decision Process
Markov Chain
Markov Reward Process
Markov Decision Process
Quiz 2
3. Dynamic Programming
Dynamic programming?
Policy evaluation
Optimal policy
Asynchronous DP
Quiz 3
4. Monte Carlo methods
Monte Carlo method 개요
Stochastic approximation
MC policy evaluation
MC control
Quiz 4
5. Temporal difference methods
TD learning 개요
TD control
Q learning
Double Q learning
Quiz 5
6. n-Step TD methods
n-step return
TD(λ) policy evaluation
Eligibility trace와 TD control
Q(λ) algorithm
Quiz 6
7. Value function approximation
Value function approximation 개요
Features for VFA
Application of VFA : Cartpole
Linear VFA for Cartpole
Quiz 7
토론
검색 폼
제목을 입력하세요.
검색
토론
연관 강의 선택
전체보기
내가 등록한 글 보기
교수자, 튜터 참여 보기
최신순
추천순
댓글 많은 순
글쓰기
MDP vs MRP
Markov Decision Process
백정
2024.04.13
추천
1
댓글
1
파이썬 프로그램 문의
Markov Chain
조덕희
2022.11.07
추천
0
댓글
1
안녕하세요, 훌륭한 수업 너무 잘 듣고있습니다. 그런데 필기할 렉쳐노트가 있으면 좋겠습니다.
dyd
2022.07.28
추천
0
댓글
1
강의자료 문의
케이준치킨
2022.04.20
추천
0
댓글
1
강의자료는 없나요?
고독남
2022.03.04
추천
0
댓글
1
다른 강의 영상이 업로드 되어있는 것 같습니다.
동적 시스템
jhp
2022.01.19
추천
0
댓글
1
이전
1
다음