강화 학습이란?
지도 학습, 비지도 학습과 달리 강화 학습은 행동에 대한 보상만 주어집니다. 그런데 강화 학습에서 풀어야 하는 문제는 행동-보상의 짝이 아니라 상태에 대한 행동을 찾는 것입니다.
엣지 오브 투모로우로 배우는 마르코프 결정 과정
open:강화-학습이란
지도 학습, 비지도 학습과 달리 강화 학습은 행동에 대한 보상만 주어집니다. 그런데 강화 학습에서 풀어야 하는 문제는 행동-보상의 짝이 아니라 상태에 대한 행동을 찾는 것입니다.
엣지 오브 투모로우로 배우는 마르코프 결정 과정