# 강화 학습이란? [[지도 학습]], [[비지도 학습]]과 달리 [[강화 학습]]은 행동에 대한 보상만 주어집니다. 그런데 강화 학습에서 풀어야 하는 문제는 행동-보상의 짝이 아니라 상태에 대한 행동을 찾는 것입니다. [[엣지 오브 투모로우]]로 배우는 [[마르코프 결정 과정]]