Show pageOld revisionsBacklinksBack to top This page is read only. You can view the source, but not change it. Ask your administrator if you think this is wrong. # 강화 학습이란? [[지도 학습]], [[비지도 학습]]과 달리 [[강화 학습]]은 행동에 대한 보상만 주어집니다. 그런데 강화 학습에서 풀어야 하는 문제는 행동-보상의 짝이 아니라 상태에 대한 행동을 찾는 것입니다. [[엣지 오브 투모로우]]로 배우는 [[마르코프 결정 과정]] open/강화-학습이란.txt Last modified: 2024/10/05 06:15by 127.0.0.1