AI engineering/AI 공부 (1) 썸네일형 리스트형 강화학습 쉽게 이해하기: 강화학습 개념과 벨만 방정식 강화학습이란?강화학습(Reinforcement Learning)은 스스로 행동하면서 보상을 최대화하는 방법을 배우는 알고리즘입니다.딥러닝이나 지도학습처럼 ‘정답’(라벨링 등)을 주지 않고, 행동 → 결과 → 보상만으로 학습합니다.주요 구성 요소Agent(행위자): 학습을 수행하는 주체 (예: 로봇 청소기, 게임 캐릭터)Environment(환경): 에이전트가 상호작용하는 세계State(상태): 현재 상황 정보Action(행동): 선택 가능한 움직임Reward(보상): 행동의 즉각적인 피드백강화학습 예시 - 미로를 탈출하는 로봇 청소기로봇 청소기가 미로를 탈출한다고 가정해봅시다.에이전트: 로봇 청소기환경: 미로상태: 현재 위치행동: 상하좌우 이동보상: 출구에 가까워지면 +1, 막다른 길이면 -1로봇은 수없.. 이전 1 다음