**Autonomous driving tech./*Machine-Learning

Autonomous Car-[강화학습]

2wnswoo 2025. 5. 16. 01:52

 

  • MC 기법 : 상태 s에서 시작하여 에피소드가 종료될 때까지 누적된 보상의 총합인 리턴 을 기반으로 상태 가지 함수를 업데이트한다.