2wnswoo 님의 블로그

  • 홈
  • 태그
  • 방명록

2025/05/13 1

Autonomous Car-[강화학습] 벨만 방정식(이해 완전히 안됨), 몬테카를로

정책 : 어떠한 상태에서 Agent가 어떠한 행동을 할지 결정하는 규칙벨만 방정식가치, Value를 계산할 때 벨만 방정식을 사용함시점 t에서 value랑 t+1 value 사이의 관계를 다룸, 재귀함수 성격을 가짐*재귀함수 : 자기 자신을 호출하는 함수 ( e.g 피보나치 수열, 0,1,2,3,5,8.13 앞의 첫번째항과 두번째항을 계속해서 더하는 구조임 )모델 프리, model free : MDP를 모를 때 학습하는 접근법모델 기반, model-based : MDP를 알고 있을 때 학습하는 접근법 ( 경험에 의한 평균값으로 계산 )벨만 기대 방정식 : 특정 정책을 따를 때 상태 가치를 다룸벨만 최적 방정식 : 최적 정책을 바로 구하는 것이 목표가능한 정책 중 가장 높은 가치를 제공하는 정책을 선택최적..

**Autonomous driving tech./*Machine-Learning 2025.05.13
이전
1
다음
더보기
프로필사진

2wnswoo 님의 블로그

Be a first mover, not a fast follower

  • 분류 전체보기 (244) N
    • **Autonomous driving tech. (165) N
      • **Experience (3)
      • *Machine-Learning (17) N
      • *Control system (1)
      • *Computer Vision (4)
      • *Learning (67) N
      • *SLAM (10)
      • *NeRF (1)
      • *C++ (29)
      • *ROS2 (18)
      • *Matlab & simulink (2)
      • *dSPACE & vector tools (1)
      • *Third-Party-Library( OpenC.. (1)
      • *Third-Party-Library( PyTor.. (0)
      • *Paper review (7)
      • *Seminar (2)
    • 공학 (20)
      • 유체역학 (7)
      • 재료공학 (8)
      • 인공지능 (15)
      • ETC (1)
    • DataAnalysis (15)
      • Pandas (2)
      • NumPy (2)

Tag

티스토리챌린지, 우, 오블완,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바