reinforcement-learning-kr icon indicating copy to clipboard operation
reinforcement-learning-kr copied to clipboard

monte carlo에서 왜 last visit 방식으로 구현?

Open hccho2 opened this issue 6 years ago • 0 comments

MC방법에서는 first visit, every visit 방식이 있는 것으로 알고 있습니다. 코드 구현은 last visit 방식인데, 이유가 있나요?

hccho2 avatar Dec 21 '19 23:12 hccho2