Mastering_the_game_of_Go_with_deep_neura.pdf

https://kim95175.tistory.com/11


Abstract

search space 줄이기

바둑과 같이 경우의 수가 아주 많은 게임의 경우, 모든 경우에 대해 탐색하는 것은 불가능하다.

  1. Reduce the depth of the search

  2. Reduce the breadth of the search

MCTS

MC rollout을 이용해 tree의 각 state에 대한 가치를 계산한다.