반응형 알파고 알고리즘1 [정보] AlphaGo 알고리즘 Google DeepMind의 AlphaGo가 작동하는 알고리즘을 간략하게 요약했습니다. 주로 기존의 자료 중 설명이 빈약했던 Reinforcement Learning에 대한 설명이 추가된 자료입니다. 많은 참고 하시기 바랍니다. AlphaGo 알고리즘 요약 from Jooyoul Lee 1. AlphaGo 알고리즘 요약 이주열 2. 바둑(or 체스) 인공지능 프로그램 기본 • 게임 경우의 수 탐색 à 트리(tree) 탐색 알고리즘 (e.g. 깊이 우선 탐색, 넓이 우선 탐색 알고리즘) 체스의 게임 트리 예시 트리 탐색 예시 3. 바둑이 쉽게 정복되지 않은 이유 • 10360 가지 경우 수 존재 • 바둑 규칙을 고려한 평균 경우 수가 250개, 바둑 평균 약 150수 정도. 따라서, 25.. 2017. 12. 9. 이전 1 다음 반응형