가능한 한 완벽하게 혁신을 표현하기 위해, 나는 세계 챔피언 Gu Li 9p와 저우 루이양 9p의 도움을 입대했다. 알파고와 이세돌의 5경기, 그리고 알파고가 경기 직전에 치른 3경기에 대한 철저한 분석을 진행했습니다. 우리는 흥미 진진하고 영감을 모두 아이디어를 발견, 그것은 AlphaGo뿐만 아니라 과학 기술 발전을 나타내는 우리에게 분명해졌다, 뿐만 아니라 바둑의 인간의 이해의 이정표. 인간의 편견에 의해 제약을받지 않고, 급진적 인 새로운 접근 방식을 실험 할 무료, AlphaGo는 큰 개방적 인 마음을 보여 창조적 인 새로운 전략으로 게임을 활성화하고있다. 물론, 아무도 전략이 플레이어의 성공을 보장 할 수 없습니다, 하지만이 게임에서 배우는 것은 하나의 이동 강도와 스타일에 긍정적 인 계몽 영향을 해야합니다. 2017년 1월, AlphaGo는 `마스터`와 `매지스터`라는 가명으로 가장 강력한 프로 바둑 선수들을 상대로 일련의 비공식 온라인 게임을 했다고 밝혔습니다. 이 알파고는 2016년 이세돌을 연기한 알파고의 개선된 버전입니다. 1주일 동안 AlphaGo는 60개의 온라인 빠른 시간 제어 게임을 플레이했습니다. AlphaGo는 게임 60 – 0이 시리즈의 승리.
지속적인 개발을 통해 AlphaGo는 바둑 게임에 독특하고 매우 강력한 접근 방식을 만들었습니다. 일부 게임은 왼쪽 하단에 블랙의 첫 번째 돌로 표시됩니다. 이것은 전통적인 방향은 아니지만,이 논평은 AlphaGo의 많은 분석을 제시, 그래서 우리는 알파고의 관점의 감각을 제공하는 것도 재미있을 것이라고 생각. 다음 게임은 AlphaGo에 입력 된 대로 정확하게 제시되므로 독자는 생성 된 것과 동일한 방식으로 셀프 플레이 게임을 경험하게되며, 이 세돌 건너편에 앉아있을 때 아자 황이했던 것처럼 5 게임 경기를 경험할 수 있습니다. 이것은 TensorFlow를 사용하여 신경망 기반 Go AI의 구현입니다. 딥 마인드의 알파고 알고리즘에서 영감을 동안,이 프로젝트는 딥 마인드 프로젝트가 아니며 공식 AlphaGo 프로젝트와 제휴하지 않습니다. 미니고는 브라이언 리의 „MuGo“를 기반으로합니다 – 자연에 게시 된 첫 번째 AlphaGo 논문 „깊은 신경 망과 나무 검색으로 이동의 게임을 마스터“의 순수한 파이썬 구현. 이 구현은 최신 AlphaGo 제로 논문에 존재하는 기능과 아키텍처 변경 사항을 추가합니다, „인간의 지식없이 이동의 게임을 마스터“. 최근에는 체스와 장기를 위해 „일반 강화 학습 알고리즘으로 셀프 플레이로 체스와 장기를 마스터“로 확장했습니다.
이 논문은 종종 각각 AG (알파고), AGZ (알파고 제로), AZ (알파 제로)로 미니고 문서에 요약됩니다.