Самостоятельная игра в стиле AlphaZero протестирована на Nim

Иллюстрация состояний игры Ним. На левой панели показана первоначальная конфигурация платы из пяти стопок: [n1, n2, n3, n4, n5] = [1, 3, 5, 7, 9]. На средней панели показано промежуточное состояние доски во время игры: [v1, v2, v3, v4, v5] = [1, 2, 4, 4, 3]в результате того, что игроки снимают жетоны. Правая панель представляет … Read more