Tänk dig att du lär ett dataprogram schackets spelregler och att du därefter lär det hur man spelar. Du har inte lärt datorn vare sig partier eller spelöppningsteori men ändå besegrar det en av världens bästa datorer Stockfish enligt den mänskliga metoden att lära sig av misstagen och det efter endast ett dygn. Resultatet blev 28 vinster och 72 remier, alltså 64-36! Det är företaget Deepmind som ligger bakom superprogrammet AlphaZero, alltså samma företag som låg bakom det superstarka programmet AlphaGo som sensationellt besegrade den legendariske gospelaren Lee Sedol från Sydkorea med de förkrossande siffrorna 4-1. Inte nog med detta, ett år senare besegrades även det kinesiska gogeniet Ke Jie med 3-0. Det går att fördjupa sig mer om artificiell intelligens på Chessbase.com.
dec 08
9 december 2017 klockan 11:44
Ett stort steg i schackutvecklingen, men inte så stort (ännu) såsom Chessbaseartikeln ger sken av. AlphaZero-programmet (AZ) spelade 100 partier mot Stockfish 8 (S8) med resultatet 28 vinster och 72 remier där AZ spelade med de vita pjäserna i 25 av vinstpartierna.
S8 är cirka ett år gammalt och långt ifrån det starkaste av tillgängliga program och uppdateringar av S8 finns på http://abrok.eu/stockfish/. Därtill finns det en handfull modifieringar/kloner av Stockfish och två kommersiella program som skulle vinna klart mot S8, även om marginalen skulle vara mindre. I matchen mot AZ spelade S8 utan öppningsbok vilket kan förklara en del underliga drag i de tio redovisade parterna. Betänketiden 1 minut per drag är också ett aber för S8 som är designad att använda mer tid i komplicerade ställningar och mindre tid i enkla dito. I ett av de publicerade och uppmärksammade partierna spelade S8 det troligen svaga 16…Nb7 istället för 16…Bc4 som verkar utjämna ställningen. Ett av de ovan nämnda programmen hittade Bc4 tämligen snart, även om det tog mer än en minut på den datorn jag använde. Det hittade även det hyllade 21.Bg5 från samma parti även om det inledningsvis valde 21.b4.
White: AlphaZero Black: Stockfish
1. d4 Nf6 2. c4 e6 3. Nf3 b6 4. g3 Bb7 5. Bg2 Be7 6. 0-0 0-0 7. d5 exd5 8. Nh4 c6 9. cxd5 Nxd5 10.
Nf5 Nc7 11. e4 Bf6 12. Nd6 Ba6 13. Re1 Ne8 14. e5 Nxd6 15. exf6 Qxf6 16. Nc3 Nb7? (16…Bc4 =) 17. Ne4 Qg6 18. h4 h6 19. h5 Qh7 20. Qg4 Kh8 21. Bg5
Programmerarna redovisar tio partier i artikeln ”Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm“ (https://arxiv.org/pdf/1712.01815.pdf) och där besvarade AZ 1.e4 med 1…e5 och som vit spelade det 1.d4 och 1.Nf3.
De som vill fördjupa sig inom området kan exempelvis gå in på https://www.chess.com/news/view/alphazero-reactions-from-top-gms-stockfish-author eller talkchess.com.
9 december 2017 klockan 22:00
Oavsett om versionen av Stockfish (S8) inte var den senaste och starkaste, som besegrades av AlphaZero, så är det ändå en otrolig prestation av programmerar-teamet bakom AlphaZero.
Personligen är jag inte helt positivt inställd till AI. Visst, utvecklingen går naturligtvis inte att stoppa men vi får hoppas att den sker under mycket kontrollerade former.
Men återigen, jag lyfter på hatten för teamet bakom AlphaZero och AlphaZero Go.