MuZero
MuZero je kompjuterski program koji je razvila kompanija za istraživanje veštačke inteligencije Dipmajnd za savladavanje igara bez poznavanja njihovih pravila.[1][2][3] Njegovo izdanje 2019. uključivalo je merila njegovih performansi u gou, šahu, šogiju i standardnom paketu Atari igara. Algoritam koristi pristup sličan AlphaZero. Podudarao se sa performansama AlphaZero u šahu i šogiju, poboljšao svoje performanse u gou (postavljajući novi svetski rekord) i poboljšao stanje tehnike u savladavanju paketa od 57 Atari igara (Arkadno okruženje za učenje), vizuelno složenog domena.
MuZero je treniran putem samostalnog igranja, bez pristupa pravilima, otvaranju knjiga ili bazama tabela za kraj igre. Obučeni algoritam je koristio istu konvolucionu i rezidualnu arhitekturu kao AlphaZero, ali sa 20 procenata manje koraka izračunavanja po čvoru u stablu pretrage.[4]
Reference
[уреди | уреди извор]- ^ Wiggers, Kyle (20. 11. 2019). „DeepMind's MuZero teaches itself how to win at Atari, chess, shogi, and Go”. VentureBeat. Приступљено 22. 7. 2020.
- ^ Friedel, Frederic. „MuZero figures out chess, rules and all”. ChessBase GmbH. Приступљено 22. 7. 2020.
- ^ Rodriguez, Jesus. „DeepMind Unveils MuZero, a New Agent that Mastered Chess, Shogi, Atari and Go Without Knowing the Rules”. KDnuggets. Приступљено 22. 7. 2020.
- ^ Schrittwieser, Julian; Antonoglou, Ioannis; Hubert, Thomas; Simonyan, Karen; Sifre, Laurent; Schmitt, Simon; Guez, Arthur; Lockhart, Edward; Hassabis, Demis; Graepel, Thore; Lillicrap, Timothy (2020). „Mastering Atari, Go, chess and shogi by planning with a learned model”. Nature. 588 (7839): 604—609. Bibcode:2020Natur.588..604S. PMID 33361790. S2CID 208158225. arXiv:1911.08265 . doi:10.1038/s41586-020-03051-4.