AlphaGo

AlphaGo
Programer(i)	Gugl DipMajnd
Tip	Computer Go softver
Veb-sajt	deepmind.com/research/highlighted-research/alphago

AlphaGo je kompjuterski program za igranje društvene igre Go.^[1] Razvila ga je kompanija DeepMind Technologies sa sedištem u Londonu,^[2] kupljena podružnica Gugla. Naredne verzije programa AlphaGo postale su sve moćnije, uključujući verziju koja se takmičila pod imenom Master.^[3] Nakon povlačenja iz takmičarske igre, AlphaGo Master je nasledila još moćnija verzija poznata kao AlphaGo Zero, koja je bila potpuno samouka bez učenja od ljudskih igara. AlphaGo Zero je zatim generalizovan u program poznat kao AlphaZero, koji je igrao dodatne igre, uključujući šah i šogi. AlphaZero je potom nasledio program poznat kao MuZero koji uči bez podučavanja u pogledu pravila.

AlphaGo i njegovi naslednici koriste Monte Karlo algoritam za pretragu stabla da pronađu svoje poteze na osnovu znanja prethodno stečenog mašinskim učenjem, posebno veštačkom neuronskom mrežom (metoda dubokog učenja) kroz opsežnu obuku, kako iz ljudske tako i kompjuterske igre.^[4] Neuronska mreža je obučena da identifikuje najbolje poteze i pobedničke procente ovih poteza. Ova neuronska mreža poboljšava snagu pretrage stabla, što rezultira jačim odabirom poteza u sledećoj iteraciji.

U oktobru 2015, u meču protiv Fan Huija, originalni AlphaGo je postao prvi kompjuterski Go program koji je pobedio čoveka profesionalnog Go igrača bez hendikepa na tabli 19×19 pune veličine.^[5]^[6] U martu 2016. pobedio je Li Sedola u meču od pet igara, što je prvi put da je kompjuterski Go program pobedio profesionalca od 9 dana bez hendikepa.^[7] Iako je izgubio od Li Sedola u četvrtoj igri, Li je priznao poraz u finalnoj igri, dajući konačan rezultat od 4 igre prema 1 u korist programa AlphaGo. Kao priznanje za pobedu, AlphaGo je dobio počasni 9-dan od strane Korea Baduk asocijacije.^[8] Uvod i izazov meča sa Lijem Sedolom dokumentovani su u dokumentarnom filmu takođe pod nazivom AlphaGo,^[9] u režiji Grega Koha. Pobedu programa AlphaGo odabrao je časopis Science kao jedan od proboja godine 22. decembra 2016. godine.^[10]

Na Budućnost Goa samitu 2017, Master verzija programa AlphaGo je pobedila Ke Đea, tada prvoplasiranog igrača na svetu, u meču od tri igre, nakon čega je AlphaGo dobio profesionalni 9-dan od strane Kineske Veiči asocijacije.^[11]

Posle meča između AlphaGo i Ke Đea, DeepMind je penzionisao AlphaGo, dok je nastavio istraživanje veštačke inteligencije u drugim oblastima.^[12] Samouki AlphaGo Zero je ostvario pobedu od 100–0 protiv rane takmičarske verzije programa AlphaGo, a njegov naslednik AlphaZero je do kraja 2010-ih smatran za najboljeg igrača na svetu u Gou.^[13]^[14]

Reference

^ „Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol”. BBC News. 12. 3. 2016. Архивирано из оригинала 26. 8. 2016. г. Приступљено 17. 3. 2016.
^ „DeepMind AlphaGO”. DeepMind Artificial Intelligence AlphaGo. Архивирано из оригинала 14. 9. 2019. г. Приступљено 16. 9. 2019.
^ „AlphaGo | DeepMind”. DeepMind. Архивирано из оригинала 28. 5. 2017. г. Приступљено 28. 5. 2017.
^ Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28. 1. 2016). „Mastering the game of Go with deep neural networks and tree search”. Nature. 529 (7587): 484—489. Bibcode:2016Natur.529..484S. ISSN 0028-0836. PMID 26819042. S2CID 515925. doi:10.1038/nature16961.
^ „Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog. 27. 1. 2016. Архивирано из оригинала 30. 1. 2016. г. Приступљено 28. 1. 2016.
^ „Google achieves AI 'breakthrough' by beating Go champion”. BBC News. 27. 1. 2016. Архивирано из оригинала 2. 12. 2021. г. Приступљено 20. 7. 2018.
^ „Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo”. YouTube. 8. 3. 2016. Архивирано из оригинала 29. 3. 2017. г. Приступљено 9. 3. 2016.
^ „Google's AlphaGo gets 'divine' Go ranking”. The Straits Times. straitstimes.com. 15. 3. 2016. Архивирано из оригинала 7. 10. 2016. г. Приступљено 9. 12. 2017.
^ „AlphaGo Movie”. AlphaGo Movie. Архивирано из оригинала 3. 1. 2018. г. Приступљено 14. 10. 2017.
^ „From AI to protein folding: Our Breakthrough runners-up”. Science. 22. 12. 2016. Архивирано из оригинала 17. 6. 2022. г. Приступљено 29. 12. 2016.
^ „中国围棋协会授予AlphaGo职业九段并颁发证书” (на језику: кинески). Sohu.com. 27. 5. 2017. Архивирано из оригинала 3. 6. 2017. г. Приступљено 9. 12. 2017.
^ Metz, Cade (2017-05-27). „After Win in China, AlphaGo's Designers Explore New AI”. Wired.
^ „AlphaZero Crushes Stockfish In New 1,000-Game Match”. 17. 4. 2019. Архивирано из оригинала 12. 11. 2020. г. Приступљено 22. 4. 2021.
^ Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (7. 12. 2018). „A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play”. Science. 362 (6419): 1140—1144. Bibcode:2018Sci...362.1140S. PMID 30523106. S2CID 54457125. doi:10.1126/science.aar6404 .

Spoljašnje veze

Mediji vezani za članak AlphaGo na Vikimedijinoj ostavi
Zvanični veb-sajt
AlphaGo wiki at Sensei's Library, including links to AlphaGo games
AlphaGo page, with archive and games
Estimated 2017 rating of Alpha Go
AlphaGo - The Movie na sajtu YouTube

[1] „Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol”. BBC News. 12. 3. 2016. Архивирано из оригинала 26. 8. 2016. г. Приступљено 17. 3. 2016.

[2] „DeepMind AlphaGO”. DeepMind Artificial Intelligence AlphaGo. Архивирано из оригинала 14. 9. 2019. г. Приступљено 16. 9. 2019.

[3] „AlphaGo | DeepMind”. DeepMind. Архивирано из оригинала 28. 5. 2017. г. Приступљено 28. 5. 2017.

[DeepMindnature2016-4] Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28. 1. 2016). „Mastering the game of Go with deep neural networks and tree search”. Nature. 529 (7587): 484—489. Bibcode:2016Natur.529..484S. ISSN 0028-0836. PMID 26819042. S2CID 515925. doi:10.1038/nature16961.

[googlego-5] „Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog. 27. 1. 2016. Архивирано из оригинала 30. 1. 2016. г. Приступљено 28. 1. 2016.

[bbcgo-6] „Google achieves AI 'breakthrough' by beating Go champion”. BBC News. 27. 1. 2016. Архивирано из оригинала 2. 12. 2021. г. Приступљено 20. 7. 2018.

[leesedolwin-7] „Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo”. YouTube. 8. 3. 2016. Архивирано из оригинала 29. 3. 2017. г. Приступљено 9. 3. 2016.

[8] „Google's AlphaGo gets 'divine' Go ranking”. The Straits Times. straitstimes.com. 15. 3. 2016. Архивирано из оригинала 7. 10. 2016. г. Приступљено 9. 12. 2017.

[alphagomovie-9] „AlphaGo Movie”. AlphaGo Movie. Архивирано из оригинала 3. 1. 2018. г. Приступљено 14. 10. 2017.

[10] „From AI to protein folding: Our Breakthrough runners-up”. Science. 22. 12. 2016. Архивирано из оригинала 17. 6. 2022. г. Приступљено 29. 12. 2016.

[AlphaGo_9-dan-11] „中国围棋协会授予AlphaGo职业九段并颁发证书” (на језику: кинески). Sohu.com. 27. 5. 2017. Архивирано из оригинала 3. 6. 2017. г. Приступљено 9. 12. 2017.

[AlphaGo's_Designers_Explore_New_AI-12] Metz, Cade (2017-05-27). „After Win in China, AlphaGo's Designers Explore New AI”. Wired.

[13] „AlphaZero Crushes Stockfish In New 1,000-Game Match”. 17. 4. 2019. Архивирано из оригинала 12. 11. 2020. г. Приступљено 22. 4. 2021.

[14] Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (7. 12. 2018). „A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play”. Science. 362 (6419): 1140—1144. Bibcode:2018Sci...362.1140S. PMID 30523106. S2CID 54457125. doi:10.1126/science.aar6404 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]