Mašinsko učenje
Mašinsko učenje (engl. Machine learning, ML) je podoblast veštačke inteligencije čiji je cilj konstruisanje statističkih algoritama i računarskih sistema koji su sposobni da se adaptiraju na analogne nove situacije i uče na bazi iskustva. Razvijene su različite tehnike učenja za izvršavanje različitih zadataka. Prve koje su bile predmet istraživanja, tiču se nadgledanog učenja za diskreciono donošenje odluka, nadgledanog učenja za kontinuirano predviđanje i pojačano učenje za sekvencionalno donošenje odluka, kao i nenadgledano učenje. Do sada najbolje shvaćen od svih navedenih zadataka je odlučivanje preko jednog pokušaja (engl. one-shot learning). Računaru je dat opis jednog objekta (događaja ili situacije) i od njega se očekuje da kao rezultat izbaci klasifikaciju tog objekta. Na primjer, program za prepoznavanje alfanumeričkih znakova kao ulaznu vrijednost ima digitalizovanu sliku nekog alfanumeričkog znaka i kao rezultat treba da izbaci njegovo ime.
Algoritmi mašinskog učenja mogu da uče iz podataka i generalizuju na nevidljive podatke, i na taj način obavljaju zadatke bez eksplicitnih uputstava.[1] Nedavno su veštačke neuronske mreže uspele da nadmaše mnoge prethodne pristupe u pogledu performansi.[2][3] Pristupi mašinskom učenju su primenjeni u mnogim oblastima uključujući obradu prirodnog jezika, kompjuterski vid, prepoznavanje govora, filtriranje elektronske pošte, poljoprivredu i medicinu.[4][5] ML je poznato po svojoj primeni na poslovne probleme pod nazivom prediktivna analitika. Iako nije svako mašinsko učenje statistički zasnovano, računarska statistika je važan izvor metoda u ovoj oblasti.
Matematičke osnove mašinskog učenja su obezbeđene metodama matematičke optimizacije (matematičko programiranje). Istraživanje podataka je srodna (paralelna) oblast proučavanja, koja se fokusira na istraživačku analizu podataka kroz učenje bez nadzora.[7][8] Sa teorijske tačke gledišta, verovatno približno tačno učenje pruža okvir za opisivanje mašinskog učenja.
Istorija
[uredi | uredi izvor]Termin mašinsko učenje skovao je 1959. Artur Semjuel, dok je bio zaposlen u IBM-u, koji je pionir u oblasti kompjuterskih igara i veštačke inteligencije.[9][10] U ovom vremenskom periodu korišćen je i sinonim samoučeći računari.[11][12]
Iako je najraniji model mašinskog učenja uveden tokom 1950-ih kada je Artur Semjuel izumeo program koji je izračunao dobitnu šansu u damama za svaku stranu, istorija mašinskog učenja ima korene unazad do decenija ljudskog nastojanja i napora da se proučavaju ljudski kognitivni procesi.[13] Kanadski psiholog Donald Heb je 1949. godine objavio knjigu Organizacija ponašanja, u kojoj je predstavio teorijsku neuronsku strukturu formiranu određenim interakcijama među nervnim ćelijama.[14] Hebov model neurona koji međusobno komuniciraju postavio je osnovu za to kako AI i algoritmi za mašinsko učenje funkcionišu pod čvorištima, ili veštačkim neuronima koje računari koriste za komunikaciju podataka.[13] Drugi istraživači koji su proučavali ljudske kognitivne sisteme takođe su doprineli savremenim tehnologijama mašinskog učenja, uključujući logičara Valtera Pitsa i Vorena Makaloka, koji su predložili rane matematičke modele neuronskih mreža kako bi došli do algoritama koji odražavaju ljudske misaone procese.[13]
Do ranih 1960-ih, kompanija Rejtion razvila je eksperimentalnu „mašinu za učenje“ sa memorijom na bušenoj traci, nazvanu Sajbertron, za analizu signala sonara, elektrokardiograma i govornih obrazaca koristeći rudimentarno potkrepljeno učenje. Ljudski operater/učitelj ju je stalno „obučavao“ da prepozna obrasce i bila je opremljena dugmetom „besmislica“ da bi se uputila da ponovo proceni pogrešne odluke.[15] Reprezentativni rad o istraživanju mašinskog učenja tokom 1960-ih bila je Nilsonova knjiga o mašinama za učenje, koja se uglavnom bavila mašinskim učenjem s ciljem klasifikacije obrazaca.[16] Interesovanje vezano za prepoznavanje obrazaca nastavilo se tokom 1970-ih, kako su to opisali Duda i Hart 1973. godine.[17] Godine 1981, objavljen je izveštaj o korišćenju nastavnih strategija tako da veštačka neuronska mreža nauči da prepozna 40 znakova (26 slova, 10 cifara i 4 specijalna simbola) sa računarskog terminala.[18]
Tom M. Mičel je dao široko citiranu, formalniju definiciju algoritama koji se proučavaju u oblasti mašinskog učenja: „Kaže se da kompjuterski program uči iz iskustva E u odnosu na neku klasu zadataka T i meru učinka P, ako se njegov učinak na zadacima u T, mereno sa P, poboljšava sa iskustvom E.“[19] Ova definicija zadataka u kojima se mašinsko učenje bavi nudi fundamentalnu operativnu definiciju, ali ne definiše polje u kognitivnom smislu. Ovom je sledio predlog Alana Tjuringa u njegovom radu „Računarska mašina i inteligencija”, u kojem se pitanje „Mogu li mašine da misle?” zamenjuje pitanjem „Mogu li mašine da urade ono što mi (kao misleći entiteti) možemo?“.[20]
Savremeno mašinsko učenje ima dva cilja. Jedan je da se klasifikuju podaci na osnovu modela koji su razvijeni; a drugi je da se na osnovu modela naprave predviđanja za buduće ishode. Hipotetički algoritam specifičan za klasifikaciju podataka može da koristi kompjuterski prikaz mladeža u kombinaciji sa nadgledanim učenjem kako bi se obučio da klasifikuje kancerogene mladeže. Algoritam mašinskog učenja za trgovanje akcijama može informisati trgovca o budućim potencijalnim predviđanjima.[21]
Vidi još
[uredi | uredi izvor]Reference
[uredi | uredi izvor]- ^ The definition "without being explicitly programmed" is often attributed to Arthur Samuel, who coined the term "machine learning" in 1959, but the phrase is not found verbatim in this publication, and may be a paraphrase that appeared later. Confer "Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" in Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). „Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming”. Artificial Intelligence in Design '96. Artificial Intelligence in Design '96 (na jeziku: engleski). Springer, Dordrecht. str. 151—170. ISBN 978-94-010-6610-5. doi:10.1007/978-94-009-0279-4_9.
- ^ „What is Machine Learning?”. IBM (na jeziku: engleski). Pristupljeno 2023-06-27.
- ^ Zhou, Victor (2019-12-20). „Machine Learning for Beginners: An Introduction to Neural Networks”. Medium (na jeziku: engleski). Arhivirano iz originala 2022-03-09. g. Pristupljeno 2021-08-15.
- ^ Hu, Junyan; Niu, Hanlin; Carrasco, Joaquin; Lennox, Barry; Arvin, Farshad (2020). „Voronoi-Based Multi-Robot Autonomous Exploration in Unknown Environments via Deep Reinforcement Learning”. IEEE Transactions on Vehicular Technology. 69 (12): 14413—14423. ISSN 0018-9545. S2CID 228989788. doi:10.1109/tvt.2020.3034800 .
- ^ Yoosefzadeh-Najafabadi, Mohsen; Hugh, Earl; Tulpan, Dan; Sulik, John; Eskandari, Milad (2021). „Application of Machine Learning Algorithms in Plant Breeding: Predicting Yield From Hyperspectral Reflectance in Soybean?”. Front. Plant Sci. 11: 624273. PMC 7835636 . PMID 33510761. doi:10.3389/fpls.2020.624273 .
- ^ Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
- ^ Machine learning and pattern recognition "can be viewed as two facets of the same field".[6]:vii
- ^ Friedman, Jerome H. (1998). „Data Mining and Statistics: What's the connection?”. Computing Science and Statistics. 29 (1): 3—9.
- ^ Samuel, Arthur (1959). „Some Studies in Machine Learning Using the Game of Checkers”. IBM Journal of Research and Development. 3 (3): 210—229. CiteSeerX 10.1.1.368.2254 . S2CID 2126705. doi:10.1147/rd.33.0210.
- ^ R. Kohavi and F. Provost, "Glossary of terms", Machine Learning, vol. 30, no. 2–3, pp. 271–274, 1998.
- ^ Gerovitch, Slava (9. 4. 2015). „How the Computer Got Its Revenge on the Soviet Union”. Nautilus. Arhivirano iz originala 22. 9. 2021. g. Pristupljeno 19. 9. 2021.
- ^ Lindsay, Richard P. (1. 9. 1964). „The Impact of Automation On Public Administration”. Western Political Quarterly (na jeziku: engleski). 17 (3): 78—81. ISSN 0043-4078. S2CID 154021253. doi:10.1177/106591296401700364. Arhivirano iz originala 6. 10. 2021. g. Pristupljeno 6. 10. 2021.
- ^ a b v „History and Evolution of Machine Learning: A Timeline”. WhatIs (na jeziku: engleski). Pristupljeno 2023-12-08.
- ^ Milner, Peter M. (1993). „The Mind and Donald O. Hebb”. Scientific American. 268 (1): 124—129. Bibcode:1993SciAm.268a.124M. ISSN 0036-8733. JSTOR 24941344. PMID 8418480. doi:10.1038/scientificamerican0193-124.
- ^ "Science: The Goof Button", Time (magazine), 18 August 1961.
- ^ Nilsson N. Learning Machines, McGraw Hill, 1965.
- ^ Duda, R., Hart P. Pattern Recognition and Scene Analysis, Wiley Interscience, 1973
- ^ S. Bozinovski "Teaching space: A representation concept for adaptive pattern classification" COINS Technical Report No. 81-28, Computer and Information Science Department, University of Massachusetts at Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf Arhivirano 2021-02-25 na sajtu Wayback Machine
- ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. str. 2. ISBN 978-0-07-042807-2.
- ^ Harnad, Stevan (2008), „The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence”, Ur.: Epstein, Robert; Peters, Grace, The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer, Kluwer, str. 23—66, ISBN 9781402067082, Arhivirano iz originala 2012-03-09. g., Pristupljeno 2012-12-11
- ^ „Introduction to AI Part 1”. Edzion (na jeziku: engleski). 2020-12-08. Arhivirano iz originala 2021-02-18. g. Pristupljeno 2020-12-09.
Literatura
[uredi | uredi izvor]- Domingos, Pedro (22. 9. 2015). The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World. Basic Books. ISBN 978-0465065707.
- Nilsson, Nils (1998). Artificial Intelligence: A New Synthesis. Morgan Kaufmann. ISBN 978-1-55860-467-4. Arhivirano iz originala 26. 7. 2020. g. Pristupljeno 18. 11. 2019.
- Poole, David; Mackworth, Alan; Goebel, Randy (1998). Computational Intelligence: A Logical Approach. New York: Oxford University Press. ISBN 978-0-19-510270-3. Arhivirano iz originala 26. 7. 2020. g. Pristupljeno 22. 8. 2020.
- Nils J. Nilsson, Introduction to Machine Learning Arhivirano 2019-08-16 na sajtu Wayback Machine.
- David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Arhivirano 2016-02-17 na sajtu Wayback Machine Cambridge: Cambridge University Press, 2003. ISBN 0-521-64298-1
- Stuart Russell & Peter Norvig, (2009). Artificial Intelligence – A Modern Approach Arhivirano 2011-02-28 na sajtu Wayback Machine. Pearson, ISBN 9789332543515
- Kevin P. Murphy (2021). Probabilistic Machine Learning: An Introduction Arhivirano 2021-04-11 na sajtu Wayback Machine, MIT Press.
- Sergios Theodoridis, Konstantinos Koutroumbas (2009) "Pattern Recognition", 4th Edition, Academic Press. ISBN 978-1-59749-272-0.
- Ethem Alpaydın (2004) Introduction to Machine Learning (Adaptive Computation and Machine Learning), MIT Press, ISBN 978-0-262-01211-9
- Bing Liu (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, ISBN 978-3-540-37881-5
- Toby Segaran, Programming Collective Intelligence, O'Reilly ISBN 978-0-596-52932-1
- Ray Solomonoff, "An Inductive Inference Machine" A privately circulated report from the 1956 Dartmouth Summer Research Conference on AI.
- Ray Solomonoff, An Inductive Inference Machine, IRE Convention Record, Section on Information Theory, Part 2, pp., 56-62, 1957.
- Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach, Tioga Publishing Company, ISBN 978-0-935382-05-1.
- Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1986), Machine Learning: An Artificial Intelligence Approach, Volume II, Morgan Kaufmann, ISBN 978-0-934613-00-2.
- Yves Kodratoff, Ryszard S. Michalski (1990), Machine Learning: An Artificial Intelligence Approach, Volume III, Morgan Kaufmann, ISBN 978-1-55860-119-2.
- Ryszard S. Michalski, George Tecuci (1994), Machine Learning: A Multistrategy Approach, Volume IV, Morgan Kaufmann, ISBN 978-1-55860-251-9.
- Bishop, C.M. (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 978-0-19-853864-6.
- Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 978-0-471-05669-0.
- Huang T.-M., Kecman V., Kopriva I. (2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 pp. 96 illus., Hardcover, ISBN 978-3-540-31681-7.
- KECMAN Vojislav (2001), Learning and Soft Computing, Support Vector Machines, Neural Networks and Fuzzy Logic Models, The MIT Press, Cambridge, MA, 608 pp., 268 illus., ISBN 978-0-262-11255-0.
- Ian H. Witten and Eibe Frank Data Mining: Practical machine learning tools and techniques Morgan Kaufmann ISBN 978-0-12-088407-0.
- Sholom Weiss and Casimir Kulikowski (1991). Computer Systems That Learn. Morgan Kaufmann. ISBN 978-1-55860-065-2..
- Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm: YALE: Rapid Prototyping for Complex Data Mining Tasks, in Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-06), 2006.
- Trevor Hastie, Robert Tibshirani and Jerome Friedman (2001). The Elements of Statistical Learning. Springer. ISBN 978-0-387-95284-0. Arhivirano iz originala 10. 11. 2009. g. Pristupljeno 31. 08. 2018.
- Vladimir Vapnik (1998). Statistical Learning Theory. Wiley-Interscience. ISBN 978-0-471-03003-4.
Spoljašnje veze
[uredi | uredi izvor]- International Machine Learning Society
- mloss is an academic database of open-source machine learning software.