Пређи на садржај

Аутоматско означавање слика

С Википедије, слободне енциклопедије
Излаз ДенсеЦап софтвера за „густе натписе”, анализа фотографије човека који јаше слона

Аутоматско означавање слика (такође познат као аутоматско обележавање слика или лингвистичко индексирање) је процес којим рачунарски систем аутоматски додељује метаподатке у облику натписа или кључних речи дигиталној слици. Ова примена техника компјутерског вида се користи у системима за проналажење слика за организовање и лоцирање слика од интереса из базе података.

Овај метод се може сматрати врстом вишекласне класификације слика са веома великим бројем класа – великим колико и величина речника.[1][2] Обично се техникама машинског учења користе анализе слике у облику екстрахованих вектора карактеристика и речи напомена за обуку, како би покушали да аутоматски примене напомене на нове слике. Прве методе су научиле корелације између карактеристика слике и напомена за обуку, затим су развијене технике коришћењем машинског превођења како би се покушало да се преведе текстуални речник 'визуелним речником', или груписаним регионима познатим као мрље. Рад који прати ове напоре укључивао је класификационе приступе, моделе релевантности и тако даље.

Предности аутоматског означавања слика у односу на проналажење слика засновано на садржају (ЦБИР) су у томе што корисник може природније да одреди упите.[3] ЦБИР генерално (тренутно) захтева од корисника да претражују по концептима слике као што су боја и текстура, или да пронађу примере упита. Одређене карактеристике слике у примерима слика могу заменити концепт на који се корисник заиста фокусира. Традиционалне методе проналажења слика, попут оних које користе библиотеке, ослањале су се на слике које су ручно означене, што је скупо и дуготрајно, посебно имајући у виду велике и стално растуће постојеће базе података слика.

Референце

[уреди | уреди извор]
  1. ^ Форсyтх, Давид; Понце, Јеан (2012). Цомпутер висион: а модерн аппроацх. Пеарсон. 
  2. ^ Руссаковскy, Олга; Денг, Јиа; Су, Хао; Краусе, Јонатхан; Сатхеесх, Сањеев; Ма, Сеан; Хуанг, Зхихенг; Карпатхy, Андреј; Кхосла, Адитyа; Бернстеин, Мицхаел; Берг, Алеxандер C. (децембар 2015). „ИмагеНет Ларге Сцале Висуал Рецогнитион Цхалленге”. Интернатионал Јоурнал оф Цомпутер Висион (на језику: енглески). 115 (3): 211—252. ИССН 0920-5691. С2ЦИД 2930547. арXив:1409.0575Слободан приступ. дои:10.1007/с11263-015-0816-y. хдл:1721.1/104944Слободан приступ. Архивирано из оригинала 2023-03-15. г. Приступљено 2020-11-20. 
  3. ^ „Арцхивед цопy” (ПДФ). и.yз.yамагата-у.ац.јп. Архивирано из оригинала (ПДФ) 8. 8. 2014. г. Приступљено 13. 1. 2022. 

Литература

[уреди | уреди извор]