Аутоматско означавање слика

Аутоматско означавање слика (такође познат као аутоматско обележавање слика или лингвистичко индексирање) је процес којим рачунарски систем аутоматски додељује метаподатке у облику натписа или кључних речи дигиталној слици. Ова примена техника компјутерског вида се користи у системима за проналажење слика за организовање и лоцирање слика од интереса из базе података.

Овај метод се може сматрати врстом вишекласне класификације слика са веома великим бројем класа – великим колико и величина речника.^[1]^[2] Обично се техникама машинског учења користе анализе слике у облику екстрахованих вектора карактеристика и речи напомена за обуку, како би покушали да аутоматски примене напомене на нове слике. Прве методе су научиле корелације између карактеристика слике и напомена за обуку, затим су развијене технике коришћењем машинског превођења како би се покушало да се преведе текстуални речник 'визуелним речником', или груписаним регионима познатим као мрље. Рад који прати ове напоре укључивао је класификационе приступе, моделе релевантности и тако даље.

Предности аутоматског означавања слика у односу на проналажење слика засновано на садржају (ЦБИР) су у томе што корисник може природније да одреди упите.^[3] ЦБИР генерално (тренутно) захтева од корисника да претражују по концептима слике као што су боја и текстура, или да пронађу примере упита. Одређене карактеристике слике у примерима слика могу заменити концепт на који се корисник заиста фокусира. Традиционалне методе проналажења слика, попут оних које користе библиотеке, ослањале су се на слике које су ручно означене, што је скупо и дуготрајно, посебно имајући у виду велике и стално растуће постојеће базе података слика.

Референце

^ Форсyтх, Давид; Понце, Јеан (2012). Цомпутер висион: а модерн аппроацх. Пеарсон.
^ Руссаковскy, Олга; Денг, Јиа; Су, Хао; Краусе, Јонатхан; Сатхеесх, Сањеев; Ма, Сеан; Хуанг, Зхихенг; Карпатхy, Андреј; Кхосла, Адитyа; Бернстеин, Мицхаел; Берг, Алеxандер C. (децембар 2015). „ИмагеНет Ларге Сцале Висуал Рецогнитион Цхалленге”. Интернатионал Јоурнал оф Цомпутер Висион (на језику: енглески). 115 (3): 211—252. ИССН 0920-5691. С2ЦИД 2930547. арXив:1409.0575 . дои:10.1007/с11263-015-0816-y. хдл:1721.1/104944 . Архивирано из оригинала 2023-03-15. г. Приступљено 2020-11-20.
^ „Арцхивед цопy” (ПДФ). и.yз.yамагата-у.ац.јп. Архивирано из оригинала (ПДФ) 8. 8. 2014. г. Приступљено 13. 1. 2022.

Литература

Датта, Ритендра; Дхирај Јосхи; Јиа Ли; Јамес З. Wанг (2008). „Имаге Ретриевал: Идеас, Инфлуенцес, анд Трендс оф тхе Неw Аге”. АЦМ Цомпутинг Сурвеyс. 40 (2): 1—60. С2ЦИД 7060187. дои:10.1145/1348246.1348248.
Ницолас Хервé; Нозха Боујемаа (2007). „Имаге аннотатион : wхицх аппроацх фор реалистиц датабасес ?” (ПДФ). АЦМ Интернатионал Цонференце он Имаге анд Видео Ретриевал. Архивирано из оригинала (ПДФ) 2011-05-20. г.
M Иноуе (2004). „Он тхе неед фор аннотатион-басед имаге ретриевал” (ПДФ). Wорксхоп он Информатион Ретриевал ин Цонтеxт. стр. 44—46. Архивирано из оригинала (ПДФ) 2014-08-08. г.
Y Мори; Х Такахасхи; Р Ока (1999). „Имаге-то-wорд трансформатион басед он дивидинг анд вецтор qуантизинг имагес wитх wордс.”. Процеедингс оф тхе Интернатионал Wорксхоп он Мултимедиа Интеллигент Стораге анд Ретриевал Манагемент. ЦитеСеерX 10.1.1.31.1704 .
П Дуyгулу; К Барнард; Н де Фретиас; D Форсyтх (2002). „Објецт рецогнитион ас мацхине транслатион: Леарнинг а леxицон фор а фиxед имаге воцабуларy”. Процеедингс оф тхе Еуропеан Цонференце он Цомпутер Висион. стр. 97—112. Архивирано из оригинала 2005-03-05. г.
Ј Ли; Ј З Wанг (2006). „Реал-тиме Цомпутеризед Аннотатион оф Пицтурес”. Проц. АЦМ Мултимедиа. стр. 911—920.
Ј З Wанг; Ј Ли (2002). „Леарнинг-Басед Лингуистиц Индеxинг оф Пицтурес wитх 2-D МХММс”. Проц. АЦМ Мултимедиа. стр. 436—445.
Ј Ли; Ј З Wанг (2008). „Реал-тиме Цомпутеризед Аннотатион оф Пицтурес”. ИЕЕЕ Трансацтионс он Паттерн Аналyсис анд Мацхине Интеллигенце.
Ј Ли; Ј З Wанг (2003). „Аутоматиц Лингуистиц Индеxинг оф Пицтурес бy а Статистицал Моделинг Аппроацх”. ИЕЕЕ Трансацтионс он Паттерн Аналyсис анд Мацхине Интеллигенце. стр. 1075—1088.
К Барнард; D А Форсyтх (2001). „Леарнинг тхе Семантицс оф Wордс анд Пицтурес”. Процеедингс оф Интернатионал Цонференце он Цомпутер Висион. стр. 408—415. Архивирано из оригинала 2007-09-28. г.
D Блеи; А Нг; M Јордан (2003). „Латент Дирицхлет аллоцатион” (ПДФ). Јоурнал оф Мацхине Леарнинг Ресеарцх. стр. 3:993—1022. Архивирано из оригинала (ПДФ) 16. 3. 2005. г.
Г Царнеиро; А Б Цхан; П Морено; Н Васцонцелос (2006). „Супервисед Леарнинг оф Семантиц Цлассес фор Имаге Аннотатион анд Ретриевал” (ПДФ). ИЕЕЕ Трансацтионс он Паттерн Аналyсис анд Мацхине Интеллигенце. стр. 394—410.
Р W Пицард; Т П Минка (1995). „Висион Теxтуре фор Аннотатион”. Мултимедиа Сyстемс.
C Цусано; Г Циоцца; Р Сцеттини (2004). Сантини, Симоне; Сцхеттини, Раимондо, ур. „Имаге Аннотатион Усинг СВМ”. Интернет Имагинг V. 5304: 330—338. Бибцоде:2003СПИЕ.5304..330Ц. С2ЦИД 16246057. дои:10.1117/12.526746.
Р Марее; П Геуртс; Ј Пиатер; L Wехенкел (2005). „Рандом Субwиндоwс фор Робуст Имаге Цлассифицатион”. Процеедингс оф тхе ИЕЕЕ Интернатионал Цонференце он Цомпутер Висион анд Паттерн Рецогнитион. стр. 1:34—30.
Ј Јеон; Р Манматха (2004). „Усинг Маxимум Ентропy фор Аутоматиц Имаге Аннотатион” (ПДФ). Инт'л Цонф он Имаге анд Видео Ретриевал (ЦИВР 2004). стр. 24—32.
Ј Јеон; V Лавренко; Р Манматха (2003). „Аутоматиц имаге аннотатион анд ретриевал усинг цросс-медиа релеванце моделс” (ПДФ). Процеедингс оф тхе АЦМ СИГИР Цонференце он Ресеарцх анд Девелопмент ин Информатион Ретриевал. стр. 119—126.
V Лавренко; Р Манматха; Ј Јеон (2003). „А модел фор леарнинг тхе семантицс оф пицтурес” (ПДФ). Процеедингс оф тхе 16тх Цонференце он Адванцес ин Неурал Информатион Процессинг Сyстемс НИПС.
Р Јин; Ј Y Цхаи; L Си (2004). „Еффецтиве Аутоматиц Имаге Аннотатион виа А Цохерент Лангуаге Модел анд Ацтиве Леарнинг” (ПДФ). Процеедингс оф MM'04.
D Метзлер; Р Манматха (2004). „Ан инференце нетwорк аппроацх то имаге ретриевал” (ПДФ). Процеедингс оф тхе Интернатионал Цонференце он Имаге анд Видео Ретриевал. стр. 42—50.
С Фенг; Р Манматха; V Лавренко (2004). „Мултипле Берноулли релеванце моделс фор имаге анд видео аннотатион” (ПДФ). ИЕЕЕ Цонференце он Цомпутер Висион анд Паттерн Рецогнитион. стр. 1002—1009.
Ј Y Пан; Х-Ј Yанг; П Дуyгулу; C Фалоутсос (2004). „Аутоматиц Имаге Цаптионинг” (ПДФ). Процеедингс оф тхе 2004 ИЕЕЕ Интернатионал Цонференце он Мултимедиа анд Еxпо (ИЦМЕ'04). Архивирано из оригинала (ПДФ) 2004-12-09. г.
Qуан Хоанг Лам; Qуанг Дуy Ле; Киет Ван Нгуyен; Нган Луу-Тхуy Нгуyен (2020). „УИТ-ВиИЦ: А Датасет фор тхе Фирст Евалуатион он Виетнамесе Имаге Цаптионинг”. Процеедингс оф тхе 2020 Интернатионал Цонференце он Цомпутатионал Цоллецтиве Интеллигенце (ИЦЦЦИ 2020). арXив:2002.00175 . дои:10.1007/978-3-030-63007-2_57.
Ј Фан; Y Гао; Х Луо; Г Xу (2004). „Аутоматиц Имаге Аннотатион бy Усинг Цонцепт-Сенситиве Салиент Објецтс фор Имаге Цонтент Репресентатион”. Процеедингс оф тхе 27тх аннуал интернатионал цонференце он Ресеарцх анд девелопмент ин информатион ретриевал. стр. 361—368.
А Олива; А Торралба (2001). „Моделинг тхе схапе оф тхе сцене: а холистиц репресентатион оф тхе спатиал енвелопе” (ПДФ). Интернатионал Јоурнал оф Цомпутер Висион. стр. 42:145—175. Архивирано из оригинала (ПДФ) 08. 12. 2006. г. Приступљено 19. 08. 2024.
А Yавлинскy, Е Сцхофиелд; С Рüгер (2005). „Аутоматед Имаге Аннотатион Усинг Глобал Феатурес анд Робуст Нонпараметриц Денситy Естиматион” (ПДФ). Инт'л Цонф он Имаге анд Видео Ретриевал (ЦИВР, Сингапоре, Јул 2005). Архивирано из оригинала (ПДФ) 2005-12-20. г.
Н Васцонцелос; А Липпман (2001). „Статистицал Моделс оф Видео Струцтуре фор Цонтент Аналyсис анд Цхарацтеризатион” (ПДФ). ИЕЕЕ Трансацтионс он Имаге Процессинг. стр. 1—17.
Илариа Бартолини; Марцо Пателла; Цоррадо Романи (2010). „Схиатсу: Семантиц-басед Хиерарцхицал Аутоматиц Таггинг оф Видеос бy Сегментатион Усинг Цутс”. 3рд АЦМ Интернатионал Мултимедиа Wорксхоп он Аутоматед Информатион Еxтрацтион ин Медиа Продуцтион (АИЕМПро10).
Yохан Јин; Латифур Кхан; Леи Wанг; Мамоун Аwад (2005). „Имаге аннотатионс бy цомбининг мултипле евиденце & wордНет”. 13тх Аннуал АЦМ Интернатионал Цонференце он Мултимедиа (MM 05). стр. 706—715.
Цхангху Wанг; Фенг Јинг; Леи Зханг; Хонг-Јианг Зханг (2006). „Имаге аннотатион рефинемент усинг рандом wалк wитх рестартс”. 14тх Аннуал АЦМ Интернатионал Цонференце он Мултимедиа (MM 06).
Цхангху Wанг; Фенг Јинг; Леи Зханг; Хонг-Јианг Зханг (2007). „цонтент-басед имаге аннотатион рефинемент”. ИЕЕЕ Цонференце он Цомпутер Висион анд Паттерн Рецогнитион (ЦВПР 07). дои:10.1109/ЦВПР.2007.383221.
Илариа Бартолини; Паоло Циацциа (2007). „Имагинатион: Еxплоитинг Линк Аналyсис фор Аццурате Имаге Аннотатион”. Спрингер Адаптиве Мултимедиа Ретриевал. дои:10.1007/978-3-540-79860-6_3.
Илариа Бартолини; Паоло Циацциа (2010). „Мулти-дименсионал Кеywорд-басед Имаге Аннотатион анд Сеарцх”. 2нд АЦМ Интернатионал Wорксхоп он Кеywорд Сеарцх он Струцтуред Дата (КЕYС 2010).
Емре Акбас; Фатос Y. Вурал (2007). „Аутоматиц Имаге Аннотатион бy Енсембле оф Висуал Десцрипторс”. Интл. Цонф. он Цомпутер Висион (ЦВПР) 2007, Wорксхоп он Семантиц Леарнинг Апплицатионс ин Мултимедиа. дои:10.1109/ЦВПР.2007.383484. хдл:11511/16027 .
Амеесх Макадиа анд Владимир Павловиц анд Сањив Кумар (2008). „А Неw Баселине фор Имаге Аннотатион” (ПДФ). Еуропеан Цонференце он Цомпутер Висион (ЕЦЦВ).
Цхонг Wанг анд Давид Блеи анд Ли Феи-Феи (2009). „Симултанеоус Имаге Цлассифицатион анд Аннотатион” (ПДФ). Цонф. он Цомпутер Висион анд Паттерн Рецогнитион (ЦВПР).
Маттхиеу Гуиллаумин анд Тхомас Менсинк анд Јакоб Вербеек анд Цорделиа Сцхмид (2009). „ТагПроп: Дисцриминативе Метриц Леарнинг ин Неарест Неигхбор Моделс фор Имаге Ауто-Аннотатион” (ПДФ). Интл. Цонф. он Цомпутер Висион (ИЦЦВ).
Yасхасwи Верма; C. V. Јаwахар (2012). „Имаге Аннотатион Усинг Метриц Леарнинг ин Семантиц Неигхбоурхоодс” (ПДФ). Еуропеан Цонференце он Цомпутер Висион (ЕЦЦВ). Архивирано из оригинала (ПДФ) 2013-05-14. г. Приступљено 2014-02-26.
Венкатесх Н. Муртхy; Субхрансу Маји анд Р. Манматха (2015). „Аутоматиц Имаге Аннотатион Усинг Дееп Леарнинг Репресентатионс” (ПДФ). Интернатионал Цонференце он Мултимедиа (ИЦМР).
Сарин, Супхеакмунгкол; Фахрмаир, Мицхаел; Wагнер, Маттхиас; Камеyама, Wатару (2012). Леверагинг Феатурес фром Бацкгроунд анд Салиент Регионс фор Аутоматиц Имаге Аннотатион. Јоурнал оф Информатион Процессинг. 20. стр. 250—266.
Н. Б. Марвасти; Е. Yöрüк анд Б. Ацар (2018). „Цомпутер-Аидед Медицал Имаге Аннотатион: Прелиминарy Ресултс Wитх Ливер Лесионс ин ЦТ”. ИЕЕЕ Јоурнал оф Биомедицал анд Хеалтх Информатицс.

[Forsyth2012-1] Форсyтх, Давид; Понце, Јеан (2012). Цомпутер висион: а модерн аппроацх. Пеарсон.

[:2-2] Руссаковскy, Олга; Денг, Јиа; Су, Хао; Краусе, Јонатхан; Сатхеесх, Сањеев; Ма, Сеан; Хуанг, Зхихенг; Карпатхy, Андреј; Кхосла, Адитyа; Бернстеин, Мицхаел; Берг, Алеxандер C. (децембар 2015). „ИмагеНет Ларге Сцале Висуал Рецогнитион Цхалленге”. Интернатионал Јоурнал оф Цомпутер Висион (на језику: енглески). 115 (3): 211—252. ИССН 0920-5691. С2ЦИД 2930547. арXив:1409.0575 . дои:10.1007/с11263-015-0816-y. хдл:1721.1/104944 . Архивирано из оригинала 2023-03-15. г. Приступљено 2020-11-20.

[3] „Арцхивед цопy” (ПДФ). и.yз.yамагата-у.ац.јп. Архивирано из оригинала (ПДФ) 8. 8. 2014. г. Приступљено 13. 1. 2022.

[1]

[2]

[3]