Пређи на садржај

Тезаурус

С Википедије, слободне енциклопедије

Тезаурус је врста терминолошког речника који садржи системско уређене називе одређеног научног подручја и основа је сваке научне дисциплине.[1] Да би био употребљив, међу називима морају постојати одређени парадигматски односи и односи еквиваленције. Те врсте односа код докумената подржаних рачунаром уређују се израдом тезауруса. Данас је тезаурус незаобилазно помагало за означавање и претраживање информација. Иако укључује синониме, антониме и хомониме садржај тезауруса се не сме се сматрати као попис истих.[2] Формиран је тако да оцртава тачну разлику између сличних речи и да помаже у одабиру праве речи.

Тезаурусу се понекад користе да би се избегло понављање речи, што доводи до елегантних варијација, које често критикују приручници за употребу: „писци их понекад користе не само да би варирали речнике, већ и за прекомерно украшавање“.[3]

Етимологија[уреди | уреди извор]

Реч „тесаурус” потиче од латинске речи thēsaurus, која је произашла из грчке речи θησαυρός (thēsauros) са значењем 'благо, ризница, магацин'.[4] Реч thēsauros је неизвесне етимологије.[4][5]

До 19. века, тезаурус је био који речник или енциклопедија, као у Thesaurus Linguae Latinae (Речник латинског језика, 1532) и Thesaurus Linguae Graecae (Речник грчког језика, 1572). Роџет је увео значење „збирка речи поређаних према смислу“ 1852. године.[4]

Развој тезауруса[уреди | уреди извор]

Реч тезаурус (речник синонимних, асоцијативних појмова) изведеница је из латинског језика из 16. века и новолатинске речи тхесаурус која је настала од грчке ријечи θησαυρός, тхесаурос - складиште, ризница, благо, драгоценост. Израз тезаурус је употребљаван у различитом значењу о чему сведочи бројна литература, што значи да се с развојем тезауруса проширивало и његово значење: а) језичко благо, збирка језичког блага, б) било какав речник, енциклопедија, лексикографски приручник, ц) попис семантички повезаних речи, д) речник синонима, е) абецедно успостављен речник синонима и антонима, и ф) специјализовани вокабулар поједине области, на пример медицине или музике.

Од средњег века тај се израз користи у пренесеном значењу за речнике, а касније за енциклопедије (у смислу језичног блага). Израз тезаурус ближи данашњој употреби 1852. године употребио је енглески лекар Питер Роџет у свом делу „Тезаурус – речник синонима енглеског језика”. Оно што му је заједничко данашњим тезаурусима јесте то што одговара на питања „Како наћи неки израз?“. Разлика је у томе што је то речник синонима те настоји да обухвати богатство језика за омогућавање разноликости изражавања, док документацијски тезаурус настоји да ограничи разноврсност природног језика, јер за исти или сличан појам увек треба користити исту ознаку.

У историји тезауруса пресудан је био систем UNITERM[6] који је помогао развоју тезауруса у смислу информацијског претраживања.[7] На међународној конференцији о општим принципима изградње тезауруса у Варшави (1970), постаје признат лексички инструмент у претраживању информација, као речник термина с прецизираним везама појмова.УНИСИСТ је израдио „Смернице за обликовање и развој научних и техничких тезауруса” (Смернице за успостављање и развој научно-техничког тезауруса за проналажење информација) које су укључене у међународне стандарде.

Дефиниције тезауруса[уреди | уреди извор]

Дефиниција тезауруса није само једна већ их има неколико и свака од њих на неки начин представља поглед аутора као и намену тезауруса. У свом излагању на конференцији у Варшави Тхомас Аитцхисон рекао је да је то абецедни попис појмова – дескриптора који пружа информацију о структурним особинама и односима појмова.

Немачко друштво за документацију тезаурус дефинише као збирку речи природног језика (општег и стручног) са приказом њихових појмовних односа.

Према стандарду ИСО 2788-1986, то је средство за терминолошку контролу, које се користи при превођењу природног језика документа, кључних речи и говора корисника у ужи, “системски језик” (документацијски/информацијски језик). Називи дескрипторског језика омогућавају детаљно индексовање докумената и тражење информација помоћу тих назива. Мора садржати све дескрипторе које користи одређени систем и исказати њихову појмовну сродност. Морају се исказати и кључне речи унутар система, које су речи споредног значења у односу на прихваћене дескрипторе.

Врсте тезауруса[уреди | уреди извор]

Тезаурус може бити: једнојезични (дескриптори/недескриптори из даног природног језика); вишејезични (дескриптори/недескриптори из више природних језика); изворни (исходиште за израду нових тезауруса); циљани (развијен из изворног тезауруса); микротезаурус (део већег тезауруса; макротезаурус (покрива широко подручје знања); специјални тезаурус (омеђен на уже подручје знања); тематски (дескриптори се разврставају по темама, подручјима, дисциплинама интереса); фасетни (појмови су апстрактније, али темељитије заступљени; фасете (групе појмова исте природе које имају по једну заједничку карактеристику) омогућују поделу речника у семантичка поља; с водећим изразима (само један израз за појам довољан је за индексирање; без водећих израза (сви изрази су дескриптори).

Везе међу терминима у тезаурусу и симболи у употреби[уреди | уреди извор]

Вредност тезауруса лежи у везама међу терминима које се утврђују према унапред одређеној схеми, а она одређује однос међу појмовима ради веће прецизности. Постоје две групе веза: парадигматске (еквиваленција - приступ дескрипторима преко појмова у природном језику; хијерархија – генеричке везе које заступају разред појмова и партитивне везе које приказују однос појма и његовог дела; асоцијација – аналогија значења међу појмовима) и синтагматске (наводе везе међу дескрипторима с обзиром на контекст, уједињују синтактичке и семантичке везе). У завршној фази израдбе тезауруса проводи се практична провера која показује његову функционалност, а одржавање се проводи периодичком провером учесталости употребе дескриптора. Кључно за рад тезауруса је усвајање општеприхваћеног класификацијског система као основе.

Односи у тезаурусу морају бити јасно дефинисани и кодирани, а у означавању међусобних односа кодовима у општој су употреби ови симболи: БТ (надређени шири појам), НТ (подређени ужи појам), БТГ (надређени генерички појам), БТП (надређени партитивни појам), НТГ (подређени генерички појам), НТП (подређени партитивни појам), РТ (сродни појам), УСЕ/употреба (упутство за синоним или квазисиноним; синоним-синоним), УФ/употреба за (синоним, квазисиноним, дескриптор-синоним), УФЦ (за комбинацију појмова).

Израда тезауруса[уреди | уреди извор]

Тезаурус израђен на систематском или формалном начелу саставља се методом анализе и систематике, зависно од типа подручја литературе. При аналитичкој методи анализирају се елементи који садржајно покривају подручје тезауруса, а током израде тезауруса стално се укључују нови документи. Извори термина су експериментално индексирање докумената, питања корисника и стручњака. Кориштењем систематске (глобалне, синтетичке) методе класифицира се садржај подручја, а тезаурус настаје на подлози искуства стручњака за поједино подручје. Изрази се траже у секундарним публикацијама (каталози, приручници и уџбеници, стручни речници, класификацијске схеме). У прикупљању термина може се поћи од аналитичке методе која се затим допуњава глобалном методом или од синтетичке методе при којој се из секундарних извора издвајају термини који чине оквир тезауруса, а аналитичком се методом прилагођавају стварном садржају. Сваки појам треба бити заступљен једним дескриптором или групом дескриптора који одговара даном у тезаурусу и по могућности им одредити садржај. Темељни захтев при изради тезауруса је постизање једнозначности при чему помажу хомоними и квалификатори који прецизирају значење сложеног дескриптора, затим објашњења и напомене о употреби, дефиниција која прецизира садржај.

До стварања лажних веза и докумената нерелевантних за упит долази због парадигматске повезаности једноставних дескриптора, тј. лажне координације. Она се отклања кориштењем индикатора улоге (симболи за смањивање опсега означеног) и индикатора смера (повезивање у смислене целине). Структуру дескриптора чине његов шири израз, ужи и сродни изрази те синоними у облику именице/глаголске именице. Структуру тезауруса чини облик сваког појма у тезаурусу у међусобним везама, а упутства у тезаурусу приказују везе међу појмовима. Обавезни делови тезауруса су увод, абецедни индекс појмова и систематски индекс дескриптора. Термини у тезаурусу могу се комбиновати у претходно повезане дескрипторе (прекоординација) или се изрази могу ставити у односе накнадно у поступку означивања или претраживања (накнадна координација).

Речник и тезаурус[уреди | уреди извор]

Тезаурус не дефинише тачну реч, тај посао је остављен речнику. Разлика између речника и тезауруса најчешће се тумачи као разлика између абецедног и концептуалног приступа. Корисник речника тражи значење речи, с друге стране, корисник тезауруса поћи ће од идеје, појма, концепта, трагајући за речима, односно за најбољом речи која ће тај појам изразити на најприкладнији начин. Речник даје значења речима, а тезаурус нуди речи за значења. Ако је појам двосмислен, може бити додано објашњен, како би се осигурала тачност.

Начини употребе[уреди | уреди извор]

Уобичајена упораба јест да су тезаурус и казало у тисканом облику. Под уобичајеном се употребом подразумева да су његови корисници и особе које индексирају и особе које претражују. Особа која индексира прегледа тезаурус како би утврдила одговарајуће термине за појмове које треба индексирати, док особа која претражује користи исти тезаурус како би утврдила одговарајуће термине које треба користити за тражење појмова који је занимају.

Ако су и тезаурус и збирка грађе коју означава у дигиталном облику, тада су могућа два начина употребе тезауруса: индексни тезаурус и тезаурус за претраживање.

Индексни се тезаурус користи када руковатељи системом претпостављају да њихови корисници неће хтјети да користе тезаурус у припреми претраживања, него ће то истраживање желети да спроведу путем слободно одабраних термина за претраживање. Сврха је индексног тезауруса да се обогате записи у бази података тако да сваки термин који особа која претражује изабере, треба бити присутан у претраживању (додавање свих синонима и ужих појмова). Тезаурус за претраживање користи се на супротан начин, као помоћ при претраживању базе података којој се не додају термини и тезауруса. Овај се тезаурус користи у сврху како би побољшао изразе за претраживање укључене у систем: синониме, уже појмове; шири и сродни појмови могу бити додани почетним терминима које предлаже корисник/особа која претражује. То може бити подржано аутоматски (термини се додају уза знање корисника) или интерактивно (корисник одмах одабире које од могућих термина треба још додати). Ти нови начини употребе тезауруса у многоме проширују његове могућности у дигиталном окружењу.

Данас је велико занимање за метатезаурусе – то су помагала која допуштају конверзију термина између појединих тезауруса. Један од најразрађенијих је примера Јединствени медицински језични систем (енгл. Unified Medical Language System – UMLS) Националне медицинске библиотека (енгл. National Library of Medicine – NLM). Садржи метатезаурус који укључује и друге речнике из различитих поља медицине.

Тезауруси српског језика[уреди | уреди извор]

Први тезаурус српског језика, по напомени из предговора издања 1940. године, је био састављен по угледу на Roget's Thesaurus енглеског језика.

  • Систематски речник српскохрватскога језика, Ранко Јовановић, Београд, 1940
  • Систематски речник српскохрватскога језика, Ранко Јовановић и Лаза Атанацковић, Матица Српска, Београд, 1980

Референце[уреди | уреди извор]

  1. ^ Реид, Кyра. „Сyнонyм Дицтионарy Wордс анд Пхрасес”. Поwер Тхесаурус. Приступљено 18. 9. 2012. 
  2. ^ Америцан Херитаге Дицтионарy оф тхе Енглисх Лангуаге, 5тх едитион, Хоугхтон Миффлин Харцоурт 2011, ISBN 9780547041018. стр. xxвии.
  3. ^ Едwин L. Баттистелла, "Беwаре тхе тхесаурус", ОУПблог, "Оxфорд Университy Пресс'с Ацадемиц Инсигхтс фор тхе Тхинкинг Wорлд", Фебруарy 11, 2018
  4. ^ а б в "тхесаурус". Онлине Етyмологy Дицтионарy.
  5. ^ Р. С. П. Беекес, Етyмологицал Дицтионарy оф Греек, Брилл, 2009, п. 548.
  6. ^ УНИТЕРМ, Мортимер Таубе, 1951.
  7. ^ „Ингwерсен, П. (1992). Информатион Ретриевал Интерацтион. Лондон: Таyлор Грахам.”. Архивирано из оригинала 2007-11-25. г. Приступљено 2007-11-28. 

Литература[уреди | уреди извор]

  • Баwден D. (1950). Тезауруси: нова постигнућа. Вјесник библиотекара Хрватске. 44(2001), 1/4; стр. 182-187.
  • Хорват, А. Тезаурус термина из књижевности и знаности о књижевности : магистарски рад. Загреб : А. Хорват, 1981.
  • Лешчић, Ј. Класификација и предметно означивање : приручник за стручне испите. Загреб : Наклада Недиљко Доминовић, 2007.
  • Лешић Ј. (1950). О тезаурусу: начела, израдба структура: преглед. Вјесник библиотекара Хрватске. 44 (2001), 1/4; стр. 172 - 181
  • Николић-Хоyт А. Концептуална лексикографија : према тезаурусу хрватскога језика. Загреб : Хрватска свеучилишна наклада, 2004.
  • Урбанија, Ј. ; Лешчић, Ј. Методологија израде тезауруса. Загреб : Наклада Недиљко Доминовић, 2004.
  • Владимир Анић,Хрватски енциклопедијски рјечник, Нови Либер, Загреб, 2003.
  • Цоллинсон, W. Е. (1939). „Цомпаративе Сyнонyмицс: Соме Принциплес анд Иллустратионс”. Трансацтионс оф тхе Пхилологицал Социетy. 38: 54—77. дои:10.1111/ј.1467-968X.1939.тб00202.x. 
  • Герда Хасслер, "Лафаyе'с Дицтионнаире дес сyнонyмес ин тхе Хисторy оф Семантицс" ин Схели Емблетон, Јохн Е. Јосепх, Ханс-Јосеф Хиедерехе, Тхе Емергенце оф тхе Модерн Лангуаге Сциенцес, Јохн Бењаминс 1999, ISBN 1556197594.1:27-40
  • Wернер Хüллен, "Рогет'с Тхесаурус, децонструцтед" ин Хисторицал Дицтионариес анд Хисторицал Дицтионарy Ресеарцх, паперс фром тхе Интернатионал Цонференце он Хисторицал Леxицограпхy анд Леxицологy, Университy оф Леицестер, 2002, Маx Ниемеyер Верлаг 2004, ISBN 3484391235. стр. 83-94.
  • Wернер Хüллен, А хисторy оф Рогет'с тхесаурус : оригинс, девелопмент, анд десигн, Оxфорд Университy Пресс 2004, Хüллен, Wернер (2004). А Хисторy оф Рогет'с Тхесаурус: Оригинс, Девелопмент, анд Десигн. Оxфорд Университy Пресс. ИСБН 0199254729. 
  • Wернер Хüллен, Нетwоркс анд Кноwледге ин Рогет'с Тхесаурус, Оxфорд, Јануарy 2009, Хüллен, Wернер (2009). Нетwоркс анд Кноwледге ин Рогет'с Тхесаурус. ИСБН 978-0-19-955323-5. дои:10.1093/ацпроф:осо/9780199553235.001.0001. 
  • Ноyес, Гертруде Е. (1951). „Тхе Бегиннингс оф тхе Студy оф Сyнонyмс ин Енгланд”. ПМЛА. 66 (6): 951—970. ЈСТОР 460151. С2ЦИД 163618345. дои:10.2307/460151. 
  • Ериц Станлеy, "Полyсемy анд Сyнонyмy анд хоw тхесе Цонцептс wере Ундерстоод фром тхе Еигхтеентх Центурy онwардс ин Треатисес, анд Апплиед ин Дицтионариес оф Енглисх" ин Хисторицал Дицтионариес анд Хисторицал Дицтионарy Ресеарцх, паперс фром тхе Интернатионал Цонференце он Хисторицал Леxицограпхy анд Леxицологy, Университy оф Леицестер, 2002, Маx Ниемеyер Верлаг 2004, ISBN 3484391235. стр. 157-184.

Спољашње везе[уреди | уреди извор]