Leksikon-gramatika
Leksikon-gramatika predstavlja metodu i praktičan način formalnog opisivanja jezika.[1] Za njenog začetnika uzima se Moris Gros koji je pravljenjem leksikon-gramatike za francuski počeo da se bavi šezdesetih godina.[2] Teorijska osnova na kojoj se zasniva leksikon-gramatika je distribucionalizam Zeliga S. Harisa,[3][4] posebno pojam transformacije. Kovencije za obeležavanje gramatičkih informacija napravljene su s namerom da budu što jednostavnije i transparentnije. Metodologija leksikon-gramatike potiče od eksperimentalnih nauka[5]. U njima je naglasak stavljen na prikupljanje činjenica na račun realnosti jezičke upotrebe, i to sa kvantitativne (sistematičan opis leksike)i kvalitativne tačke gledišta (metodološke predostrožnosti). Leksikon-gramatika postavlja i zahtev za formalizacijom. Rezultati opisa moraju biti dovoljno formalizovani da bi lingvisti-informatičari mogli da pristupe automatskoj obradi jezika, pre svega pomoću sintaksičkih parsera.[6][7] U formalnom modelu leksikon-gramatike rezultati opisa su dati u obliku tabela zvanih tablice ili matrice, u kojima se leksička jedinica ukršta sa sintaksičko-sematičkim svojstvima.[8] Dobijeni rezultati su osnova sintaksičko-semantičkih informacija.
Teorijska osnova
[уреди | уреди извор]Teorijska osnova na kojoj se zasniva leksikon-gramatika je distribucionalizam Zeliga S. Harisa[3][4], posebno pojam transformacije u značenju Zeliga Harisa. Moris Gros je bio učenik Zeliga Harisa. Kovencije za obeležavanje gramatičkih informacija napravljene su s namerom da budu što jednostavnije i što transparentnije. Ovaj zahtev potiče od Zeliga Harisa, čija je teorija okrenuta prema neposrednom, za razliku od generativne gramatike koja se bavi apstraktnim strukturama, kao što su dubinska struktura i površinska struktura[9].
Prikupljanje činjenica
[уреди | уреди извор]Metodologija leksikon-gramatike potiče od eksperimentalnih nauka.[5] Ona stavlja naglasak na prikupljanje činjenica na račun konkretne jezičke upotrebe, i to sa kvantitativne i kvalitativne tačke gledišta.
Kvantitativno : leksikon-gramatika podrazumeva sistematičnan opis leksike. Kako je ovo posao velikih razmera, ostvariv samo uz pomoć ekipa, a ne pojedinačnih stručnjaka. Ispitivanje isključivo opštih pravila sintakse, nezavisno od leksičkog materijala na koji se primenjuju, pokazalo se kao nedovoljno dobro[10]. U tome leži razlika u odnosu na generativnu gramatiku, koja svoje težište ima na opštosti.[9]
Kvantitativno : niz metodoloških predostrožnosti primenjuje se kako bi se obezbedila dobra obnovljivost zapažanja, i pre svega kako bi se sprečio rizik od veštačkog konstruisanja primera.[11] Jedna od predostrožnosti ogleda se u prihvatanju elementarne rečenice kao minimalne jedinice značenja,[12] budući da reč dobija precizno značenje tek u kontekstu. Štaviše, ubacivanjem reči u rečenicu, dobija se prednost manipulisanja nizom pogodnim za ocenjivanje kao prihvatljivog ili neprihvatljivog. Po ovu cenu se sintaksičko-sematnička svojstva mogu smatrati definisanim s dovoljno preciznosti, da bi imalo smisla porediti ih sa čitavim leksikonom. Ove predostrožnosti su se razvijale srazmerno potrebama i pojavom novih tehničkih sredstava. Tako su s početkom devedesetih saradnici na leksikon-gramatici mogli sve lakše da dobiju pomoć primera potvrđenih na korpusu.[13] Ova nova predostrožnost je samo dodata na prethodne, čineći leksikon-gramatiku metodom koja se istovremeno i oslanja na lingvističku introspekciju i lingvistički korpus, kao što je predlagao i Čarls Filmor[14]. Les projets américains FrameNet[15] et VerbNet[16] ukazujući time na relativnu bliskost sa ciljevima leksikon-gramatike.
Formalizacija
[уреди | уреди извор]Leksikon-gramatika takođe postavlja i zahtev za formalizacijom. Rezultati opisa moraju biti dovoljno formalizovani kako bi omogućili:
- verifikaciju pri poređenju sa realnom upotrebom,
- primenu automatske obrade jezika, pre svega pomoću sintaksičkih parsera od strane informatičara.[6][7]
Ovaj zahtev za formalizacijom manifestuje se kroz usvajanje posebnog informatičkog modela sintakse i semantike. Tako je i prihvatljivost modelirana kao binarno svojstvo: za potrebe deskripcije, jedna rečenica može biti smatrana za prihvatljivu ili neprihvatljivu, kao i u generativnoj gramatici i to s istim razlogom. Isto tako, leksička dvosmislenost se predstavlja pažljivim razdvajanjem reči od ukupnog broja leksičkih unosaka, koji se razlikuju jednako kao i dva leksička unoska morfološki različitih reči (na primer, različita značenja reči manquer imaće različite leksičke unoske). Sintaksičko-semantička svojstva leksičkih unosaka (na primer strukture rečenica u kojima se dati glagol može pojaviti, ili distribucija subjekta) formiraju listu koja se sistematično sučeljavaju sa svim leksičkim unoscima. Oni su obeleženi dosta neformalno obleženi kao , što predstavlja transformaciju dve rečenične strukture (ili sintaksičke konstrukcije) bitne za jedan leksički unosak. Pojam leksičkog unoska se na taj način ne meša sa pojmom sintaksičke konstrukcije. Zato se i izbegava termin "supkategorizacioni okvir", koji se često koristi u kontekstu modela po kojima su ova dva pojma u odnosu bijekcije. U okviru leksikon-gramatike odluke o klasifikaciji ("supkategorizaciji") leksičkog unoska baziraju se apriori na celokupnosti sintaksičkih konstrukcija formiranih od datog leksičkog unoska, a ne na osnovu jedne konstrukcije ("okvira"). Najzad, usvajaju se samo ona svojstva za koja je moguće pronaći proceduru koja će omogućiti da se odredi dovoljno pouzdan način da se odredi da li je dati lingvistički unosak poseduje ili ne. Takva procedura se određuje eksperimentalno tako što se na proširenom vokabularu testira obnovljivost sudova. Svojstva se tako modeliraju binarno a ne kao kontinuumi. U skladu sa ovim formalnim modelom, suština opisa jednog jezika sastoji se u specifikovanju svojstava leksičkih jedinica. Rezultati opisa tako prirodno uzimaju oblik tabela s duplim unosom, zvanih tablice ili matrice, u kojima se leksički unosci ukrštaju sa sintaksičko-semantičkim svojstvima[8]. Opis strukture rečenica stavlja u igru identifikaciju svih argumenata karakterističnih za svaki od glagolskih unosaka; pre svega se primenjuju principi za razlikovanje argumenata (subjekata i objekata ili dopuna) od odredbi.
Rezultati
[уреди | уреди извор]Rezultati koje je desetina lingvista u toku desetak godina dobila primenom navedenih metodoloških principa čine bazu sintaksičko-semantičkih informacija za automatsku obradu jezika|. O kvalitetu ove baze možemo suditi uzimajući u obzir:
- njen obim, meren brojem unosaka,
- bogatstvo jezičkih fenomena koje uzima u obzir, mereno brojem svojstava
- i njen stepen formalizacije.
Za francuski jezik postoji preko 75.000 unosaka[17] ; manje ili više iscrpni opisi, koji uvek prate isti model, postoje i za desetinu drugih jezika, pri čemu su italijanski jezik, portugalski jezik, grčki jezik i korejski jezik najreprezentativniji[18], le portugalski jezik[19], le grčki jezik[20] et le korejski jezik[тражи се извор].
Rad na predikatskim imenicama bio je završen i objavljen pod okriljem leksikon-gramatike u toku sedamdesetih[21], a rad na ustaljenim izrazima u toku osamdesetih[22].
Pojam predikatske imenice potiče iz radova Zeliga Harisa[23]. Zasnovan je na ideji da ako, na primer, glagol proučavati analiziramo kao predikat u rečenici Luka proučava pomračenja Sunca, prirodno je analizirati imenicu proučavanje (ili nisku vršiti proučavanje) kao predikat u rečenici Luka vrši proučavanje pomračenja Sunca. U ovom slučaju, data imenica je izražena predikativno. Glagol koji joj prethodi, ovde vršiti kvalifikuje se kao glagol podrške. Ova ideja je primenjivana sistematično u okviru leksikon-gramatike počevši od sedamdesetih[21][24][25][26]. Saradnici na leksikon-gramatici govore o ustaljenim izrazima kada izraz (na primer stati na ludi kamen) ima specifična svojstva (ovde, svoje značenje) koje opravdava unošenje istog kao jednog od leksičkih unosaka, iako se sastoji iz više elemenata (stati, na, ludi i kamen) koji, na ovaj ili onaj način, mogu biti smatrani rečima[22]. Sistematičan opis ovih izraza je započet u okviru leksikon-gramatike od osamdesetih[27][28][29].
Kumulativnost
[уреди | уреди извор]Iskustvo je pokazalo da nekoliko pojedinaca ili ekipa može doći do istih rezultata. Ova obnovljivost osigurava kumulativnost opisa. Ovaj rezultat je od ključnog značaja za automatsku obradu jezika u budućnosti: količina podataka koji treba da budu sakupljeni i predstavljeni u okviru koherentnog modela je tolika da brojne ekipe za istraživanje i razvoj moraju da sarađuju i moraju da da spoje svoje rezultate tako da se suštinski delovi gramatike i leksike ne moraju iznova pisati za svaki jezik. Ovaj zahtev je još uvek daleko od jednostavnog rešenja, budući da nema puno primera gramatika značajnog obima koje nisu delo pojedinačnih stručnjaka.
Референце
[уреди | уреди извор]- ^ (језик: француски)Ibrahim, Amr Helmy. 2003. Le cadre du lexique-grammaire. Linx 48:101-122.
- ^ Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe. Paris : Larousse (reizdanje pod istim naslovom, Paris: Cantilène, 1986).
- ^ а б (језик: енглески) Harris, Zellig. 1964. "Transformations in Linguistic Structure", Proceedings of the American Philosophical Society 108:5, pp. 418-122.
- ^ а б Harris, Zellig (1976). Notes du cours de syntaxe. Paris: Seuil.
- ^ а б Lamiroy, Béatrice. 2003. "In memoriam Maurice Gross", Travaux de linguistique 46:1, pp. 145-158.
- ^ а б Michel Delamar, Maurice Gross, http://www.univ-paris-diderot.fr/2001/pres011212.htm Архивирано на сајту Wayback Machine (6. децембар 2006)
- ^ а б Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, Cambridge, Mass./ London, MIT Press.
- ^ а б Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives. Paris : Hermann.
- ^ а б Syntactic Structures - Noam Chomsky, David W. Lightfoot - Google Књиге
- ^ (језик: енглески) Gross, Maurice. 1979. On the failure of generative grammar. Language 55:4, pp. 859-885.
- ^ Gross, Maurice, A linguistic environment for comparative Romance syntax, Papers from the XIIth Linguistic Symposium on Romance Languages, 1984, pp. 373-446, Amsterdam/Philadelphia: John Benjamins.
- ^ Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, Séoul : Hanshin Pub. Co.
- ^ Pre svega zahvaljujući softveru Intex koji je razvio Maks Silberštajn.
- ^ (језик: енглески) Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, Mouton de Gruyter, pp. 35-60. (Proceedings from a 1992 Nobel Symposium on Corpus Linguistics, Stockholm.)
- ^ (језик: енглески) Baker, Collin F., Charles J. Fillmore, Beau Cronin. 2003. "The Structure of the Framenet Database", International Journal of Lexicography 16.3, pp. 281-296.
- ^ (језик: енглески) Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.[мртва веза]
- ^ Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), Berlin-New York: Walter de Gruyter, pp. 2122-2129.
- ^ (језик: енглески) D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, Amsterdam/Philadelphia : Benjamins, pp. 125–136.
- ^ (језик: енглески) Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
- ^ Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
- ^ а б Labelle, Jacques. 1974. "Le substantif symétrique". Cahiers de Linguistique 5, pp. 17-49, Montréal: UQAM.
- ^ а б Gross, Maurice. 1982. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11.2, pp. 151-185, Montréal: UQAM.
- ^ (језик: енглески) Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphie, Université de Pennsylvanie (republié dans Papers in Structural and Transformational Linguistics, 1970, Dordrecht:Reidel).
- ^ Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique. Genève: Droz.
- ^ Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support. Genève: Droz.
- ^ Gross, Gaston. 1989. Les constructions converses du français, Genève : Droz.
- ^ Danlos, Laurence. 1981. La morphosyntaxe des expressions figées. Langages 63, pp. 53-74, Paris : Larousse. pdf Архивирано на сајту Wayback Machine (24. септембар 2015)
- ^ (језик: енглески) Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6. pdf
- ^ (језик: португалски) Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguistica 1-2, Lisboa: Instituto Nacional de Investigaçao Cientifica.
Литература
[уреди | уреди извор]Vidi još
[уреди | уреди извор]Povezani članci
[уреди | уреди извор]Spoljašnje veze
[уреди | уреди извор]- Visualisation de tables de lexique-grammaire (praćeno Jezičkim podacima, Leksikon-gramatikom).(језик: француски)
Bibliografija
[уреди | уреди извор]- Boons, Jean-Paul ; Alain Guillet ; Christian Leclère. 1976. La structure des phrases simples en français. Constructions intransitives, Genève : Droz.(језик: француски)
- Guillet, Alain ; Christian Leclère. 1992. La structure des phrases simples en français. Constructions transitives locatives, Genève : Droz.(језик: француски)
- Gross, Maurice. 1994. Constructing Lexicon-grammars, in Computational Approaches to the Lexicon, Atkins and Zampolli (eds.), Oxford University Press, pp. 213-263.(језик: француски)