Горњолужичкосрпски текстуални корпус
Горњолужичкосрпски текстуални корпус | |
---|---|
Веб-адреса | kontext.korpus.cz |
Комерцијалност | не |
Доступан на | горњолужичкосрпски |
Власник | Карлов универзитет |
Покренут | 2001 |
Горњолужичкосрпски текстуални корпус (глсрп. HOrnjoserbski Tekstowy KOrpus; скраћ. HoTKo)[1] дигитални је текстуални корпус горњолужичкосрпског језика.
Историја
[уреди | уреди извор]Историја горњолужичкосрпског текстуалног корпуса је повезана са пројектом Лужичкосрпског института за стварање електронског једнојезичног горњолужичкосрпског речника у првој половини 1990-их година. Међутим, овај пројекат није реализован. Године 1996, почео је рад на стварању електронског горњолужичкосрпског текстуалног корпуса. Оснивач корпуса био је радник Лужичкосрпског института Едвард Ворнар. Након што се 2003. године Ворнар преселио у Лајпциг, одговорност је прешла на руководиоца Лужичкосрпке централне библиотеке Франца Шена.[2] Године 2001, корпус је почео да ради на сајту Лужичкосрпског института. Онда је био двојезичан — лужичкосрпско-енглески.[3] У одабирању актуелних текстова (књига, новина и часописа) учествовали су Народно издавачко предузеће „Домовина” у Бауцену и Језички центар WITAJ. Већина текстова је скенирана од стране научно-техничког персонала Лужичкосрпског института.[4] Горњолужичкосрпски текстуални корпус ради у сарадњи са Институтом чешког националног корпуса на Филозофском факултету Карловог универзитета у Прагу.[1]
Садржај корпуса
[уреди | уреди извор]Мали део текстова корпуса, који се углавном односе на 19. век, чува историјску орфографију. Тако, на пример, уместо савременог š користи се историјско sch, уместо савремених ć/č — cź/cž, уместо савремених s/z — ß/s. Текстови 20. века до 1945. године користе kh за савремено h на почетку морфема и меке ŕ.[5]
Већина текстова је публицистика (57%), затим — белетристика (23%), верски текстови (4%), научни текстови (4%), речници и књиге за терминологију за поједине школске предмете (12%). Најстарији текстови припадају првој половини 19. века (дела Х. Зејлера и Р. Мења, бројеви „Часописа Матице лужичкосрпске” од 1848. године), најновији текстови су новине „Сербске новини”[5] и часопис Katolski Posoł. Већина текстова односи на период након 1989/1990. година (54%). Текстови 19. века чине 10% корпуса, прве половине 20. века до 1945. године — 18%, за период између 1945. и 1990. година — 19%.[6] Резултати претраге према корпусу дају информације о извору (аутору, наслову, месту и времену публикације).[1]
Референце
[уреди | уреди извор]- ^ а б в Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 65.
- ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 60.
- ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 61.
- ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 62.
- ^ а б Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 63.
- ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 64.
Спољашње везе
[уреди | уреди извор]- kontext.korpus.cz горњолужичкосрпски текстуални корпус
- Hornjoserbski tekstowy korpus HOTKO информација на сајту Лужичкосрпског института