Википедија:МедијаВики
Ова страница на Википедији је превазиђена, а овде је задржана превасходно из архивског интереса. |
Ово је мјесто предвиђено за координацију између сарадника у раду проширења и имплементације Викимедија софтвера за српски језик, као и за коментаре осталих заинтересованих посјетилаца :-) |
Имплементација ЛАТ-ЋИР-Е-ИЈЕ
[уреди | уреди извор]Стање
[уреди | уреди извор]- Изворни код се води (и снима у базу података) ћирилицом (до даљњег)
- Конверзија ћирилице у латиницу и обратно је аутоматска (при клику на одговарајућу групу)
- Још не постоји (или ми је измакла) синтакса за одвајање ријечи које не треба да се конвертују (оргинална имена и називи, стручни изрази и слично)
- Постоји. Између две заграде: ((не пресловљавај)). --Милош Ранчић (разговор) 08:01, 6 мај 2005 (CEST)
- Нажалост то фукционише само дјелимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само дио до везе) :-(, значи потребна је коректура алгоритма (RegExp) --Kaster 09:41, 6 мај 2005 (CEST)
- Да, Женгжу се жалио на то да не зна добро регуларне изразе. Мислим да имаш његову адресу. Можда би било добро да нас тројица размењујемо мејлове тим поводом, а овде да приказујемо шта се дешава? --Милош Ранчић (разговор) 14:26, 6 мај 2005 (CEST)
- Нажалост то фукционише само дјелимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само дио до везе) :-(, значи потребна је коректура алгоритма (RegExp) --Kaster 09:41, 6 мај 2005 (CEST)
- Подршка за екавски/ијекавски фукнционише. У употреби је синтакса ((млеко; млијеко)).
- Грешка при сл. сценарију: Кликом на линк из стране са ијекавском варијантом се не долази на страну са ијекавском него екавском (стандард) варијантом. Значи, потребна је коректура/имплементација праћења активне варијанте преко "више слојева позива", тј. глобално снимање и "ношење" актуелне варијанте.
- Број варијанти је 5 (!) Поред "Српски-Ћир-Е", "Српски-Ћир-Ије", "Српски-Лат-Е" и "Српски-Лат-Ије", постоји и варијанта "Српски" што је непотребно. Коначно, једна варијанта мора да буде водећа (стандардна). Да ли ће водећу варијанту моћи сваки корисник себи да конфигурише или ће бити "централно" одређена (Српски-Ћир-Е ?) - видјећемо.
- Укупан број варијанти треба да је 4. Стандардна варијанта (или корисничка или глобална) би требало да се крије иза линка "чланак" (article), док би остала три требало смјестити скроз десно.
- Имамо још пар ситних грешкица у називима група и сл.
- Постоји пар нејасноћа са конверзионим табелама, као на примјер ...
(LanguageSr.php, array $mToLatin) садржи следеће: 'd!ž'=> 'dž' , 'l!j'=> 'lj' , 'n!j'=> 'nj' , 'D!ž'=> 'Dž' , 'D!Ž'=> 'DŽ' , 'L!j'=> 'Lj' , 'L!J'=> 'LJ' , 'N!j'=>'Nj' , 'N!J'=>'NJ' ,
... наиме d!žd!ž није ћирилица и самим тим је тај пар непотребан (или сам ја нешто побркао).
- Па само утолико што је то спремање за следећу фазу. Другим речима, од тренутка имплементације софтвера, технички ће бити могуће писати мешаним сорсом. Ипак, наша језичка политика у тој фази (док год немамо могућност контроле уписа) остаје да се може писати само ћирилицом и екавски (уз могуће означавање екавско-ијекавских варијаната, свакако) све док не будемо овладали уписом у базу; што ће се догодити у неко догледно време. Фактички, такво стање је проузроковано тиме што би Женгжуу требало знатно више времена да одмах имплементира све. --Милош Ранчић (разговор) 08:35, 6 мај 2005 (CEST)
Постоје и други примјери са сличном тематиком. --Kaster 02:15, 4 мај 2005 (CEST)
Следећи кораци
[уреди | уреди извор]- Кориговати алгоритам (вјероватно RegExp) за одвајање ријечи без конверзије
- Израда упутства (документације)
Средства за рад
[уреди | уреди извор]- Ажурирање и праћење историје грешака
- Тест-софтвер.
Дискусија
[уреди | уреди извор]Pa ovako... ideja je odlična i lepo je što se neko tome posvećuje. Ali ima tu problema u konceptu. Prvo, nije dovoljno da može da se čita, pa i da se piše i ćirilicom i latinicom. Tu je osnovni problem što neki ljudi jednostavno nemaju ćirilicu na kompjuteru, pa im treba tekst latinicom i kad uređuju članak koji je neko napisao ćirilicom. Znači, treba raditi totalnu konverziju ili u ćirilicu ili u latinicu kad se članak snimi, pa konvertovati po potrebi za one koji koriste drugo.
Drugo, problem je kad se dozvoli pisanje teksta koji većina ljudi ne vidi, znači ((belo; bijelo)). Tu ja mogu da stavim iza ; i neku nepristojnu reč ili političku parolu, i ako na nekoj stranici uradim puno valjanih promena i jednu takvu, neće to niko ni uhvatiti. Znači da mogu ljudi da pišu u enciklopediju stvari koje nećemo ni primetiti.
Dakle, kako bi trebalo da radi:
- (j), (ij) ispred e, (e/i) u sredini reči
- N(j)emačka --> Nemačka, Njemačka
- b(ij)elo --> belo, bijelo
- b(e/i)l(j)eznica -> beležnica, bilježnica
- lj, nj, dž --> љ, њ, џ bez milosti, sintaksa za razdvajanje će trebati jako retko i već postoji u html
- mišljenje --> мишљење
- nad‌živeti --> надживети
- Kardel‌jevo -->Карделјево, kako je pisalo nekad na železničkoj stanici u Pločama.
- <nocc>bez konverzije</nocc>
- ...da ne izmišljamo džaba novu sintaksu
Zocky 14:06, 18 мај 2005 (CEST)
- Мало сам испао из штоса гледе овог (и молим Кастера да он преузме кормило гледе имплементације!), али да наведем неке ствари: Екавско-ијекавски може бити написано и мл((е;ије))ко. Проблем са Немачком је што си кренуо латиницом, а ниси видео како то изгледа ћирилицом :) (може и бележница/биљежница као други пример :) ). Формално је напорно се зајебавати са неколико сета правила, а и ко ти гарантује да то није била намерна заграда? Зато су две заграде. Што се тиче изостављања конверзије, ту је ствар у томе што сам се трудио да се користе само они знакови који постоје на српским тастатурама. Само у посебним случајевима знакови <> постоје (ако је shift краће и поред има тај знак), док углавном не постоје. Даље, "дж" се чешће појављује од "џ". Хм. Користим Фајерфокс и не разумем шта си написао код надживети и Карделјева? Успут, да кажем да, што се тиче синтаксе, принцип је сасвим прихватљив. Кинези користе знатно сложенију синтаксу за разлике. И није HTML. Али, можемо детаљно о сваком предлогу/принципу... --Милош Ранчић (разговор) 16:45, 18 мај 2005 (CEST)
Evo po tačkama, da se lepše vidi:
- Ne znam koliko se često upotrebljava razdvojeno dž, ali meni stvarno ne izgleda da češće nego spojeno. Teško mi se i setiti primera osim nadživeti, a ovih drugih koliko hoćeš, od džezve i džanarike do vradžbine. Al ko što rekoh, nemam podatak.
- Ono ‌ je html kod za razdvajanje znakova u jezicima gde nesto znace spojeni. U tekstu se ne vidi, ali razdvaja slova: ab. Jeste da je ružno ali retko treba.
- Može lako da se konvertuje i Н(Ј)емачка u Немачка i Њемачка pa to nije neki veliki problem.
- Za slučaj bilježnice sam dodao gore predlog. Zocky 20:29, 18 мај 2005 (CEST)