Алгоритам упоређивања Unicode-а
Алгоритам упоређивања Unicode-а (енгл. Unicode collation algorithm, UCA) алгоритам је описан у његовом техничком извештају бр. 10 који дефинише прилагодљиве методе за поређење две ниске. Та поређења се потом могу користити за сређивање или сортирање текста у било ком писаном систему или језику представљеном у Unicode-у.
Технички извештај Unicode-а бр. 10 прецизира Подразумевану табелу елемената упоређивања Unicode-а (енгл. Default Unicode Collation Element Table, DUCET). Ова датотека података одређуе подразумевани редослед сврставања. DUCET је прилагодив различитим језицима. Многа таква прилагођавања могу се наћи у Заједничком локалном складишту података (енгл. Common Locale Data Repository, CLDR).
Важна имплементација отвореног кода UCA укључена је у Међународне компоненте Unicode-а (енгл. International Components for Unicode, ICU). ICU подразумева и упоређивање и сређивање из CLDR је укључено у ICU. У Локалном истражицачу ICU-а (енгл. ICU Locale Explorer) могу се видети дејства сређивања и велики број посебних језичких упоређивања.
Спољашње везе
[уреди | уреди извор]- Технички стандард Unicode-а бр. 10
- Табеле Mimer SQL-а колације Unicode-{-а
- Табеле МyСQЛ-а колације Уницоде-а засноване на УЦА
- Демонстрација алгоритма упоређивања Уницоде-а на интернету уз коришћење ИЦУ Архивирано на сајту Wаyбацк Мацхине (11. мај 2008)
- мсорт — програм за сортирање који пружа необичан ниво флексибилности у дефинисању упоређивања и издвајања кључева
- ОпенРТЛ — библиотека функција користи упоређивања Уницоде-а заснована на алгоритму. Подржава и прилагођена упоређивања за локале које дефинише ЦЛДР