Алгоритам упоређивања Unicode-а

Алгоритам упоређивања Unicode-а (енгл. Unicode collation algorithm, UCA) алгоритам је описан у његовом техничком извештају бр. 10 који дефинише прилагодљиве методе за поређење две ниске. Та поређења се потом могу користити за сређивање или сортирање текста у било ком писаном систему или језику представљеном у Unicode-у.

Технички извештај Unicode-а бр. 10 прецизира Подразумевану табелу елемената упоређивања Unicode-а (енгл. Default Unicode Collation Element Table, DUCET). Ова датотека података одређуе подразумевани редослед сврставања. DUCET је прилагодив различитим језицима. Многа таква прилагођавања могу се наћи у Заједничком локалном складишту података (енгл. Common Locale Data Repository, CLDR).

Важна имплементација отвореног кода UCA укључена је у Међународне компоненте Unicode-а (енгл. International Components for Unicode, ICU). ICU подразумева и упоређивање и сређивање из CLDR је укључено у ICU. У Локалном истражицачу ICU-а (енгл. ICU Locale Explorer) могу се видети дејства сређивања и велики број посебних језичких упоређивања.

Спољашње везе

Технички стандард Unicode-а бр. 10
Табеле Mimer SQL-а колације Unicode-{-а
Табеле МyСQЛ-а колације Уницоде-а засноване на УЦА
Демонстрација алгоритма упоређивања Уницоде-а на интернету уз коришћење ИЦУ Архивирано на сајту Wаyбацк Мацхине (11. мај 2008)
мсорт — програм за сортирање који пружа необичан ниво флексибилности у дефинисању упоређивања и издвајања кључева
ОпенРТЛ — библиотека функција користи упоређивања Уницоде-а заснована на алгоритму. Подржава и прилагођена упоређивања за локале које дефинише ЦЛДР