Пређи на садржај

Хи-квадратни тест

С Википедије, слободне енциклопедије
Хи-квадратна дистрибуција, са приказаним χ2 на x-оси и p-вредношћу на y-оси.[1]

Хи-квадратни тест, такође написан као χ2 тест, јесте тест статистичке хипотезе где је дистрибуција узорка тестиране статистике хи-квадратна дистрибуција кад је нулта хипотеза истинита. Без друге квалификације, хи-квадратни тест често се користи као замена за Пирсонов хи-квадратни тест.[2] Хи-квадратни тест се користи да се утврди да ли постоји значајна разлика између очекиваних фреквенција и посматраних фреквенција у једној или више категорија.

У стандардним применама овог теста, запажања су сврстана у међусобно искључиве класе, и постоји нека теорија, или нулта хипотеза, која даје вероватноћу да било које опажање падне у одговарајућу класу. Сврха теста је да се процени колико су вероватне опсервације, под претпоставком да је нулта хипотеза тачна.

Хи-квадратни тестови се обично конструишу из суме квадрираних грешака, или помоћу варијансе узорка. Статистика теста која следи хи-квадратну дистрибуцију произилази из претпоставке независних нормално дистрибуираних података,[3][4][5][6] која је у многим случајевима валидна због централне граничне теореме. Хи-квадратни тест може се користити за покушај одбацивања нулте хипотезе да су подаци независни.

Историја

[уреди | уреди извор]

У 19. веку, статистичке аналитичке методе углавном су примењиване у анализи биолошких података и било је уобичајено да истраживачи претпостављају да су запажања пратила нормалну дистрибуцију, као што су то чинили Сер Џорџ Ери и професор Мериман, чије је радове критиковао Карл Пирсон у свом раду из 1900. године.[7]

До краја 19. века, Пирсон је уочио постојање значајне асиметрије унутар неких биолошких посматрања. Да би моделовао запажања независно од тога да ли су нормална или асиметрична, Пирсон је у низу чланака објављених од 1893 до 1916,[8][9][10][11] осмислио Пирсонову дистрибуцију, породицу непрекидних расподела вероватноће, која укључује нормалну дистрибуцију и многе асиметричне дистрибуције. Он је предложио метод статистичке анализе који се састоји од употребе Пирсонове дистрибуције за моделовање посматрања и вршења теста доброг уклапања како би се утврдило колико се модел и посматрање заиста уклапају.

Пирсонов хи-квадратни тест

[уреди | уреди извор]

Године 1900, Пирсон је објавио публикацију[7] о χ2 тесту, која се сматра једним од фундаменталних радова у модерној статистици.[12] У том раду, Пирсон је истражио тест адекватности уклапања.

Ако се претпостави да је н опажања случајног узорка из популације класификовано у к међусобно искључујућих класа са одговарајућим посматраним бројевима xи (за и = 1,2,…,к), а да нулта хипотеза даје вероватноћу пи да ће опажање пасти у и-ту класу. Дакле, доступни су очекивани бројеви ми = нпи за свако и, где

Пирсон је предложио да у случају да је нулта хипотеза тачна као н → ∞, ограничавајућа дистрибуција наведене количине је расподела χ2.

Пирсон се прво бавио случајем у којем су очекивани бројеви ми довољно велики познати бројеви у свим ћелијама под претпоставком да се сваки xи може узети као нормално расподељен, и постигао је резултат да, на граници када н постане велико, X2 следи χ2 расподелу са к − 1 степени слободе.

Пирсон је затим размотрио случај у којем очекивани бројеви зависе од параметара који се морају проценити из узорка. Он је предложио да кад ми означава праве очекиване бројеве, а ми процењене очекиване бројева, разлика

обично бива позитивна и довољно мала да се може занемарити. У закључку, Пирсон је тврдио да ако се сматра да је X2 такође расподељена као χ2 дистрибуција са к − 1 степени слободе, грешка у овој апроксимацији неће утицати на практичне одлуке. Овај закључак изазвао је одређене контроверзе у практичним применама и то није било рарешено током 20 година, до објављивања Фишерових публикација из 1922. и 1924. године.[13][14]

Апликације

[уреди | уреди извор]

У криптоанализи, хи-квадратни тест се користи за упоређивање дистрибуције отвореног текста и (могућег) декриптовања шифротекста. Најнижа вредност теста значи да је дешифровање било успешно са великом вероватноћом.[15][16] Ова метода се може генерализовати за решавање савремених криптографских проблема.[17]

У биоинформатици, хи-квадратни тест се користи за упоређивање расподеле одређених својстава гена (нпр. геномског садржаја, брзине мутације, интеракционе мреже кластеровања итд.) које припадају различитим категоријама (нпр. гени болести, основни гени, гени на одређеном хромозому итд.).[18][19]

Референце

[уреди | уреди извор]
  1. ^ M.А. Сандерс. „Цхарацтеристиц фунцтион оф тхе централ цхи-сqуаре дистрибутион” (ПДФ). Архивирано из оригинала (ПДФ) 15. 7. 2011. г. Приступљено 6. 3. 2009. 
  2. ^ Пеарсон, Карл (1900). „Он тхе цритерион тхат а гивен сyстем оф девиатионс фром тхе пробабле ин тхе цасе оф а цоррелатед сyстем оф вариаблес ис суцх тхат ит цан бе реасонаблy суппосед то хаве арисен фром рандом самплинг” (ПДФ). Пхилосопхицал Магазине. Сериес 5. 50 (302): 157—175. дои:10.1080/14786440009463897. 
  3. ^ Абрамоwитз, Милтон; Стегун, Ирене Анн, ур. (1983) [јун 1964]. „поглавље 26”. Хандбоок оф Матхематицал Фунцтионс wитх Формулас, Грапхс, анд Матхематицал Таблес. Апплиед Матхематицс Сериес. 55 (Нинтх репринт wитх аддитионал цоррецтионс оф тентх оригинал принтинг wитх цоррецтионс (Децембер 1972); фирст изд.). Wасхингтон D.C.; Неw Yорк: Унитед Статес Департмент оф Цоммерце, Натионал Буреау оф Стандардс; Довер Публицатионс. стр. 940. ИСБН 978-0-486-61272-0. ЛЦЦН 64-60036. МР 0167642. ЛЦЦН 65-12253. 
  4. ^ НИСТ (2006). Енгинееринг Статистицс Хандбоок – Цхи-Сqуаред Дистрибутион
  5. ^ Јохнсон, Н. L.; Котз, С.; Балакрисхнан, Н. (1994). „Цхи-Сqуаре Дистрибутионс инцлудинг Цхи анд Раyлеигх”. Цонтинуоус Унивариате Дистрибутионс. 1 (Сецонд изд.). Јохн Wилеy анд Сонс. стр. 415—493. ИСБН 978-0-471-58495-7. 
  6. ^ Моод, Алеxандер; Граyбилл, Франклин А.; Боес, Дуане C. (1974). Интродуцтион то тхе Тхеорy оф Статистицс (Тхирд изд.). МцГраw-Хилл. стр. 241–246. ИСБН 978-0-07-042864-5. 
  7. ^ а б Пеарсон, Карл (1900). „Он тхе цритерион тхат а гивен сyстем оф девиатионс фром тхе пробабле ин тхе цасе оф а цоррелатед сyстем оф вариаблес ис суцх тхат ит цан бе реасонаблy суппосед то хаве арисен фром рандом самплинг” (ПДФ). Пхилосопхицал Магазине. Сериес 5. 50 (302): 157—175. дои:10.1080/14786440009463897. 
  8. ^ Пеарсон, Карл (1893). „Цонтрибутионс то тхе матхематицал тхеорy оф еволутион [абстрацт]”. Процеедингс оф тхе Роyал Социетy. 54: 329—333. ЈСТОР 115538. дои:10.1098/рспл.1893.0079. 
  9. ^ Пеарсон, Карл (1895). „Цонтрибутионс то тхе матхематицал тхеорy оф еволутион, II: Скеw вариатион ин хомогенеоус материал”. Пхилосопхицал Трансацтионс оф тхе Роyал Социетy. 186: 343—414. Бибцоде:1895РСПТА.186..343П. ЈСТОР 90649. дои:10.1098/рста.1895.0010. 
  10. ^ Пеарсон, Карл (1901). „Матхематицал цонтрибутионс то тхе тхеорy оф еволутион, X: Супплемент то а мемоир он скеw вариатион”. Пхилосопхицал Трансацтионс оф тхе Роyал Социетy А. 197 (287–299): 443—459. Бибцоде:1901РСПТА.197..443П. ЈСТОР 90841. дои:10.1098/рста.1901.0023. 
  11. ^ Пеарсон, Карл (1916). „Матхематицал цонтрибутионс то тхе тхеорy оф еволутион, XIX: Сецонд супплемент то а мемоир он скеw вариатион”. Пхилосопхицал Трансацтионс оф тхе Роyал Социетy А. 216 (538–548): 429—457. Бибцоде:1916РСПТА.216..429П. ЈСТОР 91092. дои:10.1098/рста.1916.0009. 
  12. ^ Цоцхран, Wиллиам Г. (1952). „Тхе Цхи-сqуаре Тест оф Гооднесс оф Фит”. Тхе Анналс оф Матхематицал Статистицс. 23 (3): 315—345. ЈСТОР 2236678. дои:10.1214/аомс/1177729380. 
  13. ^ Фисхер, Роналд А. (1922). „Он тхе Интерпретатион оф цхи-сqуаред фром Цонтингенцy Таблес, анд тхе Цалцулатион оф П”. Јоурнал оф тхе Роyал Статистицал Социетy. 85 (1): 87—94. ЈСТОР 2340521. дои:10.2307/2340521. 
  14. ^ Фисхер, Роналд А. (1924). „Тхе Цондитионс Ундер Wхицх цхи-сqуаред Меасурес тхе Дисцрепанцеy Бетwеен Обсерватион анд Хyпотхесис”. Јоурнал оф тхе Роyал Статистицал Социетy. 87 (3): 442—450. ЈСТОР 2341149. 
  15. ^ „Цхи-сqуаред Статистиц”. Працтицал Црyптограпхy. Архивирано из оригинала 18. 02. 2015. г. Приступљено 18. 2. 2015. 
  16. ^ „Усинг Цхи Сqуаред то Црацк Цодес”. ИБ Матхс Ресоурцес. Бритисх Интернатионал Сцхоол Пхукет. 
  17. ^ Рyабко, Б. Yа.; Стогниенко, V. С.; Схокин, Yу. I. (2004). „А неw тест фор рандомнесс анд итс апплицатион то соме црyптограпхиц проблемс” (ПДФ). Јоурнал оф Статистицал Планнинг анд Инференце. 123 (2): 365—376. дои:10.1016/с0378-3758(03)00149-6. Приступљено 18. 2. 2015. 
  18. ^ Фелдман, I.; Рзхетскy, А.; Виткуп, D. (2008). „Нетwорк пропертиес оф генес харборинг инхеритед дисеасе мутатионс”. ПНАС. 105 (11): 4323—432. Бибцоде:2008ПНАС..105.4323Ф. ПМЦ 2393821Слободан приступ. дои:10.1073/пнас.0701722105. 
  19. ^ „цхи-сqуаре-тестс” (ПДФ). Архивирано из оригинала (ПДФ) 29. 06. 2018. г. Приступљено 29. 6. 2018. 

Литература

[уреди | уреди извор]

Спољашње везе

[уреди | уреди извор]