Hi-kvadratna raspodela
Funkcija gustine verovatnoće ![]() | |
Funkcija kumulativne raspodele ![]() | |
Notacija | ili |
Parametri | (poznati kao „stepeni sloboda”) |
Nositelj | ako je , inače |
CDF | |
Prosek | |
Medijana | |
Modus | |
Varijansa | |
Koef. asimetrije | |
Kurtoza | |
Entropija | |
MGF | |
CF | [1] |
U teoriji verovatnoće i statistici, hi-kvadratna raspodela (takođe hi-kvadrat ili χ2-raspodela) sa k stepena slobode je distribucija sume kvadrata k nezavisnih standardno normalnih randomnih promenljivih. Hi-kvadratna distribucija je specijalni slučaj gama distribucije i jedna je od od najšire korištenih distribucija verovatnoće u inferencijskoj statistici, naročito u testiranju hipoteza ili u konstrukciji intervala pouzdanosti.[2][3][4][5] Kada se pravi razlika od opštije necentralne hi-kvadratne raspodele, ova distribucija se ponekad naziva centralnom hi-kvadratnom raspodelom.
Hi-kvadratna raspodela se koristi u uobičajenim hi-kvadratnim testovima[6][7] za adekvatnost uklapanja posmatrane distribucije u teorijski očekivanu, nezavisnost dva kriterijuma klasifikacije kvalitativnih podataka, i procenu intervala pouzdanosti za populaciju standardnih devijacija normalne distribucije iz standardne devijacije uzorka. Mnogi drugi statistički testovi takođe koriste ovu distribuciju, kao što je Fridmanova analiza varijanse po rangovima.
[уреди | уреди извор]Ako su Z1, ..., Zk nezavisnе, standardno normalne randomne promenljive, onda je suma njihovih kvadrata,
distribuirana u skladu sa hi-kvadratnom distribucijom sa k stepeni slobode. Ovo se obično označava sa
Hi-kvadratna distribucija ima jedan parametar: k, pozitivni integer koji specificira broj stepeni slobode (broj Zi vrednosti).
Tabela χ2 vrednosti vs p-vrednosti
[уреди | уреди извор]p-vrednost je verovatnoća opservacije statističkog testa bar kao ekstrema u hi-kvadratnoj distribuciji. Shodno tome, pošto kumulativna funkcija raspodele (CDF) za odgovarajuće stepene slobode (df) daje verovatnoću da je dobijena vrednost manje ekstremna od ove tačke, oduzimanje CDF vrednosti od 1 daje p-vrednost. Mala p-vrednost, ispod izabranog nivoa značaja, ukazuje na statistički značaj, tj. dovoljan dokaz da se odbaci nulta hipoteza. Nivo značaja od 0,05 se često koristi kao granica između značajnih i neznačajnih rezultata.
Donja tabela daje broj p-vrednosti koje odgovaraju sa χ2 za prvih 10 stepeni slobode.
Stepeni slobode (df) | χ2 vrednost[8] | ||||||||||
1 | 0,004 | 0,02 | 0,06 | 0,15 | 0,46 | 1,07 | 1,64 | 2,71 | 3,84 | 6,63 | 10,83 |
2 | 0,10 | 0,21 | 0,45 | 0,71 | 1,39 | 2,41 | 3,22 | 4,61 | 5,99 | 9,21 | 13,82 |
3 | 0,35 | 0,58 | 1,01 | 1,42 | 2,37 | 3,66 | 4,64 | 6,25 | 7,81 | 11,34 | 16,27 |
4 | 0,71 | 1,06 | 1,65 | 2,20 | 3,36 | 4,88 | 5,99 | 7,78 | 9,49 | 13,28 | 18,47 |
5 | 1,14 | 1,61 | 2,34 | 3,00 | 4,35 | 6,06 | 7,29 | 9,24 | 11,07 | 15,09 | 20,52 |
6 | 1,63 | 2,20 | 3,07 | 3,83 | 5,35 | 7,23 | 8,56 | 10,64 | 12,59 | 16,81 | 22,46 |
7 | 2,17 | 2,83 | 3,82 | 4,67 | 6,35 | 8,38 | 9,80 | 12,02 | 14,07 | 18,48 | 24,32 |
8 | 2,73 | 3,49 | 4,59 | 5,53 | 7,34 | 9,52 | 11,03 | 13,36 | 15,51 | 20,09 | 26,12 |
9 | 3,32 | 4,17 | 5,38 | 6,39 | 8,34 | 10,66 | 12,24 | 14,68 | 16,92 | 21,67 | 27,88 |
10 | 3,94 | 4,87 | 6,18 | 7,27 | 9,34 | 11,78 | 13,44 | 15,99 | 18,31 | 23,21 | 29,59 |
P vrednost (verovatnoća) | 0,95 | 0,90 | 0,80 | 0,70 | 0,50 | 0,30 | 0,20 | 0,10 | 0,05 | 0,01 | 0,001 |
Ove vrednosti se mogu izračunati procenom funkcije kvantila (takođe poznate kao „inverzni CDF” ili „ICDF”) raspodele hi-kvadrata;[9] e. g., χ2 ICDF za p = 0,05 i df = 7 daje 14,06714 ≈ 14,07 kao u gornjoj tabeli.
Spoljašnje veze
[уреди | уреди извор]- Earliest Uses of Some of the Words of Mathematics: entry on Chi squared has a brief history
- Course notes on Chi-Squared Goodness of Fit Testing from Yale University Stats 101 class.
- Mathematica demonstration showing the chi-squared sampling distribution of various statistics, e. g. Σx², for a normal population
- Lin, Jinn-Tyan (1988). „Approximating the Cumulative Chi-Square Distribution and its Inverse”. Journal of the Royal Statistical Society. Series D (The Statistician). 37 (1): 3—5. JSTOR 2348373. doi:10.2307/2348373. Simple algorithm for approximating cdf and inverse cdf for the chi-squared distribution with a pocket calculator]
- Values of the Chi-squared distribution