Studentova t-raspodela
Funkcija gustine verovatnoće | |
Funkcija kumulativne raspodele | |
Parametri | stepeni slobode (realnih) |
---|---|
Nositelj | |
CDF | gde je 2F1 hipergeometrijska funkcija |
Prosek | 0 za , inače nedefinisana |
Medijana | 0 |
Modus | 0 |
Varijansa | za , ∞ za , inače nedefinisana |
Koef. asimetrije | 0 za , inače nedefinisana |
Kurtoza | za , ∞ za , inače nedefinisana |
Entropija |
|
MGF | nedefinisano |
CF | za |
U verovatnoći i statistici, Studentova t-raspodela (ili jednostavno t-raspodela) je bilo koji član familije kontinuarnih raspodela verovatnoće koje nastaju iz procenjivanja srednje vrednosti normalne raspodele populacije u situacijama gde je veličina uzorka mala i populaciona standardna devijacija nije poznata. Ovu raspodelu je razvio Vilijam Goset pod pseudonimom Student.
t-Raspodela igra ulogu u velikom broju široko korištenih statističkih analiza, uključujući Studentov t-test za procenu statističke važnosti razlike između dve srednje vrednosti uzorka, izgradnju intervala pouzdanosti za razliku između dve populacijske sredine, i u linearnoj regresionoj analizi. Studentova t-distribucija se takođe pojavljuje u Bajesovoj analizi podataka iz normalne porodice.
Ako se uzme uzorak sa n opažanja iz normalne raspodele, onda se t-raspodela sa stepeni slobode može definisati kao raspodela lokacija srednje vrednosti uzorka u odnosu na pravu sredinu, podeljena sa standardnom devijacijom uzorka, nakon što se pomnoži sa standardizacionim članom . Na taj se način, t-raspodela se može koristiti za izgradnju intervala pouzdanosti za pravu sredinu.
t-Raspodela je simetrična i zvonastog oblika, poput normalne raspodele, ali ima teže repove, što znači da je sklonija stvaranju vrednosti koje padaju daleko od srednje vrednosti. Ovo je korisno za razumevanje statističkog ponašanja određenih vrsta odnosa slučajnih veličina, u kojima je varijacija u deliocu pojačana i može da proizvede udaljene vrednosti kada brojilac odnosa padne blizu nule. Studentova t-raspodela je poseban slučaj generalizovane hiperbolične raspodele.
Istorija i etimologija
[уреди | уреди извор]U statistici, t-raspodelu su prvi izveli kao posteriornu raspodelu Helmert[2][3][4] i Lirot 1876. godine.[5][6][7] t-Raspodela se isto tako pojavila u opštijoj formi kao Pirsonova raspodela tipa IV u publikaciji Karla Pirsona iz 1895. godine.
U litiraturi na engleskom jeziku ova raspodela nosi ime iz publikacije Vilijama Goseta iz 1908. godine u časopisu Biometrika objavljene pod pseudonimom „Student”.[8] Goset je radio u Ginisovoj pivari u Dablinu u Irskoj, i bio je zainteresovan za probleme malih uzoraka – na primer, hemijskih svojstva ječma gde veličina uzorka može da bude samo 3. Jedna verzija porekla pseudonima je da je Gosetov poslodavac preferirao da zaposleni koriste književne pseudonime kad objavljuju naučne radove umesto svojih stvarnih imena, tako da je on koristio ime „Student” da bi prikrio svoj identitet. Druga verzija je da Ginis nije želeo da njegovi konkurenti znaju da oni koriste t-test za određivanje kvaliteta sirovina.[9][10]
Gosetova publikacija naziva ovu raspodelu „frekvencija distribucije standardnih devijacija uzoraka uzetih iz normalne populacije”. Ona je postala dobro poznata zahvaljujući radu Ronalda Fišera, koji je nazivao ovu raspodelu „Studentova raspodela” i predstavljao testne vrednosti slovom t.[11][12]
Nastanak Studentove raspodele iz uzorkovanja
[уреди | уреди извор]Neka je nezavisno i identično raspodeljeni kao , i.e. ovo je uzorak veličine iz normalno raspodeljene populacije sa očekivanom srednjom vrednošću i varijansom .
Neka je
srednja vrednosti uzorka i neka je
(korigovana po Beselu) varijansa uzorka. Onda randomna promenljiva
ima standardnu normalnu raspodelu (i.e. normalnu sa očekivanom vrednosti 0 i varijansom 1), i randomna promenjiva
gde je supstituisano za , ima Studentovu t-raspodelu sa stepeni slobode. Brojilac i delilac u prethodnom izrazu su nezavisne randmne promenljive uprkos toga što se zasnivaju na istom uzorku .
Definicija
[уреди | уреди извор]Funkcija gustine verovatnoće
[уреди | уреди извор]Studentova t-raspodela ima funkciju raspodele datu sa
gde je broj stepeni slobode i je gama funkcija. Ovo se isto tako može napisati kao
gde je B Beta funkcija. Za celobrojne vrednosti stepena slobode važi:
Za parno,
Za neparno,
Funkcija gustine verovatnoće je simetrična, i njen sveukupni oblik podseća na zvonasti oblik promenljive sa normalnom raspodelom sa srednjom vrednosti od 0 i varijansom od 1, izuzev što je nešto niža i šira. Sa porastom broja stepeni slobode, t-raspodela prilazi normalnoj raspodeli sa srednjom vrednosti 0 i varijansom 1. Iz tog razloga je isto tako poznato kao parametar normalnosti.[13]
Sledeće slike prikazuju gustinu t-raspodele za povećane vrednosti od . Normalna raspodela je prikazana plavom linijom radi poređenja. Treba uočiti da t-raspodela (crvena linija) postaje bliža normalnoj raspodeli sa povećanjem .
Funkcija kumulativne raspodele
[уреди | уреди извор]Funkcija kumulativne raspodele se može napisati u smislu I, regulisane nekompletne beta funkcija. Za t > 0,[14][15]
gde je
Druge vrednosti se mogu dobiti simetrijom. Jedna alternativna formula, validna za , je[14]
gde je 2F1 poseban slučaj hipergeometrijske funkcije.
Za informacije o njenoj inverznoj funkciji kumulativne distribucije, pogledajte kvantilna funkcija § Studentova t-distribucija.
Specijalni slučajevi
[уреди | уреди извор]Određene vrednosti daju posebno jednostavnu formu.
- Funkcija raspodele:
- Funkcija gustine:
- Pogledajte Košijevu raspodelu
- Funkcija raspodele:
- Funkcija gustine:
- Funkcija raspodele:
- Funkcija gustine:
- Funkcija raspodele:
- Funkcija gustine:
- Funkcija raspodele:
- Funkcija gustine:
- Funkcija raspodele:
- Pogledajte funkciju greške
- Funkcija gustine:
- Pogledajte normalnu raspodelu.
Reference
[уреди | уреди извор]- ^ Hurst, Simon. The Characteristic Function of the Student-t Distribution, Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95 Архивирано 2010-02-18 на сајту Wayback Machine
- ^ Helmert FR (1875). „Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler”. Z. Math. U. Physik. 20: 300—3.
- ^ Helmert FR (1876). „Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen”. Z. Math. Phys. 21: 192—218.
- ^ Helmert FR (1876). „Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. Astron. Nachr. 88 (8–9): 113—32. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802.
- ^ Lüroth J (1876). „Vergleichung von zwei Werten des wahrscheinlichen Fehlers”. Astron. Nachr. 87 (14): 209—20. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402.
- ^ Pfanzagl J, Sheynin O (1996). „Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution.”. Biometrika. 83 (4): 891—898. MR 1766040. doi:10.1093/biomet/83.4.891.
- ^ Sheynin O (1995). „Helmert's work in the theory of errors”. Arch. Hist. Exact Sci. 49 (1): 73—104. doi:10.1007/BF00374700.
- ^ "Student" [William Sealy Gosset] (1908). „The probable error of a mean” (PDF). Biometrika. 6 (1): 1—25. JSTOR 2331554. doi:10.1093/biomet/6.1.1.
- ^ Wendl MC (2016). „Pseudonymous fame”. Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406.
- ^ Mortimer RG (2005). Mathematics for physical chemistry (3rd изд.). Burlington, MA: Elsevier. стр. 326. ISBN 9780080492889. OCLC 156200058.
- ^ Fisher RA (1925). „Applications of "Student's" distribution” (PDF). Metron. 5: 90—104. Архивирано из оригинала (PDF) 5. 3. 2016. г.
- ^ Walpole RE, Myers R, Myers S, et al. (2006). Probability & Statistics for Engineers & Scientists (7th изд.). New Delhi: Pearson. стр. 237. ISBN 9788177584042. OCLC 818811849.
- ^ Kruschke JK (2015). Doing Bayesian Data Analysis (2nd изд.). Academic Press. ISBN 9780124058880. OCLC 959632184.
- ^ а б Johnson NL, Kotz S, Balakrishnan N (1995). „Chapter 28”. Continuous Univariate Distributions. 2 (2nd изд.). Wiley. ISBN 9780471584940.
- ^ Hogg RV, Craig AT (1978). Introduction to Mathematical Statistics (4th изд.). New York: Macmillan. ASIN B010WFO0SA. Sections 4.4 and 4.8
Literatura
[уреди | уреди извор]- Senn, S.; Richardson, W. (1994). „The first t-test”. Statistics in Medicine. 13 (8): 785—803. PMID 8047737. doi:10.1002/sim.4780130802.
- Hogg RV, Craig AT (1978). Introduction to Mathematical Statistics (4th изд.). New York: Macmillan. ASIN B010WFO0SA.
- Venables, W. N.; Ripley, B. D. (2002). Modern Applied Statistics with S (Fourth изд.). Springer.
- Gelman, Andrew; John B. Carlin; Hal S. Stern; Donald B. Rubin (2003). Bayesian Data Analysis (Second Edition). CRC/Chapman & Hall. ISBN 1-58488-388-X.
Spoljašnje veze
[уреди | уреди извор]- Hazewinkel Michiel, ур. (2001). „Student distribution”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104.
- Earliest Known Uses of Some of the Words of Mathematics (S) (Remarks on the history of the term "Student's distribution")
- Rouaud, M. (2013), Probability, Statistics and Estimation (PDF) (short изд.) First Students on page 112.