Varijansa
Disperzija ili varijansa je pojam iz teorije verovatnoće i statistike. Ona predstavlja matematičko očekivanje odstupanja slučajne promenljive od njene srednje vrednosti. Varijansa je mera disperzije, što znači da izražava koliko je skup brojeva raširen od njihove prosečne vrednosti. Varijansa ima centralnu ulogu u statistici, gde neke ideje koje je koriste uključuju deskriptivnu statistiku, statističko zaključivanje, testiranje hipoteze, adekvatnost uklapanja i Monte Karlo uzorkovanje. Varijanca je važan alat u nauci, gde je uobičajena primena statističke analize podataka. Varijanca je kvadrat standardne devijacije, drugi centralni momenat distribucije i kovarijansa slučajne promenljive sa samom sobom, a često se predstavlja sa , , , , ili .[1]
Na primer, savršena kocka za igru može da da jedan od 6 ishoda. Očekivana vrednost broja kojeg će kocka da pokaže je (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, očekivana standardna devijacija je σ ≈ 1.71 (kvadratni koren aritmetičke sredine jednakoverovatnih kvadrata apsolutnih odstupanja: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, što daje 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), očekivano kvadratno odstupanje ili varijansa je 17,5/6 ≈ 2,9 (srednja vrednost jednakoverovatnih kvadrata odstupanja: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).
Definicija
[uredi | uredi izvor]Neka je matematičko očekivanje realnog slučajnog vektora za koji postoji integral kvadrata njegovih vrednosti. Tada je varijansa slučajne promenljive:
Ako je vektor jednodimenzionalan, uslovi za mogu da se uproste. Ako je , onda važi:
Ova definicija obuhvata slučajne varijable koje su generisane procesima koji su diskretni, kontinuirani, ni jedno ni drugo ili mešoviti. Varijansa se takođe može smatrati kovarijansom slučajne promenljive sa samom sobom:
Varijansa je takođe ekvivalentna drugom kumulantu distribucije verovatnoće koja generiše . Varijansa se obično označava kao , ili ponekad kao ili , ili simbolično kao ili jednostavno (izgovara se „sigma na kvadrat”). Izraz za varijansu se može proširiti na sledeći način:
Drugim rečima, varijansa X je jednaka srednjoj vrednosti kvadrata X minus kvadrat srednje vrednosti X. Ova jednačina ne bi trebalo da se koristi za proračune korišćenjem aritmetike sa plutajućim zarezom, jer pati od katastrofalnog poništavanja ako su dve komponente jednačine slične po veličini. Za druge numerički stabilne alternative pogledajte algoritme za izračunavanje varijanse.
Diskretna slučajna promenljiva
[uredi | uredi izvor]Ako je generator slučajne promenljive diskretan sa funkcijom verovatnoće , onda je
gde je očekivana vrednost. To je,
(Kada je takva diskretna ponderisana varijansa određena ponderima čiji zbir nije 1, tada se deli zbirom pondera.)
Varijanca kolekcije od jednako verovatnih vrednosti može se napisati kao
gde je prosečna vrednost. To je,
Varijanca skupa od jednako verovatnih vrednosti može biti ekvivalentno izražena, bez direktnog pozivanja na srednju vrednost, u smislu kvadrata odstupanja svih tačaka jedne od druge:[2]
Apsolutno kontinuirana slučajna promenljiva
[uredi | uredi izvor]Ako randomna promenljiva ima funkciju gustine verovatnoće , i je korespondirajuća kumulativna funkcija raspodele, onda je
ili ekvivalentno,
gde je očekivana vrednost od data sa
U ovim formulama, integrali u odnosu na i su Lebesgov i Lebesg–Stiltjeov integral, respetivno.
Ako je funkcija integrabilna po Rimanu na svakom konačnom intervalu onda je
pri čemu je ovaj integral nepravilan Rimanov integral.
Primeri
[uredi | uredi izvor]Eksponencijalna distribucija
[uredi | uredi izvor]Eksponencijalna raspodela sa parametrom λ je kontinuirana raspodela čija je funkcija gustine verovatnoće data sa
na intervalu [0, ∞). Može se pokazati da je njegova srednja vrednost
Koristeći integraciju po delovima i upotrebljavajući očekivanu vrednost koja je već izračunata, dobija se:
Stoga je varijansa od X data izrazom
Bacanje kocke
[uredi | uredi izvor]Šestostrana koca se može modelovati kao diskretna randomna promenljiva, X, sa ishodima od 1 do 6, svaki sa jednakom verovatnoćom 1/6. Očekivana vrednost X je Dakle, varijansa X je
Opšta formula za varijansu ishoda, X, n-strane kocke je
Često korišćene distribucije verovatnoće
[uredi | uredi izvor]Sledeća tabela navodi varijansu za neke često korišćene distribucije verovatnoće.
Naziv raspodele verovatnoće | Funkcija raspodele verovatnoće | Aritmetička sredina | Varijansa |
---|---|---|---|
Binomna raspodela | |||
Geometrijska raspodela | |||
Normalna raspodela | |||
Uniformna raspodela (kontinuirana) | |||
Eksponencijalna raspodela | |||
Poasonova raspodela |
Reference
[uredi | uredi izvor]- ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. str. 51. ISBN 9781441923226.
- ^ Yuli Zhang; Huaiyu Wu; Lei Cheng (jun 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). str. 987—992.
Literatura
[uredi | uredi izvor]- Klenke, Achim (2013). Wahrscheinlichkeitstheorie. str. 106. doi:10.1007/978-3-642-36018-3.
- Loève, Michel (1977). Probability Theory I. Springer. str. 246. ISBN 3-540-90210-4.
- Itô, Kiyosi (1984). Introduction to Probability Theory. Cambridge University Press. str. 37. ISBN 0 521 26960 1.
- Lemons, Don S. (2002), An Introduction to Stochastic Processes in Physics, The Johns Hopkins University Press, ISBN 0-8018-6866-1
- Bevington, Philip R (1969). Data Reduction and Error Analysis for the Physical Sciences. New York, N.Y.: McGraw-Hill. OCLC 300283069.
- Strutz, T. (2010). Data Fitting and Uncertainty (A practical introduction to weighted least squares and beyond). Vieweg+Teubner. ISBN 978-3-8348-1022-9.
- Anscombe, F. J. (1948). „The Validity of Comparative Experiments”. Journal of the Royal Statistical Society. Series A (General). 111 (3): 181—211. JSTOR 2984159. MR 30181. doi:10.2307/2984159.
- Bailey, R. A. (2008). Design of Comparative Experiments. Cambridge University Press. ISBN 978-0-521-68357-9. Pre-publication chapters are available on-line.
- Belle, Gerald van (2008). Statistical rules of thumb (2nd izd.). Hoboken, N.J: Wiley. ISBN 978-0-470-14448-0.
- Cochran, William G.; Cox, Gertrude M. (1992). Experimental designs (2nd izd.). New York: Wiley. ISBN 978-0-471-54567-5.
- Cohen, Jacob (1988). Statistical power analysis for the behavior sciences (2nd ed.). Routledge ISBN 978-0-8058-0283-2
- Cohen, Jacob (1992). „Statistics a power primer”. Psychological Bulletin. 112 (1): 155—159. PMID 19565683. doi:10.1037/0033-2909.112.1.155.
- Cox, David R. (1958). Planning of experiments. Reprinted as ISBN 978-0-471-57429-3
- Cox, David R. (2006). Principles of statistical inference. Cambridge New York: Cambridge University Press. ISBN 978-0-521-68567-2.
- Freedman, David A.(2005). Statistical Models: Theory and Practice, Cambridge University Press. ISBN 978-0-521-67105-7
- Gelman, Andrew (2005). „Analysis of variance? Why it is more important than ever”. The Annals of Statistics. 33: 1—53. S2CID 13529149. arXiv:math/0504499 . doi:10.1214/009053604000001048.
- Gelman, Andrew (2008). „Variance, analysis of”. The new Palgrave dictionary of economics (2nd izd.). Basingstoke, Hampshire New York: Palgrave Macmillan. ISBN 978-0-333-78676-5.
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Design and Analysis of Experiments. I and II (Second izd.). Wiley. ISBN 978-0-470-38551-7.
- Howell, David C. (2002). Statistical methods for psychology (5th izd.). Pacific Grove, CA: Duxbury/Thomson Learning. ISBN 978-0-534-37770-0.
- Kempthorne, Oscar (1979). The Design and Analysis of Experiments (Corrected reprint of (1952) Wiley izd.). Robert E. Krieger. ISBN 978-0-88275-105-4.
- Lehmann, E.L. (1959) Testing Statistical Hypotheses. John Wiley & Sons.
- Montgomery, Douglas C. (2001). Design and Analysis of Experiments (5th izd.). New York: Wiley. ISBN 978-0-471-31649-7.
- Moore, David S. & McCabe, George P. (2003). Introduction to the Practice of Statistics (4e). W H Freeman & Co. ISBN 0-7167-9657-0
- Rosenbaum, Paul R. (2002). Observational Studies (2nd ed.). New York: Springer-Verlag. ISBN 978-0-387-98967-9
- Scheffé, Henry (1959). The Analysis of Variance. New York: Wiley.
- Stigler, Stephen M. (1986). The history of statistics : the measurement of uncertainty before 1900. Cambridge, Mass: Belknap Press of Harvard University Press. ISBN 978-0-674-40340-6.
- Wilkinson, Leland (1999). „Statistical Methods in Psychology Journals; Guidelines and Explanations”. American Psychologist. 5 (8): 594—604. CiteSeerX 10.1.1.120.4818 . doi:10.1037/0003-066X.54.8.594.