Варијанса
Дисперзија или варијанса је појам из теорије вероватноће и статистике. Она представља математичко очекивање одступања случајне променљиве од њене средње вредности. Варијанса је мера дисперзије, што значи да изражава колико је скуп бројева раширен од њихове просечне вредности. Варијанса има централну улогу у статистици, где неке идеје које је користе укључују дескриптивну статистику, статистичко закључивање, тестирање хипотезе, адекватност уклапања и Монте Карло узорковање. Варијанца је важан алат у науци, где је уобичајена примена статистичке анализе података. Варијанца је квадрат стандардне девијације, други централни моменат дистрибуције и коваријанса случајне променљиве са самом собом, а често се представља са , , , , или .[1]
На пример, савршена коцка за игру може да да један од 6 исхода. Очекивана вредност броја којег ће коцка да покаже је (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, очекивана стандардна девијација је σ ≈ 1.71 (квадратни корен аритметичке средине једнаковероватних квадрата апсолутних одступања: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, што даје 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), очекивано квадратно одступање или варијанса је 17,5/6 ≈ 2,9 (средња вредност једнаковероватних квадрата одступања: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).
Дефиниција
[уреди | уреди извор]Нека је математичко очекивање реалног случајног вектора за који постоји интеграл квадрата његових вредности. Тада је варијанса случајне променљиве:
Ако је вектор једнодимензионалан, услови за могу да се упросте. Ако је , онда важи:
Ова дефиниција обухвата случајне варијабле које су генерисане процесима који су дискретни, континуирани, ни једно ни друго или мешовити. Варијанса се такође може сматрати коваријансом случајне променљиве са самом собом:
Варијанса је такође еквивалентна другом кумуланту дистрибуције вероватноће која генерише . Варијанса се обично означава као , или понекад као или , или симболично као или једноставно (изговара се „сигма на квадрат”). Израз за варијансу се може проширити на следећи начин:
Другим речима, варијанса X је једнака средњој вредности квадрата X минус квадрат средње вредности X. Ова једначина не би требало да се користи за прорачуне коришћењем аритметике са плутајућим зарезом, јер пати од катастрофалног поништавања ако су две компоненте једначине сличне по величини. За друге нумерички стабилне алтернативе погледајте алгоритме за израчунавање варијансе.
Дискретна случајна променљива
[уреди | уреди извор]Ако је генератор случајне променљиве дискретан са функцијом вероватноће , онда је
где је очекивана вредност. То је,
(Када је таква дискретна пондерисана варијанса одређена пондерима чији збир није 1, тада се дели збиром пондера.)
Варијанца колекције од једнако вероватних вредности може се написати као
где је просечна вредност. То је,
Варијанца скупа од једнако вероватних вредности може бити еквивалентно изражена, без директног позивања на средњу вредност, у смислу квадрата одступања свих тачака једне од друге:[2]
Апсолутно континуирана случајна променљива
[уреди | уреди извор]Ако рандомна променљива има функцију густине вероватноће , и је кореспондирајућа кумулативна функција расподеле, онда је
или еквивалентно,
где је очекивана вредност од дата са
У овим формулама, интеграли у односу на и су Лебесгов и Лебесг–Стилтјеов интеграл, респетивно.
Ако је функција интеграбилна по Риману на сваком коначном интервалу онда је
при чему је овај интеграл неправилан Риманов интеграл.
Примери
[уреди | уреди извор]Експоненцијална дистрибуција
[уреди | уреди извор]Експоненцијална расподела са параметром λ је континуирана расподела чија је функција густине вероватноће дата са
на интервалу [0, ∞). Може се показати да је његова средња вредност
Користећи интеграцију по деловима и употребљавајући очекивану вредност која је већ израчуната, добија се:
Стога је варијанса од X дата изразом
Бацање коцке
[уреди | уреди извор]Шестострана коца се може моделовати као дискретна рандомна променљива, X, са исходима од 1 до 6, сваки са једнаком вероватноћом 1/6. Очекивана вредност X је Дакле, варијанса X је
Општа формула за варијансу исхода, X, n-стране коцке је
Често коришћене дистрибуције вероватноће
[уреди | уреди извор]Следећа табела наводи варијансу за неке често коришћене дистрибуције вероватноће.
Назив расподеле вероватноће | Функција расподеле вероватноће | Аритметичка средина | Варијанса |
---|---|---|---|
Биномна расподела | |||
Геометријска расподела | |||
Нормална расподела | |||
Униформна расподела (континуирана) | |||
Експоненцијална расподела | |||
Поасонова расподела |
Референце
[уреди | уреди извор]- ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. стр. 51. ISBN 9781441923226.
- ^ Yuli Zhang; Huaiyu Wu; Lei Cheng (јун 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). стр. 987—992.
Литература
[уреди | уреди извор]- Klenke, Achim (2013). Wahrscheinlichkeitstheorie. стр. 106. doi:10.1007/978-3-642-36018-3.
- Loève, Michel (1977). Probability Theory I. Springer. стр. 246. ISBN 3-540-90210-4.
- Itô, Kiyosi (1984). Introduction to Probability Theory. Cambridge University Press. стр. 37. ISBN 0 521 26960 1.
- Lemons, Don S. (2002), An Introduction to Stochastic Processes in Physics, The Johns Hopkins University Press, ISBN 0-8018-6866-1
- Bevington, Philip R (1969). Data Reduction and Error Analysis for the Physical Sciences. New York, N.Y.: McGraw-Hill. OCLC 300283069.
- Strutz, T. (2010). Data Fitting and Uncertainty (A practical introduction to weighted least squares and beyond). Vieweg+Teubner. ISBN 978-3-8348-1022-9.
- Anscombe, F. J. (1948). „The Validity of Comparative Experiments”. Journal of the Royal Statistical Society. Series A (General). 111 (3): 181—211. JSTOR 2984159. MR 30181. doi:10.2307/2984159.
- Bailey, R. A. (2008). Design of Comparative Experiments. Cambridge University Press. ISBN 978-0-521-68357-9.. Pre-publication chapters are available on-line.
- Belle, Gerald van (2008). Statistical rules of thumb (2nd изд.). Hoboken, N.J: Wiley. ISBN 978-0-470-14448-0.
- Cochran, William G.; Cox, Gertrude M. (1992). Experimental designs (2nd изд.). New York: Wiley. ISBN 978-0-471-54567-5.
- Cohen, Jacob. (1988). Statistical power analysis for the behavior sciences (2nd изд.). ISBN 978-0-8058-0283-2.. Routledge
- Cohen, Jacob (1992). „Statistics a power primer”. Psychological Bulletin. 112 (1): 155—159. PMID 19565683. doi:10.1037/0033-2909.112.1.155.
- Cox, David R. (1958). Planning of experiments. ISBN 978-0-471-57429-3.. Reprinted as
- Cox, David R. (2006). Principles of statistical inference. Cambridge New York: Cambridge University Press. ISBN 978-0-521-68567-2.
- Freedman, David A.(2005). Statistical Models: Theory and Practice. Cambridge University Press. ISBN 978-0-521-67105-7..
- Gelman, Andrew (2005). „Analysis of variance? Why it is more important than ever”. The Annals of Statistics. 33: 1—53. S2CID 13529149. arXiv:math/0504499 . doi:10.1214/009053604000001048.
- Gelman, Andrew (2008). „Variance, analysis of”. The new Palgrave dictionary of economics (2nd изд.). Basingstoke, Hampshire New York: Palgrave Macmillan. ISBN 978-0-333-78676-5.
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Design and Analysis of Experiments. I and II (Second изд.). Wiley. ISBN 978-0-470-38551-7.
- Howell, David C. (2002). Statistical methods for psychology (5th изд.). Pacific Grove, CA: Duxbury/Thomson Learning. ISBN 978-0-534-37770-0.
- Kempthorne, Oscar (1979). The Design and Analysis of Experiments (Corrected reprint of (1952) Wiley изд.). Robert E. Krieger. ISBN 978-0-88275-105-4.
- Lehmann, E.L. (1959) Testing Statistical Hypotheses. John Wiley & Sons.
- Montgomery, Douglas C. (2001). Design and Analysis of Experiments (5th изд.). New York: Wiley. ISBN 978-0-471-31649-7.
- Moore, David S. & McCabe, George P. (2003). Introduction to the Practice of Statistics (4e). W H Freeman & Co. ISBN 0-7167-9657-0
- Rosenbaum, Paul R.. (2002). Observational Studies (2nd изд.). New York: Springer-Verlag. ISBN 978-0-387-98967-9..
- Scheffé, Henry (1959). The Analysis of Variance. New York: Wiley.
- Stigler, Stephen M. (1986). The history of statistics : the measurement of uncertainty before 1900. Cambridge, Mass: Belknap Press of Harvard University Press. ISBN 978-0-674-40340-6.
- Wilkinson, Leland (1999). „Statistical Methods in Psychology Journals; Guidelines and Explanations”. American Psychologist. 5 (8): 594—604. CiteSeerX 10.1.1.120.4818 . doi:10.1037/0003-066X.54.8.594.