Pređi na sadržaj

Varijansa

S Vikipedije, slobodne enciklopedije
Primer uzoraka iz dve populacije sa istom srednjom vrednošću, ali različitim varijacijama. Crvena populacija ima srednju vrednost 100 i varijansu 100 (SD=10), dok plava populacija ima srednju vrednost 100 i varijansu 2500 (SD=50).

Disperzija ili varijansa je pojam iz teorije verovatnoće i statistike. Ona predstavlja matematičko očekivanje odstupanja slučajne promenljive od njene srednje vrednosti. Varijansa je mera disperzije, što znači da izražava koliko je skup brojeva raširen od njihove prosečne vrednosti. Varijansa ima centralnu ulogu u statistici, gde neke ideje koje je koriste uključuju deskriptivnu statistiku, statističko zaključivanje, testiranje hipoteze, adekvatnost uklapanja i Monte Karlo uzorkovanje. Varijanca je važan alat u nauci, gde je uobičajena primena statističke analize podataka. Varijanca je kvadrat standardne devijacije, drugi centralni momenat distribucije i kovarijansa slučajne promenljive sa samom sobom, a često se predstavlja sa , , , , ili .[1]

Na primer, savršena kocka za igru može da da jedan od 6 ishoda. Očekivana vrednost broja kojeg će kocka da pokaže je (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, očekivana standardna devijacija je σ ≈ 1.71 (kvadratni koren aritmetičke sredine jednakoverovatnih kvadrata apsolutnih odstupanja: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, što daje 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), očekivano kvadratno odstupanje ili varijansa je  17,5/6 ≈ 2,9 (srednja vrednost jednakoverovatnih kvadrata odstupanja: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).

Definicija

[uredi | uredi izvor]

Neka je matematičko očekivanje realnog slučajnog vektora za koji postoji integral kvadrata njegovih vrednosti. Tada je varijansa slučajne promenljive:

Ako je vektor jednodimenzionalan, uslovi za mogu da se uproste. Ako je , onda važi:

Ova definicija obuhvata slučajne varijable koje su generisane procesima koji su diskretni, kontinuirani, ni jedno ni drugo ili mešoviti. Varijansa se takođe može smatrati kovarijansom slučajne promenljive sa samom sobom:

Varijansa je takođe ekvivalentna drugom kumulantu distribucije verovatnoće koja generiše . Varijansa se obično označava kao , ili ponekad kao ili , ili simbolično kao ili jednostavno (izgovara se „sigma na kvadrat”). Izraz za varijansu se može proširiti na sledeći način:

Drugim rečima, varijansa X je jednaka srednjoj vrednosti kvadrata X minus kvadrat srednje vrednosti X. Ova jednačina ne bi trebalo da se koristi za proračune korišćenjem aritmetike sa plutajućim zarezom, jer pati od katastrofalnog poništavanja ako su dve komponente jednačine slične po veličini. Za druge numerički stabilne alternative pogledajte algoritme za izračunavanje varijanse.

Diskretna slučajna promenljiva

[uredi | uredi izvor]

Ako je generator slučajne promenljive diskretan sa funkcijom verovatnoće , onda je

gde je očekivana vrednost. To je,

(Kada je takva diskretna ponderisana varijansa određena ponderima čiji zbir nije 1, tada se deli zbirom pondera.)

Varijanca kolekcije od jednako verovatnih vrednosti može se napisati kao

gde je prosečna vrednost. To je,

Varijanca skupa od jednako verovatnih vrednosti može biti ekvivalentno izražena, bez direktnog pozivanja na srednju vrednost, u smislu kvadrata odstupanja svih tačaka jedne od druge:[2]

Apsolutno kontinuirana slučajna promenljiva

[uredi | uredi izvor]

Ako randomna promenljiva ima funkciju gustine verovatnoće , i je korespondirajuća kumulativna funkcija raspodele, onda je

ili ekvivalentno,

gde je očekivana vrednost od data sa

U ovim formulama, integrali u odnosu na i su Lebesgov i Lebesg–Stiltjeov integral, respetivno.

Ako je funkcija integrabilna po Rimanu na svakom konačnom intervalu onda je

pri čemu je ovaj integral nepravilan Rimanov integral.

Primeri

[uredi | uredi izvor]

Eksponencijalna distribucija

[uredi | uredi izvor]

Eksponencijalna raspodela sa parametrom λ je kontinuirana raspodela čija je funkcija gustine verovatnoće data sa

na intervalu [0, ∞). Može se pokazati da je njegova srednja vrednost

Koristeći integraciju po delovima i upotrebljavajući očekivanu vrednost koja je već izračunata, dobija se:

Stoga je varijansa od X data izrazom

Bacanje kocke

[uredi | uredi izvor]

Šestostrana koca se može modelovati kao diskretna randomna promenljiva, X, sa ishodima od 1 do 6, svaki sa jednakom verovatnoćom 1/6. Očekivana vrednost X je Dakle, varijansa X je

Opšta formula za varijansu ishoda, X, n-strane kocke je

Često korišćene distribucije verovatnoće

[uredi | uredi izvor]

Sledeća tabela navodi varijansu za neke često korišćene distribucije verovatnoće.

Naziv raspodele verovatnoće Funkcija raspodele verovatnoće Aritmetička sredina Varijansa
Binomna raspodela
Geometrijska raspodela
Normalna raspodela
Uniformna raspodela (kontinuirana)
Eksponencijalna raspodela
Poasonova raspodela

Reference

[uredi | uredi izvor]
  1. ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. str. 51. ISBN 9781441923226. 
  2. ^ Yuli Zhang; Huaiyu Wu; Lei Cheng (jun 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). str. 987—992. 

Literatura

[uredi | uredi izvor]

Spoljašnje veze

[uredi | uredi izvor]