Pređi na sadržaj

Statistička populacija

S Vikipedije, slobodne enciklopedije

U statistici, populacija je skup sličnih objekata posmatranja koji dele bar jedno zajedničko svojstvo koje je predmet statističke analize.[1] Na primer, populacija nekog naroda, između ostalih obeležja, deli zajedničko geografsko poreklo, jezik, književnost i genetičku osnovu, što ih razlikuje od ljudi drugih nacionalnosti. Primer može biti i galaksija Mlečni put, koja se sastoji populacije zvezda, ili hipotetična i potencijalno beskonačna grupa objekata zamišljena kao generalizacija iz iskustva (npr. skup svih mogućih deljenja u igri pokera).[2] Zajednički cilj statističke analize je da se dobiju informacije o nekoj izabranoj populaciji.[3] Nasuprot tome, statistički uzorak je posmatrani podskup izdvojen iz populacije da bi je predstavljao u statističkoj analizi. Ako je uzorak verodostojno odabran, tj. slučajno i bez pristrasnosti, karakteristike celokupne populacije iz koje potiče, po zakonu verovatnoće mogu biti predstavljene karakteristikama tog uzorka.[4] Odnos veličine ovog statističkog uzorka prema veličini populacije naziva se frakcija uzorkovanja.[5] Tada je moguće proceniti populacione parametre koristeći odgovarajuću statistiku uzorka.[6][7]

Statistički i biološki pojmovi populacije se međusobno bitno razlikuju.

Srednja vrednost

[uredi | uredi izvor]

Srednja vrednost populacije, ili očekivana vrednost populacije,[8][9][10] je mera centralne tendencije bilo distribucije verovatnoće ili slučajne promenljive koju karakteriše ta distribucija.[11] U diskretnoj raspodeli verovatnoće slučajne promenljive X, srednja vrednost je jednaka zbiru svake moguće vrednosti ponderisane verovatnoćom te vrednosti; to jest, izračunava se uzimanjem proizvoda svake moguće vrednosti xX i njene verovatnoće p(x), a zatim sabiranjem svih ovih proizvoda, dajući .[12][13] Analogna formula važi za slučaj neprekidne raspodele verovatnoće. Nema svaka raspodela verovatnoće definisanu srednju vrednost (pogledajte Košijevu distribuciju za primer). Štaviše, srednja vrednost može biti beskonačna za neke distribucije.

Za konačnu populaciju, populacijska sredina svojstva je jednaka aritmetičkoj sredini datog svojstva, uzimajući u obzir svakog člana populacije. Na primer, srednja visina populacije jednaka je zbiru visina svake individue – podeljeno sa ukupnim brojem pojedinaca. Srednja vrednost uzorka može se razlikovati od srednje vrednosti populacije, posebno za male uzorke. Zakon velikih brojeva novodi da što je veća veličina uzorka, veća je verovatnoća da će srednja vrednost uzorka biti bliska srednjoj vrednosti populacije.[14]

Subpopulacija

[uredi | uredi izvor]

Subpopulacija je podskup populacije, ako dele jedno ili više dodatnih svojstva. Na primer, ako je sveukupna populacija jedan narod, subpopulacija mogu biti njegove polne kategorije, ili ako su populacija sve apoteke u svetu, subpopulacija su sve apoteke u Egiptu. Nasuprot tome, podskup populacije koji nema dodatno prisustvo bilo kojeg zajedničkog dodatnog svojstva zove se uzorak. Primer mogu biti 30 nasumično odabranih osoba posmatranog uzorka ili karata iz datog kompleta.

Opisna (deskriptivna) statistika može dati različite rezultate za različite subpopulacije. Na primer, određeni lekovi mogu imati različite efekte na različite subpopulacije, a ovi efekti mogu biti zasenjeni ili odbačeni ako takve posebne subpopulacija nisu identifikovane i ispitane u izolaciji. Isto tako, parametri se često mogu preciznije proceniti ako se subpopulacije odvoje: distribuciju telesne visine ljudi je bolje modelovati prema muškaracima i ženama kao zasebnim subpopulacijama, na primer.

Populacije koje se sastoje od subpopulacija mogu se modelovati pomoću mešovitih modela,[15] kombinovanjem distribucije unutar subpopulacija u ukupnoj distribuciji populacije.[16] Čak i kada su subpopulacije dobro modelovane po jednostavnom modelu, sveukupna populacija može biti loše prilagođena, što može biti dokaz za postojanje subpopulacija. Na primer, u dve jednake subpopulacije, obe normalno distribuirane, ako imaju iste standardne devijacije a različite srednje vrednosti, ukupne distribucije će ispoljavati nisku sličnost u odnosu na normalnu distribuciju. Srednja vrednost subpopulacija će pasti na račun ukupne distribucije. Ako su dovoljno razdvojene, formiraju bimodalnu distribuciju,[17][18] a bez toga, na grafičkom prikazu imaju jednostavan i širok vrhunac. Nadalje, ispoljavaće nadvišavanje disperzije,[19] u odnosu na jedinstvenu normalnu distribuciju date varijacije. Alternativno, ako su subpopulacije sa istom srednjom vrednošću i različitim standardnim devijacijacijama, ukupna populacija će ispoljavati visoku sličnost, s oštrijm vrhom i težim krajevima (i shodno tome plićim prelaznim kategorijama) nego kod jednostavne distribucije.

Vidi još

[uredi | uredi izvor]

Reference

[uredi | uredi izvor]
  1. ^ „Glossary of statistical terms: Population”. Statistics.com. Архивирано из оригинала 03. 03. 2016. г. Приступљено 22. 2. 2016. 
  2. ^ Weisstein, Eric W. „Statistička populacija”. MathWorld. 
  3. ^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd изд.). New York: Freeman. ISBN 978-0-7167-4773-4. Архивирано из оригинала 9. 2. 2005. г. 
  4. ^ Mosteller, F.; Tukey, J. W. (1987) [1968]. „Data Analysis, including Statistics”. The Collected Works of John W. Tukey: Philosophy and Principles of Data Analysis 1965–1986. 4. CRC Press. стр. 601–720 [p. 633]. ISBN 0-534-05101-4 — преко Google Books. 
  5. ^ Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford: Oxford University Press. ISBN 0-19-920613-9. 
  6. ^ Bain, Lee J.; Engelhardt, Max (1992). Introduction to probability and mathematical statistics (2nd изд.). Boston: PWS-KENT Pub. ISBN 0534929303. OCLC 24142279. 
  7. ^ Scheaffer, Richard L.; Mendenhall, William; Ott, Lyman (2006). Elementary survey sampling (6th изд.). Southbank, Vic.: Thomson Brooks/Cole. ISBN 0495018627. OCLC 58425200. 
  8. ^ „Expectation | Mean | Average”. www.probabilitycourse.com. Приступљено 2020-09-11. 
  9. ^ Hansen, Bruce. „PROBABILITY AND STATISTICS FOR ECONOMISTS” (PDF). Архивирано из оригинала (PDF) 19. 01. 2022. г. Приступљено 2021-07-20. 
  10. ^ Wasserman, Larry (децембар 2010). All of Statistics: a concise course in statistical inference. Springer texts in statistics. стр. 47. ISBN 9781441923226. 
  11. ^ Feller, William (1950). Introduction to Probability Theory and its Applications, Vol I. Wiley. стр. 221. ISBN 0471257087. 
  12. ^ Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, p. 279
  13. ^ Weisstein, Eric W. „Population Mean”. mathworld.wolfram.com (на језику: енглески). Приступљено 2020-08-21. 
  14. ^ Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, p. 141
  15. ^ Everitt, B.S.; Hand, D.J. (1981). Finite mixture distributions. Chapman & Hall. ISBN 978-0-412-22420-1. 
  16. ^ Dinov, ID. "Expectation Maximization and Mixture Modeling Tutorial". California Digital Library, Statistics Online Computational Resource, Paper EM_MM, http://repositories.cdlib.org/socr/EM_MM, December 9, 2008
  17. ^ Hassan, MY; Hijazi, RH (2010). „A bimodal exponential power distribution”. Pakistan Journal of Statistics. 26 (2): 379—396. 
  18. ^ Holzmann, Hajo; Vollmer, Sebastian (2008). „A likelihood ratio test for bimodality in two-component mixtures with application to regional income distribution in the EU”. AStA Advances in Statistical Analysis. 2 (1): 57—69. doi:10.1007/s10182-008-0057-2. 
  19. ^ Lindsey, J. K.; Altham, P. M. E. (1998). „Analysis of the Human Sex Ratio by using Overdispersion Models”. Journal of the Royal Statistical Society, Series C. 47 (1): 149—157. doi:10.1111/1467-9876.00103. 

Literatura

[uredi | uredi izvor]

Spoljašnje veze

[uredi | uredi izvor]