Pređi na sadržaj

Dijagram rasejanja

S Vikipedije, slobodne enciklopedije
Vreme čekanja između erupcija i trajanje erupcije za Stari verni gejzir u Nacionalnom parku Jeloustoun, Vajoming, SAD. Ovaj grafikon sugeriše da generalno postoje dve vrste erupcija: učestane-kratkotrajne i spore-dugotrajne.
3D dijagram rasejanja omogućava vizualizaciju multivarijantnih podataka. Ovaj dijagram raspršenja uzima više skalarnih varijabli i koristi ih za različite ose u faznom prostoru. Različite varijable se kombinuju da formiraju koordinate u faznom prostoru i prikazuju se pomoću glifova i boje pomoću druge skalarne promenljive.

Dijagram rasejanja (koja se takođe zove tačkasti ili graf rasejanja)[1] je tip matematičkog dijagrama koji koristi kartezijanske koordinate da prikaže vrednosti za tipično dve promenljive za neki skup podataka. Ako su tačke kodirane (boja/oblik/veličina), može se prikazati jedna dodatna promenljiva. Podaci se prikazuju kao kolekcija tačaka, od kojih svaka ima vrednost jedne promenljive koja određuje položaj na horizontalnoj osi i vrednost druge varijable koja određuje položaj na vertikalnoj osi.[2]

Pregled

[uredi | uredi izvor]

Dijagram rasejanja može se koristiti ili kada je jedna kontinuirana promenljiva pod kontrolom eksperimentatora, dok druga zavisi od nje ili kada su obe kontinuirane promenljive nezavisne. Ako postoji parametar koji se sistematski povećava i/ili smanjuje drugim, on se naziva kontrolni parametar ili nezavisna promenljiva i obično se iscrtava na horizontalnoj osi. Izmerena ili zavisna varijabla se obično prikazuje duž vertikalne ose. Ako ne postoji zavisna promenljiva, bilo koji tip promenljive se može nacrtati na bilo kojoj osi, a dijagram rasejanja će ilustrovati samo stepen korelacije (ne uzročne veze) između dve promenljive.

Dijagram rasejanja može da predloži različite vrste korelacija između promenljivih sa određenim intervalom poverenja. Na primer, težina i visina bi bili na y-osi, a visina bi bila na x -osi. Korelacije mogu biti pozitivne (rastuće), negativne (opadajuće) ili nulte (nekorelirane). Ako šablon tačaka od donjeg levog ka gornjem desnom onda to ukazuje na pozitivnu korelaciju između promenljivih koje se proučavaju. Ako se šablon tačaka nagiba od gornjeg levog ka donjem desnom, to ukazuje na negativnu korelaciju. Linija najboljeg uklapanja (alternativno nazvana 'linija trenda') može se povući za proučavanje odnosa između promenljivih. Jednačina za korelaciju između promenljivih može se odrediti ustanovljenim procedurama "najboljeg uklapanja". Za linearnu korelaciju, najbolja procedura je poznata kao linearna regresija i garantovano će generisati tačno rešenje u konačnom vremenu. Nijedna univerzalna procedura "najboljeg uklapanja" nije zagarantovana da generiše ispravno rešenje za proizvoljne relacije. Dijagram rasejanja je takođe veoma koristan kada želimo da vidimo kako se dva uporediva skupa podataka slažu da pokažu nelinearne odnose između varijabli. Mogućnost da se ovo uradi može se poboljšati dodavanjem glatke linije kao što je LOESS . Štaviše, ako su podaci predstavljeni kombinovanim modelom jednostavnih relacija, ove relacije će biti vizuelno evidentne kao superponirani šabloni.

Dijagram rasejanja je jedan od sedam osnovnih alata kontrole kvaliteta.[3]

Grafikoni rasejanja mogu biti napravljeni u obliku balončića, markera i/ili linijskih grafikona .

Primer

[uredi | uredi izvor]

Na primer, da bi prikazali vezu između nečijeg kapaciteta pluća i mogućnosti da osoba zadrži dah na neki vremenski period, istraživač bi izabrao grupu ljudi za proučavanje, a zatim izmerio kapacitet pluća svake osobe (prva promenljiva) i koliko dugo ta osoba može da zadrži dah (druga promenljiva). Istraživač bi zatim iscrtao podatke u dijagramu rasejanja, dodeljujući "kapacitet pluća" horizontalnoj osi, a "vreme zadržavanja daha" vertikalnoj osi.

Osoba sa kapacitetom pluća od 400 cl koja je zadržala dah 21,7 s bi bila predstavljena jednom tačkom na dijagramu rasejanja u tački (400, 21.7) u Dekartovim koordinatama. Dijagram rasejanja svih ljudi u studiji bi omogućio istraživaču da dobije vizuelno poređenje dve promenljive u skupu podataka i pomogao bi da se utvrdi kakav bi odnos mogao postojati između te dve promenljive.

Matrice dijagrama rasejanja

[uredi | uredi izvor]

Za skup promenljivih podataka (dimenzija) X 1, X 2, . ., X k, matrica dijagrama rasejanja pokazuje sve dijagrame rasejanja promenljivih u paru na jednom prikazu sa više dijagrama rasejanja u formatu matrice. Za k promenljivih, matrica dijagrama rasejanja će sadržati k redova i k kolona. Grafikon koji se nalazi na preseku reda j-te kolone je dijagram promenljivih Xi naspram Xj. To znači da su svaki red i kolona jedna dimenzija, a svaka ćelija prikazuje dijagram rasejanja dve dimenzije.

Generalizovana matrica dijagrama rasejanja nudi niz prikaza uparenih kombinacija kategoričkih i kvantitativnih promenljivih. Mozaik dijagram, dijagram fluktacija ili obrušeni trakasti dijagram se može koristiti za prikaz dve kategoričke promenljive. Ostali grafikoni se koriste za jednu kategorijsku i jednu kvantitativnu promenljivu.

Vizuelizacija 3D podataka zajedno sa odgovarajućom matricom dijagrama rasejanja.

Primer dijagrama raspianja

[uredi | uredi izvor]
Sluča Hobs-Pirson

Vidi još

[uredi | uredi izvor]

Reference

[uredi | uredi izvor]
  1. ^ Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication izd.). Dubuque, Iowa: Wm. C. Brown Pub. str. 492. ISBN 978-0-697-21595-6. „When we search for a relationship between two quantitative variables, a standard graph of the available data pairs (X,Y), called a scatter diagram, frequently helps... 
  2. ^ Utts, Jessica M. Seeing Through Statistics 3rd Edition, Thomson Brooks/Cole. 2005. ISBN 0-534-39402-7. str. 166-167.
  3. ^ Nancy R. Tague (2004). „Seven Basic Quality Tools”. The Quality Toolbox. Milwaukee, Wisconsin: American Society for Quality. str. 15. Arhivirano iz originala 31. 10. 2018. g. Pristupljeno 2010-02-05. 

Literatura

[uredi | uredi izvor]
  • Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication izd.). Dubuque, Iowa: Wm. C. Brown Pub. str. 492. ISBN 978-0-697-21595-6. „When we search for a relationship between two quantitative variables, a standard graph of the available data pairs (X,Y), called a scatter diagram, frequently helps... 

Spoljašnje veze

[uredi | uredi izvor]