Dijagram rasejanja
Dijagram rasejanja (koja se takođe zove tačkasti ili graf rasejanja)[1] je tip matematičkog dijagrama koji koristi kartezijanske koordinate da prikaže vrednosti za tipično dve promenljive za neki skup podataka. Ako su tačke kodirane (boja/oblik/veličina), može se prikazati jedna dodatna promenljiva. Podaci se prikazuju kao kolekcija tačaka, od kojih svaka ima vrednost jedne promenljive koja određuje položaj na horizontalnoj osi i vrednost druge varijable koja određuje položaj na vertikalnoj osi.[2]
Pregled
[uredi | uredi izvor]Dijagram rasejanja može se koristiti ili kada je jedna kontinuirana promenljiva pod kontrolom eksperimentatora, dok druga zavisi od nje ili kada su obe kontinuirane promenljive nezavisne. Ako postoji parametar koji se sistematski povećava i/ili smanjuje drugim, on se naziva kontrolni parametar ili nezavisna promenljiva i obično se iscrtava na horizontalnoj osi. Izmerena ili zavisna varijabla se obično prikazuje duž vertikalne ose. Ako ne postoji zavisna promenljiva, bilo koji tip promenljive se može nacrtati na bilo kojoj osi, a dijagram rasejanja će ilustrovati samo stepen korelacije (ne uzročne veze) između dve promenljive.
Dijagram rasejanja može da predloži različite vrste korelacija između promenljivih sa određenim intervalom poverenja. Na primer, težina i visina bi bili na y-osi, a visina bi bila na x -osi. Korelacije mogu biti pozitivne (rastuće), negativne (opadajuće) ili nulte (nekorelirane). Ako šablon tačaka od donjeg levog ka gornjem desnom onda to ukazuje na pozitivnu korelaciju između promenljivih koje se proučavaju. Ako se šablon tačaka nagiba od gornjeg levog ka donjem desnom, to ukazuje na negativnu korelaciju. Linija najboljeg uklapanja (alternativno nazvana 'linija trenda') može se povući za proučavanje odnosa između promenljivih. Jednačina za korelaciju između promenljivih može se odrediti ustanovljenim procedurama "najboljeg uklapanja". Za linearnu korelaciju, najbolja procedura je poznata kao linearna regresija i garantovano će generisati tačno rešenje u konačnom vremenu. Nijedna univerzalna procedura "najboljeg uklapanja" nije zagarantovana da generiše ispravno rešenje za proizvoljne relacije. Dijagram rasejanja je takođe veoma koristan kada želimo da vidimo kako se dva uporediva skupa podataka slažu da pokažu nelinearne odnose između varijabli. Mogućnost da se ovo uradi može se poboljšati dodavanjem glatke linije kao što je LOESS . Štaviše, ako su podaci predstavljeni kombinovanim modelom jednostavnih relacija, ove relacije će biti vizuelno evidentne kao superponirani šabloni.
Dijagram rasejanja je jedan od sedam osnovnih alata kontrole kvaliteta.[3]
Grafikoni rasejanja mogu biti napravljeni u obliku balončića, markera i/ili linijskih grafikona .
Primer
[uredi | uredi izvor]Na primer, da bi prikazali vezu između nečijeg kapaciteta pluća i mogućnosti da osoba zadrži dah na neki vremenski period, istraživač bi izabrao grupu ljudi za proučavanje, a zatim izmerio kapacitet pluća svake osobe (prva promenljiva) i koliko dugo ta osoba može da zadrži dah (druga promenljiva). Istraživač bi zatim iscrtao podatke u dijagramu rasejanja, dodeljujući "kapacitet pluća" horizontalnoj osi, a "vreme zadržavanja daha" vertikalnoj osi.
Osoba sa kapacitetom pluća od cl koja je zadržala dah 400 s bi bila predstavljena jednom tačkom na dijagramu rasejanja u tački (400, 21.7) u 21,7Dekartovim koordinatama. Dijagram rasejanja svih ljudi u studiji bi omogućio istraživaču da dobije vizuelno poređenje dve promenljive u skupu podataka i pomogao bi da se utvrdi kakav bi odnos mogao postojati između te dve promenljive.
Matrice dijagrama rasejanja
[uredi | uredi izvor]Za skup promenljivih podataka (dimenzija) X 1, X 2, . ., X k, matrica dijagrama rasejanja pokazuje sve dijagrame rasejanja promenljivih u paru na jednom prikazu sa više dijagrama rasejanja u formatu matrice. Za k promenljivih, matrica dijagrama rasejanja će sadržati k redova i k kolona. Grafikon koji se nalazi na preseku reda j-te kolone je dijagram promenljivih Xi naspram Xj. To znači da su svaki red i kolona jedna dimenzija, a svaka ćelija prikazuje dijagram rasejanja dve dimenzije.
Generalizovana matrica dijagrama rasejanja nudi niz prikaza uparenih kombinacija kategoričkih i kvantitativnih promenljivih. Mozaik dijagram, dijagram fluktacija ili obrušeni trakasti dijagram se može koristiti za prikaz dve kategoričke promenljive. Ostali grafikoni se koriste za jednu kategorijsku i jednu kvantitativnu promenljivu.
Primer dijagrama raspianja
[uredi | uredi izvor]Vidi još
[uredi | uredi izvor]Reference
[uredi | uredi izvor]- ^ Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication izd.). Dubuque, Iowa: Wm. C. Brown Pub. str. 492. ISBN 978-0-697-21595-6. „When we search for a relationship between two quantitative variables, a standard graph of the available data pairs (X,Y), called a scatter diagram, frequently helps...”
- ^ Utts, Jessica M. Seeing Through Statistics 3rd Edition, Thomson Brooks/Cole. 2005. ISBN 0-534-39402-7. str. 166-167.
- ^ Nancy R. Tague (2004). „Seven Basic Quality Tools”. The Quality Toolbox. Milwaukee, Wisconsin: American Society for Quality. str. 15. Arhivirano iz originala 31. 10. 2018. g. Pristupljeno 2010-02-05.
Literatura
[uredi | uredi izvor]- Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication izd.). Dubuque, Iowa: Wm. C. Brown Pub. str. 492. ISBN 978-0-697-21595-6. „When we search for a relationship between two quantitative variables, a standard graph of the available data pairs (X,Y), called a scatter diagram, frequently helps...”
Spoljašnje veze
[uredi | uredi izvor]- Mediji vezani za članak Dijagram rasejanja na Vikimedijinoj ostavi
- Šta je dijagram rasejanja? Arhivirano na sajtu Wayback Machine (7. avgust 2020)
- Correlation scatter-plot matrix for ordered-categorical data – Objašnjenje i R kod
- Density scatterplot for large datasets (hiljade miliona tačaka)