Probabilitička teorija testiranja

U psihometriji, probabilitička teorija testiranja (engl. Item response theory) (IRT) (poznata i kao teorija latentnih osobina, teorija jakog istinitog rezultata ili moderna teorija mentalnog testa) je paradigma za dizajn, analizu i bodovanje testova, upitnika i sličnih instrumenata za merenje sposobnosti, stavove ili druge varijable. To je teorija testiranja zasnovana na odnosu između performansi pojedinaca na ispitnom predmetu i nivoa performansi ispitanika na ukupnoj meri sposobnosti koju je ta stavka dizajnirana da meri. Nekoliko različitih statističkih modela se koristi da bi se predstavile karakteristike predmeta i ispitanika.^[1] Za razliku od jednostavnijih alternativa za kreiranje skala i evaluaciju odgovora na upitnik, ne pretpostavlja se da je svaka stavka podjednako teška. Ovo razlikuje IRT od, na primer, Likertovog skaliranja, u kome se „pretpostavlja da su svi predmeti replikacije jedne druge ili drugim rečima stavke se smatraju paralelnim instrumentima“.^[2] Nasuprot tome, probabilitička teorija testiranja tretira težinu svake stavke (krive karakteristika predmeta ili ICC) kao informaciju koja treba da se ugradi u stavke skaliranja.

Pregled[uredi | uredi izvor]

Koncept funkcije probabilitičke teorije bio je pre 1950. godine. Pionirski rad IRT-a kao teorije desio se tokom 1950-ih i 1960-ih. Trojica pionira bili su psihometričar Službe za obrazovno testiranje Frederik M. Lord, danski matematičar Georg Raš i austrijski sociolog Pol Lazarsfeld, koji su samostalno vodili paralelna istraživanja. Ključne ličnosti koje su podstakle napredak IRT-a su Bendžamin Drejk Rajt i Dejvid Andrič. IRT nije postao široko korišćen sve do kasnih 1970-ih i 1980-ih, kada je praktičarima rečeno o „korisnosti“ i „prednostima“ IRT-a s jedne strane, a lični računari su mnogim istraživačima dali pristup računarskoj snazi neophodnoj za IRT, s druge strane.

Između ostalog, svrha IRT-a je da obezbedi okvir za procenu toga koliko dobro funkcionišu procene i koliko dobro funkcionišu pojedinačne stavke o proceni. Najčešća primena IRT-a je u obrazovanju, gde ga psihometričari koriste za razvijanje i dizajniranje ispita, održavanje grupa stavki za ispite i izjednačavanje poteškoća stavki za uzastopne verzije ispita (na primer, da bi se omogućila poređenja između rezultata tokom vremena).^[3]

IRT modeli se često nazivaju latentnim modelima osobina. Termin latentni se koristi da se naglasi da se odgovori na diskretne stavke smatraju vidljivim manifestacijama hipotetizovanih osobina, konstrukcija ili atributa, koje se ne posmatraju direktno, ali koje se moraju zaključiti iz manifestnih odgovora. Modeli latentnih osobina razvijeni su u oblasti sociologije, ali su praktično identični IRT modelima.

IRT se generalno smatra poboljšanjem u odnosu na klasičnu teoriju ispitivanja (CTT). Za zadatke koji se mogu obaviti korišćenjem CTT-a, IRT generalno donosi veću fleksibilnost i pruža sofisticiranije informacije. Neke aplikacije, kao što je kompjuterizovano adaptivno testiranje, su omogućene od strane IRT-a i ne mogu se razumno izvoditi koristeći samo klasičnu teoriju testiranja. Još jedna prednost IRT-a u odnosu na CTT je da sofisticiranije informacije koje IRT pruža omogućavaju istraživaču da poboljša pouzdanost procene.

IRT podrazumeva tri pretpostavke:

Jednodimenzionalna osobina označena sa ${\theta }$
Lokalna nezavisnost stavki;
Odgovor osobe na stavku može se modelirati pomoću funkcije matematičkog odgovora na stavku (IRF).

Dalje se pretpostavlja da je osobina merljiva na skali (samo postojanje testa pretpostavlja ovo), obično postavljena na standardnu skalu sa srednjom vrednošću od 0,0 i standardnom devijacijom od 1,0. Jednodimenzionalnost treba tumačiti kao homogenost, kvalitet koji treba definisati ili empirijski pokazati u odnosu na datu namenu ili upotrebu, ali ne i količinu koja se može meriti. „Lokalna nezavisnost“ znači (a) da šansa da se jedna stavka koristi nije povezana sa bilo kojim drugim predmetom(ima) koji se koristi i (b) da je odgovor na predmet nezavisna odluka svakog ispitanika, tj. nema varanja ili rada u paru ili grupnog rada. Tema dimenzionalnosti se često istražuje faktorskom analizom, dok je IRF osnovni građevinski blok IRT-a i centar je većeg dela istraživanja i literature.

Reference[uredi | uredi izvor]

^ „Glossary1”. web.archive.org. 2017-07-22. Arhivirano iz originala 22. 07. 2017. g. Pristupljeno 2022-10-30.
^ A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196-201
^ May, Kim (1993). „Book Review : Fundamentals of Item Response Theory Ronald K. Hambleton, H. Swaminathan, and H. Jane Rogers Newbury Park CA: Sage, 1991, 174 pp”. Applied Psychological Measurement. 17 (3): 293—294. ISSN 0146-6216. doi:10.1177/014662169301700309.

[1] „Glossary1”. web.archive.org. 2017-07-22. Arhivirano iz originala 22. 07. 2017. g. Pristupljeno 2022-10-30.

[2] A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196-201

[3] May, Kim (1993). „Book Review : Fundamentals of Item Response Theory Ronald K. Hambleton, H. Swaminathan, and H. Jane Rogers Newbury Park CA: Sage, 1991, 174 pp”. Applied Psychological Measurement. 17 (3): 293—294. ISSN 0146-6216. doi:10.1177/014662169301700309.

[1]

[2]

[3]