
Kada zavisne promenljive nisu pogodne za linearne modele, šta onda?
Kada vaša zavisna promenljiva nije kontinuirana, neograničena i merena na intervalnoj ili razmernoj skali, vaš model neće ispuniti pretpostavke linearnih modela.
Prikazaćemo 6 uobičajenih tipova zavisnih promenljivih koje nisu kontinuirane, neograničene i dobijene su na ordinalnoj ili nominalnoj skali i testove koji sa njima funkcionišu.
Uobičajen savet je da se koriste neparametarski testove kada pretpostavke o normalnosti distribucije podataka nisu ispunjene. To funkcioniše kada radite nešto jednostavno, poput korelacije ili upoređivanja grupnih razlika. Ali ako u model uključujete kovarijacije ili interakcije, potreban vam je pravi model.
Kategorijalne promenljive
I binarne (2 vrednosti) i višekategorijske (3 ili više vrednosti) promenljive očigledno ne ispunjavaju sve pomenute kriterijume. Ali postoje odgovarajući tipovi regresionih modela koji odlično funkcionišu za ove promenljive.
Za binarne varijable, koriste se najčešće probit i logistički regresioni modeli.
Za višekategorijske varijable koristi se multinomijalna logistička regresija.
Ordinalne promenljive
Ove promenljive se sastoje od uređenih kategorija. One uključuju promenljive ranga i slične stavke, mada nisu ograničene na njih. Iako ordinalne promenljive izgledaju kao brojevi, rastojanja između njihovih vrednosti nisu jednaka u pravom numeričkom smislu, pa nema smisla na njih primenjivati numeričke operacije, poput sabiranja i deljenja. Otuda znači da se osnova linearnih modela ne računa.
Ordinalne promenljive zahtevaju specijalizovane logističke ili probitne modele, poput modela proporcionalnih kvota. Postoji još nekoliko vrsta ordinalnih modela, poput kategorijalneregresione analize (CatReg) ali je najčešće dostupan model proporcionalnih kvota.
Frekvencuje (Count Variables)
Diskretni brojevi ne odgovaraju pretpostavkama linearnih modela iz mnogo razloga. Najočiglednije je da normalna distribucija linearnih modela dozvoljava bilo koju vrednost na skali brojeva, ali su brojevi ograničeni na 0. Jednostavno nema smisla predviđati negativan broj cigareta koje se puše svaki dan, dece u porodici ili agresivnih incidenata. No, Poissonova regresija, ili srodni modeli poput negativnog binoma, dizajnirani su za precizno modeliranje frekvencija.
Nula zasićene promenljive
Nula zasićeni podaci imaju vrh u distribuciji na vrednosti 0. Uobičajeni su u Poissonovi podaci, ali se mogu pojaviti sa bilo kojom distribucijom. Jedan od primera su rezultati na skali depresije. Skala se kretala od 0 do 20, a 0 je bila daleko najčešća vrednost (što je dobra stvar za stanje čovečanstva, ali zaista zbunjuje pretpostavke linearnog modela). Čak i ako je ostatak distribucije normalan, ne možete pretvoriti nulto zasićene podatke u normalne. Model sa nultom zasičenosti, međutim, uključuje veliki broj nula istovremeno modelujući 0/ne 0 kao logističku regresiju i sve vrednosti Ne 0 kao drugu distribuciju.
Ograničene promenljive
Ograničeni podaci imaju potpune informacije o vrednostima zavisne varijable samo za neke vrednosti. Distribucija se prekida za neke vrednosti, često na kraju distribucije. Primeri uključuju ankete koje sadrže tačne podatke o prihodima: na pr. svi preko 200 hiljada dinara mesečno, ali osim toga, svima se samo daje opcija „do 200 hiljada“. U anketama se to radi zbog pitanja privatnosti – jednostavno nema mnogo ljudi sa tako visokim primanjima. Ali ponekad je to samo problem merenja. Tobitni regresijski modeli dizajnirani su za rukovanje nepreciznim merenjima na nekim delovima skale.
Proporcije
Proporcije, ograničene na 0 i 1, ili procenti, ograničene na 0 i 100, zaista postaju problematične ako je veliki deo podataka blizu granica. Ako svi podaci padnu u srednji dio, recimo u rasponu od .2 do .8, linearni model može dati razumno dobre rezultate. Ali osim toga, morate koristiti beta regresiju ako je proporcija kontinuirana ili logističku regresiju ako proporcija meri diskretne događaje sa određenim ishodom (proporcija pitanja na koja je tačno odgovoreno).
Tekst Karen Grace-Martin (The Analysis Factor) preuzet i prilagođen.