Conspect al capitolului 16, ”Testing hypotheses about the difference between two independent means”, din ”Statistical reasoning in psychology and education”, de Minium, King și Bear
Atunci când sunt folosite două eșantioane, ne putem aștepta ca ele să rezulte în medii diferite, chiar dacă au fost tratate în mod identic. Însă întrebarea de cercetare nu se referă la eșantioane, ci la populații. Astfel, în cazul eșantioanelor independente, ipoteza nulă afirmă că diferența dintre media primei populații și media celei de-a doua populații este zero.
Ipoteza alternativă în cazul eșantioanelor independente poate fi direcțională sau nondirecțională. Dacă ipoteza este nondirecțională, atunci diferența dintre media primei populații și media celei de-a doua populații nu este zero. Dacă avem o direcție, atunci ipoteza alternativă ar putea fi că diferența dintre media primei populații și media celei de-a doua populații este mai mare sau mai mică decât zero.
Pașii testării ipotezei sunt aceiași ca pașii pentru o singură medie – se selectează un coeficient alfa, criteriul pentru decizie, și un eșantion suficient de mare pentru a permite observarea unei diferențe. Apoi sunt examinate caracteristicile distribuției pentru a compara rezultatele cu cele așteptate în cazul în care ipoteza nulă este adevărată.
Distribuția eșantionării randomizate a diferențelor dintre două medii
În cazul eșantioanelor independente, suntem interesați de diferența dintre două medii, iar distribuția de referință este distribuția eșantionării randomizate a diferențelor dintre două medii. Astfel, să spunem că avem două populații – X și Y. Se extrage câte un eșantion randomizat din fiecare populație, se calculează media pentru fiecare și se face diferența. Apoi eșantioanele sunt reintroduse în populație și este extras altul. Repetând acest proces, se obține distribuția de referință.
Această distribuție este utilizată pentru a stabili ce diferență ar apărea între X și Y dacă ipoteza nulă este valabilă. Media acestei distribuții este zero, deoarece și diferența dintre mediile populației este zero.
O altă modalitate de a conceptualiza acestă distribuție este considerarea tuturor diferențelor posibile. Dacă specificăm mărimea eșantioanelor X și Y, enumerăm toate posibilele eșantioane care pot fi formate, calculăm media fiecăruia, cuplăm fiecare medie X cu fiecare medie Y și facem diferența dintre ele, obținem un set al tuturor posibilelor diferențe. Și în acest caz, media distribuției este zero.
Aceste eșantioane trebuie să fie independente. Dacă eșantioanele sunt extrase independent și aleator, fiecare dintre diferențe are o probabilitate egală de a apărea.
Există câteva caracteristici importante ale distribuției rezultate. În primul rând, media distribuției este zero. În al doilea rând, distribuția aproximează o distribuție normală. Dacă distribuțiile eșantioanelor din X și Y sunt normale, atunci și distribuția diferențelor va fi normală.
Proprietățile distribuției diferențelor de medii
Există trei caracteristici care definesc complet o distribuție – medie, abatere standard și formă. Știm deja că media este zero și că forma aproximează o distribuție normală. În ceea ce privește abaterea standard, ea diferă în funcție de independența eșantioanelor.
Eșantioanele independente sunt cele în care selecția elementelor care formează scorurile Y nu sunt influențate de selecția elementelor care formează scorurile X. Eșantioanele dependente sunt cele în care aceiași participanți primesc ambele condiții.
Abaterea standard a distribuției eșantioanelor se numește eroarea standard a diferențelor între medii. În cazul eșantioanelor independente, eroarea standard este radical din suma erorilor standard pentru fiecare eșantion.
Formula pentru T
Formula pentru abaterea standard presupune să cunoaștem eroarea standard a mediei pentru X și Y și abaterea standard a populației. Estimarea erorii standard pentru eşantioane independente este radical din suna abaterilor standard pentru fiecare eşantion.
Pentru a testa diferenţa dintre cele două medii independente, se poate calcula un scor z. Atunci când mărimea eșantionului este relativ mare, z se apropie de o distribuție normală.
Fisher a arătat că o abordare diferită rezultă în statistici cu distribuție t. Modificarea presupune asumarea egalității dintre erorile standard ale eșantioanelor, asumpție numită asumpția omogenității varianței.
Se poate calcula o estimare pentru cele două eșantioane prin cuplarea sumelor pătratelor de la fiecare eșantion și raportarea lor la numărul total de grade de libertate. Astfel, formula devine radical din eroarea standard cumulată, înmulțită cu suma dintre 1 raportat la nx și 1 raportat la ny. Eroarea standard cumulată este egală cu suma dintre suma pătratelor pentru x și suma pătratelor pentru y, raportată la suma dintre gradele de libertate pentru fiecare eșantion.
Dacă numărul de participanți este egal, atunci formula este simplificată, fiind radical din suma dintre suma pătratelor x și suma pătratelor y, raportată la produsul dintre n și n -1.
Atunci când calculăm t, formula este diferența mediilor, raportată la eroarea standard xy.
Testele unidirecționale
În cazul în care alegem să derulăm un test unidirecțional, ipoteza nulă este că diferența mediilor este egală cu zero, iar ipoteza alternativă este că diferența mediilor este mai mică sa mai mare decât zero.
Mărimea eșantionului în inferențe
Atunci când inferențele sunt făcute pentru două eșantioane, este posibil ca acestea să nu fie egale. În acest caz, asumpția omogenității varianței poate rezulta într-o valoare mai mică a abaterii standard.
Asumpții ale inferențelor
În cazul testelor cu eșantioane independente, fiecare eșantion trebuie selectat randomizat din populație. Cele două eșantioane trebuie să fie selectate independente. Selectarea eșantioanelor se face cu înlocuire și distribuția are o formă normală.
În asumpția unei curbe normale, este important să se cunoască abaterile standard. Folosind testul t și distribuția t, această asumpție poate fi evitată. O altă excepție se aplică doar diferențelor între eșantioane independente. Pentru ca distribuția t să fie aplicabilă, este asumată varianța omogenității. Această asumpție este de multe ori valabilă, iar dacă este încălcată, nu apar probleme dacă eșantionul este suficient de mare. Această problemă este rezolvată și dacă eșantioanele au aceeași mărime.
În ceea ce privește distribuția normală, conform teoriei limitelor centrale, puterea acestei tendințe este pronunțată atunci când eșantionul este mare. Dacă eșantionul este mic, este necesară verificarea normalității distribuției. O alternativă pot fi și testele nonparametrice, precum testul Mann-Whitney.
Modelul eșantionării randomizate vs modelul asignării randomizate
Scopul statisticii inferențiale este de a ajunge la o concluzie despre un parametru al populației. Una dintre asumpțiile de bază care ne permit să facem asta este eșantionarea randomizată.
Însă majoritatea cercetătorilor lucrează cu eșantioane de conveniență, precum cele formate din studenți. În acest caz, se utilizează asignarea randomizată. Această metodă permite împărțirea grupului de participanți în două sau mai multe subgrupuri. Asignarea randomizată diferă de eșantionarea randomizată prin lipsa unei populații bine definite din care are loc extragerea participanților.
În acest caz, apare o problemă, deoarece procedurile pentru inferență diferă între cele două metode. Însă pentru majoritatea situațiilor în care sunt formate grupuri prin asignarea randomizată, aplicația modelului eșantionării randomizate rezultă în concluzii statistice identice. Dar în cazul metodei de asignare rezultatele nu pot fi generalizate dincolo de participanți.
Eșantionarea randomizată și asignarea randomizată ca și control experimental
Beneficiul experimental primar al eșantionării randomizate este șansa scăzută de a implica influențe externe, precum motivația, în grupurile comparate. Cei care au o probabilitate mare de a se descurca bine au aceeași șansă de a fi implicați ca și cei care au o probabilitate mică de a se descurca bine. Astfel, apare un nivel înalt de control al factorilor externi.
Acest aspect nu este asigurat de asignarea randomizată. Dar cu cât este mai mare mărimea eșantionului, cu atât crește egalitatea dintre eșantioane. Se recomandă și asigurarea unor condiții identice pentru cele două grupuri, astfel încât singura diferență să fie variabila manipulată.
Experimentul vs studiul in situ
Două caracteristici primare ale experimentului sunt manipularea unei variabile, numită variabilă independentă, și controlul factorilor externi. Unele variabile independente nu pot fi manipulate, precum leziunile cerebrale, genul sau vârsta. Pentru a studia aceste aspecte, este necesară identificarea unor subpopulații care le dețin. Studiile în care manipularea lipsește nu se numesc experimente, ci studii in situ.
În studiile in situ, nivelul de control este mai scăzut decât în experimente, fiind mai dificil de interpretat rezultatele.
Radu este psiholog, doctor în psihologie, consultant organizațional, antreprenor și editorul fondator al Psihoteca.