Conspect al capitolului 11, ”The Matched t Test”, din ”Explaining Psychological Statistics”, de Barry Cohen.
Fundamente conceptuale
Designul pre-post
Cea mai simplă metodă de a calcula un test t pereche este cea a diferenței directe. În acest caz, ipoteza nulă afirmă că diferența înainte – după intervenție este zero. Pentru a respinge ipoteza nulă, testul t trebuie să arate că media diferențelor este suficient de mare pentru a trece pragul alfa. Formula pentru acest test t este formată din două raportate. Prima dată avem raportul dintre abaterea standard a diferenței scorurilor și radical din numărul de participanți. Media diferențelor este raportată la acest raport.
Testul t pentru eșantioane pereche ca funcție a corelației liniare
Măsura în care valoarea testului t pereche întrece valoarea testului t cu eșantioane independente depinde de corelați dintre cele două eșantioane (înainte – după). Motivul pentru care valoarea testului t pereche este mai mare decât valoarea cea a testului t cu eșantioane independente este faptul că valorile înainte – după corelează puternic.
Astfel, creșterea coeficientului de corelație scade variabilitatea scorurilor. Acest aspect de potrivește conceptului de corelație – dacă aceeași constantă este adăugată tuturor scorurilor din primul set, pentru a obține scorurile din al doilea se, corelația va fi perfectă, iar variabilitatea va fi zero.
Reducerea gradelor de libertate
Testele cu eșantioane pereche prezintă un dezavantaj față de cele cu eșantioane independente – numărul de grade de libertate este jumătate din cel al eșantioanelor independente. În cazul eșantioanelor independente, gradele de libertate reprezentau suma numărului de persoane din cele două grupuri, minus 2. În cazul testelor cu eșantioane perechi, gradele de libertate reprezintă numărul diferențelor minus 1. Deoarece t critic crește odată cu reducerea gradelor de libertate, t critic este mai mare pentru aceste teste.
Acest dezavantaj este contraatacat de corelația dintre scoruri, care crește t-ul calculat. Când eșantionul este foarte mare, diferența la nivelul t critic este mai mică.
Dezavantajele design-ului pre-post
Ceea ce îi lipsește acestui design este un grup de control. Este important să existe cel puțin un grup de control, deși pot fi incluse și două – unul placebo și unul doar măsurat de două ori. Un grup de control în cazul acestui design ar putea indica și efectele unei variabile externe.
Alte design-uri cu măsurători repetate
O altă variantă a design-ului este măsurarea aceluiași participant de două ori, în condiții experimentale diferite, în cadrul aceleiași sesiuni. Un design cu măsurători repetate simultan nu implică un grup de control. Dar apare o probabilitate mare de a exista variabile confundate. Un astfel de design este eficient în colectarea datelor, dar există multe situații în care acest design nu este posibil.
Design-ul cu eșantioane pereche
Uneori, cercetătorii doresc să compare două condiții, fără a fi posibilă testarea aceleiași persoane în ambele.
Dacă nu este posibil să se folosească aceeași persoană de două ori, atunci se caută două persoane pe cât posibil de asemănătoare. Apoi fiecare membru din pereche este asignat aleator uneia dintre cele două condiții. După ce se fac toate măsurătorile, se calculează diferențele pentru fiecare pereche. Similaritatea din fiecare pereche asigură corelația necesară.
Eșantioanele corelate sau dependente
Testul t perechi este numit și test pentru eșantioane corelate. O altă modalitate de a spune că cele două eșantioane sunt corelate este eșantioane dependente. Deoarece sunt comparate mediile a două eșantioane dependente, acest test poate fi numit și testul t pentru diferența dintre două medii dependente.
Când să nu folosim testele t pereche
Atunci când potrivirea participanților este eficientă, atunci valoarea scorului t va crește, fără a fi nevoie să crească numărul de participanți. Însă, în unele situații în care este posibil să fie folosite aceleași persoane, este imposibil să fie făcute grupuri pereche. În astfel de cazuri, este necesar să utilizăm teste t pentru eșantioane independente.
Proceduri statistice de bază
Pentru a înțelege acest tip de teste, vom parcurge un exemplu. Să spunem că vrem să comparăm două metode de a învăța copiii să citească.
În primul pas, are loc stabilirea ipotezelor. Ipoteza de cercetare spune că cele două metode diferă în efectul asupra achiziției de cunoștințe. Ipoteza nulă afirmă că cele două metode sunt egale. Ipoteza alternativă potrivită este una bidirecțională.
În al doilea pas, se alege testul statistic și nivelul de semnificație. Deoarece fiecare participant dintr-un grup este potrivit cu unul din celălalt grup, se alege testul t pentru eșantioane dependente. Nivelul de semnificație rămâne cel convențional, de .05.
În al treilea pas se selectează eșantionul și se colectează datele. Prima dată se selectează un eșantion mare în mod randomizat. Apoi participanții sunt potriviți în perechi pe baza similarității la nivelul variabilei relevante. Fiecare copil din fiecare pereche este asignat randomizat unui grup. Se înregistrează nivelul de citire după un an.
În al patrulea pas se identifică regiunea de respingere. Numărul de grade de libertate este numărul de perechi minus 1. Dacă avem 20 de participanți, avem 10 perechi, iar gradele de libertate sunt 9. Se caută în tabel t-ul critic. În cazul unor grade de libertate de 9, t critic este 2.262.
În al cincilea pas se calculează valoarea lui t. Prima dată se calculează media diferenței scorurilor, prin suma diferențelor raportate la numărul de perechi. Apoi se calculează abaterea standard nebiasată. Pentru aceasta avem nevoie de diferența dintre suma diferențelor la pătrat și suma diferențelor la pătrat, raportată la n. Abaterea standard este egală cu radical din produsul acestei diferențe și 1 raportat la gradele de libertate. După ce avem valoarea abateri standard, se poate calcula t.
Al șaselea pas implică decizia statistică. Dacă t calculat este mai mic decât t critic, atunci se poate respinge ipoteza nulă.
Folosind formula corelației
După ce este calculată corelația dintre eșantioane, se poate calcula scorul t utilizând corelația. În acest caz, formula pentru t conține la numărător diferența mediilor. Numitorul formulei este radical din două dintr-o diferență. Diferența este formată din raportul sumei abaterilor standard și n, pe de-o parte. Pe de altă parte, diferența este formată din raportul produsului dublului corelației și abaterilor standard la n.
Formula pentru testul t perechi cu scoruri brute
Formula pentru scoruri brute, deși pare mai ușor de aplicat, poate rezulta în mai multe erori de calcul neobservabile. În această formulă, numărătorul este format din suma diferențelor. Numitorul este radical dintr-un produs. O parte a acestui produs este 1/ grade de libertate. A doua parte a produsului este formată din diferența dintre produsul dintre n și suma pătratelor diferențelor și suma diferențelor, la pătrat.
Intervale de încredere
Deși sunt implicate două populații, lucrând cu diferența scorurilor permite identificarea unor intervale de încredere pentru o singură populație. Formulare pentru intervale de încredere este media diferențelor +/- produsul dintre t critic și abaterea standard.
Asumpții ale testului t pereche
Testele t pereche au două asumpții – normalitatea și eșantionarea independentă randomizată. Asumpția normalității nu este critică pentru eșantioane mari. Dacă eșantionul este mic și forma distribuției este departe de cea normală, se recomandă utilizarea testelor non-parametrice.
Design-uri care necesită teste t pereche
Procedura testelor t pereche poate fi folosită cu o varietate de design-uri cum măsurători repetate sau eșantioane pereche.
Designul cu măsurători repetate
Două design-uri cu măsurători repetate folosite sunt cele simultane și cele succesive. Design-urile succesive au două subtipuri – cele de tip înainte – după și cele cu contrabalansare. În cazul celui înainte – după este necesar un grup de control pentru a elimina explicațiile alternative.
În design-ul cu contrabalansare, se urmărește eliminarea efectului ordinii. Să luăm exemplul unui studiu în cercetătorul vrea să vadă diferența între rezolvarea unor probleme de aritmetică în timp ce participantul ascultă muzică veselă sau muzică tristă. Dacă participanții ar asculta mereu muzică veselă prima dată, este posibil ca performanțele mai mari în a doua secvență să se datoreze exersării. Din acest motiv, o parte din participanți vor asculta prima dată muzică veselă, iar o altă parte va asculta prima dată muzică tristă.
O altă problemă este efectul carryover. De exemplu, într-un studiu în care în prima condiție este indusă o emoție, iar în a doua este indusă o altă emoție, este posibil ca efectele primei emoții să se prelungească și în a doua condiție. Uneori aceste efecte nu pot eliminate prin contrabalansare, fiind nevoie de o perioadă mai mare de timp între cele două etape.
Designul cu eșantioane pereche
Design-ul cu eșantioane pereche cuprinde, de asemenea, două subtipuri – experimental și natural. În tipul experimental, cercetătorul creează perechi bazându-se pe pre-testarea aspectelor relevante pentru studiu. O altă metodă de a crea perechi experimental este crearea randomizată a unor perechi, dar prezentarea aceluiași stimul cu instrucțiuni diferite.
În design-ul cu perechi naturale, perechile apar natural – soț și soție, mamă – fiică sau tată – fiu. Deoarece aceste perechi nu sunt create experimental, este nevoie de precauție în interpretarea datelor.
Radu este psiholog, doctor în psihologie, consultant organizațional, antreprenor și editorul fondator al Psihoteca.