Testarea ipotezelor despre medii simple (z și t)

Conspect al capitolului 14, ”Testing hypotheses about single means (z and t)”, din ”Statistical reasoning in psychology and education”, de Minium, King și Bear

Când respingem și când acceptăm ipoteza

Ipoteza pe care cercetătorii o testează se numește ipoteza nulă, notată H0. Pentru fiecare ipoteză nulă există și o ipoteză alternativă, notată cu HA. Dacă rezultatele obținute sunt contrare ipotezei nule, atunci aceasta este respinsă. În cazul caz contrar, ipoteza nulă este acceptată.

Decizia de a respinge ipoteza nulă apare atunci când probabilitatea ca diferența observată să se datoreze șansei este foarte mică. De obicei, ipoteza nulă este respinsă dacă probabilitatea ca rezultatul să se datoreze șansei este .05 sau mai mică. Acest criteriu reprezintă nivelul de semnificație și este notat cu alfa.

Generalitatea proceduri de testare a ipotezelor

În procesul de testare a ipotezelor, o ipoteză nulă este formulată cu privire la un parametru al populației, alături de o ipoteză alternativă. Apoi este selectat un eșantion al populației pentru observații. Pe baza acestuia sunt obținute mai multe statistici, precum media. Apoi se calculează care ar fi rezultatele obținute dacă ipoteza nulă ar fi valabilă. În final, ipoteza nulă este păstrată dacă rezultatul coincide cu cele expectate dacă ipoteza nulă este valabilă.

Asumpțiile inferențelor despre o singură medie

Pentru ca inferențele statistice cu privire la o singură medie să fie valabile, este nevoie ca anumite condiții să fie îndeplinite. În primul rând, trebuie selectat un eșantion randomizat din populație. În al doilea rând, eșantionul trebuie să fie selectat prin eșantionare cu înlocuire. În al treilea rând, distribuția eșantionării trebuie să prezinte o distribuție normală. În final, abaterea standard a populației trebuie să fie cunoscută. De multe ori, această valoare este estimată pe baza valorilor eșantionului.

Estimarea erorii standard

Pentru a testa o ipoteză, este necesară calcularea erorii standard a mediei. Pentru a calcula eroarea standard, este nevoie să cunoaștem abaterea standard a populației. În practică, aceasta este estimată pe baza eșantionului.

În mod intuitiv, ne putem gândi să înlocuim abaterea standard a populației cu abaterea standard a eșantionului. Dar această abordare este problematică. Formula nebiasată a varianței populației este suma pătratelor diferențelor dintre scor și medie, raportate la n-1. Estimarea abaterii standard este radical din varianță.

Formula pentru estimarea erorii standard abaterea standard, raportată la radical din N.

Distribuția T

Dacă asumpțiile inferențelor sunt respectate, atunci distribuția Z este una normală, deoarece valorile mediei vor varia de la un eșantion la altul, dar media populației și eroarea standard a populației rămân constante. Astfel, z este egal cu diferența dintre o variabilă distribuită normal și o constantă, adică media populație, raportată la o altă constantă, adică eroarea standard. Deoarece constantele nu modifică distribuția scorurilor, dacă mediile sunt distribuite normal, atunci și Z va fi.

În ce privește formula T, aceasta este diferența dintre media eșantionului și media populației, raportată la abaterea standard. Dacă este calculat T-ul pentru toate eșantioanele, atunci obținem distribuția T. Aceasta nu are o distribuție normală, fiind numită distribuția T student.

Caracteristicile distribuției T Student

Atunci când mărimea eșantionului este mare, atunci t  va semăna cu z, iar distribuția se apropie de cea normală. Atunci când numărul de grade de libertate este mai mic decât infinit, distribuția t și distribuția z au anumite puncte în comun – ambele au media egală cu 0, sunt simetrice și sunt unimodale. La nivelul diferențelor, distribuția t este leptokurtică, are o abatere standard mai mare și depinde de gradele de libertate.

Pentru un număr infinit al gradelor de libertate, t critic coincide cu z critic. Cu cât mai mică este valoarea gradelor de libertate, cu atât crește t critic. T este foarte similar cu z atâta timp cât gradele de libertate sunt mai mari de 100. Pe măsură ce gradele de libertate scad, și distribuția t de schimbă, la început mai încet, apoi mai abrupt.

Gradele de libertate și distribuția t

Atunci când se calculează abaterea standard, gradele de libertate sunt n-1.

Utilizarea distribuției t

Într-o problemă, știm că scorul gradelor de libertate este 20 și alfa setat este .05. Se cere valorilor t care stabilesc limita respingerii ipotezei nule. Pentru a face asta, se identifică valoarea t sub care se află 2.5% din populație și valoarea t peste care se află 2.5% din populație, ținând cont de gradele de libertate. Valoarea indicată de tabel este +/- 2.086.

Folosind aceleași date, se cere identificarea valorii t pentru care probabilitatea este .05 sau mai mare. Consultând tabelul, se identifică rândul pentru gradele de libertate egale cu 20. Apoi se identifcă coloana pentru .05. T-ul identificat este 1.725.

Calcularea t cu scoruri brute

Formula utilizată pentru a calcula t cu scoruri brute este un raport. La numărător se află diferența dintre media eșantionului și media populației. La numitor se află radical din suma pătratelor, raportată la produsul dintre n și n-1.

Ipoteze alternative direcționale și nondirecționale

Să luăm exemplul unui profesor care vrea să studieze cantitatea de zahar consumată de studenți, știind că ceilalți consumă în medie 100 de g de zahăr. În acest caz, ipoteza nulă este H0 μ=100, iar ipoteza alternativă este HA μ≠100. Această ipoteză este una nondirecțională.

Uneori, poate fi folosită și o ipoteza direcțională. Să spunem că profesorul este interesat de măsura în care studenții consumă mai mult zahar. În acest caz, ipoteza alternativă este HA: μ>100. Această ipoteză este una direcțională. Dacă ipoteza este că studenții consumă mai puțin zahăr, HA: μ<100.

Decizia de a alege o ipoteză direcțională este determinată de raționamentul din spatele studiului și trebuie stabilită înainte de analiza datelor.

Citirea rapoartelor de cercetare

Atunci când în studii apare expresia „nu a fost semnificativ”, atunci ipoteza nulă nu a fost respinsă. Dacă nu este raportat nivelul alfa, atunci putem asuma că acesta a fost setat la .05. cuvântul „semnificativ” se referă la un rezultat cu o probabilitate mică de a se datora șansei.

În raportarea rezultatelor, este importantă să specificăm dacă testul a fost unidirecțional sau bidirecțional.

Metoda bootstrap

Metoda bootstrap generează noi eșantioane pe baza celui original și nu implică asumpții cu privire la distribuția scorurilor în populație. Să spunem că avem un eșantion selectat randomizat de 15 persoane. Fiecare dintre aceste scoruri este copiat de un computer de un număr mare de ori. Aceste copii sunt combinate, rezultând sute de eșantioane adiționale.

Dacă populația inițială prezintă o distribuție normală, metoda bootstrap și metodele convenționale sunt la fel de bune. Însă dacă populația inițială deviază de la distribuția normală, atunci metoda bootstrap este superioară.

Probleme în selectarea unui eșantion randomizat și formularea unor concluzii

O problemă importantă poate fi generalizarea. Rezultatele studiilor pot fi generalizate doar la eșantioanele asemănătoare cu cele din studiu.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.