Tendința centrală

Conspect al capitolului 5, ”Central tendency”, din ”Statistical reasoning in psychology and education”, de Minium, King și Bear.

Indicatorii tendinței centrale sunt un rezumat sub forma unui singur număr care descrie cel mai bine locația centrală a întregii distribuții de observații. Acești indicatori sunt utili atunci când dorim să comparăm scorurile a două sau mai multe grupuri pe o anumită dimensiune.

Cei mai frecvent folosiți indicatori ai tendinței centrale sunt: modul, mediana și media aritmetică.

Modul

În distribuțiile negrupate, modul este scorul care apare cu cea mai mare frecvență. În distribuțiile grupate este considerat a fi mijlocul intervalului care conține cele mai multe scoruri.

Simbolul folosit pentru mod este Mo.

Mediana

Mediana este valoarea care împarte distribuția în două jumătăți egale. Sub această valoare se află 50% dintre scorurile distribuției.

Simbolul folosit pentru mediană este Mdn. Pentru că jumătate dintre scoruri se află sub nivelul medianei, aceasta mai este numită și percentila 50 sau P50.

Pentru a afla mediana, scorurile trebuie ordonate ierarhic de la cel mai mic la cel mai mare. Dacă N (numărul total de scoruri din distribuție) este impar, atunci există un scor în distribuție care are un număr egal de scoruri înaintea lui și după el. Dacă N este par, atunci mediana este considerată jumătatea diferenței dintre cele două scoruri care se află în mijlocul distribuției.

Formula pentru calcularea medianei este:

Mdn = P50 = LL + (i){[(1/2n – cum f inferioare)] / f}

LL reprezintă limita inferioară reală a intervalului ce conține P50.

i este lățimea intervalului.

1/2n = jumătate din numărul de cazuri

Cum f inferioare = numărul de scoruri care se află sub LL

F = frecvența scorurilor din intervalul ce conține mediana.

Media aritmetică

Media aritmetică reprezintă suma tuturor scorurilor din distribuție, împărțită la numărul total de scoruri.

Vom folosi pentru a face referire la media unui eșantion. Scorurile individuale sunt reprezentate prin și numere subscrise (ex: X1, X2, Xn). Vă reamintim că n reprezintă numărul de scoruri din eșantion, iar N este numărul de unități din populație. Media populației va fi reprezentată prin litera grecească mu (μ) – se citește ”miu”.

Majuscula literei grecești sigma (Σ) reprezintă operația de însumare și se citește ”sumă de”. Minuscula sigma (σ) reprezintă abaterea standard, detaliată în capitolul despre variabilitate.

Proprietăți ale modului

Modul este ușor de obținut, dar nu este o valoare stabilă de la un eșantion la altul. În plus, este posibil să existe mai mult de un mod într-un set de scoruri. Într-o distribuție rectangulară, fiecare scor este în același timp și mod. Însă modul este singura măsură ce poate fi utilizată pentru a descrie tendința centrală când avem date obținute pe o scală nominală (date categoriale).  

Proprietăți ale mediei

Spre deosebire de alți indicatori ai tendinței centrale, media este responsivă la poziția exactă a fiecărui scor în distribuție. Modificarea oricărui scor modifică suma scorurilor și, implicit, media lor.

Media este punctul de echilibru al unei distribuții. Ceea ce înseamnă că suma tuturor deviațiilor negative de la medie (diferențelor negative dintre medie și scor) este egală cu suma tuturor deviațiilor pozitive de la medie (adică diferențele pozitive dintre medie și scor).

Media este mai sensibilă la prezența sau absența unor scoruri extreme – aflate la periferia distribuției.

Când este necesar un indicator care să reflecte suma scorurilor, media este cea mai bună alegere, fiind singurul indicator care este bazat pe această cantitate.

De asemenea, media este cea mai utilă atunci când avem nevoie să facem calcule statistice ulterioare. Ea poate fi utilizată în formule aritmetice și algebrice la care ceilalți indicatori ai tendinței centrale nu se pretează.

Cea mai importantă caracteristică a mediei este că variază cel mai puțin de la un eșantion la altul, fiind cea mai rezistentă la variația datorată modificării eșantioanelor. Această calitate ne ajută să extrapolăm cu privire la populație pe baza datelor obținute dintr-un singur eșantion.

Proprietăți ale medianei

Mediana este mai puțin sensibilă la prezența unor scoruri extreme. Ea nu este afectată dacă un scor este puțin sub mediană sau mult sub mediană. De aceea, mediana ar putea să fie indicatorul tendinței centrale mai adecvat când avem de a face cu distribuții puternic asimetrice sau care au foarte puține scoruri deviante.

Mediana este a doua după medie în ce privește măsura în care poate să reziste la influența fluctuațiilor de eșantionare în condiții normale.

Indicatori ai tendinței centrale în distribuții simetrice și asimetrice

În distribuții perfect simetrice, media, mediana și modul au exact aceeași valoare. Cu cât este mai asimetrică distribuția, cu atât este mai mare diferența dintre medie și mediană.

Într-o distribuție asimetrică negativ, modul are valoarea cea mai mare, urmat de mediană și medie. Mediana este cam la două treimi distanță dintre mod și medie. În schimb, într-o distribuție asimetrică pozitiv, se poate observa exact opusul: modul are valoarea cea mai mică, urmat de mediană și medie.

Astfel, putem să folosim poziția relativă a medianei și a mediei pentru a determina direcția asimetriei, dacă nu putem vedea reprezentarea grafică a distribuției.

Efectele transformării scorurilor

Transformarea scorurilor este procesul prin care fiecare scor din distribuție este modificat într-un alt scor, pe o altă scală.

Dacă aduni o valoare constantă la fiecare scor, toate scorurile vor crește cu acea valoare, iar media va crește și ea cu aceeași valoare. Analog, dacă scădem, înmulțim sau împărțim fiecare scor cu o constantă, media va fi afectată la fel. Toate aceste transformări sunt transformări liniare, pentru că se menține o relație proporțională între scorurile originale și transformări.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.