MODULUL IV
INFERENŢA STATISTICĂ
STRUCTURA MODULULUI 4.1. Proprietăţile distribuţiei normale 4.2. Probleme de estimare 4.2.1. Semnificaţia unei medii 4.2.2. Semnificaţia frecvenţei 4.3. Sarcini sau probleme de comparaţie 4.3.1. Semnificaţia diferenţei între două medii în cazul eşantioanelor independente 4.3.2. Semnificaţia diferenţei între două medii în cazul eşantioanelor perechi 4.4.Sumar Bibliografie Anexa.1.1 (distribuţia t) Exerciţii Întrebări cu răspunsuri multiple
OBIECTIVELE MODULULUI După parcurgerea acestui modul studentul va cunoaşte: • proprietăţile distribuţiei normale • interpretarea semnificaţiei mediilor şi frecvenţelor • raţionamentul ipotezei nule • modalităţi de testare a ipotezei nule în cazul eşantioanelor independente • modalităţi de testare a ipotezei nule în cazul eşantioanelor perechi
1
4.1. PROPRIETĂŢILE DISTRIBUŢIEI NORMALE După cum s-a arătat, datele obţinute în cursul unei experienţe, a unei observaţii sistematice sau anchete, constituie un eşantion pe care îl considerăm extras dintr-o “colectivitate” mai largă sau populaţie. În final, extrapolăm de la eşantion la populaţie, extindem concluziile asupra întregii colectivităţi vizate prin cercetare. Să luăm câteva exemple: 1o. Ne propunem să determinăm, pe baza unor metode precizate, volumul vocabularului la copiii de 5 ani. Prin enunţul ei, sarcina sau problema stabileşte populaţia pe care o avem în vedere: copiii de 5 ani. Ancheta noastră nu poate cuprinde în mod practic decât o subcolectivitate limitată, un eşantion de populaţie, în care un număr de N copii sunt aleşi la întâmplare. Înregistrările făcute pe acest lot stabilesc un volum al vocabularului să zicem de 2024 de cuvinte. Un alt cercetător, propunându-şi aceeaşi problemă, ajunge la o cifră uşor diferită, să zicem 1936 de cuvinte. Repetând procedura, un al treilea cercetător găseşte 2000 de cuvinte. 2o. Cerinţe de ordin practic ne impun determinarea procentului tulburărilor de vorbire în clasele I-II, pentru a aproxima schema de organizare a reţelei logopedice. Determinările efectuate pe câteva eşantioane ne evidenţiază un procent de circa 12-13 %. Se ridică întrebarea dacă această frecvenţă caracterizează populaţia şcolară din clasele menţionate. 3o. Pentru organizarea reţelei de învăţământ special se ridică problema estimării proporţiei de deficienţi mintali pentru palierul de vârstă 6-7 ani. Determinările arată un procent de circa 2%, dacă se consideră ca prag psihometric al debilităţii mintale IQ = 70. Dacă se fixează un prag mai sever, evident procentul va fi mai mare. Aceste diferenţe de la un eşantion la altul se datoresc hazardului şi se numesc fluctuaţii de eşantionare. Situaţia este identică şi în alte condiţii. Compoziţia eşantioanelor prezintă variaţii, diferenţe întâmplătoare în diferite studii pe aceeaşi populaţie. Dacă vom lua de pildă, şase clase paralele de elevi dintr-o şcoală şi le vom supune aceleiaşi probe vom constata diferenţe sau fluctuaţii în rezultatele obţinute de la o clasă la alta. Este vorba despre fluctuţii de eşantionaj datorate factorilor aleatori. Un grup natural intact, luat în compoziţia sa dată, constituie un eşantion la întâmplare, dacă nu au intervenit factori de selecţie controlaţi de noi. Prelucrarea statistică, aşa cum am văzut, reduce datele brute la câteva valori caracteristice: frecvenţe sau procente, medii, abateri standard etc. Se pune întrebarea: în ce măsură datele obţinute sunt relevante pentru populaţie. Această operaţie se numeşte inferenţă statistică. Datele obţinute asupra eşantionului se apropie de indicii adevăraţi ai populaţiei, această apropiere sau aproximaţie fiind cu atât mai mare cu cât volumul eşantionului N este mai mare.
2
Practic, nu reuşim să determinăm exact indicii caracteristici ai populaţiei. Indicii eşantionului constituie estimări ale parametrilor populaţiei. În exemplul ales mai sus, volumul mediu m – stabilit pe baza studierii grupului de copii – reprezintă o estimare a mediei adevărate a colectivităţii generale. Întrucât nu se pot cerceta toţi copiii de 5 ani ne bazăm în afirmaţiile noastre pe datele asupra eşantionului cercetat. Luând ca bază indicii eşantionului, extrapolându-i deci la populaţie, comitem o anumită eroare, a cărei valoare probabilă trebuie să fie, evident, cât mai mică. În felul acesta, în legătură cu indicii stabiliţi asupra eşantionului – medii sau frecvenţe – se pune problema erorii probabile pe care o comitem bazându-ne pe ei în extrapolarea la populaţie. Raţionamentul se întemeiază pe proprietăţile distribuţiei normale, schiţate deja în capitolul precedent în legătură cu semnificaţia abaterii standard. În psihologie, ca şi în alte domenii, modelul distribuţiei normale este un model privilegiat, pentru că îl regăsim în numeroase situaţii. S-a stabilit că ±2σ, mai exact ±1,96σ, în raport cu media acoperă 95% din rezultate (elemente). Cu alte cuvinte, 95% din elemente cad în intervalul m ± 1,96σ, iar 5% cad în afara acestui interval. Procentul de 5% se compune din 2,5%, respectiv 2,5% de o parte şi de alta a mediei spre extremităţile distribuţiei.De asemena, s-a stabilit că 99% din rezultate (elemente) sunt cuprinse în intervalul m ± 2,58σ , în timp ce 1% (0,5% + 0,5%) din elemente sunt exterioare acestui interval. (Fig. 4.1.).
Figura 4.1. Proprietăţile distribuţiei normale Pentru a evita o anumită variabilitate a situaţiilor se introduce o distribuţie – standard. Variabila brută x se înlocuieşte cu variabila normată z pe baza formulei de transformare deja amintite: x−m z= , σ prin care se împarte fiecare abatere de la medie (x – m) cu abaterea standard σ. Graţie transformării amintite, orice distribuţie normală, are media egală cu zero şi varianţa egală cu 1. Pentru această ultimă distribuţie s-a întocmit un tabel, care permite să avem proporţia de elemente pentru care variabila este exterioară unui interval oarecare centrat pe medie. Este vorba de tabelul legii normale reduse , care ne permite să vorbim în cele din urmă în limbajul şanselor, al probabilităţilor. Variabila redusă | z | prezintă de regulă valori între 0 şi 3,00 (cu două zecimale). Figura 4.2 redă un exemplu pentru | z | = 1,00.
3
Variabila iniţială x este înlocuită cu variabila standardizată z, având m = 0. Din punctele z, respectiv - z, ridicăm ordonatele corespunzătoare, care indică punctele de inflexiune ale curbei şi haşurăm spre cele două extremităţi suprafaţa exterioară benzii cuprinse între cele două ordonate (Fig. 4.2).
Fig. 4.2. Pentru | z | = 1,00 corespunde o valoare de 0,317, ceea ce înseamnă că pentru un element extras la întâmplare din mulţime există 317 şanse dintr-o mie ca acesta să cadă în una din suprafeţele haşurate – într-o parte sau alta- deci să-i corespundă o valoare | z | >1,00. Reţinem în continuare două repere: pentru | z | =1,96 corespunde 0,05 , iar pentru | z | = 2,58 , valoarea 0,01. Cu alte cuvinte, există 5 şanse din 100 ca unui element considerat la întâmplare din mulţime să-i corespundă o valoare | z | > 1,96, după cum există o şansă din 100 ca | z | să fie mai mare decât 2,58. De aceste două repere, frecvent utilizate, se leagă deci şanse sau probabilităţi precizate: 5%, respectiv 1%. Rezumând: într-o distribuţie normală standard avem 95% din valorile z cuprinse între –1,96 şi + 1,96; de asemenea avem 99% din valorile z cuprinse între –2,58 şi +2,58. De aici se poate face pasul spre o distribuţie normală oarecare având media m şi abaterea standard σ. Întrucât variabila standardizată z s-a obţinut – plecând de la variabila iniţială x – graţie formulei: x−m z= , σ reiese că: a spune că z este cuprins între –1,96 şi +1,96 înseamnă a spune că -1,96 < (x-m)/σ < 1,96 sau (m – 1,96σ) < x < (m + 1,96σ), ceea ce s-a enunţat la început. Cu alte cuvinte, există 95% din valorile x interioare intervalului : [m – 1,96σ; m +1,96σ], după cum există 99% din valorile x interioare intervalului: [m – 2,58σ; m + 2,58σ]. Afirmaţiile făcute anterior au devenit astfel propoziţii motivate.
4
4.2. PROBLEME DE ESTIMARE
Aşa cum s-a arătat, marcăm indicii eşantionului cu o bară aşazată deasupra m , f , σ , iar parametrii populaţiei îi notăm în mod obişnuit: m, f, σ. Pornind de la indicii eşantionului stabilim cu o anumită probabilitate valoarea parametrilor. În mod obişnuit nu putem determina exact valoarea parametrului, ci stabilim un interval în care se găseşte cu certitudine practică parametrul respectiv. Cu cât acest interval este mai mic, cu atât informaţia noastră asupra adevăratei valori în populaţie este mai precisă . Se cere deci o concentrare a masei de probabilitate într-o regiune restrânsă. Intervalul menţionat se numeşte interval de încredere. 4.2.1. Semnificaţia unei medii Semnificaţia unei medii depinde pe de o parte de volumul eşantionului studiat (N), iar pe de altă parte, de variabilitatea populaţiei (σ) din care s-a extras grupul dat. Cu cât volumul datelor creşte, cu atât media devine mai stabilă şi deci mai reprezentativă. S-a numit eroarea standard a mediei cantitatea σ/ N care se notează cu E. Aceasta ne oferă un etalon pentru a evalua eroarea ce o comitem luând drept bază media eşantionului m în locul mediei adevărate m a colectivităţii generale (pe care practic nu reuşim de cele mai multe ori să o determinăm). În relaţia de mai sus σ reprezintă abaterea standard a colectivităţii generale, care rămâne aproape întotdeauna necunoscută, fiind înlocuită în calcule cu σ determinată pe baza datelor eşantionului (când N este destul de mare). Reluând tabelul din tabelul 3.4, avem: N=51; m = 13,17 ; σ = 4,74 ; Făcând înlocuirile: 4,74 = 0,66 . 51 În mod curent nu ne putem aştepta să determinăm valori punctuale pentru parametrii populaţiei. În acest sens se stabilesc intervale. Pe baza erorii standard a mediei E se stabilesc limitele între care se găseşte, cu o probabilitate dată adevărata valoare m a colectivităţii generale. Aceste limite se numesc limite de încredere, iar intervalul delimitat de ele este intervalul de încredere. Întrucât mediile prezintă distribuţie normală, se stabilesc drept limite de siguranţă : m -1,96E şi m +1,96E. În exemplul menţionat vom avea: L1 = 13,17 - (1,96 x 0,66) şi L2 = 13,17 + (1,96 x 0,66). Efectuând înmulţirile obţinem: 13,17 +/- 1,29, adică 11,88 şi 14,46. Acestea sunt limitele între care se găseşte aproape sigur (cu o probabilitate de 95%) adevărata medie m a colectivităţii generale.Afirmând că media adevărată se va găsi între 11,88 şi 14,46 riscăm totuşi să greşim în 5% din cazuri. E=
5
Se obişnuieşte să se noteze şi riscul pe care ni-l asumăm de a greşi făcând o aserţiume sau alta. Aceasta a căpătat denumirea de prag sau nivel de semnificaţie. Astfel, intervalul ( m -1,96E; m +1,96E) se numeşte interval de încredere la pragul de p = 0,05, ceea ce înseamnă că în 5% din cazuri adevărata medie se află în afara intervalului ales. În practică, se ia adeseori pragul p = 0,01, ceea ce indică riscul de a greşi în 1% din cazuri. Limitele de încredere vor fi atunci L1= m -2,58E şi L2= m +2,58E. 4.2.2. Semnificaţia frecvenţei Transpunând noţiunile prezentate anterior, putem spune că eroarea - tip a frecvenţei este: p×q E= N şi că limitele de încredere, la pragul de p = 0,05vor fi: p× q p× q. ) ( f− 1,96 ;f + 1,96 N N Practic, N fiind mai mare (>100), vom comite o eroare foarte mică înlocuind în calculul limitelor de încredere pe p prin f , şi pe q prin 1- f. După înlocuire vom avea: f × (1 − f ) f × (1 − f ) ( f − 1,96 , f + 1,96 ). N N Exemplu (după Faverge) Să considerăm un exemplu. Într-o statistică a erorilor de la casierie s-au observat 134 de erori în plus şi 289 de erori în minus. Frecvenţa f a erorilor în plus este: 134 f = = 0,32 (423 = 134 + 289). 423 Vom avea: f (1 − f ) 0,32(1 − 0,32) = = 0,020 . N 423 La pragul de semnificaţie de p = 0,05, limitele de încredere se obţin calculând: 1,96 x 0,020 = 0,04. E=
Ele sunt: 0,32 + 0,04 = 0,36, 0,32 - 0,04 = 0,28. Cu alte cuvinte, admiţând că eşantionul nostru face parte din cele 95% pentru care parametrii se situează în intervalul de încredere, putem afirma că procentajul erorilor în plus va fi cuprins între 36% şi 28%.
6
4.3. SARCINI SAU PROBLEME DE COMPARAŢIE În chip frecvent intervin în cercetările psihologice probleme de comparaţie. Astfel, se compară între ele mediile obţinute într-o experienţă şi se pune întrebarea dacă diferenţele constatate sunt semnificative sau nu, se pot extinde la populaţie sau nu. Exemplu (după I. Radu): Într-o experianţă de instruire programată au fost cuprinse două clase paralele. La probele de control date în post- test s-a constatat la clasa experimentală - cu un efectiv de 33 elevi - o medie a notelor de 7,7, iar în clasa de control (N = 34), media la aceleaşi teste a fost de 6,7. Diferenţa dintre medii este 1,00. Se pune întrebarea dacă această diferenţă este semnificativă, dacă putem extrapola la populaţie, ceea ce ne indică dacă metoda de instruire încercată este mai bună decât cele curente. Rezultatele unei investigaţii pot să apară exprimate şi sub formă de frecvenţe sau proporţii. În exemplul citat mai sus rezultatele experimentului ar putea fi exprimate şi în frecvenţe, indicând proporţiile consemnate de răspunsuri corecte şi de răspunsuri greşite. Şi în cazul acesta se pune întrebarea dacă diferenţele constatate sunt semnificative sau nu. Răspunsul la întrebarea pusă s-ar putea obţine repetând experienţa. Dacă rezultatele se menţin statornice vom putea conchide asupra semnificaţiei lor. Cum experienţele nu se pot repeta indefinit - procedeu de altfel neeconomic - s-a conturat un mecanism logic prin care se infirmă ipoteza hazardului, notată H0. În condiţiile experienţei obişnuite ne-am putea mulţumi cu diferenţe între medii de 0,5 sau 0,7 ori 0,9 ş.a.m.d., după cum diferenţe de 5%, 7% etc între frecvenţe ar părea doveditoare. Experimentul ştiinţific nu poate face extrapolări la populaţie bazate doar pe simpla evaluare intuitivă. Întrebarea este: de la ce nivel (0,5 sau 0,7, respectiv 5%; 7%;...) diferenţele pot fi considerate semnificative? În orice experienţă studiem procesul dat în anumite condiţii, într-un anumit context: la lecţie, la joc, în activităţile practice, în condiţii de laborator etc. Trebuie să admitem că, într-un fel sau altul, întâmplarea poate interveni în desfăşurarea fenomenului cercetat prin condiţii neaşteptate, prin compoziţia grupului, prin deosebiri în personalitatea profesorului etc. Datele obţinute sunt afectate în felul acesta de un element aleator (întâmplător). În consecinţă, alături de ipoteza specifică (Hs), ce stă la baza experienţei respective şi care este o ipoteză psihologică sau pedagogică se poate formula şi o altă ipoteză care să atribuie numai întâmplării tendinţele sau diferenţele constatate. Aceasta din urmă este "ipoteza întâplării"sau ipoteza nulă (H0) şi se enunţă pentru toate cazurile în aceiaşi termeni. De notat că atât ipoteza nulă (H0) cât şi ipoteza alternativă (Hs) se referă la populaţie, nu la eşantioane ca atare. Preocupat să dovedească în mod temeinic justeţea ipotezei specifice, cercetătorul va admite în mod provizoriu –în raţionamentul său – ipoteza nulă şi va determina şansele (probabilitatea) ca diferenţele obţinute în experiment să aibă loc numai pe baza " legilor întâmplării" (care sunt legi de probabilitate bine studiate). Ştim că probabilitatea ia valori între 0 şi 1, iar transcrisă în procente – între 0 şi 100%. Dacă probabilitatea obţinerii diferenţei date, în baza ipotezei nule, este foarte mică (de pildă, mai mică decât 0,05 ceea ce se scrie p < 0,05), atunci respingem ipoteza
7
hazardului şi arătăm toată încrederea ipotezei specifice. Dacă însă, probabilitatea determinată în lumina ipotezei nule este mai mare (de pildă, p > 0,10 putând merge până la 1), atunci nu ne putem asuma riscul respingerii ipotezei nule şi vom considera diferenţele efectiv obţinute ca fiind încă nesemnificative. Prin urmare se acceptă ca semnificative acele rezultate care au şansele de a se produce prin simpla întâmplare numai într-un număr mic de cazuri: sub 5% din cazuri, uneori sub 10%. Şansele de a obţine rezultatele respective prin simplul joc al factorilor aleatori se află în acest caz sub 10%, respectiv 5% ( ceea ce se scrie p < 0,10 respectiv p < 0,05). Înseamnă că, acceptând rezultatele unei experienţe drept proba justeţei ipotezei specifice, ne asumăm totodată riscul de a greşi în mai puţin de 10%, respectiv 5% din cazuri. Fiecărei aserţiuni i se asociază astfel un prag de semnificaţie, care indică riscul de a greşi pe care ni-l asumăm. Rezumând: mecanismul logic al ipotezei nule permite infimarea ipotezei hazardului şi acceptarea în consecinţă a ipotezei alternative (H s). Ipoteza nulă şi ipoteza alternativă sunt contradictorii; a respinge ipoteza nulă înseamnă a accepta ipoteza specifică. Dacă plasăm pe o axă probabilităţile amintite vom avea situaţia din figura 4.3.
1 0,05 0,01 p |-------------------- . . . -----------------|------------------|------------------> H0 nu se consideră infirmată | H0 se consideră infirmată şi se suspendă decizia | şi se acceptă Hs limita semnificativităţii Fig. 4.3 Respingând ipoteza nulă şi accepând existenţa unui efect al variabilei independente – ceea ce susţine Hs - ne asumăm un risc de a greşi destul de mic: 5% respectiv 1%. Măsurarea acestui risc, notată cu α, constituie pragul de semnificaţie, care însoţeşte fiecare aserţiune. Se poate întâpla ca ipoteza nulă să nu fie infirmată, z cal fiind mai mic decât 1,96 (deci p > 0,05). În cazul acesta nu se conchide că H0 ar fi validată, ci, pur şi simplu, că nu se poate decide; intervine o zonă de suspendare a judecăţii. Valoarea | z | care separă cele două zone - zona de respingere a ipotezei nule şi zona de suspendare a judecăţii - se numeşte valoare critică. Ea corespunde valorii z cal având o probanbilitate asociată egală cu α. Riscul de a greşi α se poate lua 10%, 5%, 1%. Tradiţia a acreditat pragul de p≤ 0,05 sau p≤ 0, 01. În funcţie de cerinţele cercetării se alege pragul indicat. De notat că ipoteza nulă nu poate fi niciodată acceptată; a nu se respinge H0 nu echivalează cu acceptarea ei. În schimb, ipoteza specifică nu poate fi niciodată respinsă. Fiind o ipoteză statistică imprecisă nu se poate calcula distribuţia de eşantionaj sub ipoteza alternativă (Abdi, 1987). Valorile cririce ale criteriului z, t, ş.a. au fost calculate pentru diferite praguri α fiind prezentate sub formă de tabele ce urmează doar a fi consultate. Regula de decizie este precizată: - dacă criteriul z, calculat pe eşantionul experimental este mai mare sau egal cu valoarea critică (z critic), probabilitatea sa asociată este mai mică sau egală cu pragul α
8
(se decide respingerea H0); - dacă criteriul z cal, calculat pe eşantionul experimental, este mai mic decât valoarea critică (z critic), probabilitatea asociată este mai mare decât pragul α. În consecinţă intervine suspendarea judecăţii: nu se va respinge nici accepta H0. În sens strict, se va decide de a nu se decide ...(Abdi, 1987). În probleme de comparaţie statistică urmează să se facă disticţia între eşantioane independente şi eşantioane perechi. O clasă de elevi, spre exemplu, poate fi considerată practic ca un eşantion la întâmplare extras dintr-o colectivitate mai largă. Dacă se consideră o altă clasă, paralelă, în vederea unei experienţe determinate, atunci alegerea poate fi făcută în două feluri. Se pot alege în mod independent cele două eşantioane: faptul că un element sau altul din primul eşantion a fost ales nu are nici o influenţă asupra alegerii elementelor din eşantionul al doilea. Compoziţia celor două grupe nu este reglementată pe baza unei probe prealabile; cele două clase sunt considerate în compoziţia lor stabilită prin " legile întâmplării". În acest caz este vorba despre eşantioane independente. Se poate proceda şi altfel. Se pot constitui eşantioane perechi. În cazul acesta, fiecare element dintr-un eşantion corespunde unui element dintr-un alt eşantion (formează o pereche cu el). De exemplu, pentru a compara două metode de instruire se constituie două grupe cu acelaşi număr de elevi, astfel ca fiecărui elev dintr-o grupă să-i corespundă un elev din cealaltă grupă, având acelaşi nivel de cunoştinţe, eventual acelaşi C.I. În felul acesta, compoziţia grupelor este precizată pe baza unei probe anterioare, în virtutea căreia elementele celor două eşantioane nu se determină la întâmplare. Fiecare individ dintr-o grupă are "corespondent” în grupa a doua, având aceeaşi notă (sau acelaşi nivel) în proba preliminară. Situaţia este identică şi în cazul când acelaşi grup de subiecţi este supus de două ori la probe diferite (de exemplu, înainte şi după acţiunea unui anumit factor experimental). Se obţin atunci două grupe de măsurări efectuate pe aceiaşi subiecţi, care constituie perechi. Prin urmare putem alege grupele de studiu în mod independent şi atunci este vorba de o alegere la întâmplare a elementelor; sau putem asocia într-un anumit fel - pe baza unui criteriu precis - elementele celor două eşantioane, două câte două, şi atunci compoziţia lor este determinată de regulă în virtutea unei probe prealabile: test de inteligenţă, test de cunoştinţe etc.
4.3.1. Semnificaţia diferenţei între două medii în cazul eşantioanelor independente Probele de semnificaţie diferă în funcţie de două situaţii: ●când numărul de măsurători (N) în fiecare eşantion este destul de mare (mai mare ca 30); ●când numărul de măsurări sau volumul eşantionului este mai mic dacât 30. În experimentele cu caracter instructiv de la care am pornit N1= 33 şi N2 = 34, deci ne aflăm în prima situaţie. Pentru a vedea dacă cele două medii constatate diferă semnificativ, facem raţionamentul care urmează.
9
Admitem pentru moment ipoteza nulă şi stabilim care este şansa de a fi verificată. Cu alte cuvinte presupunem că diferenţa între cele două medii m1 şi m 2 se datoreşte întâmplării şi că nu există diferenţe reale între eşantioanele considerate. În limbaj statistic înseamnă că cele două grupe constituie eşantioane extrase la întâmplare din aceeaşi populaţie. Pentru a testa ipoteza nulă se utilizează criteriul sau raportul: m1 − m 2 z= 2 2 σ1 σ 2 , + N1 N 2 în care notaţiile sunt deja cunoscute. Calculând valoarea raportului de mai sus, notat cu | z |, ne vom referi la proprietăţile curbei normale schiţând valorile calculate (z cal) în raport cu valorile critice (1,96 şi 2,58). Dacă valoarea ce va corespunde indicelui z cal este mai mare decât 1,96, atunci diferenţa între cele două medii este semnificativă la pragul de p < 0,05, iar dacă z cal > 2,58, atunci diferenţa este semnificativă la pragul de p < 0,01. Bineînţeles, dacă vom avea z cal < 1,96, atunci ipoteza nulă nu va fi infirmată, iar diferenţa obţinută în cadrul experienţei nu va fi considerată concludentă pentru a proba justeţea ipotezei specifice (vom suspenda decizia). 2 În exemplul considerat trebuie să cunoaştem cu privire la fiecare grup m , N şi σ .
σ 2
m1 = 7,7; N 1 = 33; 1 = 3,15; 2
m 2 = 6,7; N 2 = 34;σ 2 = 3,5; Utilizând formula stabilită obţinem: 7,7 − 6,7 = 2,33 3,15 3,5 . + 33 34 Raportul găsit este mai are decât 1,96 şi mai mic decât 2,58, deci p < 0,05. Făcând un calcul de interpolare se află p = 0,02; deci diferenţa este net semnificativă, ipoteza nulă fiind infirmată. Când volumul datelor obţinute în fiecare eşantion este mai mic (numărul de măsurări este mai mic decât 30) se utilizează un procedeu întrucâtva diferit. Ipoteza nulă se enunţă la fel: presupunem că cele două grupe de date sunt două eşantioane întâmplătoare ce provin din aceeşi colectivitate generală. Verificăm apoi şansa acestei ipoteze pe baza criteriului t: m1 − m 2 t = 1 1 . s2 ( + ) N1 N 2 Pentru a obţine o estimare a dispersiei colectivităţii - care este notată în formulă cu s2 - se combină datele celor două eşantioane:
10
2
s =
∑(x − m ) + ∑(x − m 1
2
2
)2
N1 + N 2 − 2 Formulele de la numărător ne sunt cunoscute de la calcularea dispersiei (sumei de pătrate referitoare la cele două grupe), iar N1 şi N2 sunt efectivele celor două eşantioane. Există un tabel special (întocmit de Student) în care figurează probabilităţile raportului | t | corespunzător numărului "gradelor de libertate" care depinde de volumul eşantioanelor (vezi Anexa 1.1.). În cazul nostru numărul acesta - notat n - este: n = N1 + N2 - 2. Să luăm un exemplu. În procesul învăţării eşalonarea repetiţiilor este mai productivă decât concentrarea lor. Într-o experienţă se ia câte o grupă formată fiecare din câte 10 subiecţi şi se experimentează în cele două situaţii prevăzute: repetiţii eşalonate sau concentrate în timp. Încă din prima perioadă subiecţii manifestă o diferenţă. Vrem să ştim dacă ea este semnificativă (după P. Oleron). Datele consemnate de autor sunt: N1 = 10; m1 = 13,3; ∑ ( x − m1 ) 2 = 82,1;
∑ (x − m
N 2 = 10;
m 2 = 14,2;
2
s = t =
2
) 2 = 97,6;
82,1 + 97,6 = 9,98 18 14,2 − 13,3
1 1 9,98 + 10 10
= 0,63
| t | fiind calculat, ne referim la tabelul distribuţiei | t | întocmit de Student. Acest tabel prezintă o coloană n sau v, care corespunde gradelor de libertate. În tabelul de mai sus n = 10 +10 - 2 = 18. Căutăm în coloana n pe 18. După ce l-am fixat, mergem pe rândul respectiv şi căutăm valoarea lui | t | la pragul de 0,05 şi 0,01 (probabilitatea o citim în prima linie de sus a tabelului unde găsim de la dreapta spre stânga: 0,01; 0,02; 0,05; 0,10). În cazul nostru tabelul indică 2,10 pentru | t | la pragul de 0,05 respectiv 2,88 la oragul de 0,01. Valoarea calculată în exemplul ales este 0,63, deci este mult mai mică decât 2,10 căreia îi corespunde p = 0,05. Putem spune atunci că pentru | t | = 0,63 avem p > 0,05. şi astfel ipoteza nulă nu este infirmată. Considerăm diferenţa dintre medii ca nesemnificativă, mai exact suspendăm decizia. În general, dacă valoarea găsită prin calcul este mai mică decât valoarea | t | indicată în tabel la pragul p = 0,05, atunci considerăm că ipoteza nulă nu este infirmată, iar diferenţele obţinute în experienţă ca nesemnificative. Dacă valoarea calculată de noi este mai mare decât valoarea | t | la pragul 0,05, dar mai mică dacât valoarea lui | t | la pragul de 0,01, vom spune că diferenţa este semnificativă la pragul de 0.05. În sfârşit, dacă valoarea găsită de noi este mai mare decât valoarea | t | indicată în tabel pentru p = 0,01, atunci vom spune că diferenţa este semnificativă la pragul de 0,01. Observăm că respingerea ipotezei nule se face considerând un prag de 11
semnificaţie ales în prealabil (cel mai riguros este p = 0,01). De reţinut este faptul că ipoteza nulă nu se consideră niciodată demonstrată; ea poate fi doar infirmată. Efectul admiterii sau respingerii ipotezei nule se răsfrânge asupra ipotezei specifice. Neinfirmarea ipotezei nule pune sub semnul întrebării ipoteza specifică, infirmarea ipotezei nule consolidează foarte mult ipoteza specifică. Cele două ipoteze H 0 şi Hs sunt, cum s-a spus, contradictorii. 4.3.2. Semnificaţia diferenţei între două medii în cazul eşantioanelor perechi Când elementele celor două eşantioane sunt asociate într-un anumit mod două câte două (de exemplu, rezultatele înregistrate înainte şi după acţiunea unui factor experimental), procedeul cel mai simplu constă în a raţiona asupra diferenţelor pe care le prezintă fiecare pereche de date asociate, corelate. Să notăm cu x rezultatele din primul grup de măsurări (eşantion) şi cu x' valorile asociate din eşantionul al doilea. Diferenţa corespunzătoare fiecărei perechi de note x - x' o însemnăm cu d. Se obţin astfel patru coloane. Exemplu: Cu o grupă de 10 elevi s-a încercat la geografie, în decursul trimestrului II al anului şcolar, o metodă nouă de învăţare individuală, pe baza unor întrebări de control fixate pe cartonaşe. S-au înregistrat notele elevilor la geografie la începutul experienţei, adică la sfârşitul trimestrului I şi apoi la încheierea trimestrului II. Vrem să ştim dacă metoda respectivă aduce o îmbunătăţire semnificativă a situaţiei şcolare. Pentru a determina acest lucru întocmim un tabel în care vom înscrie subiecţii, rezultatele obţinute în cele două situaţii şi vom calcula diferenţele dintre ele (Tab.4.1.). Se observă din tabel că avem diferenţe nule, pozitive şi negative. Formulăm ipoteza nulă, adică atribuim numai întâmplării diferenţele constatate, Dacă s-ar datora numai întâmplării, aceste diferenţe ar fluctua în jurul lui 0 într-un sens sau altul, iar media lor ar fi egală cu zero md= 0 (cu md am notat media diferenţelor). Tabelul 4.1 Subiecţi A B C D E F G H I K N=10
Note trim. II x`
Note trim. I x
8 7 5 6 5 6 6 5 4 7
6 5 5 4 6 4 5 4 6 5
12
d
d2
+2 +2 0 +2 -1 +2 +1 +1 -2 +2 Σd = +9
4 4 0 4 1 4 1 1 4 4 Σd2 = 27
Vom însuma algebric coloana d (ţinând deci seama de semne) şi vom afla ∑d = T. Apoi, făcând raportul T/N, vom afla media diferenţelor md. În exemplul ales, md = T/N = 0,09, deci md diferă de zero; nu ştim dacă diferenţa aceasta este suficient de mare pentru a putea fi considerată semnificativă sau nu. Se utilizează criteriul: md t = σd N în care cunoaştem m d şi N, dar nu cunoaştem σ d (abaterea standard a diferenţelor). Tratăm diferenţele aşa cum am considerat înainte datele brute. Calculăm mai întâi dispersia diferenţelor: T2 2 d − ∑ 2 N σd = N −1 şi 2
σd = σd În exemplul ales adăugăm în tabel o coloană d2, pe care însumând-o obţinem 2 Σd =27. Făcând înlocuirile: 2
σd =
27 − 81 / 10 = 2,1 9
de unde
σ d = 2,1 = 1,4 Deci 0,9 = 2,0 1,4 10 Căutăm în Anexa 1.1. | t | ţinând seama de faptul că în acest caz numărul gradelor de libertate este N - 1 (şi nu N1+N2- 2, ca în primul caz). În exemplul de mai sus, N - 1 = 9. Căutând în tabel găsim pentu 9 grade de libertae,la pragul de p = 0,05 cifra 2,26. Valoarea calculată de noi este inferioară acestei cifre. Înseamnă că nu s-a demnostrat falsitatea ipotezei nule şi, în felul acesta nu se poate spune că rezultatele experienţei sunt semnificative. Când N este destul de mare (>60) putem raporta valoarea găsită prin calcul la valorile z (1,96 şi 2,58) fără să mai facem apel la Tabelul lui Student. Trebuie reamintit în încheiere că atât raportul | z | cât şi criteriul | t | presupun drept condiţie aspectul normal al distribuţiilor supuse comparaţiei. t =
13
4.4. Sumar În cercetarea psihologică modelul consacrat este cel al investigării la nivelul eşantioanelor urmat de extrapolarea la nivelul populaţiei, proces denumit inferenţă. În cadrul inferenţei statistice se disting două tipuri de probleme: probleme de estimare, respectiv probleme de comparaţie. Problemele de estimare, permit pe baza unui indice obţinut la nivelul eşantionului estimarea cu o anumită probabilitate a intervalului în care se află parametrul pentru populaţie. În problemele de comparaţie pe baza unor teste de semnificaţie adaptate situaţiei concrete se determină probabilitatea ipotezei nule (pragul de semnificaţie). În cazul eşantioanelor independente se folosesc două teste în funcţie de volumul eşantionului; pentru eşantioane cu efective mai mari de 30 de subiecţi se utilizează testul z, iar pentru eşantioane cu un volum sub 30 de subiecţi testul t. În cazul eşantioanelor perechi se foloseşte testul t.
Bibliografie Abdi H. (1987). Introduction ou traitemant statistique des données expérimentale, Grenoble: Presses Universitaire de Grenoble.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F. Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole Publishing Company, Pacific Grove. Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures naturelles, Paris, Bordas. Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New York, Appleton
14
ANEXA 1.1.
Distribuţia t P n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60
∞
0.10
0.05
0.02
0.01
6.34 2.92 2.35 2.13 2.02 1.94 1.90 1.86 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.75 1.74 1.73 1.73 1.72 1.72 1.72 1.71 1.71 1.71 1.71 1.70 1.70 1.70 1.70 1.69 1.68 1.68 1.68 1.67 1.64
12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.20 2.18 2.16 2.14 2.13 2.12 2.11 2.10 2.09 2.09 2.08 2.07 2.07 2.06 2.06 2.06 2.05 2.05 2.04 2.04 2.03 2.02 2.02 2.01 2.00 1.96
31.82 6.96 4.54 3.75 3.36 3.14 3.00 2.90 2.82 2.76 2.72 2.68 2.65 2.62 2.60 2.58 2.57 2.55 2.54 2.53 2.52 2.51 2.50 2.49 2.48 2.48 2.47 2.47 2.46 2.46 2.44 2.42 2.41 2.40 2.39 2.33
63.66 9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25 3.17 3.11 3.06 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.84 2.83 2.82 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.75 2.72 2.71 2.69 2.68 2.66 2.58
15
EXERCIŢII 1. Precizaţi şi explicaţi care este rolul inferenţei statistice în prelucrarea datelor unei cercetări de psihologie experimentală. 2. În ce condiţii întreaga colectivitate a universităţii în care învăţaţi poate fi considerată o populaţie? În ce condiţii colectivitatea universităţii poate fi considerată un eşantion? În cazul în care colectivitatea universităţii este folosită ca şi eşantion, cum este realizată selecţia ? Se poate vorbi de o selecţie randomizată? De ce? 3. Având următoarele ipoteze specifice, formulaţi pentru fiecare ipoteza nulă corespunzătoare. 1. Există o diferenţă între băieţi şi fete în ceea ce priveşte abilităţile de învăţare şi domeniile de studiu pentru care prezintă interes: băieţii preferând ştiinţele exacte, iar fetele ştiinţele sociale. 2. Persoanele cu un stil de învăţare vizual reţin mai multe informaţii din grafice decât persoanele cu un stil de învăţare verbal. 3. Un program regulat de exerciţii duce la îmbunătăţirea performanţelor şcolare. Ce rol are formularea şi testarea ipotezei nule în desfăşurarea unui experiment prin care se testează ipotezele specifice formulate?
ÎNTREBĂRI CU RĂSPUNSURI MULTIPLE 1. Pornind de la indicii unui eşantion se pot: a) calcula parametrii populaţiei b) estima parametrii populaţiei c) determina intervalul în care se găsesc parametrii populaţiei d) determina probabilitatea cu care parametrii populaţiei se încadrează într-un anumit interval e) determina valoarea parametrilor populaţiei R. b,c,d, 2. Pe baza unui test de semnificaţie statistică s-a determinat o probabilitate a ipotezei nule H 0 de 0,01. Ce probabilitate va avea ipoteza specifică HS în acest caz? a) 99% b) 95% c) 1% d) toate răspunsurile sunt corecte e) toate celelalte răspunsuri sunt greşite R. e.
3. Când probabilitatea ipotezei nule (H0 ) este mai mare de 5%:
16
a) b) c) d) e)
putem accepta ipoteza specifică putem accepta ipoteza nulă respingem ipoteza specifică respingem ipoteza nulă se suspendă decizia
R. e
17