Curs 9 - Testul T Pentru 2 Eșantioane Dependente.pdf

  • Uploaded by: Marilena Claudia
  • 0
  • 0
  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Curs 9 - Testul T Pentru 2 Eșantioane Dependente.pdf as PDF for free.

More details

  • Words: 2,522
  • Pages: 8
Curs 9 – Testul t pentru eșantioane dependente (perechi) Lector univ. dr. Adrian Gorbănescu

De mic copil urmăresc cursele de Formula 1. În timpul sezonului, aștept cu nerăbdare weekendurile în care sunt programate curse, iar uneori îmi place să joc Formula 1 pe PC. Pasionat de acest sport, când eram elev în clasa a VI-a, am creat o competiție similară celei de Formula 1 cu materiile de la școală (la acea vreme nu existau jocuri de F1 pentru PC). Astfel, fiecare materie de la școală reprezenta un pilot, iar nota pe care o primeam la materia respectivă reprezenta numărul de puncte primit în cursă. De exemplu, Matematica era corespondentul lui Mika Hakkinen, Lb. Română era corespondentul lui David Coulhard, Istoria îl reprezenta pe Damon Hill ș.a.m.d. Chiar mi se părea că acest joc mă motivează să învăț mai bine, astfel încât să adun cât mai multe puncte. Oare chiar era adevărat? Testul t pentru eșantioane dependente m-ar fi ajutat să compar media notelor obținute înainte și după introducerea acestui joc. 9.1 Introducere În secțiunea anterioară am prezentat testul t pentru eșantioane independente care este utilizat atunci când dorim să comparăm mediile a două eșantioane formate din participanți diferiți. Însă, situațiile de cercetare, mai ales în domeniul psihologiei, ne pun de multe ori în situația de a compara mediile provenite de la un eșantion care este supus unui set de evaluări repetate. Un astfel de context este tipic testului t pentru eșantioane dependente. În concluzie, testul t pentru eșantioane dependente (perechi, corelate) este utilizat atunci când comparăm scoruri măsurate pe aceiași participanți. Literatura de specialitate (Popa, 2008; Salkind, 2015) precizează trei contexte care solicită aplicarea testului t pentru eșantioane dependente: 1. Măsurători repetate (înainte – după) – în această situație o caracteristică psihologică este evaluată pe același eșantion înainte și după aplicarea unui „tratament” (training, psihoterapie, medicație etc.). De exemplu, evaluarea depresiei înainte și după participarea la un program terapeutic. 2. Perechi naturale – acest context presupune ca cercetătorul să măsoare un aspect psihologic pe două eșantioane formate din participanți care au trăsături similare. De cele mai multe ori astfel de eșantioane perechi sunt formate în cadrul relațiilor de familie (soț – soție, gemeni, tată – fiu etc). Un exemplu de cercetare în care avem un astfel de design este cel în care dorim să comparăm diferența dintre satisfacția în cuplu a soților și a soțiilor.

3. Modelul intra-subiect (within-subjects) – implică realizarea unei comparații între două metode de investigare a aceleiași caracteristici folosind același eșantion. De exemplu, compararea tensiunii arteriale folosind un stetoscop și un instrument electronic. În fiecare din aceste contexte suntem interesați să analizăm în ce măsură apariția unui fenomen (variabila independentă) generează o modificare a trăsăturii investigate (variabila dependentă). În cadrul testului t pentru eșantioane dependente variabila independentă este măsurată pe scală nominal dihotomică (înainte-după, vară-iarnă, stânga-dreapta), iar variabila dependentă este măsurată pe scală de interval-raport. În cadrul testului t pentru eșantioane dependente accentul cade pe diferențele dintre cele două perechi de valori (X1 – X2). Rezultatele astfel obținute vor forma o distribuție a diferențelor care este simbolizată cu D. Ipoteza de nul susține că media populației de diferențe (µD) este egală cu 0. Cu alte cuvinte, diferențele negative dintre cele două evaluări le egalează pe cele pozitive. Ipoteza cercetării susține că media diferențelor (media distribuției de diferențe) este semnificativ diferită față de 0. Cele două ipoteze sunt notate astfel: H0: µ1 - µ2 = 0 H1: µ1 - µ2 ≠ 0 • µ1 – reprezintă media primului eveniment/condiții. • µ2 – reprezintă media celui de al doilea eveniment/condiții. Formula de calcul a testului t pentru eșantioane dependente este: 𝑚𝐷 𝑡= , 𝑢𝑛𝑑𝑒: 𝑠𝑒𝐷 (formula 8.1) • mD – este media distribuției de diferențe între cele două evaluări (media distribuției D). • seD – reprezintă eroarea standard a distribuției D. 𝑠𝑒𝐷 =

• •

𝑠𝐷

, 𝑢𝑛𝑑𝑒: √𝑁 (formula 8.2) sD – este abaterea standard a distribuției de diferențe D. N – este volumul eșantionului.

9.2 Exemplu de calcul Un cercetător este interesat să studieze efectul pe care îl are administrarea unor vitamine asupra rezistenței fizice a unor cicliști (α = 0,05, bilateral). În acest sens, măsoară numărul de kilometri parcurși de fiecare sportiv pe o durată de 30 de minute înainte și după introducerea medicamentației. În tabelul 8.1 sunt prezentate performanțele sportivilor (N=15) înainte, respectiv după administrarea vitaminelor. Ipoteza cercetării: Performanța cicliștilor se va modifica după administrarea vitaminelor. Ipoteza de nul: Performanța cicliștilor nu se va modifica după administrarea vitaminelor. Pentru a putea lua decizia statistică trebuie să comparăm valoarea lui t (calculat) cu tcritic. Îl vom obține pe tcritic în tabelul din Anexa 3, la intersecția dintre coloana corespunzătoare lui α = 0,025 (deoarece α = 0,05 bilateral) cu linia pentru 14 grade de libertate (df = N - 1). Astfel, lui tcritic îi corespunde valoarea ±2,14.

Tabelul 9.1 – Datele cercetării și calculele necesare testului t pentru două eșantioane dependente Înainte După D (X1) (X2) (X1 – X2) D – mD (D – mD)2 22 25 -3 -1,733 3,003 20 24 -4 -2,733 7,469 25 20 5 6,267 39,275 17 19 -2 -0,733 0,537 16 20 -4 -2,733 7,469 25 23 2 3,267 10,673 20 24 -4 -2,733 7,469 23 21 2 3,267 10,673 25 28 -3 -1,733 3,003 23 23 0 1,267 1,605 21 22 -1 0,267 0,071 19 22 -3 -1,733 3,003 20 22 -2 -0,733 0,537 22 24 -2 -0,733 0,537 26 26 0 1,267 1,605 m1 = m2 mD= ∑= 21,6 =22,867 1,267 96,933

În prima etapă a procedurii de calcul suntem interesați să obținem distribuția de diferențe D (X1 – X2). Această distribuție are media mD = -1,267. După cum se poate observa, mD este egală cu diferența dintre m1 și m2. Nu contează dacă distribuția de diferențe D este obținută prin realizarea diferenței X1 – X2 sau X2 – X1, deoarece valoarea calculată a lui t este aceeași, doar semnul fiind schimbat . Este importantă maniera în care este interpretat semnul diferenței. Faptul că diferența X1 – X2 are semn negativ înseamnă că scorurile din prima condiție (înainte de administrarea vitaminelor, în exemplul nostru) sunt mai mici comparativ cu al doilea moment al măsurării. În concluzie, după administrarea vitaminelor performanța cicliștilor a crescut. Acum trebuie să testăm dacă această creștere a performanței este una semnificativă statistic. În a doua etapă vom calcula abaterea individuală a fiecărei diferențe de la media distribuției de diferențe (D – mD), după care vom ridica fiecare abatere individuală la pătrat (D – mD)2. Aceste calcule ne permit să obținem eroarea standard a mediei distribuției de diferențe. Totuși, mai înainte de toate, avem nevoie de abaterea standard a distribuției D. ∑(𝐷 − 𝑚𝐷 )2 96,933 𝑠𝐷 = √ → 𝑠𝐷 = √ → 𝑠𝐷 = √6,923 → 𝑠𝐷 = 2,631 𝑁−1 14 𝑠𝐷 2,631 2,631 𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = → 𝑠𝑒𝐷 = 0,679 3,872 √𝑁 √15 Astfel, valoarea calculată a testului t este: 𝑚𝐷 −1,267 𝑡= ,→ 𝑡 = → 𝑡 = −1,865 𝑠𝑒𝐷 0,679 Pentru a lua decizia statistică vom compara valoarea calculată a lui t cu tcritic. La fel ca în cazul testului t pentru eșantioane independente, când │tcalculat│≥ │tcritic│ luăm decizia de a

respinge ipoteza de nul. Dacă │tcalculat│< │tcritic│vom lua decizia de a accepta ipoteza de nul. Deoarece │-1,86│< │-2,14│vom accepta ipoteza de nul și vom respinge ipoteza cercetării. În concluzie, probabilitatea ca cicliștii să obțină o performanță superioară, ca urmare a întâmplării, după administrarea vitaminelor este mai mare decât nivelul erorii de tip I (α) stabilit și nu ne putem asuma că diferența observată se poate datora vitaminelor.

Imaginea 8.1 – Decizia statistică bilaterală folosind distribuția t 9.3 Intervalul de încredere pentru diferența dintre medii Nu trebuie să pierdem din vedere că obiectivul principal al utilizării testelor statistice și al statisticii inferențiale este de a generaliza rezultatele obținute la nivelul populației. Precizia cu care vom estima intervalul în care se află diferența dintre medii depinde de α. Noi ne-am asumat un prag α = 0,05 și vom face estimarea cu o precizie de 95%. Limitele intervalului de încredere pentru diferența dintre medii îl vom calcula folosind formula: 𝜇𝐷 = 𝑚𝐷 ± 𝑡𝑐𝑟𝑖𝑡𝑖𝑐 ∗ 𝑠𝑒𝐷 (formula 8.3) • µD – reprezintă media populației de diferențe. • mD – este media distribuției de diferențe. • tcritic – reprezintă valoarea critică tabelară obținută pentru nivelul de încredere stabilit. • seD – reprezintă eroarea standard a distribuției D. • După introducerea valorilor corespunzătoare în formulă vom obține următoarele limite ale intervalului de încredere: • lim inf 95% = -1,267 – 2,14*0,679 → lim inf 95% = -1,267 – 1,453 → lim inf 95% = 2,72. • lim sup 95% = -1,267 + 2,14*0,679 → lim sup 95% = -1,267 + 1,453 → lim sup 95% = 0,186. Analiza intervalului de încredere pentru diferența dintre medii ne permite să observăm că valoarea 0 este cuprinsă între cele două limite. Astfel, cu o precizie de 95% media populației de diferențe poate să aibă orice valoare cuprinsă între -2,72 și 0,186, inclusiv 0 (așa cum susține ipoteza de nul). Prezența lui 0 între cele două limite ale intervalului de încredere pentru diferența dintre medii este un alt indiciu pentru acceptarea ipotezei de nul. 9.4 Testul t pentru eșantioane dependente cu SPSS Vom rula testul t pentru eșantioane dependente în SPSS folosind datele din exemplul de la secțiunea 8.2. Variabila dependentă este reprezentată de numărul de kilometri parcurși de cicliști în cele 30 de minute înainte, respectiv după administrarea vitaminelor (măsurată pe scală de interval/raport). Variabila independentă este reprezentată de momentul măsurării (înainte / după) și este măsurată pe scală nominală dihotomică.

Pentru început trebuie să aranjăm baza de date în SPSS. Vom crea două variabile: una care va cuprinde numărul de kilometri parcurși înainte de a lua vitaminele și alta care primește valorile pentru performanța de după administrare. Apoi vom introduce datele din tabelul 8.1. în secțiunea Data View din SPSS. Atunci când realizăm baza de date este esențial să realizăm corespondența între performanța înregistrată de un participant înainte și cea avută după „tratament”. Astfel, aruncând o privire peste imaginea de mai jos, care arată cum au fost introduse datele, înțelegem că al treilea participant a parcurs 25 de kilometri înainte de a primi tratamentul și 20 de kilometri după administrare. Participantul cu numărul 10 a rulat 23 de kilometri atât înainte de a lua vitaminele, cât și după finalizarea „tratamentului”.

Pentru a lansa testul folosim meniul Analyze → Compare Means → Pired-Samples T

Test.

Cu ajutorul săgeții sau prin tehnica „drag and drop” în zona Paired-Variables vom trece cele două variabile în zona Variable 1, respectiv Variable 2 în funcție de maniera în care dorim să analizăm diferența dintre variabile. SPSS întotdeauna realizează diferența în sensul Variable 1 – Variable 2. În final se acționează butonul OK.

În zona de afișare a rezultatelor vom obține trei tabele. Tabelul Paired Samples Statistics prezintă statistica descriptivă a celor două măsurători: media, volumul eșantionului, abaterea standard și eroarea standard a mediei.

Paired Samples Corelations prezintă rezultatele testului de corelație Pearson dintre cele două măsurători, dar informațiile din acest tabel nu fac obiectul de interes al acestei secțiuni. Vom detalia testul de corelație Pearson în capitolul 10.

Tabelul Paired Samples Test conține rezultatele testului t pentru eșantioane dependente, unde: • • • • • • •

Mean – media distribuției de diferențe (-1,267). Std. Deviation – abaterea standard a distribuției de diferențe (2,631). Std. Error Mean – eroarea standard a mediei diferențelor (0,679). 95% CI Confidence Interval of Diference – reprezintă limitele intervalului în care se află media reală a diferenței dintre medii. În cazul nostru, cu o probabilitate de 95% diferența reală dintre medii se află între -2,724 și 0,191. t – valoarea calculată a testului t pentru eșantioane dependente (-1,864). df –numărul de grade de libertate. Sig (2-tailed) – este probabilitatea asociată testului și este simbolizată prin p. Pe principiul explicat și cu ocazia testelor statistice anterioare când p > α acceptăm ipoteza de nul și respingem ipoteza cercetării. Dacă p ≤ α respingem H0 și acceptăm H1. Pentru exemplul prezentat p (0,083) > α (0,05) și vom accepta ipoteza de nul.

9.5 Raportarea rezultatelor testului t pentru eșantioane dependente Rezultatele testului statistic trebuie transpuse sub forma unui raport de cercetare. Astfel, rezultatele obținute în exemplul analizat vor fi prezentate într-o formă narativă (American Psychological Association, 2010) astfel : Utilizând un prag α = .05 a fost aplicat testul t pentru eșantioane dependente pentru a evalua dacă rezistența fizică a cicliștilor se modifică semnificativ după administrarea unor vitamine. Rezultatele indică faptul că media rezistenței cicliștilor (exprimată în kilometri rulați în 30 de minute) înainte de administrarea vitaminelor (M = 21.60, SD = 2.99) nu diferă semnificativ de media rezistenței cicliștilor înregistrată după administrarea tratamentului (M = 22.87, SD = 2.41), obținându-se o valoare calculată t(14) = 1.86, p > .05, d = -.47. Intervalul de încredere (95%) al diferenței dintre medii este cuprins între -2.72 și .19. Tabelele prezentate în output trebuie raportate conform standardelor APA (2010) astfel: Tabel 8.2 – Rezultatele testului t pentru eșantioane dependente kilometri înainte versus kilometri după Mean t df p Cohen’s d -1.26 1.86 14 > .05 -.47

Tema 9 Studenții seriei I (grupele 1, 2, 3,4 și 5) vor trimite temele pe e-mail la adresa [email protected] până luni, 3 decembrie ora 20.00. La secțiunea subject se va specifica Seminar Statistică. Temele trimise fără a avea această specificație la Subjet nu vor fi luate în considerare. Studenții seriei II (grupele 6, 7, 8, 9 și 10) vor trimite tema pe e-mail la adresa [email protected] până luni, 3 decembrie, ora 20.00. Pe e-mail se vor trimite următoarele documente: 1. Baza de date va fi salvată sub denumirea Nume Prenume_grupa (de exemplu, Popescu Bogdan_grupa 1) și va fi trimisă prin e-mail la adresa menționată mai sus. 2. Output-ul salvat sub denumirea Nume_Prenume_grupa. 3. Un document word salvat sub aceeași denumire care va cuprinde răspunsurile la subpunctele a, b, c, și d. De asemenea documentul va cuprinde, pe lângă rezolvarea exercițiului, explicația procedurilor utilizate pentru a obține rezultatele prezentate. 4. Poza foii A4 pe care ați rezolvat punctul 3e. al temei 1. În ce context se folosește testul t pentru eșantioane dependente? 2. Pe ce scală este măsurată variabila independentă în contextul testului t eșantioane dependente?

pentru

3. Un cercetător este interesat să studieze efectul pe care îl are vizionarea unor filme documentare asupra comportamentului agresiv al adolescenților. În acest sens, măsoară numărul comportamentelor agresive, înainte și după vizionarea filmului documentar. În tabelul de mai jos sunt prezentate datele cercetării. Înainte După 5 2 4 2 5 4 6 4 5 3 7 5 4 1 5 3 6 3 4 2 4 0 4 0 3 2 4 2 6 5 Pentru α = 0,01 (bilateral): a. Enunțați ipoteza cercetării. b. Enunțați ipoteza de nul. c. Precizați rezultatele testului t pentru eșantioane dependente (t, sig (p)), decizia cu privire la ipoteza de nul și ipoteza cercetării și precizați limitele intervalului de încredere. d. Prezentați rezultatele în stil APA. e. Descrieți procedura de calcul a testului t pentru eșantioane dependente (calculați valoarea lui t și specificați valoarea tcritic) și luați decizia statistică.

Related Documents

Testul T Si Z
November 2019 6
Testul
May 2020 10
Curs 9
June 2020 9
Curs 9
November 2019 19
Curs 9
May 2020 5
Curs 9
May 2020 7

More Documents from ""

December 2019 16
December 2019 12
P1-2 Frp.doc
December 2019 16
Eutranfreq.txt
November 2019 17