CORELAŢII Obiective: - Coeficientul de corelaţie Pearson - Coeficientul de determinare - Graficul de tip nor de puncte (XY Scatter) - Regresia liniară simplă
Problema 1. Se realizează un studiu pe un lot format din 46 de pacienţi diabetici. Se culeg date despre următorii parametrii biomedicali: vârsta (ani), colesterol total (mg/dL), colesterol HDL (mg/dL) – bun, trigliceride (mg/dL). Datele sunt prezentate în fişierul CorelatiiRegresii. Salvaţi fişierul în partiţia voastră şi realizaţi următoarele prelucrări statistice în acest fişier. a.
Calculaţi
coeficientul
de
corelaţie
Pearson
dintre
Vârstă
şi
colesterol
HDL
cu
ajutorul
funcţiei
din
fișierul
Excel.
CORREL. c.
Calculaţi coeficientul de corelaţie Pearson dintre trigliceride și colesterol HDL
d. Mai
jos
aveţi
o
parte
din
matricea
de
corelaţii
a
variabilelor
Copiaţi următorul tabel în foaia de calcul Sheet2, redenumiți-l în Corelații, şi completaţi ultimele trei coloane - intensitate corelație – utilizaţi regulile empirice ale lui Colton - tipul relaţiei – direct sau invers proporţională - interpretarea testului statistic pentru coeficientul de corelație (statistic semnificativ p<0.05 / nu e statistic semnificativ) rezultatul testului este valoarea lui p din paranteza de după coeficientul de corelație) testul verifică dacă există diferență statistic semnificativă între coeficientul de corelație și 0 (absența corelației) Prima variabilă
A doua variabilă
Vârstă Vârstă Vârstă Colesterol total Colesterol total
Colesterol total Trigliceride Colesterol HDL
-0.08 (0.61) nulă 0.26 (0.13) -0.18 (0.23)
Trigliceride
0.39 (0.61)
Colesterol HDL
0.44 (0.002)
Corelatie Coeficientul de corelatie Pearson – r (valoarea lui p) slabă sau
Relaţie
indirect proporțională
Semnificația statistică a testului statistic pentru coeficientul de corelație nu e statistic semnificativ
Completaţi interpretarea Coeficientului de corelaţie pe coloana corelaţie conform regulilor lui Colton: Reguli empirice privind interpretarea coeficientului de corelaţie Colton (1974): 1. un coeficient de corelaţie de la -0,25 la 0,25 indică o corelaţie slabă sau nulă, 2. un coeficient de corelaţie de la 0,25 la 0,50 (sau de la -0,25 la -0,50) indică un grad de asociere acceptabil 3. un coeficient de corelaţie de la 0,5 la 0,75 (sau de la -0,5 la -0,75) indică o corelaţie moderată spre bună 4. un coeficient de corelaţie mai mare decât 0,75 (sau mai mic decât -0,75) indică o foarte bună asociere sau corelaţie
În funcție de valoarea coeficientului de corelație Pearson putem spune că o relație între două variabile este direct proportională dacă r > 0, respectiv putem spune că o relație este invers proportională dacă r < 0. e.
Reprezentaţi grafic relaţia dintre Vârstă şi colesterol HDL (grafic de tip nor de puncte - Scatter), adăugaţi pe grafic dreapta de regresie asociată şi coeficientul de determinare. Interpretaţi în Excel graficul, coeficienţii dreptei de regresie şi coeficientul de determinare.
f.
Reprezentaţi
grafic
relaţia
dintre
trigliceride
și
colesterol
HDL.
Adăugaţi
pe
grafic
dreapta
de regresie asociată şi coeficientul de determinare. Interpretaţi în Excel graficul, coeficienţii dreptei de regresie şi coeficientul de determinare.