Curs 5.pdf

  • Uploaded by: Tarus Iulia
  • 0
  • 0
  • October 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Curs 5.pdf as PDF for free.

More details

  • Words: 1,554
  • Pages: 16
STATISTICA CURS 5 1

INDICATORI MEDII DE POZIŢIE – CUANTILE Cuantilele (percentile, în engl.) = valori ale variabilei utilizate pentru caracterizarea poziţiei relative a unui nivel individual în setul de date. Cuantilele pot fi utilizate în cazul variabilelor măsurate pe scalele ordinală şi de raport şi realizează o divizare a distribuţiei într-un număr de „k” părţi egale. Cele mai uzuale cuantile sunt:  Cuantila de ordin 2 ( mediana )  Cuantilele de ordin 4 (cuartile, notate Q1, Q2 = Me, Q3, care împart seria în patru părţi egale, delimitând câte 25% din observaţii.  Cuartilele se determină în cazul seriilor cu asimetrie redusă. 2

Cuartilele într-o serie de repartiţie

Cuantilele de ordin 10 (decile, notate D1, ...., D9 şi care delimitează câte 10% din observaţii, D5 = Me) Cuantilele de ordin 100 (centile, care delimitează câte 1% din observaţii). Centila cu rangul 25 este cuartila 1 (P25 = Q1). Centila cu rangul 50 coincide cu: cuartila 2, mediana, decila 5 (P50 = Q2 = Me = D5). Centila cu rangul 75 este egală cu cuartila 3 (P75 = Q3). Centilele se determină în cazul seriilor cu asimetrie pronunţată. 3

Functii EXCEL Funcţiile EXCEL utilizate sunt:

MODE pentru determinarea valorii modale, adică cea mai mică dintre valorile cu frecvenţa maximă; MEDIAN pentru determinarea valorii medianei; AVERAGE pentru determinarea mediei.

EXCEL

Funcţia QUARTILE ce are drept argumente setul de date şi numărul cuartilei dorite (valori Secvenţa este: între 0 şide 4)comenzi se obţinSPPS valorile:

Analyze Ordinul cuartilei Valoarea Descriptive Statistics 0 (xmin ) 140 Frequencies 1 (Q1) 170 2 (Me) 200 Statistics 3 (QMedian, 230 1) Mode, Mean 4

4

(xmax)

260

Diagrama Box-Plot Principalii indicatori medii de poziţie pot rezuma grafic (diagrama Box-Plot), pe de o parte tendinţa centrală, variabilitate datelor şi forma distribuţiei variabilei studiate, iar pe de altă parte valorile extreme şi cele aberante. Indicatorii utilizaţi pentru construirea diagramei Box-Plot sunt:

5

-

valoarea minimă xmin (denumită şi centila 0);

-

cuartila inferioară Q1 (delimitează cele mai mici 25% din valori);

-

mediana Me (delimitează 50% din valori);

-

cuartila superioară Q3 (delimitează cele mai mari 25% din valori);

-

valoarea maximă xmax (denumită şi centila 100).

Diagrama Box-Plot În cadrul diagramei Box-Plot, cutia este delimitată de cuartilele Q1 şi Q3 şi cuprinde 50% dintre valorile variabilei, situate în centrul distribuţiei. Linia din interiorul cutiei reprezintă valoarea mediană, iar liniile inferioară, respectiv superioară sunt date de valorile extreme ale seriei (xmin şi xmax). Diagrama Boxplot este utilă şi pentru identificarea valorilor extreme şi a celor aberante (outliers, în engl.). Valorile extreme ale setului de date sunt fixate la o limită maximă egală cu 1,5*lungimea cutiei (lungimea cutiei este Q3-Q1). Valorile aberante (de tip outlier) sunt considerate toate observaţiile situate la stânga sau la dreapta valorilor extreme (dacă este cazul) şi reprezentate în diagramă. 6

VARIABILITATEA Variabilitatea poate fi caracterizată atât prin intermediul indicatorilor simpli cât şi a celor sintetici. Indicatorii simpli ai variabilităţii măsoară împrăştierea valorilor individuale ale seriei, una faţă de alta sau faţă de o anumită valoare tipică. Indicatorii sintetici ai variabilităţii cuantifică, într-o singură expresie, împrăştierea tuturor valorilor din seria de date în raport cu o anumită valoare tipică.







7

Indicatorii simpli ai variabilităţii 1. Amplitudinea absolută a variaţiei - Ax, (range, în engl.) se calculează ca diferenţă dintre valoarea maximă şi valoarea minimă a variabilei X: Ax = xmax — xmin Ax are unitatea de măsură a variabilei. Ax descrie ecartul maxim al valorilor pe scală. Ax se foloseşte în construirea intervalelor de variaţie şi a graficelor. Ax este sensibilă la valorile extreme şi nu ţine cont de distribuţia celorlalte valori din serie. Ax nu este un indicator adecvat pentru a descrie împrăştierea datelor din serie.

8

Indicatorii simpli ai variabilităţii 1. Abaterea individuală (di) măsoară împrăştierea fiecărei valori faţă de nivelul mediu al variabilei X: di  xi  x sau d i  ( xi  x)  ni

Abaterile di au unitatea de măsură a variabilei; Abaterile di sunt pozitive, negative sau egale cu zero; Valorile mari ale abaterile di arată o variabilitate ridicată; Valorile mici ale abaterile di arată că valorile variabilei sunt concentrate în jurul mediei; Abaterile di se compensează reciproc, suma lor fiind nulă:

 x  x  0 sau  x  x n  0 . n

i 1

9

n

i

i 1

i

i

Indicatorii simpli ai variabilităţii 1. Abaterea intercuartilică (AI) se determină ca diferenţă între cuartila superioară (Q3) şi cea inferioară (Q1) şi arată intervalul în care se încadrează 50% dintre valorile variabilei situate în mijlocul distribuţiei: AI  Q3  Q1

AI are unitatea de măsură a variabilei studiate; AI reprezintă lungimea dreptunghiului din diagrama Box-Plot.

10

Indicatori sintetici ai variabilităţii 1. Abaterea medie liniară ( d ) se determină ca medie aritmetică a abaterilor individuale, considerate în valoare absolută: n

d 

 xi  x i 1

n

r

sau

d

x i 1

i

r

 x ni

 ni

r



x i 1

i

 x ni*%

100

i 1

d se exprimă în unitatea de măsură a variabilei; d arată cu cât se abat, în medie, valorile individuale de la media lor ; d nu poate fi utilizată în calcule algebrice; d acordă aceeaşi importanţă atât abaterilor mici cât şi abaterilor mari ale valorilor de la media lor, însă variabilitatea datelor este afectată, în mod deosebit, de abaterile mari de la medie. 11

Indicatori sintetici ai variabilităţii 2. Dispersia (variance, în engl.) se determină ca medie aritmetică a pătratelor abaterilor individuale. ESTIMATOR

PARAMETRU

(Dispersia variabilei în eşantion,

(Dispersia variabilei în populaţia statistică)

sample variance, în engl.)

 x  x n

i

s  2

i 1

n 1

În cazul datelor sistematizate dispersia se determină astfel:

 x  x n r

2

i

s2 

12

i 1

n 1

i

N

2

2 

 x i 1

 

2

i

N

Indicatori sintetici ai variabilităţii Dispersia este cel mai utilizat indicator pentru analiza variabilităţii datelor datorită proprietăţilor sale algebrice; Dispersia acordă o importanţă mai mare abaterilor individuale mari (prin calcularea pătratului abaterilor), sintetizând astfel mai fidel variabilitatea datelor; Dispersia are o unitate de măsură dificil de interpretat (prin determinarea pătratelor abaterilor individuale sunt ridicate la pătrat şi unităţile de măsură ale variabilei) În cazul eşantioanelor de volum mare ( n  30 ), putem lua în calcul următoarea aproximare

n 1  n , dispersia în eşantion

fiind:

 x n

s2 

i

x



2

i 1

n

Dispersia se poate determina şi prin metoda momentelor (dispersia este momentul centrat de ordinul 2 şi se calculează ca diferenţă dintre momentul iniţial de ordinul 2 şi pătratul momentului iniţial de ordinul 1):

 n 2 2 xi xi   xi   2 2 s  i 1  x  i 1   i 1  n n n   n

13

n

     

2

Indicatori sintetici ai variabilităţii Abaterea standard (numită şi abatere medie pătratică) este cel mai utilizat indicator de caracterizare a împrăştierii datelor, fiind un parametru al repartiţiei normale; Între indicatorii variabilităţi abatere medie liniară ( d ) şi abatere standard ( s ) există următoarea relaţie:

d  s, d 

4 s 5

Abaterea standard are unitatea de măsură a variabilei; În dezvoltarea teoriei statistice, majoritatea modelelor tradiţionale sunt bazate pe distribuţii descrise de media aritmetică şi abaterea standard; În analizele financiare abaterea standard este considerată o măsură a „riscului”: Exemplu: Considerând două proiecte de investiţii, A şi B, pentru care profiturile medii sunt aproximativ egale, iar deviaţia standard a proiectului A este de 3000 Eur şi deviaţia standard a proiectului B este de aproximativ 7000 Eur, atunci investiţia prudentă (cu un risc mai redus) este investiţia cu deviaţia standard mai mică, adică investiţia A. 14

Indicatori sintetici ai variabilităţii 3. Abaterea/deviaţia standard (standard deviation, în engl.) reprezintă rădăcina pătrată a dispersiei. Abaterea standard determinată la nivelul eşantionului (sample standard deviation, în engl.) – estimator este:

 x  x n

s s  2

i 1

i

n 1

 x  x  n n

2

sau s  s  2

i 1

2

i

n 1

Abaterea standard a variabilei în populaţia statistică – parametru este: N

  2  15

2   x    i i 1

N

i

Indicatori sintetici ai variabilităţii 4. Coeficientul de variaţie reprezintă expresia relativă a variabilităţii, fiind calculat ca raport între abaterea standard şi medie:

v

s x

100

Indicatorii sintetici ai variabilităţii, exprimaţi în mărimi absolute, nu permit realizarea comparaţiilor între serii statistice, din perspectiva variabilităţii/omogenităţii datelor; Exprimarea în mărime relativă a variabilităţii, prin intermediul coeficientului de variaţie, face posibilă compararea seriilor statistice din punctul de vedere al variabilităţii; Omogenitatea ridicată a datelor este asigurată de valori mici ale coeficientului de variaţie; Dacă două serii statistice au coeficienţi de variaţie diferiţi, seria care are coeficientul de variaţie mai mic este mai omogenă; Seriile pentru care v  30-35% sunt considerate omogene (cu variabilitate redusă), cu medii reprezentative care caracterizează corect tendinţa centrală a seriei. Coeficientul de variaţie nu se poate calcula dacă media este nulă ( x  0 ), iar pentru valori ale mediei apropiate de zero, valoarea coeficientului de variaţie poate să fie lipsită de semnificaţie. 16

Related Documents

2.34-5pdf
June 2020 46
Curs Mp_prostean.pdf
July 2020 1
Curs Icu1
May 2020 1

More Documents from ""