Statistică Matematică și Prelucrarea Datelor Experimentale SMPDE - curs
Inferență statistică • Observațiile sau investigările statistice presupun studierea unei caracteristici corespunzătoare unei populații. • Datorită faptului că accesul la întreaga populație (toate observațiile posibile) este mai dificil de realizat (populație finită sau infinită), această colectare a datelor cu privire la o caracteristică (caracteristici) se realizează în general prin eșantionarea. • Inferența statistică reprezintă procesul de extrapolare (generalizare) a informațiilor rezultate în urma studierii unui eșantion, la nivelul întregii populații.
Inferență statistică • Inferența statistică reprezintă partea statisticii ce se ocupă cu dezvoltarea metodelor și tehnicilor de investigare a unei populații. • Importanța acestei operații poate fi mai bine sesizată dacă luăm în considerare faptul că eșantionul reprezintă un procent infim din întreaga populație (1:10000). • Concluziile obținute pot fi eronate dacă eșantionul analizat nu reprezintă întreaga diversitate pe care o întâlnim în populație. operației de eșantionare
Eșantionarea • Eșantionul (lot) - reprezintă o submulțime a populației statistice asupra căreia experimentatorul aplică metode statistice propriu-zise. • Extragerea unui eșantion dintr-o populație se bazează pe anumite metode de alegere a elementelor eșantionului. • Metode de alegere: – metode bazate pe reprezentativitate (elemente ce dețin toate caracteristicile populației); – metode probabiliste (elementele au aceeași șansă de a fi selectate din populație).
Inferență statistică • Eșantionarea unei populații se poate face: – cu returnare (după extragerea unui element, acesta se introduce din nou în cadrul populației, putând fi ulterior extras); – fără returnare. • Dintr-o populaţie de volum N se pot extrage eşantioane de volum n, unde n
Eșantionarea Exemplu: Se consideră o populație în care o variabila poate lua orice valoare întreagă între 0 și 4 (valoare numerică ce reprezintă numărul de defecte ale unui produs). Se consideră populația ca fiind formată din 5 obiecte, fiecare având 0, 1, 2, 3 sau 4 defecte. Se extrag eșantioane formate din două exemplare. Eșantionarea se face atât cu returnare de element cât și fără returnare de element.
Eșantionarea • După extragerea unui Eşantionarea fără returnare element, acesta NU se 0, 1 reintroduce în populație 1, 2 0, 2 2, 3 1, 3 3, 4 • Se obțin 10 de eșantioane; 0, 3 2, 4 1, 4 • Fiecare element are asociat 0, 4 un număr de defecte; Mediile fiecărui eşantion • Media calculate pentru 0.5 fiecare eșantion diferă de la 1.5 1.0 2.5 un eșantion la altul. 2.0 3.5 1.5 3.0 2.5 2.0
x
Eşantionarea Distribuţia mediilor
0.5 1.0 1.5 2.0 2.5 3.0 3.5
Nr. eşantioane f 1 1 2 2 2 1 1
Total
10
𝑥ҧ
Prob. de apariţie f/f 1/10 1/10 2/10 2/10 2/10 1/10 1/10
x x / N 2 .0 x2
2 x x i
N
0.75
x 2.0, 0.75 2 x
Eşantionarea
Eșantionarea Eşantionarea cu returnare 0, 0 0, 1 0, 2 0, 3 0, 4
1, 0 2, 0 3, 0 4, 0 1, 1 2, 1 3, 1 4, 1 1, 2 2, 2 3, 2 4, 2 1, 3 2, 3 3, 3 4, 3 1, 4 2, 4 3, 4 4, 4 Mediile fiecărui eşantion 0.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 2.5 1.0 1.5 2.0 2.5 3.0 1.5 2.0 2.5 3.0 3.5 2.0 2.5 3.0 3.5 4.0
• După extragerea unui element, acesta se reintroduce în populație • Se obțin 25 de eșantioane; • Fiecare element are asociat un număr de defecte; • Media calculate pentru fiecare eșantion diferă de la un eșantion la altul.
x
Eşantionarea 𝑥ҧ 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 Total
Distribuţia mediilor Probabiltatea Nr. eşantioane de apariţie f f/f 1 1/25 2 2/25 3 3/25 4 4/25 5 5/25 4 4/25 3 3/25 2 2/25 1 1/25 25
x x / N 2 .0 x2
2 x x i
N
1.00
x 2.0, 1.0 2 x
x
Eşantionarea
x
𝑥ҧ
Volumul eşantionului n = 3 Nr. Probabilitate eşantioane f de apariţie
0.00 0.33 0.67 1.00 1.33 1.67 2.00 2.33 2.67 3.00 3.33 3.67 4.00 Total
1 3 6 10 15 18 19 18 15 10 6 3 1 125
0.008 0.024 0.048 0.080 0.120 0.144 0.152 0.144 0.120 0.080 0.048 0.024 0.008 1.00
x x / N 2 .0 x2
2 x x i
N
0.75
x 2.0, 0.66 2 x
Eşantionarea
x
𝑥ҧ 0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 Total
Volumul eşantionului n = 4 Nr. eşantioane Probabilitate de f apariţie 1 4 10 20 35 52 68 80 85 80 68 52 35 20 10 4 1 625
0.0016 0.0064 0.0160 0.0320 0.0560 0.0832 0.1088 0.1280 0.1360 0.1280 0.1088 0.0832 0.0560 0.0320 0.0160 0.064 0.0016 1.0000
x x / N 2 .0 x2
2 x x i
N
0.66
x 2.0, 0.5 2 x
Eşantionarea
Eşantionarea 0 1 2 3 4 5 2.0
n = 2 cu returnare
x 2.0, x2 1.0 n=3
x 2.0, x2 0.66 n=4
x 2.0, x2 0.5
2
2 x x i
N
2.00
fără returnare
x 2.0, x2 0.75
.
Eşantionarea La eşantionarea cu returnare, relaţia dintre σ2xത și σ2 2 este: 2 x n La eşantionarea fără returnare: 2 N n 2 x n N 1
Pentru n<=0.05N factorul de corecţie poate fi ignorat
Eşantionarea • Histogramele pentru eșantionări cu volum n = 2, n = 3, și n = 4 elemente. • Pe măsură ce n crește, repartiția se apropie de cea normală. • Tendința este adevărată pentru toate eșantioanele, indiferent de distribuția populației. • Această tendință se numește teorema limită centrală.
Eşantionarea • Pe măsură ce volumul eşantionului crește, distribuția tinde spre una normală (chiar în situația când populația are o altfel de distribuție). • Proprietățile repartiției normale pot fi aplicate pentru determinarea erorii ce apare datorită eșantionării. • În practică teorema limită centrală se aplică pentru eșantioane de volum 𝑛 ≥ 30
Inferența statistică estimarea valorilor testarea ipotezelor parametrilor unei referitoare la populaţii parametrii populaţiei (media, dispersia)
Estimări • În practică studiul unei populații se efectuează pe o submulțime a sa, un eșantion, iar concluziile obținute sunt extinse prin inferență statistică la nivelul întregii populații. • Concluziile rezultate în urma studiului sunt afirmații adevărate la nivelul eșantionului, dar la nivelul populației ele au aceeași valoare numai cu o anumită probabilitate. • Determinarea valorilor parametrilor populației pe baza valorilor unor indicatori, obținute pe eșantioane, se numește estimare statistică.
Estimări • Mărimile caracteristice ale unei populații se numesc parametri. ₋ media populației 𝜇 ₋ deviația standard a populației 𝜎 ₋ eroarea standard a mediei 𝜎𝑥ҧ • Mărimile caracteristice ale unui eșantion se numesc statistici sau indicatori statistici. – media eșantionului 𝑥ҧ – deviația standard a eșantionului 𝑆 – eroarea standard a mediei 𝑆𝑥ҧ
Estimări • Estimatorul reprezintă o statistică utilizată pentru a aproxima un parametru. Ex: media eșantionului 𝑥ҧ este un estimator al mediei populației 𝜎. • Estimația reprezintă valoarea pe care o ia un estimator într-o determinare concretă. • Un estimator trebuie sa aibă cel puțin doua calități: – să reflecte corect rezultatele obținute; – să aibă o precizie suficient de mare.
Estimare
Estimări
punctuală
cu un interval
Estimări • Media unui eşantion poate fi considerată o estimare punctuală. • În cazul estimării punctuale a mediei se consideră abaterea standard a populaţiei cunoscută. • Condiții necesare pentru o estimare bună – Estimare eficientă (deviația standard să fie cât mai mică posibil); – Estimare nedeplasată (media eșantionului este egală cu parametrul estimat); – Estimare consistentă (valoarea estimată tinde spre valoarea adevărată pe măsură ce volumul eșantionului creşte).
Estimări • În statistică se consideră că valoarea adevărată a unui parametru reprezintă un element necunoscut, o valoare intrinsecă. • Valoarea adevărată poate fi estimată cu ajutorul unor măsurări repetate asupra aceleiași mărimi, corespunzătoare parametrului respectiv, sau asupra unor entități de același tip, ce conține informații despre parametru căutat.
Estimări • O singură estimare a mediei diferă de media populației, datorită erorii de eșantionare.
• Din acest motiv, în multe situații se preferă estimarea printr-un interval de încredere: • Intervalul de încredere reprezintă “o plaje de valori” în interiorul căruia poate fi stabilit cu o anumită certitudine poziția parametrului populației estimat.
• Intervalul estimat cu un nivel de încredere 1 − 𝛼 se numește interval de încredere (unde 𝛼 este nivelul de semnificație).
Estimari • 100(1 - ) este nivelul de încredere • Z/2 este valoarea variabilei Z ce exclude la fiecare extremitate a distribuției o arie de /2 • /2-cvantila distribuției normale standard.
Arie 95%
2.5%
-1.96
n
+1.96
2.5%
n
Estimări • Astfel estimarea unui parametru teoretic nu se face printr-o singura valoare ci printr-un interval în care parametrul estimat se găsește cu o probabilitate mare. • 𝜇 = 𝑥ҧ ± 𝑍𝛼Τ2 • 𝜎𝑥ҧ = 𝑥ҧ ± 𝑍𝛼Τ2
𝜎 𝑛 𝜎
𝑛
Estimări x 1.96 x x 1.96
n
• Valoarea corespunzătoare mediei populației este o cantitate fixă, dar necunoscută. • Este incorect să se interpreteze estimare pe baza intervalului de încredere ca o probabilitate corespunzătoare mediei populației 𝝁.
Estimări • Estimarea cu ajutorul unui interval de încredere pentru media µ a distribuției normale se bazează pe un eșantion de volum n și medie 𝑥ҧ . • Se pot utiliza diferite nivele de încredere în estimarea intervalului valorii medii. • În practică s-a demonstrat că nivelul de încredere de 95% pentru media a populației satisface optim cerințele în majoritatea cazurilor concrete.
Estimări • Exemplu: În cadrul unui studiu clinic s-a constatat că media glicemiei la un eșantion de 121 de pacienți este 105 iar varianța este 36. – Care este intervalul de încredere corespunzător mediei populației, ce are o distribuție normală, din care s-a extras eșantionul analizat cu un prag de semnificație 𝛼 = 0.05.
Estimări 𝑛 = 121 𝑆 2 = 36 => 𝑆 = 6 𝑥ҧ = 105 𝜇 = 𝑥ҧ ± 𝑍𝛼Τ2
𝜎 𝑛
Z = 1.96 6 𝜇 = 105 ± 1.96 121 [105 − 1.07 105 + 1.07] [103.93 + 106.07]
Estimări • Un interval de încredere prea mare (larg) conferă foarte puține informații. • De exemplu se realizează o estimare a salariului unui inginer debutant, cu un interval de încredere de 95%. – Cu limitele între 2000 lei și 10000 lei. – Cu limite între 2500 și 2700 lei. • Cea de-a doua estimare este cu un interval mai îngust, ceea ce confer informații mai precise cu privire la salariul unui debutant.
Estimări • Dimensiunea intervalului de încredere este o funcție ce depinde de – Nivelul de încredere; – Deviația standard a populației; – Dimensiunea eșantionului.
𝑥ҧ ± 𝑍𝛼Τ2
𝜎 𝑛
• Creșterea dimensiunii eșantionului conduce la diminuarea intervalului de încredere pentru același nivel de încredere.
Estimări • Un nivel de încredere mare conduce la un interval de încredere mare.
Estimări • O deviație standard mare a populației conduce la un interval de încredere mai larg.
Estimări • În mod uzual, este o mărime necunoscută (informaţii certe sunt cele legate de eşantion). • Se poate demonstra, că S este o estimare nedeplasată a abaterii standard. – În cazul eşantioanelor de volum mare, estimarea este foarte bună; – În cazul eşantioanelor de volum mic, S poate fi subestimat. Din acest motiv la eşantioanele de volum mic, trebuie lărgit intervalul de încredere. Acest lucru se realizează prin utilizarea repartiţiei t.
Estimări • În cazul în care 𝑥ҧ este media unui eșantion mic (N< 30 ), abaterea 𝑆 nu este aproape de valoarea parametrului 𝜎. • În acest caz mediile eșantioanelor au o distribuție t ce este caracterizată de numărul gradelor de libertate 𝜈 =𝑁−1 • Similar cu repartiția normală 𝜇 = 𝑥ҧ ± 𝑡𝛼Τ2,𝜈 ∙ 𝑆𝑥ҧ unde 𝑡(1 − 𝛼Τ2 , 𝑛 − 1) iar 𝑆𝑥ҧ =
𝑆
𝑛
• Cvantila repartiției t se evaluează în Matlab cu 𝑡𝑖𝑛𝑣(𝑡, 𝑣).
Estimări Exemplu: Masa unor persoane ce utilizează un ascensor este prezintă o distribuție normală. În urma extragerii unui eșantion avem următoarele valori: 71 85 68 72 58 76 74 80 – Să se estimeze cu o probabilitate de 95% valoarea medie.
Estimări x t 1 2 , n 1
S n
t 1 2 , n 1 t 0.05 2 ,8 1 2.365 𝑡𝑖𝑛𝑣([0.025 0.975], 7)
x 73 S 8.09
Sx
S 2.365 2.86 n 8
= 73 (2.3652.86) = 73 6.76
66.24;79.76
Estimări De reținut: • Pentru o estimare corectă a unui parametru statistic se utilizează intervalul de încredere. • Intervalul de încredere depinde de volumul eșantionului și de eroarea standard. • Cu cât volumul eșantionului este mai mic cu atât intervalul de încredere este mai larg. • Cu cât eroarea standard este mai mare cu atât intervalul de încredere este mai larg.
Testarea ipotezelor • Informațiile legate de o anumită populație statistică se obțin prin selectarea unui eșantion, cu ajutorul căruia se estimează parametrii populației respective. • Pe baza acestor parametri se poate forma o imagine asupra caracteristicilor analizate. Exemplu: • Dintr-un lot de piese se extrage un eșantion de n elemente și se efectuează măsurări ale greutății G • Greutatea presupusă va fi o variabilă repartizată normal cu media 𝜇 și dispersia 𝑆.
Testarea ipotezelor • Pentru eșantionul extras s-a determinat prin calcul media experimentală. • Se pune problema dacă, rezultatul obținut constituie o ipoteză statistică, adică o presupunere (supoziție) asupra populației statistice luate în studiu. • Se numește ipoteză statistică orice presupunere relativă la parametrii uneia sau mai multor populații statistice sau presupuneri legate de distribuția de probabilitate a populației statistice.
Testarea ipotezelor • În multe probleme din inginerie se pune problema dacă se acceptă sau se resping valorile obținute.
• Chiar dacă ipoteza statistică este avansată pe baza unui eșantion, concluzia referitoare la valoarea parametrului sau la natura repartiției se referă la întreaga populație. • O presupunere asupra unor elemente ale repartiției ഥ ) poate admite o alternativă (µ ≠ G ഥ). (µ = G
• Ipotezele pot fi acceptate sau nu cu anumite probabilități de corectitudine a deciziei.
Testarea ipotezelor • Ipoteza inițială se mai numește și ipoteză nulă și se notează H0. • Ipoteza nulă presupune că toate măsurătorile pe care dorim să le comparăm sunt egale, iar eventualele diferențe se datorează exclusiv întâmplării.
• Ipoteza nulă este ipoteza care se testează statistic. • În funcție de rezultatul testării se acceptă sau se respinge ipoteza inițială.
Testarea ipotezelor • Pe baza ipotezei nule se pot compara: – O valoare medie (obținută pe baza unui eșantion) cu o valoare data; – Două valori medii (obținute pe baza a două eșantioane);
– O distribuție experimentală cu una teoretică; – Două distribuții experimentale; – Două sau mai multe dispersii.
Testarea ipotezelor • Cealaltă ipoteză se numește ipoteza alternativă sau concurentă se notează H1. • Dacă ipoteza alternativă este acceptată, decizia susține faptul că variația fenomenului studiat nu se datorează doar întâmplării (intervin și alți factori). • Se acceptă ipoteza alternativă dacă diferențele constatate sunt vizibil astfel încât nu pot fi explicate prin efectul întâmplării.
Testarea ipotezelor • Ipotezele statistice nu sunt echivalente cu ipotezele științifice. • În cazul unei ipoteze științifice este suficient un singur exemplu contrar pentru a o infirma, dar o ipoteză statistică poate fi adevărată, chiar dacă într-o anumită situație a fost respinsă ca fiind falsă.
Testarea ipotezelor • Ipotezele statistice sunt însoţite de două tipuri de erori: – O eroare - probabilitatea de a respinge ipoteza H0, când în realitate ea este adevărată. Eroarea : = P(respinge H0H0 adevărată). – O eroare –probabilitatea de acceptare a ipotezei H0, când în realitate ea este falsă. Eroarea : = P(acceptă H0H0 falsă).
Testarea ipotezelor Aceste erori se mai numesc erori de tip I şi II.
Testarea ipotezelor • Metoda efectivă de luare a deciziei asupra acceptării sau respingerii ipotezei H0 se face cu ajutorul unui test sau criteriu statistic. • Testul impune luarea uneia dintre cele două decizii (acceptare sau respingere a ipotezei nule) cu un anumit risc. • 1 - este probabilitatea de respingere a ipotezei nule când aceasta este falsă.
• 1 - se consideră respectiv
ca fiind puterea testului
Testarea ipotezelor • Din punct de vedere practic, pentru a verifica ipoteza H0 cu alternativa H1 sunt necesare: – o statistică a cărei repartiție să fie cunoscută; – o valoare considerată “critică” cu care să se compare valoarea calculată a statisticii;
– o regulă de decizie prin care să se accepte sau să se respingă Ho; – o valoare a riscului ales , ce se mai numeşte nivel de semnificaţie al testului.
Testarea ipotezelor • Etapele aplicării unui test statistic o Formularea ipotezei nule şi a celei alternative. H 0 : 0 H 1: : 0
H 0 : 0
sau
H 1: : 0
sau
H 0 : 0 H 1: : 0
.
o Alegerea nivelului de semnificație 𝛼 (uzual este 5% sau 1%). o Selectarea statisticii şi a valorii critice. Tip test
Ipoteze
2 extremităţi
H0 =0
o extremitate
=0
o extremitate
=0
H1
0 0 0
x
Z
t
0 Z / 2 x 0 Z x 0 Z x
Z/2
t(/2,)
+ Z
+ t(,)
- Z
- t(,)
Testarea ipotezelor regiune de respingere
regiune de respingere
a)
b)
Arie /2%
Arie /2%
Arie %
regiune de acceptare
regiune de acceptare
H0: = 0
H0: = 0
H1: ≠ 0
regiune de respingere c)
H1: > 0
Arie %
H0: = 0 regiune de acceptare
H1: < 0
Testarea ipotezelor • Etapele aplicării unui test statistic (continuare) o Determinarea statisticii testului (media experimentală sau valoarea transformată în format standard Z sau t). Z
x 0
x
sau t
x 0 Sx
o Formularea deciziei –
se acceptă H0, dacă 𝑥ҧ aparține intervalului de acceptare (se respinge H0 dacă acest lucru nu se întâmplă)
–
Dacă utilizăm Z sau t se acceptă H0 dacă valoarea Z, respectiv t cade în interiorul domeniului de acceptare (în caz contrar se respinge)
–
se acceptă H0 dacă 𝑥ҧ , Z sau t este mai mare sau mai mic decât valoarea critică (în funcţie de ipoteza alternativă) și se respinge în caz contrar
Testarea ipotezelor Exemplu: În urma unui studiu statistic cu privire la procesul de sudare a caroseriilor unor mașini, s-a constatat că un robot sudează în medie 5 caroserii pe oră cu o deviație standard de 0.8. Analizând un eșantion de 60 de caroserii sudate de un al doilea robot s-a constatat că procesul de asamblare are o medie de 5.45 caroserii pe oră. • Să se testeze ipoteza că producția de 5.45 diferă de cea de 5. Se admite un nivel de semnificație de 0.05.
Testarea ipotezelor • Deoarece se cunoaşte valoarea lui , se aplică distribuţia normală, cu variabila Z. • Date iniţiale: – = 5; = 0.8; n = 60 • Ipoteze: – H0: 0 = ; H1: 0 • Nivel de semnificaţie = 0.05 Z/2 = Z0.025 = 1.96 – În Matlab 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.975, 0, 1)
Testarea ipotezelor Deviaţia standard a mediei: x
n
0 .8 0.1033 60
Valori critice (limitele): – pentru 𝑥:ҧ 0 Z / 2 x 5 1.960.1033 4.7975 şi 5.2025 – pentru Z: Z/2 -1.96 şi 1.96
Testarea ipotezelor Formularea deciziei: – valoarea 𝑥ҧ = 5.45 cade în afara intervalului determinat de valorile critice (5.45> 5.2025) – Valoarea Z
x 0
x
5.45 5 4.3562 0.1033
se găseşte în afara intervalului determinat de valorile critice. Concluzia: Indiferent de testul aplicat se poate afirma că se respinge ipoteza nulă cu un interval de încredere de 95%, deci media producției în cel de-al doilea caz diferă de prima.
Testarea ipotezelor
Testarea ipotezelor Nu se poate afirma că media eșantionului este mai mare, deoarece s-a utilizat un test cu două extreme. • Se testeze dacă media eșantionului este mai mare decât media populației • Ipoteze:
H0: 0 = ; H1: 0 > • Nivel de semnificaţie = 0.05 Z = Z0.05 = 1.645 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.95,0,1)
Testarea ipotezelor • Deviația standard a mediei: x 0.1033
Valori critice (limitele): – pentru 𝑥:ҧ 0 Z x 5 + 1.6450.1033 = 5.1699
– pentru Z: + Z 1.645
Testarea ipotezelor Formularea deciziei: – valoarea𝑥ҧ = 5.45 valoare critică 5.1699. – valoarea 𝑍 = 4.3562 > 1.645 Z
x 0
x
5.45 5 4.3562 0.1033
Concluzia: În ambele teste se respinge ipoteza nulă şi cu un interval de încredere de 95% se acceptă ipoteza alternativă (productivitatea celei de-al doilea robot este mai mare).
Testarea ipotezelor
Testarea ipotezelor Exemplu: În urma unui sondaj realizat, de un producător de telefoane mobile, asupra unui eșantion de acumulatori ce urmau să fie integrați într-un nou produs, s-a constatat că durata medie de funcționare între încărcări este de 148 ore. •
Să se verifice ipoteza că durata de funcționare este de 150 de ore (ipoteza alternativa fiind un timp de funcționare mai mic de 150 ore) la un nivel de semnificație de 0.05, știind că dispersia duratei de funcționare este 35.
Testarea ipotezelor • Deoarece se cunoaşte valoarea lui 𝜎 2 , se aplică distribuţia normală, cu variabila Z. • Date iniţiale: – = 148; 𝜎 = 5.92; n = 30 • Ipoteze: – H0: 0 = ; H1: 0 • Nivel de semnificaţie = 0.05 Z/2 = Z0.025 = 1.96 – În Matlab 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.975, 0, 1)
Testarea ipotezelor Deviaţia standard a mediei: x
n
5.92 1 35
Valori critice (limitele): – pentru 𝑥:ҧ 0 Z / 2 x 148 1.961 146.04 şi 149.96 – pentru Z: Z/2 -1.96 şi 1.96
Testarea ipotezelor Formularea deciziei: – valoarea 𝑥ҧ = 150 cade în afara intervalului determinat de valorile critice (150> 149.96) – Valoarea
Z
x 0
x
150 148 2 1
se găseşte în afara intervalului determinat de valorile critice. Concluzia: Indiferent de tipul testului aplicat se poate afirma că se respinge ipoteza nulă cu un interval de încredere de 95%, deci media duratei de funcționare nu este 150 de ore.
Testarea ipotezelor
Testarea ipotezelor Nu putem afirma că media eșantionului este mai mică, deoarece s-a utilizat un test cu două extreme. • Se testeze dacă media eșantionului este mai mică decât media populației • Ipoteze:
H0: 0 = ; H1: 0 < • Nivel de semnificaţie = 0.05 Z = Z0.05 = 1.645 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.95,0,1)
Testarea ipotezelor • Deviația standard a mediei: x 1
Valori critice (limitele): – pentru 𝑥:ҧ 0 Z x 148 − 1.6451 = 146.355
– pentru Z: - Z -1.645
Testarea ipotezelor Formularea deciziei: – valoarea𝑥ҧ = 150 valoare critică 146.355. – valoarea 𝑍 = 2 > 1.645 Z
x 0
x
150 148 2 1
Concluzia: Conform ambelor teste, se se acceptă cu un interval de încredere de 95% că durata de funcționare nu este cu mult diferită de media de 150 de ore.
Testarea ipotezelor
Testarea ipotezelor Exemplu: Pentru determinarea nivelului de pregătire, pentru examenul de licență, au fost testați studenți din două departamente cu profil diferit. Au fost formate două eșantioane de 15 studenți, iar rezultatele centralizate sunt prezentate în continuare (valoarea înregistrată fiind notele obținute). profil 1 profil 2
volum n1 = 15 n2 = 15
medie 7.5 6.2
S 7.1 9.3
Datorită faptului că studenții provin de la două departamente diferite nu sunt motive să se presupună că varianţele cele două populaţii ar fi egale.
Testarea ipotezelor • Se va aplica testul t, varianțele fiind necunoscute și volumul eșantioanelor mic. • Ipoteze: H0: 0 = ; H1: 0 • Nivel de semnificaţie: 𝛼 = 0.05 • Deviaţia standard a mediei: S x1 x2
S12 S 22 7.12 9.32 3.0210 n1 n2 15 15
Testarea ipotezelor • Valori critice t/2 = 2.05 cu = 28 (𝑡/2 = 𝑡𝑖𝑛𝑣(0.975,28) ș𝑖 = 15 + 15 − 2)
• Testul t
S S n1
2 1
n1 S n2 S 22 n1 1 n2 2 1
2 2
2
n2 1
28
x1 x2 1 2 7.5 6.2 0.43 S x1 x2
3.0210
Concluzie: Deoarece |t| < |t/2| nu se respinge ipoteza nulă, deci între cele două departamente nu există diferenţe statistice semnificative.