FORMULARIO STATISTICA Frequenze relative:
fi =
k ni ; i = 1,2, , k ; ∑ f i = 1 ; n = numero di osservazioni n i =1
Frequenze percentuali:
pi = f i *100 =
k ni * 100; i = 1,2, , k ; ∑ pi = 100 ; n = numero di osservazioni n i =1
Frequenze cumulate: la frequenza cumulata è il numero totale di osservazioni che hanno un valore inferiore o uguale al valore specificato. Per calcolare la frequenza cumulata bisogna ordinare in senso crescente le modalità della variabile e poi sommando le frequenze della modalità specificata insieme a quelle di tutte le modalità precedenti. Moda (dati in serie): Modalità della variabile che si verifica il maggior numero di volte Moda (dati in classi di uguale ampiezza): Classe modale è la classe in cui cade il maggior numero di osservazioni Mediana: Modalità di una variabile a cui appartiene il caso che divide a metà la distribuzione. Calcolo: 1. ordinare le modalità della variabile in ordine crescente 2. calcolare le frequenze assolute cumulate 3. individuare il valore centrale della distribuzione (il caso mediano): se il numero di soggetti n è dispari: C md =
n +1 2
n 2 n = +1 2
C md 1 = se il numero di soggetti n è pari ci sono due valori centrali:
C md 2
4. osservare in che modalità cade il caso mediano (per n pari e se il tipo di variabile lo consente, la mediana è la media delle due modalità del carattere corrispondenti ai due valori centrali individuati) Quartili Q1= (N+1)/4
Q2=2*(N+1)/4=(N+1)/2
Q3=3*(N+1)/4
Media (dati in serie): n
x=
∑x i =1
i
n
,n =
numero di osservazioni
Media (dati raggruppati per frequenze assolute): k
x=
∑x j =1
i
n
* ni
k
,k =
numero di modalità della variabile; n= numero di osservazioni;
∑n i =1
i
=n
1
Media (dati in classi e frequenze assolute): k
x=
∑m i =1
i
* ni
; mi = (limite superiore + limite inferiore)/2 = valore centrale classe
n
Range xmax - xmin Varianza (dati in serie):
( xi − x ) 2 σ =∑ ; n i =1 2
n
Varianza (dati rappresentati con distribuzione di frequenze):
ni ( x i − x ) 2 σ =∑ , ni = frequenza assoluta nella classe i e n i =1 2
k
k
∑n i =1
i
=n
Varianza (dati in classi):
ni ( m i − x ) 2 σ =∑ , ni = frequenza assoluta nella classe i; mi= (limite superiore + limite inferiore)/2 = n i =1 2
k
valore centrale classe Deviazione standard:
σ = σ2 Distribuzione normale o gaussiana
.3 .2
probabilità f(x)
x−µ σ
.1
z=
0
Normale standardizzata o rapporto critico
.4
L’area sotto la curva è pari all’unità. Definita da due parametri: media ( µ ) e deviazione standard ( σ ). La distribuzione è unimodale, a forma di campana, e simmetrica intorno a x = µ . La variabile casuale normale x ammette tutti i valori reali fra − ∞ e + ∞ . La curva normale standardizzata è definita da µ = 0 e σ = 1 .
-4
-2
0
x
2
4
2
Inferenza sulle medie Errore standard:
ES = σ
n
Test di ipotesi Confronto fra media campionaria e media di popolazione
H 0 : X = µ H a : X ≠ µ
z=
x −µ ES( x )
z=
x−µ σ n
Intervallo di confidenza al 95% per la media della popolazione
IC( µ ) = x ± zα / 2 ⋅ ES( x )
IC( µ ) = x ± 1.96 ⋅ σ
n
Concordanza
K=
Po − PE 100 − PE
dove: PO = accordo osservato (a+d/N) PE = accordo casuale atteso ( a + c ) ( a + b ) (b + d ) ( c + d ) PE = * * + N N N N 100= massimo accordo possibile (100%)
a c (a+c)
b d (b+d)
(a+b) (c+d) N
3