CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di “oggetti” (unità di analisi) di ricerca
N = ampiezza della popolazione
PARAMETRI = caratteristiche della popolazione [media, proporzione (= distribuzione %), correlazione] CAMPIONE = insieme degli oggetti (unità campionarie = casi) selezionati tra gli N oggetti della popolazione allo scopo di rappresentarla popolazione = oggetto da conoscere
n = ampiezza del campione
campione = strumento di conoscenza
CAMPIONAMENTO = procedura per scegliere le n unità campionarie fra le N unità della popolazione STIMA = valore approssimativo di un dato parametro della popolazione fornito dal campione CAMPIONAMENTO
1
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE Poiché il campione permette di stimare i parametri della popolazione si tratta di stabilire quanto il dato stimato si avvicina al dato della popolazione A tale scopo vengono presi in considerazione 2 aspetti: LIVELLO DI FIDUCIA della stima = la probabilità di ottenere la stessa stima selezionando 100 campioni con le stesse caratteristiche
livello di fiducia al 95% = se ripeto 100 volte le operazioni di campionamento otterrò 95 campioni uguali e dunque 95 stime uguali
INTERVALLO DI CONFIDENZA della stima = ampiezza dell’errore della stima = errore di campionamento CAMPIONAMENTO
2
MISURA DELL’ERRORE DI CAMPIONAMENTO - 1 Poiché il campione permette di stimare i parametri della popolazione si tratta di stabilire quanto il dato stimato si avvicina al dato della popolazione, ovvero si tratta di misurare la bontà della stima = misurare l’errore di campionamento ad essa associato
V parametro della popolazione (sconosciuto)
=
v stima del campione
CAMPIONAMENTO
+/-
e errore di campionamento 3
MISURA DELL’ERRORE DI CAMPIONAMENTO - 2 Nel caso più comune (= stima di una proporzione o valore percentuale nella popolazione mediante campionamento casuale semplice) la formula per la determinazione dell’errore campionario è la seguente:
e=
z
pq
1-f
n-1 dove z
=
coefficiente dipendente dal livello di fiducia della stima prescelto ( se 95% = 1,96)
p
=
proporzione nel campione della categoria in esame
q
=
1-p
n
=
ampiezza del campione
f
=
frazione di campionamento = n/N CAMPIONAMENTO
4
MISURA DELL’ERRORE DI CAMPIONAMENTO - 3 Data la
e=
z
pq
1-f
n-1 si osservi che l’errore di campionamento aumenterà in relazione a: quanto più elevato è il livello di fiducia “z” della stima voluto dal ricercatore (infatti, se 95% z = 1,96; se 99% z = 2,58); quanto minore è l’ampiezza del campione “n”. Si osservi inoltre che poiché “f” (frazione di campionamento) = n/N, con N molto grandi “f” si avvicina a 0 e quindi 1 – f tende a 1 il “fattore di correzione per popolazioni finite” tende a 1 e quindi la dimensione della popolazione è generalmente un aspetto trascurabile CAMPIONAMENTO
5
DETERMINAZIONE DI n CAMPIONARIO Data la
e=
z
pq
1-f
n-1 e fissando a priori: il livello di fiducia “z” della stima, quindi determinando il valore di “z”; l’intervallo di confidenza della stima, vale a dire “e” Osservando inoltre che il valore di “pq” sarà al massimo 0,25, cioè quando p = 0,50
è possibile calcolare l’ampiezza del campione (casuale semplice) come nella seguente tabella: CAMPIONAMENTO
6
DETERMINAZIONE DI n CAMPIONARIO Casuale semplice - Livello di fiducia della stima = 95% INTERVALLO DI CONFIDENZA 5%
2%
1%
N
n
N
n
N
n
100
80
100
96
100
99
300
170
300
270
300
296
500
220
500
415
500
475
1000
285
1000
715
1000
910
5000
370
5000
1660
5000
3330
>8000
400
10000
2000
10000
5000
>50000
2500
20000
6350
>200000
10000
CAMPIONAMENTO
7
ESEMPIO di CALCOLO dell’INTERVALLO DI CONFIDENZA Dato : un campione casuale semplice di 420 soggetti, estratto dalla popolazione residente in un comune con 50.000 abitanti, un livello di fiducia della stima pari al 95% si rileva che la stima campionaria della percentuale dei cattolici praticanti è pari a 25,7%. L’intervallo di confidenza della stima (= “e”) calcolato usando la e=
pq
z
1-f
n-1 senza tener conto di
1-f
dal momento che “f” tende a 0
0,257 x 0,743 e=
1,96
= 0,042 = 4,2%
419 CAMPIONAMENTO
8
TIPI DI CAMPIONAMENTO PROBABILISTICO CAMPIONAMENTO CASUALE SEMPLICE CAMPIONAMENTO SISTEMATICO
necessaria lista completa delle unità della popolazione
CAMPIONAMENTO STRATIFICATO
proporzionale oppure non proporzionale
CAMPIONAMENTO A STADI
popolazione suddivisa in unità primarie e secondarie
CAMPIONAMENTO A GRAPPOLI
popolazione suddivisa “naturalmente” in gruppi di unità spazialmente contigui
CAMPIONAMENTO
9
TIPI DI CAMPIONAMENTO NON PROBABILISTICO
CAMPIONAMENTO A VALANGA (snow ball)
CAMPIONAMENTO A SCELTA RAGIONATA
CAMPIONAMENTO PER QUOTE
CAMPIONAMENTO
come stratificato, ma unità selezionate in modo non casuale
10
PONDERAZIONE Se la distribuzione % di una variabile nella popolazione è nota ed è ritenuta rilevante rispetto all’oggetto della ricerca è opportuno allora procedere alla ponderazione POPOLAZIONE
CAMPIONE
obbligo > obbligo totale
obbligo > obbligo totale
M
33
15
48
M
30
25
55
F
27
25
52
F
20
25
45
totale
60
40
100
totale
50
50
100
Coefficiente di ponderazione (“peso”) per M con obbligo = 33/30 = 1,1 CAMPIONAMENTO
11
GLI ERRORI DI SELEZIONE
ERRORE DI CAMPIONAMENTO
ERRORE DI COPERTURA
lista della popolazione incompleta o inesistente
ERRORE DI “NON RISPOSTA” (o “caduta”)
problema delle sostituzioni
CAMPIONAMENTO
12