Fakulteta za socialno delo
METODOLOGIJA RAZISKOVANJA V SOCIALNEM DELU I/7 Blaž Mesec
2006/07
© B. Mesec, Metodologija I
1
Metodologija raziskovanja v socialnem delu s statistiko I
7 VZORČENJE
2006/07
© B. Mesec, Metodologija I
2
Vzorčenje kot možnost Kaj nameravamo? Opisati en primer, skupino, organizacijo? > Kvalitativna raziskava Najti posameznike z določenimi značilnostmi (ki potrebujejo pomoč)? > popis Ugotoviti strukturne značilnosti neke množice (kategorije) ljudi? > popis ali vzorčenje
2006/07
© B. Mesec, Metodologija I
3
Množični pojav, populacija Množični pojav = pojav, ki se v času in prostoru ponovljeno pojavlja (breza, krava, človek, občina, csd) Populacija ali statistična množica = skupina enot množičnega pojava, ki ustreza določenim opredeljujočim pogojem 2006/07
© B. Mesec, Metodologija I
4
Populacija: opredeljujoči pogoji, primeri Opredeljujoči pogoji populacije: Stvarni, krajevni, časovni Primer: Populacijo sestavljajo študentje 2. letnika FSD (stvarni pogoj) v Ljubljani, (krajevni pogoj) vpisani v š.l. 2006/2007 (časovni pogoj).
2006/07
© B. Mesec, Metodologija I
5
Populacija: vrste
Posamezniki (študentje FSD) Skupine (vzgojne skupine v zavodu) Skupnosti (krajevne, občine) Organizacije (invalidske o., strokovna društva, csd, šole)
2006/07
© B. Mesec, Metodologija I
6
Popis in vzorčenje Popis: zberemo podatke o vsaki enoti populacije Vzorčenje: iz populacije izberemo le določeno število enot, o katerih zberemo podatke; ugotovitve o teh enotah posplošimo, kot da veljajo za celotno populacijo 2006/07
© B. Mesec, Metodologija I
7
Vzorec ali delna populacija
Delna populacija: Populacijo študentov 2. l. FSD sestavljajo redni in izredni študentje. Redni (izredni) študentje so del populacije ne vzorec. Kako bi sestavili vzorec?
S slučajnostnim izborom, npr. vsakega četrtega študenta izmed vseh rednih in izrednih.
2006/07
© B. Mesec, Metodologija I
8
Vzorčenje populacija
posplošimo
vzorec
izberemo 2006/07
© B. Mesec, Metodologija I
9
Popis ali vzorčenje Popis izvedemo, če Populacija < 500 Hočemo odkriti posameznike z določeno značilnostjo (potrebo po pomoči) Hočemo prave (točne) vrednosti Vzorčenje izvedemo, če Populacija > 500 Hočemo le strukturne podatke za populacijo (%) Se zadovoljimo z določenim odstopanjem od pravih vrednosti 2006/07
© B. Mesec, Metodologija I
10
Vzorčenje: osnovna zahteva Vzorec mora predstavljati (reprezentirati) populacijo. Vzorec predstavlja populacijo, če je izbran slučajnostno (z žrebanjem enot populacije, ki pridejo v vzorec, in podobnimi postopki). Pod določenimi pogoji predstavljajo populacijo tudi neslučajnostni vzorci. 2006/07
© B. Mesec, Metodologija I
11
Vrste vzorcev
Slučajnostni – Enostavni slučajnostni – Sistematični – Slojeviti (stratificirani)
Neslučajnostni – Priročni – Namenski – Kvotni
2006/07
© B. Mesec, Metodologija I
12
Enostavni slučajnostni vzorec/1
Žrebanje
Vzorčenje s ponavljanjem: izžrebano enoto vrnemo v boben. Vsaka enota ima ves čas enako verjetnost, da bo izbrana. Npr. 1/900
Vzorčenje brez ponavljanja: izžrebane enote ne vrnemo v boben. Vsaka naslednja enota ima večjo verjetnost, da bo izbrana. Npr. 1/900, 1/899, 1/898, 1/897, 1/896 itd.
2006/07
© B. Mesec, Metodologija I
13
Enostavni slučajnostni vzorec/2
Tabela slučajnih števil (izsek) 7526 5172 2023 3632 0761
2006/07
7460 1898 0950 3816 2838
5644 6030 1896 4575 6166
© B. Mesec, Metodologija I
8640 6677 4729 0738 8534 14
Enostavni slučajnostni vzorec/3 > Postopek izbiranja vzorčnih enot iz populacije Vpisna štev.
Ime
202
A.A.
037
A.B.
163
A.S.
073
B.M.
005
B.Š.
017
B.V.
002
B.E.
189
B.T.
018
D.S.
2006/07
Oddelimo po tri prve cifre v vsakem stolpcu ! ! ! ! 7526 7460 5644 8640 5172 1898 6030 6677 2023 0950 1896 4729 3632 3816 4575 0738 0761 2838 6166 8534 ! ! ! ! V vzorec pridejo enote 202, 073, 189 © B. Mesec, Metodologija I
15
Enostavni slučajnostni vzorec/4 Prednosti Preprost postopek Ni treba imeti podatkov o značilnostih populacije Preprost izračun napake ocene Pomanjkljivosti Potrebno oštevilčiti vse enote populacije
2006/07
Možnost nereprezentativ. vzorca Manjša točnost ocen Stroški pri geogr. razpršeni populaciji Možnost izpada majhnih subpopulacij Zavržemo podatke o slojih (subpopulacijah), če obstajajo
© B. Mesec, Metodologija I
16
Sistematični vzorec/1 > postopek 1. 2.
3.
4. 5.
Seznam enot populacije. Odločitev za velikost vzorca (želena točnost ocen? Razpršenost lastnosti v populaciji?) Izračun vzorčnega razmerja (N/n; npr. 1000/10 = 10) in določitev intervala izbora Izbor vsake 10. enote (3., 5., 15., 20. …) Prvo enoto izberemo naključno (datum, tabela slučajnih števil)
2006/07
© B. Mesec, Metodologija I
17
Sistematični vzorec/2 > lastnosti Prednosti Preprost izbor Če je interval primeren, vključuje vse sloje Večja točnost ocen kot pri enostav. slučaj. Vzorcu Omogoča uporabo podatkov o slojih (subpopulacijah), če so
2006/07
Pomanjkljivosti Moramo imeti seznam populacije Nevarnost periodičnega ponavljanja enot določene vrste v seznamu Če seznam ni razdeljen po slojih, podoben enost. slučajnostnemu
© B. Mesec, Metodologija I
18
Slojevit (stratificiran) vzorec/1 > definicija, vrste Definicija: Če je populacija razdeljena na sloje (subpopulacije, razrede, razdelke) iz vsakega sloja izberemo enote v vzorec. Vrste: proporcionalen izbor, neproporacionalen izbor 2006/07
© B. Mesec, Metodologija I
19
Slojevit (stratificiran) vzorec/2 > postopek Populacijo razdelimo na sloje (razrede, razdelke) oz. upoštevamo obstoječo delitev. Sestavimo sezname enot po slojih. Izračunamo vzorčno razmerje in določimo velikost vzorca (npr. 10%). Iz vsakega sloja izberemo 10% enot (proporcionalni izbor) oz. iz vsakega sloja enako abs. število (=drugačen %) (disproporcionalni izbor) s sistematičnim ali enostav. slučaj. izborom. 2006/07
© B. Mesec, Metodologija I
20
Slojevit (stratificiran) vzorec/2 > slika populacija
posplošimo
vzorec izberemo
2006/07
© B. Mesec, Metodologija I
21
Slojevit (stratificiran) vzorec/3 > primer proporcionalnega, disproporcionalnega vzorčenja IZOBRAZBA
IZOBRAZBENA STRUKTURA POPULACIJE ŠTEV.
PROPORCIONALNO STRATIFICIRAN
%
ŠTEV.
%
DISPROPORCIONALN O STRATIFICIRAN ŠTEV.
%
NIŽJA
100
10
20
10
70
33,3
SREDNJA
300
30
60
30
70
33,3
VIŠJA
600
60
120
60
70
33,3
200
100
210
100,0
SKUPAJ
1000 2006/07
© B. Mesec, Metodologija I
22
Slojevit (stratificiran) vzorec/4 > prednosti in pomanjkljivosti Pomanjkljivosti
Prednosti
Bolj reprezentativen kot enost. slučaj. Vključuje tudi manjše sloje Bolj točne ocene pri manjših vzorcih
2006/07
Zahteva predhodne podatke o sestavi populacije Zamudno sestavljanje delnih vzorcev Možnost napak pri uvrščanju enot Računanje napake ocene zapleteno
© B. Mesec, Metodologija I
23
Priročni vzorec Opredelitev: Skupino, ki nam je dostopna, vzamemo kot vzorec (predstavnico) širše populacije. Primer: Študentje psihologije ‘predstavljajo’ “človeštvo” Udeleženci seminarja ‘predstavljajo’ populacijo slov. socialnih delavcev Pogoj posploševanja: Posplošujemo lahko, če domnevamo, da se enote vzorca v relevantnih lastnostih ne razlikujejo od enot populacije (študent = človek; študentje FSD ne predstavljajo populacije vseh študentov UNI-LJ) 2006/07
© B. Mesec, Metodologija I
24
Namenski vzorec Opredelitev: Subpopulacijo, za katero je ugotovljeno, da je tipična, povprečna, vzamemo kot predstavnico celotne populacije. Primer: CSD, ki ima povprečno kadrovsko strukturo, strukturo zadev, uporabnikov, lahko predstavlja celotno populacijo CSD v Slo. 2006/07
© B. Mesec, Metodologija I
25
Kvotni vzorec Opredelitev: Iz stratificirane populacije vzamemo iz vsakega stratuma določeno število enot po načelu priročnosti. Primer: Anketar dobi nalogo, da anketira po 10 oseb vsake stopnje izobrazbe (N, S, V). 2006/07
© B. Mesec, Metodologija I
26
Parametri in vzorčne ocene/1 Parameter = prava vrednost variable, ki jo dobimo, če populacijo popišemo (označujemo z grškimi črkami: μ) Vzorčna ocena = vrednost variable, ki jo dobimo na osnovi vzorca (bolj ali manj odstopa od prave vrednosti; označujemo z lat. črkami: ẍ, p)
2006/07
© B. Mesec, Metodologija I
27
Parametri in vzorčne ocene/2 populacija Izračunam o oceno ẍ vzorec Izračunamo μ
parameter 2006/07
© B. Mesec, Metodologija I
28
Značilnosti vzorčnih ocen
Točnost – netočnost
Nepristranskost – pristranskost
Nespremenljivost (natančnost) – spremenljivost (nenatančnost)
2006/07
© B. Mesec, Metodologija I
29
>Točnost vzorčne ocene: definicija
Točnost: razlika med vzorčno oceno in pravo vrednostjo (parametrom); izrazimo kot napako ocene (e) e=ẍ-μ Točnosti običajno ne moremo neposredno izračunati, ker ne poznamo parametra; če bi poznali parameter, ne bi bilo treba vzorčiti = paradoks vzorčenja Točnost ocenimo iz odnosov med značilnostmi populacije in vzorca kot verjetnost napake določene velikosti.
2006/07
© B. Mesec, Metodologija I
30
Točnost vzorčne ocene/2: primer
Mesec, Majcen, Družbeni položaj starejših občanov Ljubljane (1984)
Starost 65-69
populacija n % 10.258 32,97
vzorec n 239
% 32,74
70-74
8.945
28,75
206
28,22
75+
11.910 38,28
285
39,04
skupaj 31.113 100,00 730
100,00 = 2,35 %
2006/07
© B. Mesec, Metodologija I
31
sx =
1 n
sx
1 Točnost vzorčne ocene/3 = >odvisnost od velikosti vzorca: n Napaka ocene je tem manjša, čim večji je vzorec – napaka se manjša s kvadratnim korenom velikosti vzorca. napaka ocene: n = numerus, velikost vzorca S = 1 (privzamemo v naslednjih računih) 2006/07
s sx = n
© B. Mesec, Metodologija I
32
Točnost vzorčne ocene/4 Velikost vzorca Napaka ocene
Odvisnost napake ocene od velikosti vzorca
2006/07
100
0,10
200
0,07
300
0,06
400
0,05
500
0,04
1.000
0,03
2.500
0,02
10.000
0,01
© B. Mesec, Metodologija I
33
Velikost populacije in vzorca/1 Pri predvolilnih javnomnenjskih anketah Populacija volivcev Slo: ca 1,500.000 Vzorec telefonske ankete: ca 1.000 Velikost vzorca v %: 0,067
2006/07
© B. Mesec, Metodologija I
34
Velikost populacije in vzorca/2 Absolutna velikost populacije
Absolutna Vnaprej velikost izbrana 1% vzorca absol. velikost vzorca
Relativna Napaka velikost ocene vzorca v % (s=1)
1,000.000
10.000
1.000
0,1
0,03
100.000
1.000
1.000
1
0,03
10.000
100
1.000
10
0,03
1.000
10
1.00
10
0,09
100
1
30
30
0,15
2006/07
© B. Mesec, Metodologija I
35
Velikost populacije in vzorca/3
Vzorec je lahko relativno (%) tem manjši, čim večja je populacija.
Čim manjša je populacija, tem večji mora biti, relativno (%), vzorec.
2006/07
© B. Mesec, Metodologija I
36
Točnost vzorčne ocene/4 >odvisnost od spremenljivosti znaka v populaciji
Točnost ocene je tem večja (napaka ocene je tem manjša), čim manjša je razpršenost značilnosti v populaciji (=čim bolj homogena je populacija glede na dano značilnost) Čim bolj homogena je populacija, tem manjši vzorec bo dal zahtevano točnost.
2006/07
© B. Mesec, Metodologija I
37
>Nepristranskost vzorčnih ocen Ocena je nepristranska, če je imela vsaka enota populacije enako možnost, da bo izbrana v vzorec. = če je vzorčenje slučajnostno Primer: loterijsko žrebanje V nasprotnem primeru je ocena pristranska. Primer: Literary Digest 2006/07
© B. Mesec, Metodologija I
38
>Nespremenljivost vzorčnih ocen
Nespremenljivost (natančnost) ocene je verjetnost, da dobimo točno oceno.
Če bi iz iste populacije vzeli več vzorcev, bi se pri nekaterih postopkih in značilnostih ocene bolj razlikovale, pri drugih pa manj.
2006/07
© B. Mesec, Metodologija I
39