Distribuciones Bidimensionales Métodos Lógico-Cuantitativos Ciencias de la Comunicación UDELAR
Distribuciones Bidimensionales • Se presenta en un cuadro de doble entrada. • Distribución conjunta de 2 variables. • Cada individuo investigado aporta el dato para cada una de las variables. • Se presentan los valores de cada individuo para cada una de las variables.
Distribuciones Bidimensionales Variable Dependiente (Y) Y X 1 2 3 4 5 6 7 8 1 2 2 17 1 0 0 1 0 2 2 9 31 1 1 0 4 0 3 1 0 0 0 0 0 0 0 4 0 1 1 1 0 0 0 0 1 0 5 0 Variable 5 12 49 3
Independien te (X)
FA de Y
23 48 1 3 75
FA de X
N
Distribuciones Bidimensionales • Al introducir un modelo de relación entre variables introducimos los conceptos de: Dependencia e Independencia ¡¡Mucha atención con estos conceptos!!.
Distribuciones Bidimensionales
• Detrás de la tabla debe haber una hipótesis que vincule las dos variables. • La Estadística solo puede medir asociación. • La DEPENDECIA es una presunción teórica del investigador. • La causalidad es inferida, no puede ser probada estadísticamente. • La determinación de Variable “dependiente” e “independiente” entonces, esta dada por el investigador y no lo puede determinar la estadística que solo puede medir asociación.
Distribuciones Categorías de Variable Dependiente Bidimensionales (Y)
Y
X
1
2
3
4
5
6
7
8
1
2 2 1 0
2 9 0 1
17 31 0 1
1 1 0 1
0 1 0 0
0 0 0 0
1 4 0 0
0 0 0 0
23
5
12
49
3
1
0
5
0
75
2 3 4
Cat. de Var. Independi ente (x)
48 1 3
Individuos que miden en las 2 variables (distribución conjunta)
N
Distribuciones Categorías de Variable Dependiente Bidimensionales (Y) Y X 1 2 3 4 5 6 7 8 1 Se presenta en un cuadro de 23 doble entrada 2 48 3 1 4 3 Cat. de 5 12 49 3 1 0 5 0 75 Var. Independi ente (X)
Distribución Marginal de Y
Dist Mar g. de X
N
Distribuciones Bidimensionales • La Frecuencia Absoluta de cada variable, que se acumula en los márgenes del cuadro, ahora se llama distribución marginal. • En la última fila se acumula la distribución marginal de la variable dependiente (Y). • En la última columna se acumula la distribución marginal de la variable independiente (X). • La suma de cada marginal da N.
Distribuciones Bidimensionales Las distribuciones bidimensionales son importantes para ver cuales son las categorías de una variable que mas se relacionan con categorías de la otra variable. Este tipo de relación se ve mas claramente cuando calculamos las Frecuencias Relativas de la Distribución Bidimensional. Debemos dividir cada uno de las Frecuencias conjuntas (cuadros) entre el numero N.
Distribuciones Categorías de Variable Dependiente Bidimensionales (Y) Salario
Cat. de Var. Inde pend iente (X)
9000-15000
157
72
42
12
2
285
Secundaria
72
132
21
7
2
234
Terciaria s/ terminar
43 35
55 37
80 86
75 110
90 343 126 394
307
296
229
204
220 125 6
Terciaria
Total
15000-21000 21000-27000 27000-33000
Total
Hasta 9000 Nivel Educativo Primaria
Individuos que miden en las 2 variables
Distribuciones Categorías de Variable Dependiente Bidimensionales (Y) salario Hasta 9000
Cat. de Var. Inde pend iente (X)
9000-15000 1500021000
2100027000
2700033000
Total
Primaria
0,13
0,06
0,03
0,01
0,00
0,23
Secunda ria
0,06
0,11
0,02
0,01
0,00
0,19
Terciaria s/ terminar
0,03
0,04
0,06
0,06
0,07
0,27
Terciaria
0,03
0,03
0,07
0,09
0,10
0,31
Total
0,24
0,24
0,18
0,16
0,18
1,00
Individuos que miden en las 2 variables (distribución conjunta)
Distribuciones Bidimensionales X
Y
1
2
3
4
5
6
1 2
3 4 5
1
Cuando los datos en una distribución bidimensional siguen este modelo, podemos decir que presenta categorías asociadas en la diagonal principal. La relación es directa, cuando aumentan los valores en una variable, también aumentan en la otra. Esto no es válido para variables nominales.
Distribuciones Bidimensionales 1
X 1 2 3 4 5
2
Y 3
4
5
6
1
Cuando las distribución bidimensional sigue este modelo, podemos decir que presenta categorías asociadas en la diagonal secundaria. La relación es inversa, cuando aumentan los valores en una variable, disminuyen en la otra. Esto no es válido para variables nominales.
Distribuciones Condicionadas • Otra forma de análisis de una distribución bidimensional es analizar una variable condicionada por las categorías de la otra variable. • Tenemos que dividir las frecuencias conjuntas de la distribución entre las frecuencias marginales de la variable que condiciona. • Este cuadro es mejor visualmente si lo calculamos en porcentajes, por lo tanto es conveniente multiplicarlo por 100. frecuencia relativa ( ci d i ) =
frecuencia conjunta ( ci , d j ) frecuencia marginal ( d j )
*100
Distribuciones Condicionadas Hasta 9000
9000-15000
15000-21000
21000-27000
27000-33000
Nivel Educativo Primaria
157/307*100
72/296*100
42/229*100
12/204*100
Secundaria
72/307*100 Terciaria s/ terminar
132/296*100
2/229*100
2/220*100
Total
285/1256*10 0 234/1256*10 0
43/307*100
Terciaria
Total
307/307*100
296/296*100
229/229*100 204/204*100
1256/1256*1 220/220*100 00
Distribuciones Condicionadas Hasta 9000
9000-15000
15000-21000
21000-27000
27000-33000
Total
Nivel Educativo Primaria
51,14
18,34
15,04
0,91
0,91
24,02
Secundaria
23,45
44,59
9,17
3,10
0,91
18,31
Terciaria s/ terminar
14,01
18,58
34,93
33,19
40,91
26,84
Terciaria
11,40
12,50
37,55
48,67
57,27
30,83
Total
100,00
100,00
100,00
100,00
100,00
100,00
• Vemos la variable Nivel Educativo condicionada por Salario. • De cada 100 individuos que ganan hasta 9000, el 51,14% solo curso primaria. El 23,45 curso secundaria y así sucesivamente.
Hasta 9000
Distribuciones Condicionadas 9000-15000
15000-21000
21000-27000
27000-33000
Total
Nivel Educativo Primaria
51,14
18,34
15,04
0,91
0,91
24,02
Secundaria
23,45
44,59
9,17
3,10
0,91
18,31
Terciaria s/ terminar
14,01
18,58
34,93
33,19
40,91
26,84
Terciaria
11,40
12,50
37,55
48,67
57,27
30,83
Total
100,00
100,00
100,00
100,00
100,00
100,00
• Si comparamos el marginal columna con las frecuencias condicionadas en cada fila, tenemos una clara referencia de asociación. • Si el marginal columna difiere de los valores de cada fila, hay asociación. Si en todas la fila hay el mismo valor no hay asociación.
Distribuciones Condicionadas • Otra forma de observar la asociación entre dos variables es describir cómo varía la media de la variable dependiente en función de la variable independiente. Estrictamente, este razonamiento conduce a estudiar cómo cambia la media de la distribución de la variable dependiente condicionada a los valores de la variable independiente. Este análisis de la media convierte a la estrategia útil solo para variables cuantitativas.
Distribuciones Condicionadas Salario (Y)
3000-9000
Nivel Educativo(X)
MC 6000
9000-15000 15000-21000 21000-27000 27000-33000 MC 12000
MC 18000
MC 24000
MC 30000
Media Total
157 72 43
72 132 55
42 21 80
12 7 75
2 2 90
285 234 343
10211
Terciaria
35
37
86
110
126
394
21883
Total
307
296
229
204
220
1256 16213
Primaria Secundaria Terciaria s/ terminar
Utilizamos para el cálculo la Marca de Clase
11205 19994
Distribuciones Conjuntas Las estrategias de análisis que recorrimos, tanto para bidimensionales como para condicionadas funcionan tanto para variables cualitativas, como para variables cuantitativas. Los estadísticos que se utilicen para el análisis dependerán del nivel de medición de la variable.