Estadistica Ii.docx

  • Uploaded by: JHON SABOGAL
  • 0
  • 0
  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica Ii.docx as PDF for free.

More details

  • Words: 1,912
  • Pages: 10
Tamaño de muestra Utilizando la variable edad (P6040), realice lo siguiente: ● Realice un histograma y describa la información según la forma y la curtosis de los datos. El en histograma se evidencia lo siguiente: Clase 10 20 30 40 50 60 70 80 90 y mayor...

Frecuencia 55 68 56 50 52 42 31 11 5 0

Histograma 80 70

Frecuencia

60 50 40 30 Frecuencia

20 10 0

Clase

En el histograma se puede evidenciar que la asimetría de la distribución en la edad de la muestra de la población tiene un sesgo positivo, por lo cual la moda del conjunto de datos es mayor a la mediana y la misma es mayor a la media, adicional a que la curtosis es platicurtica dado que la frecuencia de los datos no cuenta con grandes variaciones.



Realice una descripción numérica y descripción como es la población.

Clase

Frecuencia

porcentaje de Análisis participación

10 20 30 40 50 60 70 80 90 Total

55 68 56 50 52 42 31 11 5 370

15% 18% 15% 14% 14% 11% 8% 3% 1% 100%

El 15% tiene una edad entre los 0 y 10 años El 18% tiene una edad entre los 10 y 20 años El 15% tiene una edad entre los 20 y 30 años El 14% tiene una edad entre los 30 y 40 años El 14% tiene una edad entre los 40 y 50 años El 11% tiene una edad entre los 50 y 60 años El 8% tiene una edad entre los 60 y 70 años El 3% tiene una edad entre los 70 y 80 años El 1% tiene una edad entre los 80 y 90 años

Se puede evidenciar que la desviación estándar es alta por lo cual los datos no son simétricos, de igual manera concluimos lo siguiente el 18% de la muestra de la población tiene una edad de 10 a 20 años y que el 15% tiene entre 20 y 30 años, por otro lado el 28% entre 30 y 50 años, lo que nos indica que la mayoría de la población se ubica en una edad menor a los 60 años, por lo cual podemos evidenciar que en los departamentos analizados las edades más frecuentes son la niñez, la adolescencia, los adultos jóvenes y los adultos, la menor cantidad está en los adultos mayores, donde también se evidencia que la desviación estándar ya que los datos no son simétricos.



Calcule una nueva variable que sea el

En cuanto a la realización de ala variable se tomo en cuenta lo siguiente:

Clase 5 10 15 20 y mayor...

Frecuencia 67 121 125 57 0

Histograma Frecuencia

150 100 50

Frecuencia

0 5

10

15

20

y mayor...

Clase

En el histograma de P6040NEW se puede evidenciar que la asimetría de la distribución en la edad de la muestra de la población es normal, adicional a que la curtosis es mesocúrtica dado que la frecuencia de los datos cuenta con variaciones medias.



Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente fórmula:

Donde, se tiene lo siguiente: Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca. S: Es la desviación estándar de la variable. Es el margen de error absoluto. Para el calculo de la muestra utilizo lo siguiente:

𝑛0 =

1.962 ∗ 20.882657 = 320.891260 0.52

𝑛=

320.891260 = 319.193763 320.891260 1+ 60356

Así que la muestra a tomar es de 320.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto que no supere 0.5. Z=1.96 S=4.5266 Margen de error de 0.5 1.962 4.52662 = 314.8591 0.52 314.8591 𝑛= = 170.1048 314.8591 1+ 370

𝑛0 =

Se tomará una muestra de 170



Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra, utilizando el algoritmo del coordinado negativo. A cada individuo se le asigna una probabilidad aleatoria generada de una distribución uniforme 0,1 luego se ordenan los datos de menor a mayor tomando como referencia la probabilidad. Luego selecciono los 170 primeros datos ●

Compara la media poblacional, con la media muestral y determine la variación relativa. Para calcular la variación relativa usamos: 𝑠 20.524209 ∗ 100% = ∗ 100% = 59.1576% 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 34.69411 Vemos que la variación relativa es alta, por lo tanto, tenemos en esta nueva muestra mucha variación de las edades, es decir los datos esta muy dispersos, ahora comparando la edad poblacional con la edad muestral vemos que la muestral es mayor que la poblacional, es decir, la edad promedio poblacional es de 33.5486 años y la muestral es de 34.694 años, vemos que se incremento un poco la edad de esta nueva muestra. 𝑐𝑣 =

Intervalo de confianza para dos variables numéricas Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:



Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias? Cuenta P6020 163 207

P6020 Hombre Mujer

de

250

Escolaridad

200

150

100

50

0 HOMBRE

MUJER

Como vemos el grado de escolaridad en las mujeres es mas alto que en los hombres como vemos hay mas frecuencia de mujeres que hombres, posiblemente eso ayude a que las mujeres tengas mayor escolaridad. ●

Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de resultados.

ESC Hombre Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta

ESC Mujeres 6,766871166 0,374484478 6 11 4,781097751 22,85889571 -0,82165222 0,31210214 18 0 18 1103 163

Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta

7,946859903 0,334541761 8 11 4,813217773 23,16706533 -0,89303957 -0,09231937 19 0 19 1645 207

Como vemos el la media del escolaridad de los hombres es menor que la de las mujeres, ambos tiene desviaciones estándar muestrales muy similares.



Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la escolaridad de los hombres y de las mujeres de forma individual. Intervalo de confianza para las mujeres: 4.8132 7.9468 ± 𝑇207−1,0.025 √207 Calculado el 𝑡206 ,0.025 = 1.97 de la tabla de la normal. Se tiene que el intervalo de confianza con un nivel de significancia del 5% es de 4.8132 7.9468 ± 1.97 ∗ √207 (7.2877,8.6058) Intervalo de confianza para las Hombres: 6.7668 ± 𝑇163−1,0.025

4.7810

√163 Calculado el 𝑡162 ,0.025 = 1.97 de la tabla de la normal. Se tiene que el intervalo de confianza con un nivel de significancia del 5% es de 4.7810 6.7668 ± 1.97 ∗ √163 (6.0290,7.5045)



Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.

4.81322 4.78102 7.9468 − 6.7668 ± 𝑡𝑉,0.025 √ + 207 163 Donde 𝑣

=

[

4.8132 207

4.81322

(

2

207

+

4.7810 163

2

]2

2 2 4.78102 ) ( 163 )

207−1

+

= 348.96

163−1

Se tiene que v es 349, y calculando la así que calculando 𝑡349,,0.025 = 1.96 el intervalo de confianza da que es: 4.81322 4.78102 1.18 ± 1.96√ + 207 163 (0.1957,2.1642)

Prueba de hipótesis para dos variables nominales Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y realizar lo siguiente: Antes de realizar las siguientes pregunta se planea la siguiente tabla para tener una mejor comprensión sobre la información que se pretende investigar

Sexo

Percepción del encuestado No

Hombre Mujer Total general

12 13 25

No Responde 118 153 271

Sí 33 41 74

Total general 163 207 370

Ahora se planea la proporción

Sexo

Percepción del encuestado Sí

Hombre

20,25%

No Responde 72,39%

No 7,36%

Total general 100,00%

Mujer Total general



19,81% 20,00%

73,91% 73,24%

6,28% 6,76%

100,00% 100,00%

Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

EL ESTABLECIMIENTO AL QUE ASISTE ... ¿ES OFICIAL? 80.00% 70.00%

73.91%

72.39%

60.00% 50.00% Sí 40.00%

No Responde No

30.00% 20.00% 20.25%

19.81%

10.00% 7.36%

6.28%

0.00% Hombre

Mujer

de la gráfica comparando hombres con mujeres, los que dicen que si que asistieron a un colegio oficial (barra azul) es muy poca, para hombres es de 20.25%, mientras que las mujeres es de 19,81%, esta diferencia muy pequeña, seguido tenemos la información de los que “No Responde” esta tiene la proporción mas grande en ambos sexos, finalmente los que responden “No” (barra gris) son muy poquitos en comparación con las otras respuestas, en ambos notamos que la diferencia entre hombres y mujeres respondiendo a esta pregunta es muy similar. Para los siguientes puntos usaremos la fórmula:

𝑝̂ ∗ (1 − 𝑝̂ ) 𝑝̂ ± 𝑍𝛼 √ 𝑛 2 Con 𝑍0.05 = 1.96 n=370 2



Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento oficial. Estimamos la proporción de hombres que afirman que asistieron a colegio oficial, la información la tomamos de la tabla anterior

𝑃=

33 = 0.2025 163

0.2025 ∗ (1 − 0.2025) 0.2025 ± 1.96√ 163

El intervalo de confianza para la proporción de hombres es (0.1408,0.2641) Por lo tanto, con una confianza del 95% de que el intervalo de confianza contenga el verdadero valor de la proporción de hombres que afirman que sí. ●

Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento oficial.

𝑃=

41 = 0.1981 207

0.1981 ∗ (1 − 0.1981) 0.1981 ± 1.96√ 207

El intervalo de confianza para la proporción de mujeres es (0.1438, 0.2523) lo cual nos indica que con una confianza del 95% el intervalo de confianza contiene el verdadero valor de la proporción poblacional de las mujeres que afirman que si asistieron a colegio oficial ●

Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Prueba de Hipótesis a trabajar

𝐻0 : 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑣𝑠 𝐻𝑎 : 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 > 𝑃𝑀𝑢𝑗𝑒𝑟𝑒𝑠 Estadístico de prueba: 𝑍=

𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 − 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 − (𝜋1 − 𝜋2 ) √𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 ∗ (1 − 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 ) + 𝑛

𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 ∗ (1 − 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 ) 𝑚

Información para reemplazar en el estadístico de prueba n=163 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 0.2025 m=207 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 0.1981 (𝜋1 − 𝜋2 ) = 0 𝑍=

0.2025 − 0.1981 − 0 √0.2025 ∗ (1 − 0.2025) + 0.1981 ∗ (1 − 0.1981) 163 207

= 0.1049351

Se calcula el siguiente el valor crítico con un nivel de significancia es del 5% 𝑍𝛼 = 𝑍0.05 = 1.64 El valor critico lo comparamos con el valor de Z, vemos que el valor de Z es menor al valor crítico, ósea 0.1049 < 1.64 entonces concluimos, con una confianza del 95% que la proporción de mujeres y hombres que afirman asistir a colegios oficiales es igual. Ósea la hipótesis nula 𝐻0 𝑃𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑃𝑚𝑢𝑗𝑒𝑟𝑒𝑠 no se rechaza.

Related Documents

Estadistica
November 2019 25
Estadistica
August 2019 43
Estadistica
June 2020 19
Prova Estadistica
May 2020 5

More Documents from ""

Estadistica Ii.docx
November 2019 11
Mml-2w.docx
December 2019 12
Simuladores2003-2
November 2019 40
Aprendizaje Wikipedia
May 2020 29
May 2020 29