Guia De Estadistica 2019-i.docx

  • Uploaded by: Luis Eduardo Acevedo Romero
  • 0
  • 0
  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Guia De Estadistica 2019-i.docx as PDF for free.

More details

  • Words: 9,309
  • Pages: 52
[Escriba aquí]

Guía de estudios 2019-1

Estadística Docente: Dra. Dany B. Lázaro Silva.

Pertenece a:

Estadística

2019-I

Este material ha sido preparado para que sea utilizado en las actividades del curso, tanto en clase como en el desarrollo de actividades por encargo. Aquí podrás hacer tus anotaciones de clase y ejercitarte para lograr el dominio esperado en este curso. Sácale provecho al material.

Recomendaciones:



Ser puntuales en el ingreso a las aulas, los controles y trabajos para la continua se tomaran o recibirán en los primeros minutos. La inasistencia a una evaluación es calificada con nota 0 (cero).



Para el registro de la asistencia en el sistema, la tolerancia será de 5 minutos, pasado los cuales no se considerará asistencia en el sistema (va para el cómputo del DPI).



Los celulares deberán mantenerse apagados durante las clases. La interrupción por el uso de ellos generará la disminución de un punto (cada vez) sobre el promedio de las notas continuas a todos los estudiantes de la sección.



Durante el curso de Estadística nos dedicaremos en exclusivo al mismo, por ello traeremos calculadoras (con cálculo de raíz cuadrada).



Cuando algún compañer@ participe los demás debemos escuchar.



Cumplir con la presentación de los trabajos indicados en la fecha prevista; no se aceptarán trabajos fuera de fecha.

2

Estadística

2019-I

Contenido: Historia. tipos. usos en la vida cotidiana y en campos especializados. análisis de la realidad. variables: definición, tipos; unidad de análisis.

Historia de la estadística

Toma nota de algunos datos relevantes:

Etapas de la historia de la estadística: Etapas Inicial

Sistemática

Contemporánea

Eventos Comprendida desde la antigüedad hasta mediados del siglo XVIII. Vinculada a los censos poblacionales, registro de bienes y servicios de un Estado. En Alemania se crea la primera cátedra de Estadística. En Inglaterra los aritméticos políticos, intentaron cuantificar las leyes empíricas que rigen los fenómenos políticos y sociales. En Francia se origina la Escuela Probabilística (basada en juegos de azar). En la URSS se axiomatiza el cálculo de probabilidades, dándole mayor rigor científico a la misma. Se extiende desde principios del siglo XIX hasta nuestros días. El desarrollo de la Estadística se fundamenta científicamente, a partir de los años 30, a raíz de los problemas planteados en la sociedad industrial y por el desarrollo de otras ramas de la Matemática. 3

Estadística

2019-I

Lectura HISTORIA DE LA ESTADÍSTICA Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Herodoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio. Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos. Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico. 4

Estadística 2019-I Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística. Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía o permanecía estática. En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros. Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones. Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones. Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las físicas. Recuperado de: http://estadisticaaplicadaproyecto.wikispaces.com/Estadistiva+Descriptiva, el 20/12/2012 Trabajo por encargo 1 Apoyado en la información de la clase, la lectura y otras fuentes que puedas utilizar (no olvide citarlas en el trabajo), elabore un gráfico (línea de tiempo u otro) para mostrar la historia de la estadística. Se debe presentar en la próxima clase. 5

Estadística

2019-I

Trabajo de investigación estadística Formar grupos de máximo 4 estudiantes. El trabajo de investigación se desarrollará de manera progresiva conforme se desarrollen los temas en las sesiones de clase. La presentación de los avances corresponde a las evaluaciones continuas, mientras que el informe final se vincula al Examen Final.

Estado

Avance 1

Avance 2 Avance 3

Avance 4 Informe final

Trabajo de investigación estadística Actividad Se presenta y corresponde a: Selección de tema de investigación, Aportes Semana 3 teóricos e identificación de la población y Continua 1 muestra. Elaboración del instrumento de recolección de datos Aplicación del instrumento de recolección de datos Procesamiento de datos 1: Distribución de frecuencias Procesamiento de datos 3: Medidas de dispersión Presentación y breve exposición del informe final

Semana 6 Continua 2 Semana 10 Continua 3

Semana 13 Continua 4 Semana 14

Aporta el

25 % de la nota

25% de la nota

25% de la nota

25% de la nota 25% de la nota de la Prueba final

Debe tener como mínimo 20 ítems: 4 datos generales (por lo menos 1 corresponderá a una variable ordinal), 1 pregunta de filtro, 8 sobre variables cuantitativas y 7 sobre variables cualitativas. El instrumento deberá aplicarse a 20 personas, como mínimo.

6

Estadística

2019-I

¿Cómo se registra información en una ficha?

7

Estadística

2019-I

Definición de estadística Etimológicamente:

Definiciones: Conceptos claves de la definición 1:

Conceptos claves de la definición 2:

Trabajo por encargo 2 1. Elaborar tres fichas textuales sobre definiciones de estadística, utilizando fuentes bibliográficas. 2. Realice una ficha de comentario sobre la definición. 3. Elabora un mapa mental o conceptual sobre su propia definición de estadística

Tipos de estadística De acuerdo a las funciones que realiza, pueden ser: Tipos Propósito Las conclusiones son válidas para Método que utiliza para el análisis

8

Estadística Trabajo por encargo 3

2019-I

1. Selecciona y adjunta como mínimo 3 artículos periodísticos o académicos en los que se observe el uso de la estadística. 2. Resalta la información estadística y coméntala.

9

Estadística

2019-I

Las variables Se llama variable porque

Se opone a constante porque

Ejemplo 1: Artistas Variables

Valores (dominio de variación)

Constantes y sus valores

Ejemplo 2: Cantantes Variables

Valores (dominio de variación)

10

Estadística

2019-I

Constantes y sus valores Las variables se denotan (se reemplazan o codifican) con las últimas letras del alfabeto (x, y, z) mientras que los valores que pueden tomar se los identifica con la letra acompañada de un número sub índice. Por ejemplo:

Variable: Sexo Denotación: X Valores de dominio: X1: Masculino X2: Femenino Ejercicio 1: Si quisiéramos estudiar las características de los estudiantes que se encuentran en el aula; ¿cuáles serían las variables y sus dominios de variación? Variables

Denotación

Valores (dominio de variación)

Tipos de Variables Las variables toman distintos criterios para poder clasificarlas; en el curso tomaremos como criterio su naturaleza, de esta manera tenemos tres tipos de variables: • •

Ordinales Nominales

Cualitativas

• •

Continuas Discretas

Cuantitativas

11

Estadística 2019-I Las cualitativas expresan cualidades o atributos que no son susceptibles de cuantificar, no hacen uso de los números, en cambio se pueden clasificar o categorizar. Por ejemplo:

Las ordinales pueden utilizar los números para expresar orden, pero no se puede hacer operaciones aritméticas con ellos. Admiten relaciones de tipo mayor que- menor que, antes que-después que. Por ejemplo:

Las nominales solo permiten la clasificación o categorización, no se puede establecer ningún tipo de orden para establecer jerarquías o valores. Por ejemplo:

Las cuantitativas utilizan escalas de medición, se pueden medir o contar, representan magnitudes y se puede realizar operaciones aritméticas con ellas, que tienen un significado. Por ejemplo:

Las discretas se expresan en números enteros, son el resultado de contar. Por ejemplo:

Las continuas se expresan en cualquier número, admite valores decimales o fraccionales, son el resultado de medir. Por ejemplo:

12

Estadística

2019-I

Ejercicio 2: Relacione las variables con el tipo, según corresponda: Variable Cualitativa Ordinal = 1 , Variable Cualitativa Nominal= 2 , Variable Cuantitativa Discreta= 3 y Variable Cuantitativa Continua= 4. Variable

Tipo

Variable

Magnitud de consumo de huevos

Religión

Carrera profesional

Litros de leche adquiridos

Estatura

Nivel de instrucción

Posición que ocupa entre los hijos

Estado civil

Autor preferido

Estado de las carreteras

Actividades deportivas

Años de estudio

Kilometraje de buses interprovinciales

Jerarquía de puestos en la organización

Ritmo cardiaco

Marca de automóvil preferido

Lugar de origen

Ingreso anual

Tipo

Unidad de Análisis Representan los “objetos de investigación”, sobre quienes o qué trata el estudio, son los que portan la variable. Por ejemplo: •

Se quiere hacer una investigación sobre los colores favoritos de los niños para lanzar un nuevo producto escolar, dirigido a desarrollar actividades lúdicas.

¿Cuál es la variable de estudio? ¿A quién le preguntamos (unidad de análisis) por la variable de estudio?



Se quiere hacer una investigación sobre las características básicas que deben tener los arquitectos egresados de UCAL

¿Cuál es la variable de estudio? ¿A quién le preguntamos (unidad de análisis) por la variable de estudio?

13

Estadística Trabajo por encargo 4

2019-I

En el artículo siguiente, identifica las variables y responde a lo solicitado en el cuadro.

Perú tiene casi 8.5 millones de jóvenes pero ¿cuántos tienen educación superior? De la población de 15 a 29 años de edad, el 17.6% no estudian ni trabajan, por lo cual se encuentran en una situación de mayor vulnerabilidad, según el INEI.

Con motivo del Día de la Juventud, el jefe del Instituto Nacional de Estadística e Informática (INEI), Aníbal Sánchez, informó que, de acuerdo a proyecciones para el año 2017, en el Perú existen 8 millones 441 mil jóvenes de 15 a 29 años de edad, de los cuales 4 millones 275 mil son hombres y 4 millones 165 mil mujeres. Al año 2016, se tiene que el 35.8% de jóvenes peruanos cuenta con educación superior, de los cuales 21.5% con educación superior universitaria y 14.3% con superior no universitaria, de acuerdo con los resultados de la Encuesta Nacional de Hogares (Enaho). Añadió que, la proporción de jóvenes con educación superior se incrementó cerca de cinco puntos porcentuales en relación con el año 2011 (30.9%). En el año 2016, el 55.7% cuentan con educación secundaria y el 8,5%, educación primaria. De acuerdo al área de residencia, presentaban mejor nivel educativo los jóvenes del área urbana, donde el 41.3% tiene estudios superiores (16% no universitarios y 25.3% universitarios), que en el área rural, en que solo 13.9% cuenta con estudios superiores (7.7% y 6.3%, respectivamente). Censos Nacionales 2017El jefe del INEI señaló que los resultados de los Censos Nacionales 2017, que se realizarán el 22 de octubre, permitirán obtener información actualizada sobre la población joven en el Perú y sus condiciones de vida, lo que servirá para implementar adecuadas políticas públicas en beneficio de este grupo poblacional. Jóvenes y la PEA Los jóvenes que integran la Población Económicamente Activa (PEA) suman 5 millones 15 mil, de los cuales 3 millones 910 mil se encuentran en el área urbana y 1 millón 105 mil en el área rural. Del total de jóvenes de la PEA, el 91.6% tiene empleo y el 8.4% busca empleo activamente. Según área de residencia, la tasa de desocupación es superior en el área urbana (10.2%) que en el área rural (1.7%). De la población ocupada joven, el 78.6% tiene un empleo informal, lo que muestra una disminución respecto al año 2015 (80.1%); en tanto, el empleo formal en el año 2016 representó el 21.4%, tasa mayor a la del año anterior (19.9%). Área de servicios A nivel nacional, por tipo de ocupación, el 41.9% de la población joven ocupada se desempeña en la rama de servicios: 10% en Transportes y Comunicaciones; 8% en Hoteles y restaurantes; 3.5% en Enseñanza; y 20.3% en Otros servicios (como intermediación financiera, actividad inmobiliaria, empresarial, entre otros). Les siguen las actividades económicas de Agricultura, Pesca y Minería (22.7%), Comercio (18.7%) y Manufactura (10.5%). Por área de residencia, se observa que en el área rural, la población joven ocupada se desempeña principalmente en el sector primario (68%) Agricultura, Pesca y Minería, en tanto que en el área urbana, el 50.2% se encuentra en el sector de servicios. Ni estudian ni trabajan De la población de 15 a 29 años de edad, el 17.6% no estudian ni trabajan, por lo cual se encuentran en una situación de mayor vulnerabilidad. En el área urbana el 18.4% y en el área rural el 14.4% se encuentran en la misma situación.

14

Estadística 2019-I La tasa más alta de jóvenes que no estudian ni trabajan se encuentra en el grupo de 25 a 29 años de edad (19.4%). Según sexo, la proporción de mujeres que no estudian ni trabajan (23,5%) es mayor que la de hombres (11.9%). Seguro de saludAl año 2016, del total de jóvenes, el 67.6% tienen un seguro de salud, lo que evidencia un incremento de más de 12 puntos porcentuales con respecto al año 2011 (55.1%). De acuerdo con el área de residencia, cuentan con un seguro de salud el 79% de los jóvenes en el área rural y el 64.8% en el área urbana. 40 de cada 100 jóvenes acceden a algún servicio del sistema financiero formalEl 40,1% de los jóvenes de 18 a 29 años de edad han tenido acceso a alguno de los servicios del sistema financiero formal (cuenta de ahorro, cuenta corriente, ahorro a plazo fijo, cuenta con tarjeta de crédito o tarjeta de débito). El mayor acceso de la población joven al sistema financiero formal se registra en la Provincia Constitucional del Callao (54,5%); y le siguen la Provincia de Lima (53,9%) y los departamentos de Moquegua (48,8%), Arequipa (46,7%) e Ica (41,1%). Al año 2016, el 32,8% tiene una tarjeta de ahorro, el 32,4% una tarjeta de débito y solo el 8,8% una tarjeta de crédito. https://gestion.pe/economia/peru-8-5-millones-jovenes-educacion-superior-144111 En el texto puedes encontrar variables sin que se expliciten sus dominios de variación o pueden señalar dominios de variación sin mencionar a la variable. Debes identificar variables (explicitas o no) y señalar sus dominios (explícitos o no). Variable

Tipo

Dominio de variación

15

Estadística

2019-I

Población (N) La población es el conjunto de todas las observaciones posibles de la unidad de análisis respecto a la variable de estudio.

La población puede ser

Homogénea

Heterogénea

Ejercicio 3: Identifique el tipo de población Población

Tipo

Alpacas blancas puneñas nacidas en el mes de agosto del 2017 Jóvenes electores de Lima

Lectores de El Comercio Estudiantes varones de Comunicación de UCAL matriculados en el 3er ciclo, en el semestre 2018-2 Estudiantes de UCAL

Si se desea conocer el promedio de notas de los estudiantes de UCAL ¿quiénes conformarían la población?

Muestra (n) La muestra es una fracción significativa de la población. Por ejemplo, si quisiéramos hacer una investigación sobre los hábitos de estudio de los estudiantes de UCAL; la población estaría conformada por todos los estudiantes de UCAL. La muestra estaría formada por un grupo de estudiantes que los represente en la condición deseada (estudiantes de UCAL) y cuyo número permita que las conclusiones se generalicen a toda la población. REPRESENTATIVA

La muestra puede ser ERRÁTICA

16

Estadística

2019-I

Técnicas de muestreo Son los métodos y procedimientos para determinar la muestra. Implica determinar el tamaño de la muestra y los miembros o integrantes de la muestra.

Tamaño de la muestra Para obtener el mínimo número de elementos que constituyen la muestra se utiliza la siguiente fórmula:

Donde:

Basado en la Teoría de las Probabilidades p+q=1

n =Tamaño de la muestra N = Tamaño de la población Z = Nivel de confianza: al 95% = 1,96; al 99% = 2,57

p = Probabilidad de ocurrencia

(Si no tenemos el dato asumiremos que

es de 0,5) q = Probabilidad de no ocurrencia

q=1-p

d = Nivel de precisión. Consideraremos que es de 0,1

Ejercicio 4: Se desea realizar un estudio sobre el clima laboral en una empresa de marketing, en la que laboran 120 empleados (N). ¿Cuál es el tamaño mínimo de la muestra, si el nivel de confianza (Z) elegido es de 95% (1,96), la probabilidad de encontrarlo es 0,5 y el nivel de precisión (d) es de 0.1?

17

Estadística 2019-I Ejercicio 5: Se desea realizar un estudio sobre la percepción de la calidad de servicio de la cafetería en una empresa de servicios educativos, en la que estudian 680 seminaristas (N). ¿Cuál es el tamaño mínimo de la muestra, si el nivel de confianza (Z) elegido es de 95% (1,96), la probabilidad de encontrarlos es 0,8 y el nivel de precisión (d) es de 0.1?

Procedimientos de muestreo

Muestreo NO Probabilístico

Muestreo Probabilístico

Ejemplo:

Ejemplo:

Tipos de muestreo Muestreo

Probabilístico

Condición

Tipo

Se conoce el valor del total de la población y existe relación de los elementos que la constituyen.

Muestreo Aleatorio simple: a) Con reemplazo b) Sin reemplazo Tabla de números aleatorios Muestreo sistemático

No probabilístico

No se sabe cuántos ni quienes conforman esta población; conforme se los identifica se va formando la muestra. Corresponde a una población heterogénea y se conoce la proporción en la que está conformada.

18

Muestra espontánea

Muestra por cuotas

Procedimientos para obtener una muestra probabilística Pasos Muestreo aleatorio simple Con reemplazo

Sin reemplazo

1. Elaborar una lista numerada de los elementos que conforman la población. 2. Elaborar tarjetas o balotas con el dato de cada elemento de la población. 3. Colocar las balotas en un ánfora. 4. Sacar la primera balota, registrarlo en la relación de sujetos muestrales y devolver la balota al ánfora. 5. Sacar la segunda balota, registrarlo en la relación de sujetos muestrales y devolver la balota al ánfora; así sucesivamente hasta completar la muestra.. 6. Se elabora la relación de los seleccionados, en la que se puede identificar a la muestra por los números asignados a la población.

1. Elaborar una lista numerada de los elementos que conforman la población. 2. Elaborar tarjetas o balotas con el dato de cada elemento de la población. 3. Colocar las balotas en un ánfora. 4. Sacar la primera balota, registrarlo en la relación de sujetos muestrales y dejar la balota fuera del ánfora. 5. Sacar la segunda balota, registrarlo en la relación de sujetos muestrales y dejar la balota fuera del ánfora; así sucesivamente hasta completar la muestra. 6. Se elabora la relación de los seleccionados, en la que se puede identificar a la muestra por los números asignados a la población.

OBSERVACIÓN: Si alguna balota seleccionada vuelve a salir debe obviarse su registro y retornarla al ánfora.

Muestreo con Tabla de Números Aleatorios 1. Elaborar una lista numerada de los elementos que conforman la población. 2. Tomar en cuenta el número de dígitos de la población y el rango válidos para la selección de la muestra; de 1 a n. 3. Establecer una intersección de filas y columnas así como una dirección (arriba, abajo, a la derecha o izquierda) para iniciar la búsqueda de los sujetos muestrales. 4. Se elabora la relación de los seleccionados, en la que se puede identificar a la muestra por los números asignados a la población.

OBSERVACIÓN: Se requiere utilizar la tabla de números aleatorios.

Muestreo sistemático

1. Elaborar una lista numerada de los elementos que conforman la población. 2. Determinar el valor del intervalo K, aplicando la fórmula: K= N n 3. Elegir un primer elemento, al azar o de manera arbitraria, que se encuentre dentro del rango de la población, de 1 a n. Constituirá el primer sujeto muestral. 4. A ese número elegido, se le debe sumar el valor de K, y así se obtiene el segundo sujeto muestral. 5. A ese segundo sujeto muestral se le adiciona el valor de k, obteniendo el tercer sujeto muestral; así sucesivamente hasta completar la muestra. 6. Se elabora la relación de los seleccionados, en la que se puede identificar a la muestra por los números asignados a la población.

Estadística 2018-2 Ejercicio 6: Se desea seleccionar una muestra para realizar un estudio sobre las marcas de bebidas preferidas por los estudiantes de un sector de la UCAL al que asisten 80 alumnos. Se ha determinado que la muestra estará formada por 22 estudiantes. Indica las acciones que se deben realizar para identificar a la muestra, utilizando el Muestreo Aleatorio Simple sin reemplazo

Ejercicio 7: Se desea seleccionar una muestra para realizar un estudio sobre los cursos de formación general preferidos por los estudiantes de la UCAL, siendo la población (N) de 359 alumnos. Se ha determinado que la muestra estará formada por 20 estudiantes. Indica las acciones que se deben realizar para identificar a la muestra, utilizando la Tabla de Números Aleatorios.

20

Estadística

2018-2

TABLA DE NÚMEROS ALEATORIOS Tomado de: Freund, John E. (1988) Estadística Elemental Moderna Treinta y un mil

1

2

3

4

5

6

7

8

9

10

1

8735 6744 5149 1898 9784 7522 5329 1052 2687 5492

2

2552 2067 3599 4888 4068 6368 8239 3847 9139 1100

3

8717 8331 2559 8748 2580 2408 8145 2132 9008 4431

4

0504 4035 7295 4856 7757 6319 8019 4852 0647 6498

5

8116 0924 9171 2976 5401 5347 3067 6293 5658 1001

6

5485 7988 5791 1169 1022 7187 2492 5264 4282 7895

7

4478 1918 3540 2766 8972 2117 7169 9517 9717 6260

8

9720 9897 3733 9375 1888 3585 4605 0720 0817 6624

9

9877 5751 4041 7624 1854 6061 7913 9457 5073 8968

10

7812 7730 8330 5928 7333 4707 6007 4538 8210 7319

11

4119 7062 4346 0613 2238 3118 6460 0714 4916 2816

12

7064 3055 6746 9579 6366 8256 6710 7077 0322 4218

13

0656 0989 6887 7919 3594 0618 1794 7281 7377 9239

14

2946 1828 0888 4856 4944 6782 7267 2883 1026 5813

15

4214 5551 7295 2925 1518 2568 4892 8716 7843 1747

16

3375 8715 1523 1379 6273 7669 0977 8265 7247 5956

17

0980 9961 9808 3411 8879 0832 4678 3358 4116 1223

18

9831 5750 8580 5339 0592 5442 2901 3523 0984 9664

19

5170 5255 8312 9502 7911 4979 8795 9848 8868 6477

20

2783 6107 4905 4620 3578 3134 4250 6811 4214 2977

21

7884 6915 6442 9239 3608 5639 3502 9278 4663 8208

22

2212 8966 4909 9910 6253 1931 8183 5043 3742 1000

23

6941 5954 8272 4466 6403 7659 1212 4156 3490 2606

24

5499 4654 5138 5907 6421 8117 8847 2305 6343 0867

25

9991 8479 9262 4424 0134 4516 3356 1778 4286 7094

21

Estadística

2018-2

Ejercicio 8: Se desea seleccionar una muestra con la finalidad de realizar un estudio sobre las empresas de diseño de interiores de Lima, siendo la población (N) de 337. Se ha determinado que la muestra estará formada por 21 empresas. Indica las acciones que se deben realizar para identificar a la muestra, utilizando el muestreo sistemático.

22

Estadística

2018-2

Sistemas de recopilación de datos Sistemas Características Ejemplo

¿Qué necesitamos para recolectar datos? • •

Determinar, definir (conocer bien) las variables. Evaluar si se puede obtener de manera directa (o concreta) o si es necesarios identificar sus aspectos (indicadores).

• •

Identificar a la unidad de análisis. Elegir la técnica e instrumento más adecuados.

Fuentes

Primaria

Secundaria

Ejercicio 1 El Ministerio de Cultura desea conocer las características sociodemográficas de los usuarios para tomar decisiones sobre la organización de las visitas a las ruinas de Caral. ¿Qué datos recopilamos? ¿Es necesario descomponerlo en aspectos o factores?

¿De quién lo obtenemos? ¿Qué tipo de fuente es?

23

Estadística

2018-2

Técnicas de Recopilación TÉCNICA

INSTRUMENTO

Observación

Ficha de Observación

Encuesta: Entrevista

Guía de entrevista

Focus group

Guía - filmadora

Cuestionario

Cuestionario

Prueba: Personalidad Eficiencia

CARACTERÍSTICAS

Test Prueba o examen

Escalas de Actitudes y de opiniones

Escalograma o Escala

Experimentación

Ficha de Experimentación

Recopilación documental

Ficha y registro

Análisis de contenido

Ficha de Análisis

Ejercicio 2 Tomando en cuenta el enunciado del ejercicio 1: ¿qué técnica es la más apropiada? ¿Qué instrumento de recolección de datos desarrollaría? ¿Por qué? 24

Estadística

2018-2

Estructura de la variable VARIABLE

NIVEL EDUCACIONAL DE LA POBLACIÓN

INDICADORES

DOMINIO DE VARIACIÓN

1. Grado de instrucción promedio.

Primaria, secundaria, técnica, universitaria.

2.

0- 10 pésimo; 11-20 malo; 21 – 30 regular; 31 40 bueno; 41 a más, excelente.

0% - 10% regular, 11% - 20% bueno; etc.

Tasa de alfabetización.

3. Número de profesionales por 100 habitantes.

0% - 10% regular, 11% - 20% bueno; etc.

4. Tasa de escolaridad de 06 a 16 años.

Ejercicio 3 Tomando en cuenta lo desarrollado en el trabajo por encargo N° 4, elabore la estructura de la variable. VARIABLE

INDICADORES

DOMINIO DE VARIACIÓN

25

Estadística Unidad de análisis:

2018-2

¿Cómo se elaboran los instrumentos? Se parte de la estructura de la variable y se formula una o más preguntas (o ítems) por cada indicador o variable de estudio. Generalmente, se realizan preguntas sobre otras características (datos generales, por ejemplo) que no siendo variables de estudio son relevantes para entender el comportamiento o respuestas recogidas. VARIABLE

INDICADORES

Items

1. Número de ingesta de comidas por día

Marque con una “X” las comidas que consume en un día: Desayuno

Para el indicador 1

Refrigerio de media mañana Hábitos alimenticios

2. Horario de ingesta de comidas Almuerzo Refrigerio de media tarde 3. Tipo de alimentos

Cena Lonche

La matriz de datos nos permite organizar una base de datos para poder registrar las respuestas de nuestra unidad de análisis; la referencia de la matriz nos señala los dominios de variación de la variable o indicadores.

Ejercicio 4 Forme grupo de 4 alumnos como máximo. Utilizando los datos del Trabajo por encargo 4 y lo desarrollado en el ejercicio 3: • •

definan la técnica y el instrumento más adecuado para recolectar datos. elaboren el instrumento (consideren datos generales y de la variable de estudio).

26

Estadística Trabajo por encargo 5 (grupal)

2018-2

En grupos de 4 estudiantes: • • •

Obtenga información sobre un producto (por ejemplo: pasta dental, bebidas gaseosas, etc). Elija una técnica de recolección de datos y elabore el instrumento. Debe tener como mínimo 20 items: 4 datos generales (por lo menos 1 corresponderá a una variable ordinal), 1 pregunta de filtro, 8 sobre variables cuantitativos y 7 sobre variables cualitativas.

• • •

Identifique las variables, indicadores y elabore los ítems. Identifique a la unidad de análisis (accesible). El instrumento deberá aplicarse a 20 personas, como mínimo.

Amenidades

X representa a la variable nota X1 es el valor de la nota del sujeto 1; X2 es el valor de la nota del sujeto 2, y así hasta tener un Xn Xi representa a todos los valores que toma la variable nota (es decir, reemplaza a X1, X2, … Xn.) ∑ (sigma) es el símbolo que significa suma o adición. ¿Qué significará ∑ Xi ? ¿Qué significará Xi 2? ¿Qué significará ∑ Xi 2? Para denotar la resta se utiliza el signo (-), para la multiplicación se puede usar (x), (*), (.) o simplemente colocar los factores juntos; para la división se usa (/). ¿Qué significará ∑ Xi - 1? ¿Qué significará Xi 2/5 ? ¿Qué significará ∑ Xi 2 Y?

27

Estadística

2018-2

Contenidos: organización de datos: tabla de distribución de frecuencias, elementos, tipos, interpretación de datos, representación gráfica.

Tipos de tabla de distribución de frecuencias tipo de tablas

Categórica

Numérica

tipo de variable orden de los dominios Frecuencias sumatoria total

Elementos Cuadro N° 1 Universidad de Ciencias y Artes de América Latina Población estudiantil por carrera matriculada en el curso de Estadística La Molina – 2013-0

Carrera

fi

hi%

Arquitectura de interiores Comunicación Diseño Gráfico Publicitario Total Fuente: Estudiantes de estadística 2013-0 Elaboración propia

28

Estadística 2018-2 Si el dominio de variación está constituido por muchos valores distintos, entonces se trabaja con datos agrupados, por ejemplo: edades de los pacientes de una clínica: 0 -8; 9 – 17; 18 – 26; 27 – 35; 36-44; 45-53; 54-62; etc. Se llama agrupados porque los valores están formando grupos, de los cuales sólo vemos los extremos: desde 0, hasta 8, lo que incluye 0, 1, 2, 3, 4, 5, 6, 7 y 8.

Revisemos algunos conceptos Recolectemos algunos datos, de 10 compañeros; la pregunta es: ¿A qué edad consumiste alcohol por primera vez? Respuestas:

Ordenación: Es la colocación de los datos numéricos tomados en orden decreciente o creciente. Ejercicio 1: Ordene los datos del grupo, en orden creciente (de menor a mayor)

Rango o Recorrido (R): Es la diferencia entre el mayor y el menor de los valores de la variable. Ejercicio 2: Identifique Valor mayor = o Rango (R)=

Valor menor =

Clase (K): Son las celdas que contienen los dominios de variación o los valores de las variables que se presentan en una tabla. No existe un número mínimo o máximo de clases; sin embargo, por convención se recomienda entre 5 a 15 clases para facilitar la organización y presentación de los datos.

Límites de clase: Cuando se trabaja con datos agrupados, estos forman un intervalo. Los límites de clase son los valores extremos, superiores e inferiores, del intervalo de clase. Por ejemplo:

Notas 3 clases

Límite inferior= K=3

1 - 5 6 - 10 11 - 15 Total 29

Clase 1 o K 1 Límite superior =

Estadística Ejercicio 3:

2018-2

¿Cuál es el valor del Límite superior de la clase 1? ¿Cuál es el valor del Límite inferior de la clase 3? Frecuencia: Son las veces en que se observa o se repite un valor o valores de una variable, que se muestran en las clases. Frecuencia Absoluta Simple (fi ): Señala las veces que se repite los valores de una clase, basado en los datos reales, tal como se recogieron de la realidad.

Frecuencia Absoluta Acumulada (Fi): Señala las veces que se repiten los valores en la acumulación de datos, tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con la que se trabaje. Sólo se utilizan con variables cuantitativas, en las tablas numéricas. Frecuencia Porcentual o Relativa Simple (hi% ): Señala el porcentaje en el que se repite los valores de una clase, basado en los datos reales; se considera como 100% el total de datos obtenidos de la realidad y se trabaja con las fi. Se obtienen mediante la aplicación de la regla de 3 simple. Frecuencia Porcentual o Relativa Acumulada (Hi% ): Señala el porcentaje en el que se repite los valores en la acumulación de datos, tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con la que se trabaje; se considera como 100% el total de datos obtenidos de la realidad y se trabaja con las Fi. Se obtienen mediante la aplicación de la regla de 3 simple. Sólo se utilizan con variables cuantitativas, en las tablas numéricas. Datos:

X= Edad

X1 = 17 X2 = 23 X3 = 23

X4 = 22

X5 = 19

X6 = 16 X7= 24 X8 = 21

X9 = 20

X10 = 18

X11 = 19 X12 = 21 X13 = 23

X14 = 17

X15 = 21

X16 = 21 X17 = 20 X18 = 19

X19 = 22

X20 = 21

Edad

fi

16 - 18 años

4

19 - 21 años 22 – 24 años

Número de alumnos de un curso de diseño gráfico Total

Si 20 es el 100%, ¿cuánto será 4? Para hallar h1% 20 - 100% 4

-

X

X = 4 x 100 = 400 = 20,00 20 20

30

20

Fi

hi% 20,00

Hi%

Estadística Ejercicio 4:

2018-2

¿Cuántos alumnos tienen entre 16 a 18 años?

¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 22 a 24 años?

¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 16 a 21 años?

¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 16 a 24 años?

¿Qué porcentaje representa?

Para formar los intervalos, requerimos trabajar con los siguientes elementos: Número de clases (K): Se utiliza en el caso de tablas numéricas de datos agrupados. Se calcula aplicando las siguientes fórmulas:

K = 1 + 3,3 (log.N)

ó

K = √n

2k

ó

Ejercicio 5: Tenemos n=25, ¿cuántas clases debemos formar? Tenemos n = 35, ¿cuántas clases debemos formar? Tenemos n= 60, ¿cuántas clases debemos formar?

Tamaño de clase (t): Es la longitud o el ancho de los intervalos o la diferencia entre los límites de una misma clase. t= R K

-c

o

Ejercicio 6: Para Valor mayor = 48 n= 25

t = L superior - L inferior

Valor mayor = 89 Valor menor = 13

Valor menor = 23 n= 36

¿Cuál será el tamaño?

¿Cuál será el tamaño?

Armemos la primera clase:

Armemos la primera clase:

Amplitud de intervalo (w): Es la cantidad de datos que están comprendidos en un intervalo de clase o la diferencia de dos límites iguales de dos clases sucesivas. w= R+1 K

o

t = L superiork+1 - L superiorK 31

Estadística Ejercicio 7: Halle la amplitud para Valor mayor = 48 Valor mayor = 88 Valor menor = 13 26 n= 36 n= 81

Ejercicio 8: Armemos las clases

32

2018-2 Valor menor =

Estadística

2018-2

Gráficos Existen diferentes tipos de gráficos, que se utilizan en función al tipo de variable. Generalmente para variables cuantitativas se utiliza el gráfico de barras y para variables cualitativas el gráfico circular (llamado también de pastel o de 360°). Gráfico de barras Número de hijos por familia Huaraz – 2012

Utiliza la frecuencia absoluta simple (f), con discretas.

Gráfico de Histograma Ingreso familiar anual Surco – 2010

Utiliza la frecuencia absoluta simple (f), con variables cuantitativas variables cuantitativas continuas. Polígono de frecuencias Edad de profesionales La industria – La Libertad

Utiliza la marca de clase, con variables cuantitativas que se presentan en datos agrupados.

Utiliza la frecuencia relativa absoluta (h%), con variables cualitativas y ordinales.

33

Estadística Ejercicio 9: ¿Qué gráfico se debe usar?

2018-2

Variable

Tipo de variable

Gráfico

Notas obtenidas en el promedio general Marcas de automóviles más vendidas en el 2012 Religión de estudiantes de filosofía Ventas anuales de una empresa Años de estudio de los gerentes

Trabajo por encargo 6 (individual) Dados los siguientes datos correspondientes a las notas obtenidas por un grupo de alumnos en el curso de Estadística:

1.

1

8.5

7

15.5

5

18.75

16.75

7.25

8.5

18.75

7.25

5.5

4.75

3.75

20

4.5

10.75

7.75

9

12

8

6.25

8

9.25

12.25

Identifique el valor de n y ordene los datos. n=

34

Estadística 2. Determine el R.

2018-2

V mayor =

V menor=

R= 3.

Determine el valor de K.

4.

Identifique el t y el w, conforme los intervalos y elabore la tabla de distribución de frecuencias.

t=

w=

5.

Formar las clases: K1 , K2 , …,, Kn

6.

Elaborar la tabla de distribución de frecuencias

fi

Fi

Total 35

hi%

Hi%

Estadística 7.

Interprete el f3 y el H4%

8.

Elabore el gráfico correspondiente.

2018-2

Trabajo por encargo 7 (grupal) A partir del instrumento aplicado por el grupo, elabore la distribución de frecuencias y gráfico correspondiente para cada dato obtenido. Se presentará en la próxima clase.

36

Estadística

2018-2

Evaluación parcial

RECORDEMOS: X representa a la variable Xi representa a todos los valores que toma la variable (reemplaza a X1, X2, … Xn.) ∑ (sigma) es el símbolo que significa suma o adición. (-) es el signo que indica que se debe restar. (x), (*), (.) o simplemente colocar los factores juntos, son las formas en las que se señala que debe multiplicarse. (/) o (÷) nos indica que se debe dividir.

Leamos los códigos matemáticos y operemos con ellos. Datos: Edades de un grupo de niños miembros de una familia: 10, 13, 8, 1, 5, 4, 5, 11

∑ Xi = X i2 = ∑ Xi = Xi - 1 =

n

37

Estadística

2018-2

Contenidos: medidas de tendencia central: media, mediana y moda, interpretación, medidas de tendencia no central: Cuantiles.

Medidas de tendencia central Son estadígrafos que ofrecen medidas de resumen de la población o muestra, brindando un solo valor numérico que nos orienta hacia el “centro” de un conjunto de datos. Su aplicación depende del tipo de variable.

Medida

Denotación

Definición

Tipo de variable Cuantitativa

Cualitativa

Es la suma de las observaciones dividida por el número de observaciones. Indica el promedio obtenido por el grupo.

Media

Se utiliza para describir el centro o medio de una distribución o de un grupo de datos, cuando los valores se colocan en orden ascendente o descendente.

Mediana

Es el valor de mayor frecuencia en la distribución; es decir, aquel que más veces aparece.

Moda

Cálculo de la Media Donde:

Para datos no agrupados

Xi = Datos obtenidos n

X =

n = Tamaño de la muestra Interpretación: La media de VARIABLE es de VALOR EN LA UNIDAD DE MEDIDA DE LA VARIABLE.

i =1

Ejercicio 1: Hallar la media para los datos solicitados e interprete:

Sujeto

N° de hijos N° de habitantes por familia en el hogar

1

5

5

2

4

6

3

3

4

4

2

3

5

1

6

6

3

6

38

Estadística 7

2018-2 1

2

Para datos agrupados

∑𝑛 𝑖=1 𝑥𝑖 𝑓𝑖 ∑𝑛 𝑖=1 𝑓𝑖

𝑋=

𝑥𝑖 = Xi = marca de clase

𝑙𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 2

Ejercicio 2: La siguiente es una tabla de distribución de frecuencia del consumo de vasos agua (a la semana) por un grupo de estudiantes . Determine la media e interprete los resultados. Cantidad de vasos de agua consumidos

fi

Fi

hi%

Hi%

1 -5

5

5

5.21

5.21

6 - 10

10

15

10.42

15.63

11 - 15

50

65

52.08

67.71

16 - 20

20

85

20.83

88.54

21 - 25

11

96

11.46

100.00

TOTAL

96

100.00

Cálculo

Interpretación

39

Estadística

2018-2

Cálculo de la Mediana Para hallar la mediana, lo primero que debemos hacer es ordenar los datos en orden creciente o decreciente. Luego hallar la posición de la mediana aplicando la fórmula siguiente: Me = n + 1 2 Finalmente, buscar el valor que se ubique en la posición encontrada. Interpretación: El 50% de la muestra tendrá a lo más (o como máximo) VALOR ENCONTRADO EN LA POSICIÓN DE LA MEDIANA, mientras que el restante 50% lo supera.

Si las observaciones son impares se encontrará una posición de la variable. Por ejemplo: Tenemos 5 notas

12

14

14

Posiciones 1

2

3

Valor de la variable

15

17

4

5

Si las

n=5 Me = = 3 La posición de la mediana es 3 y su valor es 14 puntos. observaciones son pares no se encontrará una posición real, entonces se trabaja con los valores circundantes y se obtiene una media de los mismos.

Valor de la variable Posiciones

12

14

14

1

2

3

15

17

19

4

5

6

3,5

n=6 Me = 6 + 1 = 3,5 2

14 + 15 = 14,5 puntos 2 La posición de la mediana es 3,5 y su valor es 14,5 puntos.

Ejercicio 3: Hallar la mediana para los datos solicitados e interprete:

Sujeto

1

2

3

4

5

6

7

N° de hijos por familia

5

4

3

2

1

3

-

N° de habitantes en el hogar

5

6

4

3

6

6

2

40

Estadística

2018-2

Cálculo de la Moda Para hallar la moda, tenemos que identificar el valor o los valores que se repiten más veces. La moda puede ser:

2

4

5

6

7

9

9

12

15

2

5

5

6

7

9

9

12

15

2

5

5

6

6

9

9

12

15

2

4

5

6

7

8

9

12

15

2

2

2

4

4

4

6

6

6

2

2

2

2

4

4

4

6

6

6

Recordemos que la moda es la única medida de tendencia central que se aplica en variables cualitativas y ordinales, en este caso también se reconoce como moda a aquel valor que se repite más veces.

Interpretación: La moda es TIPO y recae en VALOR QUE SE REPITE MÁS VECES, por haber obtenido la mayor frecuencia que es VALOR Ejercicio 4: Consulte a 5 compañeros que estén a su alrededor por las variables solicitadas, identifique la moda e interprete.

Sujeto

1

2

3

Plato criollo favorito Tiempo de traslado a la universidad en minutos Deporte favorito Horas de sueño por día Curso más demandante 41

4

5

Estadística

2018-2

Medidas de tendencia no central Los Cuantiles (de cuanto) son estadígrafos que hacen cortes (dividen) a una distribución de frecuencias (lo que significa que los datos están ordenados) en proporciones de cuatro, diez o cien partes. Si tuviéramos una n=20 y los dividimos en 4 grupos proporcionales, ¿cuántos habría en el primer grupo o bloque? ¿Qué porcentaje representan? ¿Cuántos habría en el tercer bloque y qué porcentaje representan? ¿Cuánto lo diferencia del valor total? Si tuviéramos que señalar la posición de los datos en cada bloque, ¿cuál sería la posición máxima del bloque 1, del bloque 2 y del bloque 3? Grafícalo.

Cuartiles - Q

Los cuantiles pueden ser

i

Deciles - D

i

Percentiles o Centiles - P

i

Por ejemplo, en el caso de los Quartiles: Xi = 2, 3, 4, 5, 7, 7, 7, 8, 8, 9, 10, 10, 12, 12, 13, 14

Q1

Q2

25%

2

3

Q3

5

7

7

25%

25%

25%

4

Q4

7

8

8

9

10

75%

25%

42

10

12

12

13

14

Estadística

2018-2

¿Cómo hallamos los Cuantiles?

Cuartiles

Deciles

𝑖 ∑ 𝑓𝑖 −𝐹𝑖−1 4

𝑄𝑖 = 𝐿𝑖 + [

𝑓𝑄𝑖

] 𝑤 𝐷𝑖 = 𝐿𝑖 + [

Percentiles

𝑖 ∑ 𝑓𝑖 −𝐹𝑖−1 10

𝑓𝐷𝑖

]𝑤

𝑃𝑖 = 𝐿𝑖 + [

𝑖 ∑ 𝑓𝑖 −𝐹𝑖−1 100

𝑓𝑃𝑖

]𝑤

¿Qué diferencias encuentra en las fórmulas? ¿A qué se deberá?

Donde: i = 1,2,3, ….100; según se trate de hallar el primer, segundo, tercer, …. centésimo cuantil. Li = Límite inferior de la clase cuántica Ʃfi = Suma de todas las frecuencias absolutas simples (Ʃfi-1) = Fi-1 Suma de las frecuencias absolutas simples de las clases anteriores a la clase cuantílica. fQi, fDi, fPi = Frecuencia que corresponde a la clase cuantílica. W = Amplitud

Pasos: 1° Necesitamos los datos ordenados en una frecuencia. Se realizó una encuesta sobre el consumo semanal de carne en una muestra de 80 familias en la comunidad de “Pachacutec”, los resultados se muestran en el cuadro siguiente. Hallar el Cuartil 1 (Q1)

43

Estadística

2018-2

2° Hallar la frecuencia acumulada (Fi)

3° Se calcula la posición que contiene el cuantil solicitado y se identifica a la clase que lo contiene.

La posición 20 se ubica en la F2, entonces la clase cuartílica es la clase 2. 4° Identificamos los datos que requiere la fórmula: Li = 2;

𝑖 ∑ 𝑓𝑖 4

=

Fi-1= 15; fQ1= 26;

1(80) 4

W = 2 (valor constante)

= 20

5° Se aplica la fórmula. 𝑖 ∑ 𝑓𝑖 4

𝑄𝑖 = 𝐿𝑖 + [

−𝐹𝑖−1

𝑓𝑄𝑖

] 𝑤 =2+[

20−15 26

] 2 = 2 + 0.38 = 2,38

6° Se interpreta los resultados. Interpretación: El 25% de las familias de la comunidad de Pachacútec consumen como máximo 2,38 Kg de carne por semana. Ejercicio 5: Halle el Q3

44

Estadística Trabajo por encargo 8 (individual)

2018-2

Identifique los datos para hallar el decil 5, para el Cuadro 3: Consumo de vasos de agua por semana

fi

Fi

Posición: (i) ∑fi = 10

11

- 15

35

35

Clase decílica (usar F)=

16

- 20

5

40

Li de la clase decílica =

21 -

25

28

68

Fi-1 (F de la clase anterior)=

26 -

30

12

80

fi (f de la clase decílica)=

TOTAL

80

Amplitud

Escriba la fórmula y transforme:

Interprete:

Identifique los datos para hallar el percentil 35, para el Cuadro 3: Consumo de vasos de agua por semana

fi

Fi

Posición: (i) ∑fi = 100

11

- 15

35

35

Clase percentílica (usar F)=

16

- 20

5

40

Li de la clase percentílica =

21 -

25

28

68

Fi-1 (F de la clase anterior)=

26 -

30

12

80

fi (f de la clase percentílica)=

TOTAL

80

Amplitud

Escriba la fórmula y transforme:

Interprete:

45

Estadística Identifique los datos que requiere para hallar el decil 8: Consumo de vasos de agua por semana

fi

Fi

11

- 15

35

35

16

- 20

5

40

21 -

25

28

68

26 -

30

12

80

TOTAL

80

Escriba la fórmula y transforme:

Interprete:

Identifique los datos que requiere para hallar el percentil 75, para el Cuadro 3: Consumo de vasos

de

fi

Fi

agua por semana 11

- 15

35

35

16

- 20

5

40

21 -

25

28

68

26 -

30

12

80

TOTAL

80

Escriba la fórmula y transforme:

Interprete: 46

2018-2

Estadística Trabajo por encargo 9 (grupal)

2018-2

A partir del instrumento aplicado por el grupo, encuentre el valor de 2 cuantiles de cada tipo (cuartiles, deciles, percentiles) por cada tabla numérica. Se presentará en la próxima clase.

Contenidos: medidas de dispersión: rango, desviación media, análisis e interpretación. Medidas bidimensionales: correlación simple.

Medidas de dispersión Son estadígrafos que miden la dispersión o desviación de los datos con respecto al valor central. Rango

Coeficiente de variación

Pueden ser:

Desviación estándar

Desviación media

Varianza

Rango ( R ) Es la distancia existente entre el valor mayor de todas las observaciones y el valor menor. Ejercicio 1: Halle el R en los datos siguientes:

Gaseosas consumidas al mes por estudiantes universitarios: 3

67

2

72

5

22

31

6

20

12

9

4

13

28

14 52

15

2

33

63

9

5

32

18

60 12

58 90

25

Consumo de vasos de agua por semana

R=

11

- 15

16

- 20

21 -

25

26 -

30

48 TOTAL

47

R=

Estadística

2018-2

Desviación Media (DM) Es el promedio de la suma de las desviaciones, en valor absoluto, de cada observación o dato con respecto a su media aritmética. Nos señala cuánto se alejan los valores respecto del centro.

¿Cómo hallamos la DM para datos no agrupados? Se obtiene aplicando la siguiente fórmula: ¿Qué hace la función del valor absoluto?

Donde:

𝐷𝑀 =

Xi = Observación o dato

̅| ∑ |𝑋𝑖 − 𝑋

𝑥̅ = Media

𝑛

n = Número de observaciones

Para el siguiente caso: ¿Cuál es el valor de la DM del tiempo (en minutos) utilizado por las alumnas para desarrollar una tarea? Alumnas

14

16

13

15

17

16

Pasos 1° Hallamos la media

n

X =

i =1

= 14 + 16 + 13 + 15 + 17 + 16 = 91 = 15,67 6 6

2° Aplicamos la fórmula. Realizamos la sustracción de cada valor de Xi menos la Media, aplicamos el valor absoluto. ∑|𝑥𝑖 − 𝑥̅ | = |14 – 15,67| + |16 – 15,67| + |13 – 15,67| + | 15 – 15,67| + |17 – 15,67| + |16 – 15,67| ∑|𝑥𝑖 − 𝑥̅ | = 1,67 + 0,33 + 2,67 + 0,67 + 1,33 + 0,33 = 7,0

𝐷𝑀 =

̅| ∑ |𝑋𝑖 − 𝑋 𝑛

=

7 6

= 1,17 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

3° Interpretamos: El tiempo utilizado por las alumnas para desarrollar la tarea se dispersa, en promedio, 1,17 minutos con respecto al valor central.

48

Estadística Ejercicio 2: Halle la DM del tiempo utilizado por los niños para desarrollar una tarea. Interprete.

2018-2

alumnos

14

16

12

15

18

13

¿Cómo hallamos la DM para datos agrupados? Se obtiene aplicando la siguiente fórmula:

Donde: Xi = Marca de clase

∑ |𝑋𝑖 − 𝑋̅ | 𝑓𝑖 𝐷𝑀 = ∑ 𝑓𝑖

𝑥𝑖 =

𝑙𝑙í𝑚 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟+𝑙𝑖𝑚 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 2

𝑥̅ = Media

fi = frecuencia absoluta de clase

Pasos 1° A partir de los datos organizados (clases en intervalos y frecuencia absoluta simple) en una tabla, procedemos a obtener la marca de clase. 2° Multiplicamos cada marca de clase por su frecuencia y lo sumamos; ese dato se divide entre el total de datos y obtenemos la media. 3° A cada marca de clase le restamos la media y obtenemos el valor absoluto. 4° Cada valor absoluto lo multiplicamos por su frecuencia absoluta simple (f) y sumamos todos los productos. 5° Lo dividimos entre el total de las observaciones o la sumatoria de las f. 6° Finalmente, lo interpretamos.

49

Estadística

2018-2

Interpretación: La edad de los clientes se dispersa,

en promedio, años con respecto al valor central.

Ejercicio 3: Halle la DM de las notas obtenidas por los estudiantes del curso de redacción e interprete.

Notas

Fi

1

-

4

5

5

-

8

12

9

-

12

15

13

-

16

10

17

-

20

3

TOTAL

Xi

Xi . fi

|Xi - X|

45

50

(Xi – X).fi

Estadística

2018-2

Estructura del trabajo final: INFORME ESTADÍSTICO

Universidad de Ciencias y Artes de América Latina Carrera Profesional de XXXXXX

XXPoner el título del trabajoXXX

INFORME DE INVESTIGACIÓN ESTADÍSTICA PRESENTADO POR:

• APELLIDOS Y NOMBRES DE LOS INTEGRANTES DEL GRUPO EN ORDEN ALFABÉTICO

Lima, ………, 2017

51

Estadística

2018-2

INDICE INTRODUCCIÓN Capítulo I: Descripción de XX la variable de estudio XX ....................... N° de página 1.1. Datos históricos ................................................................ …………………….. 1.2. Características de XX la variable de estudio XX………………………………………. ……

Capítulo II: Descripción de la población y muestra…………………………… 2.1 Población: ...................................................................... ……………… 2.2 Muestra .......................................................................... ……………………… 2.2.1 Tamaño .................................................................. ……………… 2.2.2 Selección de la muestra .......................................... ………………. Capítulo III: Instrumento………………………………………………………… 3.1 Variable(s) de estudio:………………………………………………… 3.1.1 Tipo: ................................................................. ……………………….…….. 3.1.2 Dominios de variación… ................................. ………………….... 3.2 Técnica e instrumento:………………………………………………….. 3.2.1 Selección y sustento… ...................................................................... 3.2.2 Matriz de construcción de reactivos / ítems / preguntas ………... Capítulo IV: Resultados………………………………………………………... 4.1 Descripción de la muestra 4.2 De la variable de estudio: 4.2.1 Distribución de frecuencias………………………………………. 4.2.2 Medidas de tendencia central………………………………………………………. 4.2.3 Medidas de tendencia no central…………………………………………………. 4.2.3 Medidas de dispersión……………………………………………. Capítulo V: Referencias…………………………………………………….. (Fuentes consultadas y utilizadas en el desarrollo del trabajo: bibliográficas, hemerográficas y electrónicas)

Anexos i. ii. iii.

Instrumentos aplicados ........................................... Formatos Pro.seso… ................................................ xiii. Cálculos realizados ......................................... xiv. Evidencia de aplicación de los instrumentos ..

52

Related Documents

Guia De Estadistica
October 2019 10
Estadistica
November 2019 25
Estadistica
August 2019 43
Estadistica
June 2020 19

More Documents from ""