Unidad-iii-estadistica-autoguardado.docx

  • Uploaded by: nicole suarez
  • 0
  • 0
  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Unidad-iii-estadistica-autoguardado.docx as PDF for free.

More details

  • Words: 5,480
  • Pages: 32
República Bolivariana de Venezuela. Ministerio del Poder Popular Para la Educación Superior, Ciencia y Tecnología. “Universidad Nacional Experimental Simón Rodríguez.” Núcleo-Maturín. Maturín- estado Monagas.

ESTADÍSTICA:

III-Distribución de Frecuencias. IV-Representación Gráfica. V-Medidas de Tendencia Central. VI- Medidas de Variabilidad.

Profesor.

Bachilleres.

Aray, Luis

Cabello, Lucianny. Caraballo, Daniela. Lubaton, Elizaidi. Rondón, Yoselin. Suarez, Nicole.

Sección: “O” “Marzo, 2019”

1

Índice. Contenido.

Pág.

Unidad III-Distribución de frecuencias………………………………....……………4 Tipos de frecuencias………………………………………………………………..........4 Distribución de frecuencias para datos no agrupados………………………………..5 Componentes de distribución de frecuencias para datos no agrupados….………..7 Distribución de frecuencia para datos agrupados o de clase………………………...7 Componentes de distribución de frecuencias para datos agrupados……………….9 Unidad IV- Métodos de representación graficas…….......…………………........10 Tipos de gráficos…………………………………………………………………………12 Uso de cada tipo de gráficos……………………………………………………………17 Unidad V-Medidas de tendencia central……………………………………..…….17 Tipos de medidas de tendencia central y Fórmulas de cálculo………………………………………….…………………………23 Tipos de graficas de medidas de tendencia central………………………………….25 Unidad VI-Medidas de dispersión o variabilidad…………………………………26 Tipos de medidas de dispersión……………………………………………………….28 Fórmulas de cálculo…………………………………………………………………….29 Grafica de dispersión………………………………………………………….………..30 Conclusión……………………………………………………………………………….31 Referencias bibliográficas………………………………………..…………………….32

2

Introducción. La estadística es el estudio de los modos de recolectar y analizar datos con el fin de establecer conclusiones acerca del medio del cual se han obtenido los datos. Es la ciencia que

trata

sobre

la

toma, organización recopilación,

presentación

y análisis de datos para deducir conclusiones sobre ellos y para tomar decisiones que estén de acuerdo con los análisis efectuados. La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere conocer el estado sanitario de un país, a través de ciertos parámetros como la tasa de morbilidad o mortalidad de la población. .La estadística puede aplicarse a cualquier ámbito

de

la

realidad,

y

por

ello

es

utilizada

en física, química, biología, medicina, astronomía, psicología, sociología, lingüístic a, demografía, etc. Y es importante en todos los contextos desde el estudiantil, de trabajo y profesional por que se aplica en la vida diaria de cada uno de estos en el estudiantil por ejemplo para sacar tu promedio de una calificación o para saber la media o cuanto necesitas para ciertas materias.

3

Unidad III- Distribución de Frecuencia Las distribuciones de frecuencias es una ordenación en forma de tabla de los datos estadísticos, en la que se le asigna a cada dato su frecuencia correspondiente. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos. La frecuencia es el número de veces que se repite o aparece el mismo dato estadístico en un conjunto de observaciones de una investigación determinada. Tipos de frecuencias: 

Frecuencia absoluta o completa: Es el número de veces que aparece un determinado valor en un estudio estadístico, se representa por fi. La suma de las frecuencias absolutas es igual al número total de datos representados por N; para indicar resumidamente esta suma se utiliza la letra griega Σ (sigma mayúscula) que se lee como suma o sumatoria.



Frecuencia acumulada: Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Esta se representa por Fi.



Frecuencia relativa: Se dice que es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por hi. La suma de las frecuencias relativas siempre debe ser igual a 1.



Frecuencia relativa acumulada: Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos; se representa por Hi. Se puede expresar en tantos por ciento.

Ejemplo: Supongamos que las calificaciones de un estudiante de secundaria son las siguientes:18,13,12,14,11,08,12,15,05,20,18,14,15,11,10,10,11,13.N=18  La frecuencia absoluta de 11 es 3 pues 11 aparece 3 veces.  La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o iguales a 11.

4

 La frecuencia relativa de 11 es 0.16, porque corresponde a la división de 3/18. (3 de las veces que se repite o aparece, entre las 18 notas que aparecen en total)  La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la división de 7/18 (frecuencia absoluta acumulada entre el número total de muestras) Según la naturaleza de la variable estudiada las distribuciones de frecuencia pueden ser para datos no agrupados y datos agrupados. Distribución de frecuencia para datos no agrupados. Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho modificación al tamaño de las unidades originales. Se presenta cuando la variable es discreta y no presenta excesivos valores; aquí cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias. Componentes de la distribución de frecuencias para datos no agrupados Esta tabla está compuesta por las siguientes columnas: 

Valores de la variable: son los diferentes valores que toma la variable en el estudio.



Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La sumatoria de las frecuencias absolutas es igual al número de datos.



Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van contando hasta ese momento o cuántos datos se van reportando.



Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del estudio. 5



Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han reportado hasta ese momento. Es la suma de las frecuencias relativas, y se puede calcular también dividiendo la frecuencia acumulada entre el número de datos del estudio.



Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.



Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la frecuencia relativa acumulada por 100%.

Ejemplo: Sea X la variable que representa el número de fallas de asistencia al colegio de los 50 estudiantes de un curso durante un año escolar. X genera el siguiente conjunto de los datos numéricos: 3,2,3,4,1,2,3,4,3,3,3,5,6,6,5,3,4,1,2,3,2,5,1,3,3,3,2,4,1,2,2,3,3,5,5,6,3,4,4,1,2,4,3,7, 7,3,7,6,5,3.  Población: La totalidad de los estudiantes del colegio de estudio.  Muestra: Los 50 estudiantes del curso en estudio.  Tipo de variable: La variable X solamente toma valores enteros en el intervalo[1,7] razón por la cual afirmamos que X es una variable cuantitativa discreta. Entonces:

6

 Recordemos que la frecuencia absoluta fi indica el número de veces que aparece el valor xi de la variable  Así, fi=6 indica que 6 de los 50 estudiantes faltaron 5 días al colegio durante el año escolar.  La frecuencia acumulada Fi indica el número de elementos del conjunto que son inferiores o iguales a un valor xi determinado de la variable.  Así, F5=43 indica que 43 de los 50 alumnos registraros 6 o menos faltas de asistencia (como máximo o a lo sumo 6 faltas). Lo anterior equivale a afirmar que el 43/50 * 100%=86% de los estudiantes registraron como máximo 6 faltas de asistencia.

Distribución de frecuencia de clase o de datos Agrupados: Es aquella distribución en la que los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un número grande de valores o la variable es continua; en este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Estas deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase; las cuales estarán delimitada por el límite inferior y el límite superior de la clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.

7

Componentes de una distribución de frecuencia de clase 

Rango o Amplitud total (recorrido): El rango es el tamaño del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribución de frecuencia se designa con la letra R. 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟



Clase o Intervalo de clase: Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos límites.

Una regla práctica para determinar cuántos intervalos van a incluirse es el uso de una formula dada por Herbert Sturges, dicha fórmula es: 𝐾 = 1 + 3,322 log(𝑛) Donde: K: Número de intervalos de clases n: Número de valores total en el conjunto de datos La respuesta obtenida bajo esta fórmula no debe considerarse como definitiva, sino como una guía, dado que el valor debe ser un muero entero. 

Amplitud de Clase, Longitud o Ancho de una Clase: La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Esta puede determinarse dividiendo el recorrido entre el valor de K. Simbólicamente está dada por: 𝐼𝑐 = 𝑅/𝐾

8



Punto medio o Marca de clase: El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el cálculo de la media aritmética.

Ejemplo: Una tienda realizo un trabajo para determinar el precio de cierto artículo en las tiendas de la competencia. La siguiente tabla muestra los precios en Bs.S de dicho artículo para realizar así la distribución de frecuencia.

Entonces:  Variable cuantitativa continua  Rango o amplitud total: R= 0.81-0.7=0.11  Clase o intervalo de clase: K=1+3.322(log 90) =7.5=8  Amplitud de clase, longitud o ancho de una clase: Ic=0.11/8 =0.01375

9

Unidad IV- Métodos de representación gráfica. Los gráficos estadísticos, también conocidos como técnicas gráficas, son gráficos en el campo de las estadísticas que se utilizan para visualizar datos cuantitativos. En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización de sombreado, colores, puntos, líneas, y símbolos (coordenadas), permiten representar la información. La utilidad de los grafico es doble, ya que pueden servir no solo como sustituto a las tablas, sino que también constituyen por si mismos una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no solo para describir y resumir la información, sino también para analizarla. Los métodos estadísticos gráficos tienen cuatro objetivos: La exploración del contenido de un conjunto de datos, el uso para encontrar estructura en los datos, verificación de supuestos en modelos estadísticos, comunicar los resultados de un análisis. Mientras que las estadísticas y los procedimientos de análisis de datos generalmente producen su salida en forma numérica o tabular, las técnicas gráficas permiten que dichos resultados se muestren en algún tipo de forma pictórica; Incluyen gráficos como gráficos de dispersión, histogramas, gráficos de probabilidad, gráficos de espagueti, gráficos de residuos, gráficos de caja, gráficos de bloques y biplots; el análisis de datos exploratorios se basa, en gran medida, en tales técnicas. Tipos de gráficos 

Diagramas de barras: Muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.

10



Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas.



Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema de ejes cartesianos.



Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones proporcionales según el valor de las frecuencias relativas.



Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable.

11



Cartogramas: expresiones gráficas a modo de mapa.



Pirámides de población: para clasificaciones de grupos de población por sexo y edad.

Uso de cada tipo de gráfico. 

Diagrama de barras: Se utiliza para la representación de variables cuantitativas discretas, cada valor de la variable se representa por un punto sobre el eje OX y sobre él se dibuja una barra de longitud igual o proporcional a su frecuencia absoluta. Si la frecuencia absoluta que se utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama de barras acumulativo.

Ejemplo: En una empresa se desea conocer el color de ojos de sus empleados, se observa a los 50 empleados y se obtienen los siguientes resultados:

12



Histograma: Se utiliza para la representación de variables cuantitativas continuas, cada intervalo se representa sobre el eje OX, este será la base del rectángulo que se dibuja sobre él con altura igual o proporcional a su frecuencia absoluta. Como los intervalos son consecutivos, los rectángulos quedan adosados. Si se utilizarán rectángulos de amplitud diferente, el área del rectángulo es la que tendría que ser proporcional a la frecuencia absoluta correspondiente a ese intervalo. Histograma acumulativo, si se utiliza la frecuencia absoluta acumulativa.

Ejemplo: Se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase).

13

14



Polígonos de frecuencias: Se utilizan para variables estadísticas cuantitativas, discretas o continuas. Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una poligonal, los extremos superiores de las barras. Para una variable continua, el polígono de frecuencias se obtiene uniendo por una poligonal los puntos medios de la base superior de los polígonos del histograma. Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el impacto visual de los mismos.

Ejemplo: Permite reflejar las temperaturas máximas promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal), deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), en cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El polígono de frecuencia se creará al unir, mediante un segmento, las diversas temperaturas más elevadas promedio 

Gráficos de sectores: Se utiliza para todo tipo de variable estadística, cuantitativa o cualitativa. Consiste en dibujar sectores sobre un círculo, siendo la amplitud de los sectores proporcional a su frecuencia absoluta, cada sector se rellena con un color diferente. El cálculo de la amplitud en grados sexagesimales del sector correspondiente se realiza así: ángulo = frecuencia relativa*360

Ejemplo: Un compañero de Ana decidió preguntar a sus compañeros por su deporte favorito y obtuvo los datos, que aparecen en la tabla siguiente:

15



Pictogramas: Es un tipo de gráfico, que en lugar de barras utiliza figuras proporcionales a la frecuencia; generalmente se emplea para representar variables cualitativas. Para realizar su grafica primero de debe escoger las figuras que sean alusivas al tema y se les asigna un valor. En caso de que una cantidad represente un valor menor, la figura aparecerá mutilada.

Ejemplo: A partir de la gráfica se puede indicar ¿en qué mes se plantaron menos arboles? Y ¿en cuál mes se hicieron más plantaciones?



Cartogramas: Un cartograma es un diagrama que muestra datos cuantitativos asociados a áreas, mediante la modificación de los tamaños de las unidades de enumeración que comprenden un mapa geográfico. Las frecuencias o rangos de frecuencias se muestran mediante el uso del color o el tamaño (requiriéndose una leyenda para comprenderse).

Ejemplo: Un cartograma que indica la densidad de una población

16



Pirámides de población: La pirámide de población o pirámide demográfica como también se le conoce, es la representación gráfica de la distribución por edad y sexo de la población. Gráficamente consiste en un doble histograma de frecuencias, dispuestas en forma horizontal, señalando los puntos de la población masculina (a la izquierda) y la población femenina (a la derecha).

Ejemplo:

Las características de la estructura de la población, dependerá de los factores de la dinámica demográfica: mortalidad, fecundidad y migración. La combinación de estos tres factores, al igual que el tamaño de la población, son aspectos determinantes en la descripción de la población. Unidad V-Medidas de tendencia central. Son medidas estadísticas que se usan para describir cómo se puede resumir la Localización de los datos, estas ubican e identifican el punto alrededor del cual se centran los datos, además nos indican hacia donde se inclinan o se agrupan más dichos datos. Cumplen con el propósito de mostrar en qué lugar se ubica el elemento promedio o típica del grupo, comparar o interpretar cualquier valor en relación con el puntaje central o típico, comparar el valor adquirido por una misma variable en dos diferentes ocasiones, y comparar los resultados medios obtenidos por dos o más grupos. 17

Tipos de medidas de tendencia central. Las medidas de tendencia central más utilizadas son: la media, la mediana y la moda 

La media: También conocida como promedio aritmético resulta ser la medida de tendencia central más conocida y utilizada, se representa por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ cuando se trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc. Se obtiene sumando todos los valores de los datos y divide el resultado entre la cantidad de datos. Sus fórmulas de cálculo son:  Media aritmética para datos no agrupados muéstrales:

 Media aritmética para datos no agrupados poblacionales:

Ejemplo: Se presenta la siguiente muestra de las puntuaciones en un examen de un curso de estadística: 70,90, 95, 74, 58, 70, 98, 72, 75, 85, 95, 74, 80, 85, 90, 65, 90, 75, 90, 69. Podemos calcular el promedio de las puntuaciones para conocer cuántos estudiantes obtuvieron puntuaciones por encima y por debajo del promedio. 18

Primero, sumamos todos los valores de los datos y el resultado lo divide entre el total de datos o tamaño de la muestra. Al sumar todas las puntuaciones en el ejemplo anterior obtendrás un total de 1600, que dividido por 20(total de datos), es igual a 80. Si empleamos la fórmula obtenemos:

 Media aritmética para datos agrupados:

Donde:  X: promedio muestral (estadístico).  μ: promedio poblacional (parámetro).  Σ: Signo de sumatoria.  N = número de datos de la población.  n: número de datos de la muestra.  fi: frecuencia absoluta.  Xc: Marca de clase o punto medio. Ejemplo: Los gastos diarios en periódicos del hotel agrupados en una tabla de frecuencia:

19

El promedio aritmético es:

Donde:  Se construye la tabla de distribución de frecuencias.  Se obtiene el total de la frecuencia absoluta de clase por el punto medio.  El resultado obtenido se divide entre el tamaño de la muestra. 

La mediana (Me): Es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud, en ocasiones se le llama media posicional, porque queda exactamente en la mitad de un grupo de datos, luego de que los datos se han colocado de forma ordenada. En este caso la mitad (50%) de los datos estará por encima de la mediana y la otra mitad (50%) estará por debajo de ella. La mediana es el valor intermedio cuando los valores de los datos se han ordenado. Sus fórmulas de cálculo son:  Para datos no agrupados: Primero se ordenan los datos, luego se calcula la posición de la mediana con la siguiente formula: (n+1) ÷ 2 donde, n es el número de datos.

Ejemplo I: Se tiene una muestra de tamaño 5 con los siguientes valores: 46, 54, 42, 48 y 32. Primer paso, ordenar los datos: 32 42 46 48 54 Como la cantidad de datos es impar (5 datos), la mediana es el valor del dato que se encuentra ubicado en la posición (5+1) ÷2=3, la mediana es: Me = 46.

20

Ejemplo II: Se ha obtenido una muestra con los valores de datos: 27, 25, 27, 30, 20 y 26. Primer paso, ordenar los datos de forma ascendente: 20 25 26 27 27 30 Como el número de datos es par (6), la mediana es el promedio de los datos que se encuentran en las posiciones (6+1) ÷1 = 3.5. Por lo tanto la mediana es:

 Para datos agrupados:

Donde:  Li: Límite inferior real de la clase que contiene la mediana.  n: tamaño de la muestra.  Fi-1 = Frecuencia acumulada anterior a la clase que contiene la mediana.  Fi: frecuencia de clase absoluta de la clase mediana. Ejemplo: Según la tabla de datos. Para identificar la clase mediana se divide n/2 y la primera clase que contenga una frecuencia acumulada mayor que n/2. n = 32, entonces n/2 = 32/2 = 16. Buscar la primera frecuencia acumulada mayor que 16, esa será la clase mediana.

21

Ahora se aplica la fórmula: Me = (6.95 + ((32/2 – 8)/9) ∗ (0.9)) = 6.95 + (16 – 8) / 9) ∗ (0.9) Me = (6.95 + (8/9) ∗ (0.9)) = 6.95 + (0.88 ∗ 0.9) Me = 6.95 + 0.79 Me = 7.75 ≈ 7.8 

La Moda (Mo): Es el dato que más se repite o el dato que ocurre con mayor frecuencia. En un

polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico, El cálculo de la moda es sencillo, esta es de fácil interpretación y resulta ser la única medida de posición central que puede obtenerse en las variables de tipo cualitativo, y en su determinación no intervienen todos los valores de la distribución. Una muestra puede tener no tener moda o tener más de una moda, en dicho caso se establece que de tener una moda seria unimodal, dos modas seria bimodal o más de dos modas seria multimodal. Ejemplos:  Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30. Mo = 25 es unimodal  Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.Mo= 20 y 25, se dice que es bimodal.  Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.Mo= 20, 25 y 30, se dice que es multimodal. Sus fórmulas de cálculo son:  Para datos no agrupados: Lo primero que debemos hacer es ordenar los datos de estudio, posteriormente buscamos la repetición de una cifra con mayor frecuencia, para ello organizaremos los números de forma ordenada.

22

La moda será el dato que aparezca con mayor asiduidad. La moda puede no existir, o aparecer en varias ocasiones en el mismo supuesto. Ejemplo: Determinar la moda de la siguiente muestra:3,5,4,9,0,1,5,2,5,7,8. 2,4,5,5,7,8,9,5,8,1,3,0. La moda es 5  Para datos agrupados: Cuando tratamos datos agrupados antes de definir la moda, debemos obtener el intervalo modal, que es el de mayor frecuencia absoluta. Para obtener la moda estadística en datos agrupados haremos uso de la fórmula:

Donde  Lir: Límite inferior verdadero de la clase modal  d1: Es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal (𝑓𝑖 − 𝑓𝑖 − 1)  d2: Es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal. (𝑓𝑖 − 𝑓𝑖 + 1)  fi: Es la frecuencia absoluta de la clase modal.  fi-1: Es la frecuencia de clase absoluta anterior a la clase modal  fi+1: Es la frecuencia de clase absoluta posterior a la de la clase modal.  i: Amplitud del intervalo modal. Ejemplo: En los datos agrupados, la moda, es la marca de clase de la clase que contenga la mayor frecuencia absoluta. Según la tabla de datos:

23

d1 = 9 – 5 = 4 d2 = 9 – 7 = 2 Mo = 6.95 + (4 / 4 + 2) * 0.9 = 6.95 + (4 / 6) * 0.9 = 6.95 + 0.66 * 0.9 Mo = 6.95 + 0.59 Mo = 𝟕. 𝟓𝟓 ≈ 𝟕. 𝟔 Tipos de gráficas de medidas de tendencia central. 

Gráfica poligonal o de línea.

 En el eje horizontal se ubican a intervalos regulares las profesiones.  En el eje vertical se colocan las frecuencias.  Se representa cada par ordenado (profesión, frecuencia) por un punto  Se unen los puntos, cerrando el polígono. 

Gráfica de Barras: cada barra se traza teniendo en cuenta la magnitud de la frecuencia que se representa.

24



Histograma: consiste en una serie de rectángulos cuyas bases están en el eje horizontal con centros.

Unidad VI-Medidas de dispersión o variabilidad Son medidas que informan sobre la variabilidad que existe en un conjunto de puntuaciones. Indican en qué medida las puntuaciones se aproximan entre sí. Las medidas de dispersión son números reales no negativos, su valor es igual a cero cuando los datos son iguales y este se incrementa a medida que los datos se vuelven más diversos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de desviaciones positivas y negativas podría cancelarse entre sí, así que se adoptan dos clases de estrategias para salvar este problema.

25

Una es tomando las desviaciones en valor absoluto (por ejemplo desviación media) y otra es tomando las desviaciones al cuadrado (por ejemplo varianza). Ejemplo: Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros: 3, 3, 4, 4,5. Entonces: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. Éste es la media:

La varianza es:

Siendo la desviación típica su raíz cuadrada:

Tipos de medidas de dispersión. 

La desviación estándar: Es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.

Ejemplo: Los administradores dan seguimiento al tiempo de egreso de los pacientes tratados en las áreas de urgencia de dos hospitales. Aunque los tiempos de egreso promedio son aproximadamente iguales (35 minutos), las desviaciones estándar son significativamente diferentes. La desviación estándar del hospital 1 es de aproximadamente 6. En promedio, el tiempo para dar de alta a un paciente se 26

desvía de la media (línea discontinua) aproximadamente 6 minutos. La desviación estándar del hospital 2 es de aproximadamente 20. En promedio, el tiempo para dar de alta a un paciente se desvía de la media (línea discontinua) aproximadamente 20 minutos. 

Rango, amplitud total o recorrido: Podemos definirlo como la distancia que existe entre la máxima y la mínima puntuación de una distribución. El rango es la medida de dispersión más imperfecta, por cuanto se determina sólo a partir de puntuaciones extremas, ignorando a todas las demás. Entre los tipos de rango se encuentran:  Rango excluyente: La diferencia que existe entre la máxima y la mínima puntuación en una distribución.  Rango incluyente: La diferencia entre la máxima y la mínima puntuación más una unidad de medida

Ejemplo: 2, 8, 9, 1, 23, 56. Entonces:  El rango excluyente sería: 56-1 55  El rango incluyente sería: 561+1 56 

Varianza (S): Podemos

definirla

como el promedio del cuadrado de las

diferencias de todas las puntuaciones respecto a la

media

aritmética. La

varianza es la distancia media entre puntuaciones. Una varianza puede valer cualquier cosa, es decir, no tiene límites numéricos. Ejemplo: Datos sin agrupar

27

Ejemplo II: Datos agrupados en intervalos



Coeficiente de variación: Es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del manual o la fuente utilizada. Su fórmula es la siguiente:

Fórmulas de cálculo. 

Para datos no agrupados:  Rango: Se calcula hallando la diferencia entre los valores máximo y mínimo. R = Valor máximo – Valor mínimo.  Desviación estándar:

.  Varianza: La desviación estándar para datos agrupados se obtiene con la misma fórmula de los datos no agrupados, solos que X es la marca de clase del intervalo.

28

 Coeficiente de variación: El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

El coeficiente de variación se suele expresar en porcentajes:

El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas .Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor dispersión corresponderá al valor del coeficiente de variación mayor Para Datos Agrupados  La varianza para una población se calcula con:

 La desviación estándar poblacional se calcula con:

 La varianza de la muestra se calcula con:

 La desviación estándar de una muestra se calcula con:

29

Grafica de dispersión Es una forma fenomenal de expresar datos de dos variables, y hacer predicciones basadas en los datos. Al contrario de los histogramas y los diagramas de caja, los de dispersión muestran valores de datos individuales. Este es el diagrama de dispersión que expresa la cantidad de dinero que se ganó Mateo cada semana trabajando en la tienda de su padre.

Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó en esa semana en el eje y. En general, la variable independiente (la variable que no está influenciada por nada) está en el eje x y la variable dependiente (la que es modificada por la variable independiente) está en el eje y. En este diagrama podemos ver que en la semana 2 Mateo se ganó alrededor de $125, y en la semana 18 estuvo cerca de los $165. Pero más importante aún es la tendencia. Por ejemplo, con estos datos podemos ver que Mateo gana cada vez más según pasan las semanas. Quizá su padre le da más horas a la semana o más responsabilidades.

30

Conclusión. Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que actualmente ésta se ha convertido en un método muy efectivo para describir con mucha precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información, ahora tiene un papel mucho más importante del que tenía en años pasados. Es de vital importancia para nuestra vida profesional venidera, que manejemos estos conceptos con facilidad, así mismo el que los usemos de la manera apropiada, siempre en pro de buscar soluciones a los problemas que se nos puedan presentar.

31

Referencias bibliográficas. 

https://www.ecured.cu/Tablas_de_frecuencia



https://issuu.com/franciscoe71/docs/prueba2_pdf



http://aldocgh.tripod.com/



https://www.hiru.eus/es/matematicas/medidas-de-tendencia-central

32

More Documents from "nicole suarez"