Estadistica Descriptiva

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica Descriptiva as PDF for free.

More details

  • Words: 996
  • Pages: 4
ESTADISTICA DESCRIPTIVA La estadística descriptiva se relaciona con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas. Se recibe información en forma de datos a través de los periódicos, televisión, internet, y demás medios de transmisión de información; es necesario tener una hipótesis de la información que contiene los datos que recibimos. Los métodos empleados para resumir y organizar datos se denomina estadística descriptiva; mientras que los métodos para tomar decisiones se denomina inferencia estadística.

La población se refiere a los elementos del universo respecto al cual se quiere obtener hipótesis a través de la información obtenida para así mismo tomar decisiones. A cada elemento se le puede asociar una medición que bien puede ser numérica o cualitativa dependiendo de la característica que se quiera estudiar. La Muestra es el subconjunto de observaciones seleccionadas de la población de interés Variables •

A cada característica de los elementos de una población se le llama variable, las cuales pueden ser cualitativas y cualitativas.

o

Cualitativas: se refieren a categorías o atributos de los elementos (individuos) estudiados; sus tipos son:

* Dicotómicas: Solo hay dos categorías, las cuales son excluyentes una de la otra, como los antónimos * Nominal: Tiene más de dos categorías y no existe orden entre ellas, ejemplo: color de ojos, grupo sanguíneo * Ordinal: Tiene varias categorías y hay orden entre ellas, ejemplo: grado tumoral, calificación del riesgo.

o

Cuantitativas: Los datos son de tipo numérico, sus tipos son:

* Continuas: Número infinito no numerable de elementos, con el está asociado el término “medida”, ejemplo: Presión arterial, edad, peso * Discreta: Números finitos o infinitos numerables de elementos. Se asocia con el término “conteo”, ejemplo: Numero de hijos, numero de estudiantes.

LAS MEDIDAS DESCRIPTIVAS MÁS COMUNES DE TENDENCIA CENTRAL O LOCALIZACION SON:

Mediana aritmética y la mediana (existen otras medidas de tendencia central que en ocasiones pueden resultar de interés: la moda, los cuartiles, los deciles, los percentiles, la media armónica, la media geométrica y la media ponderada)

LA MEDIA ARITMÉTICA o simplemente promedio (también llamada Media muestral ya que generalmente se calcula en relación a una muestra); numero de observaciones de muestra dividido por la suma del inverso de cada una de las observaciones.

Características de la Media



Es intuitiva y fácil de calcular



Su valor puede que no coincida con ninguno de los valores de la muestra



La suma de las diferencias de cada valor de la muestra con le media su resultado es cero(0)

MEDIANA Es el valor más “Intermedio” una vez que los datos han sido ordenados en forma creciente. La mediana es aquel valor que deja el 50% de los datos por debajo y otro 50% por encima. Cabe destacar que es preferible el uso del la mediana como medida descriptiva del centro cuando se quiere reducir o eliminar el efecto de valores extremos en un conjunto de datos (muy grandes o muy pequeños)

MODA Es una medida de tendencia central que se puede utilizar sea cual sea el tipo de variable a estudiar. La moda de un conjunto de observaciones es el valor que más se repite, aquel cuya frecuencia absoluta es máxima. Puede ser única, que haya más de una, o que no exista.

La

localización o tendencia central de un conjunto de datos no necesariamente proporciona información suficiente para describirlos adecuadamente. Debido a que todos los valores son semejantes, la variación entre ellos se considera importante. Se puede decir que un conjunto de datos tiene una dispersión reducida si los mismos se acumulan estrechamente en torno a alguna medida de localización de interés y se dice que tiene una gran dispersión si se esparcen ampliamente alrededor de alguna medida de localización de interés.

Las medidas descriptivas más comunes de dispersión son: El rango, la varianza, la desviación estándar y el rango intercuartilico.

EL RANGO: De la muestra es la medida de variabilidad más sencilla entre todas las mencionadas; y se define como la diferencia entre la observación más grande y la más pequeña; R = X max – X min. Aunque es una medida muy fácil de calcular, ignora toda la información de la muestra entre las observaciones más grande y más pequeña. Sin embargo, vale la pena resaltar que el rango se utiliza mucho en aplicaciones estadísticas al control de calidad, donde lo común es emplear muestras con tamaños n = 4 o n = 5 ya que en estos casos la perdida de información no se considera relevante. En general, se desea una medida de variabilidad que dependa de todas las observaciones y no solo de unas pocas; así que parece razonable medir la variación en términos de los desvíos referentes a alguna medida de localización (generalmente esta medida es la media)

CUARTILES, DECILES Y PERCENTILES Los cuartiles se dividen a un conjunto de datos en cuatro partes iguales: se piensa en un conjunto de datos ordenados de menor a mayor, el valor del medio es la mediana, esto es 50% de los datos son mayores que la mediana y 50% son menores, de manera similar los cuartiles dividen a un conjunto de datos en cuatro partes.

ASIMETRIA Si los valores de la serie de datos presentan la misma forma a la izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimetríca. Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetria de Fisher

CURTOSIS El Coeficiente De Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución Se definen 3 tipos de distribuciones según su grado de curtosis: •

Distribución mesocurtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).



Distribución leptocurtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.



Distribución platicurtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

Related Documents