Estadistica-descriptiva-y-graficacion-1er-hemi.docx

  • Uploaded by: mary sol
  • 0
  • 0
  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica-descriptiva-y-graficacion-1er-hemi.docx as PDF for free.

More details

  • Words: 4,897
  • Pages: 27
Estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase). Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). Variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. Las variables cuantitativas son de naturaleza numérica y se obtienen con instrumentos de medición (peso, talla, presión arterial, valores de hematócrito); pueden ser continuas, cuando no poseen interrupciones en la escala de valores que se presente (ejemplo: talla: 1.79 m; peso: 51.99 kg), o pueden ser discretas cuando tienen interrupciones en la escala de valores (ejemplo: número de hijos, ingresos en una guardia, defunciones hospitalarias). La escala de razón, utilizada para variables cuantitativas, es el nivel más alto de medición medición; consiste en obtener los valores reales de cada medición individual

La escala de intervalos que se aplica a variables cuantitativas consiste en ordenar los valores de una serie de datos, estableciendo distancias definidas entre dichos datos. LAS VARIABLES CUALITATIVAS son características que no pueden ser medidas con instrumentos (como el color de ojos, la religión o el estado civil); se clasifican en nominales y ordinales. En la escala nominal se designan o nombran las observaciones en varias categorías como el grupo y Rh, religión, estado civil y algunas pueden ser dicotómicas, por ejemplo, aprobado sí o no, género masculino o femenino. La escala ordinal consiste en clasificar por grados de acuerdo con algún criterio, por ejemplo, vómito leve, moderado, severo; estado socioeconómico bajo, medio, alto. Ejemplo de la utilización de diferentes tipos de escalas de las variables para un mismo fenómeno. Evaluación de la diarrea. Escala de razón: número de evacuaciones por día = 20. Escala de intervalo: número de evacuaciones por día = de 1-5; 6-15, >15.

Escala ordinal: diarrea leve, moderada, severa. Escala nominal: con diarrea, sin diarrea RAZÓN Es la comparación, a través de una división, de dos grupos de individuos con atributos de diferente naturaleza. Es la forma más simple de mostrar desigualdades entre grupos. Continuando con otro ejemplo hipotético, se han atendido a 1,200 pacientes con diabetes en el Servicio de Urgencias, 900 de ellos fueron mujeres y 300 hombres. En la división puede considerarse como numerador cualquiera de los valores. De ahí que 900/300 = 3, por lo que la relación entre mujeres y hombres con respecto a diabetes mellitus que acudieron al Servicio de Urgencias fue de 3 mujeres por cada hombre (3:1).

TASA La tasa es la medida de frecuencia que da cuenta de la velocidad de cambio en la población, de estar sana a pasar al estado enfermo, o del estado de enfermo a sano. La tasa es la comparación, a través de una división, entre el número de veces que se presenta una enfermedad, o el evento estudiado, en un periodo determinado, entre el tiempo-persona o tiempo poblacional, que es la expresión con la que cada individuo contribuye libre de la enfermedad, o del evento, en el tiempo de seguimiento

MEDICIÓN CLÍNICA-DESCRIPTIVA: La estadística descriptiva tiene como objetivo mostrar el comportamiento en conjunto de los valores que se obtienen a través de la medición de las variables elegidas. Muestra los detalles simples de cada variable en el grupo de individuos que son estudiados así como su distribución. Las medidas de resumen de las variables cuantitativas en escala de razón que se usan para la descripción son: media, mediana y moda. También se llaman medidas de tendencia central. Las medidas de dispersión para variables cuantitativas en escala de razón son: varianza y desviación estándar. Indican qué tan alejados están los valores del centro de la distribución

MEDIA Es el promedio aritmético de las observaciones. Es el valor que representa a todos los individuos de la muestra. La fórmula es: X= x /n Donde x es el valor de cada una de las observaciones y n representa el total de las observaciones. Los pasos para obtener la media son: 1. Sumar los valores de todas las observaciones. 2. El resultado de la suma se divide entre el número total de observaciones. Ejemplo: Se pretende describir el promedio de edad de los 10 niños que ingresaron por primera vez a una guardería. Las edades registradas en años fueron: 1, 2, 3, 2, 1, 4, 1, 1, 3 y 4. La suma de las edades de todos los niños es 22, dividido entre los 10 niños es igual a 2.2 años. Por lo tanto, el promedio de edad de los niños que ingresaron por primera vez a una guardería es de 2.2 años. Uno de los inconvenientes de esta medida de resumen es su sensibilidad a valores extremos, tanto muy altos como muy bajos, ya que la media se ve influida por estos valores. Cuando esto ocurre es preferible utilizar otra medida de resumen como la mediana. MEDIANA Es el valor que divide exactamente a la mitad una serie de valores ordenados de menor a mayor, lo que provee una lista de observaciones con los valores más bajos y otra de observaciones con los valores más altos. Cuando la cantidad de observaciones es impar, la mediana es el valor de la observación que justamente está en medio de la serie ordenada de valores; su fórmula es mediana = n + 1/ 2 Cuando el número de observaciones es par, la mediana es el promedio de los dos valores centrales, ordenados en forma progresiva. Pasos para obtener la mediana: 1. Ordenar los valores de las observaciones de menor a mayor. 2. Identificar la ubicación del valor de la mediana. 3. Cuando la serie es par, identificar los dos valores centrales, sumarlos y promediarlos. Ejemplo: Encontrar la mediana de la hemoglobina glicosilada (medida en %) de 14 personas con diabetes mellitus tipo II tratados con glibenclamida: 8, 11.9, 8.5, 7.4, 8, 9.6, 8.5, 6.7, 7, 10.4, 7, 8.2, 8.7, 8.1. Observaciones ordenadas de menor a mayor: 6.7, 7, 7, 7.4, 8, 8 ,8.1, 8.2, 8.5, 8.5, 8.7, 9.6, 10.4 y 11.9. Se obtiene el promedio de los números centrales marcados en negritas (8.1 + 8.2)/2 = 16.3/2 = 8.15, que es el valor de la mediana. MODA Es el valor que más se repite en una serie de datos. En algunos casos, es posible encontrar dos o más modas por lo que la distribución se considera bimodal o trimodal. En el ejemplo anterior hay tres modas, ya que los valores 7, 8 y 8.5 se repiten en dos ocasiones. Si la media, la mediana y la moda adoptan el mismo valor en una serie de datos, podemos concluir que la distribución se acerca a la normalidad. MEDIDAS DE DISPERSION: Las medidas de dispersión son números reales no negativos, su valor es igual a cero cuando los datos son iguales y este se incrementa a medida que los datos se vuelven más diversos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).

La s m ed i d a s de di sp e r si ó n n o s i n fo r man s ob r e cu án t o s e al ej an del c en t r o l os v al o r es de l a di st ri bu ci ón .

El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. 

LA DISPERSIÓN.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque:   

Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.

RANGO:

Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

VARIANZA Y DESVIACIÓN ESTÁNDAR La varianza es la dispersión que presentan los datos con respecto al valor promedio. Da cuenta de la variabilidad de los valores tomando como referencia al promedio. La fórmula es:

Debido a que la varianza es muy compleja de interpretar, ya que el resultado se expresa al cuadrado, por ejemplo litro cuadrado, metro cuadrado, mmHg cuadrado, es conveniente utilizar una medida de dispersión más comprensible como lo es la desviación estándar.

La desviación estándar es la distancia a lo largo de un eje horizontal entre el promedio y el punto donde la curva pasa de convexa a cóncava y nos brinda información del porcentaje del área bajo la curva que se logra tener, es decir, el porcentaje de los valores de que se encuentran bajo la curva de distribución normal. Se consideran como normales los valores ubicados entre la media y más menos dos desviaciones estándar, que equivalen al 95.4% (Figura 1). La desviación estándar se obtiene simplemente calculando la raíz cuadrada de la varianza y la fórmula es:

Siguiendo el ejemplo anterior, el valor promedio de la hemoglobina glicosilada sería de 8.35 y la varianza de estos valores con respecto al promedio sería de 1.54 al cuadrado. Si calculamos la raíz cuadrada de 1.54 obtenemos la desviación estándar que sería en este caso de 1.24. Por lo anterior, los valores normales se encontrarían entre 8.35 más menos 2 (1.24), lo que da un intervalo de valores entre 5.87 y 10.83.

Desviación típica: Se calcula como raíz cuadrada de la varianza. Coeficiente de varización de Pearson: se calcula como cociente entre la desviación típica y la media.

Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva: a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra. Para medir el nivel de concentración de una distribución de frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice de Gini. b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares. c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra.

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución

GRAFICACION: Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico de tarta", "gráfico de torta" o "gráfica de 360 grados", es un recurso estadístico que se utiliza para representar porcentajes y proporciones. El número de elementos comparados dentro de una gráfica circular suele ser de más de cuatro. Se utilizan en aquellos casos donde interesa no solamente mostrar el número de veces que se dan una característica o atributo de manera tabular sino más bien de manera gráfica, de tal manera que se pueda visualizar mejor la proporción en que aparece esa característica respecto del total. A pesar de su popularidad, se trata de un tipo de gráfico poco recomendable debido a que nuestra capacidad perceptual para estimar relaciones de proporción o diferencias entre áreas de sectores circulares es mucho menor que, por ejemplo, entre longitudes o posiciones, tal y como sucede en otras gráficas.

El diagrama circular (también llamado gráfica circular, gráfica de pastel o diagrama de sectores) sirve para representar variables cualitativas o discretas. Se utiliza para representar la proporción de elementos de cada uno de los valores de la variable.

Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa. Entiéndase como porción la parte del círculo que representa a cada valor que toma la variable.

Diagrama de Caja y Bigotes Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.

  

Construcción: Comparar distribuciones Diagrama de Caja a través de Excel

Construcción: Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

Las líneas de tendencia se usan para mostrar gráficamente las tendencias de los datos y analizar los problemas de predicción. Este análisis también se denomina análisis de regresión. Mediante el uso del análisis de regresión, puede representarse una línea de tendencia en un gráfico más allá de los datos reales para predecir los valores futuros. Por ejemplo, en el siguiente gráfico se utiliza una línea de tendencia lineal simple que pronostica los cuatro próximos trimestres para mostrar claramente una tendencia hacia ingresos en incremento.

Diagrama de dispersión Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.

Descripción[editar] Se emplea cuando una variable está bajo el control del experimentador. Si existe un parámetro que se incrementa o disminuye de forma sistemática por el experimentador, se le denomina parámetro de control o variable independiente y habitualmente se representa a lo largo del eje horizontal (eje de las abscisas). La variable medida o dependiente usualmente se representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Además, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos. El diagrama de dispersión es una de las herramientas básicas de control de calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de control, el diagrama de Ishikawa y el diagrama de flujo...

Los dispersogramas son gráficos elaborados a partir la utilización de las coordenadas cartesianas con el fin de mostrar los valores de datos "x" e "y" de un mismo elemento suceso. También conocido como diagrama de dispersión, puede sugerir diferentes tipos de correlaciones entre las variables con un intervalo de confianza determinado. Dicha correlación puede ser positiva, negativa o nula.

Dispersograma

  

Gráfico que representa la distribución de dos variables en una población de muestra. Una variable se representa gráficamente en el eje vertical y la otra horizontal. Un dispersograma demuestra el grado de tendencia de presentación de las variables en relación mutua. Denominamos parámetro de control cuando un parámetro incrementa o disminuye de forma sistemática por el experimentados. Un diagrama de dispersión puede indicar diferentes tipos de correlaciones: Correlación positiva. Indica un aumento. Correlación negativo. Indica un descenso. Nula. No hay correlación entre las variables. Con tal de estudiar la correlación que existe entre las variables, es posible trazar una línea de ajuste o línea de tendencia. En el caso de una correlación lineal, el ajuste se conoce como regresión lineal y asegura una solución correcta en un tiempo finito. Uno de los aspectos más relevantes del disperiograma es que permite mostrar las relaciones no lineales entre las variables. HISTOGRAMA: En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o

comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias, porque la variable representada en el eje horizontal ya no representa un espectro continuo de valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase. Ejemplos de su uso es la representación de edades o estaturas de una población. Por comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos. En los casos en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Tipos de gráficos relacionados con el histograma[editar] 

Histograma de frecuencias absolutas Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en educación no universitaria por su sencillez, pero sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales. En esos niveles educativos se introduce una estadística elemental y todavía no se puede profundizar en estos detalles. 

Histograma de frecuencias relativas Representa la frecuencia relativa mediante la altura de las barras. Igual que en el caso anterior se usa mucho en educación no universitaria. La elaboración del gráfico es más complicada pues los números ya no son enteros. Como en el caso anterior sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales.

 Histograma Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las barras, que no se corresponderá con la altura como ocurría en los casos anteriores. Es el que se suele usar en educación universitaria. Para su elaboración debe introducirse el concepto de altura de histograma, que es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el 100%. frente a otros en que no salen nunca) y de la costumbre, se pueden encontrar otras elecciones. ¿Qué es?

Es una gráfica de la distribución de un conjunto de datos. Es un tipo especial de gráfica de barras, en la cual una barra va pegada a la otra, es decir no hay espacio entre las barras. Cada barra representa un subconjunto de los datos. ¿Qué muestra el histograma? Un histograma muestra la acumulación ó tendencia, la variabilidad o dispersión y la forma de la distribución. ¿Para qué tipo de variable se usa? Un histograma es una gráfica adecuada para representar variables continuas, aunque también se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar gráficamente la distribución de una variable cuantitativa o numérica. Los datos se deben agrupar en intervalos de igual tamaño, llamados clases.

DEFINICIÓN DE

POLÍGONO DE FRECUENCIA

Polígono de frecuencia es el nombre que recibe una clase de gráficoque se crea a partir de un histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.

Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se forma a partir de la unión de los distintos puntos medios de las cimas de las columnas que configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son unas y otras. En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para llevar a cabo lo que es la comparación de los resultados de un proceso determinado.

Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente. Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal), deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), en cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El polígono de frecuencia se creará al unir, mediante un segmento, las diversas temperaturas más elevadas promedio. Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta en el mismo dibujo. El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia, mientras que el área que se sitúa debajo de la curva incluye todos los datos que existen. Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número de veces que un acontecimiento periódico se reitera en una unidad temporal. Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar que estos se pueden confeccionar de una manera muy sencilla y rápida. En concreto, se da la oportunidad de acometerlos mediante un programa informático que se ha convertido en uno de los ejes claves del funcionamiento de cualquier empresa. Nos estamos refiriendo al software conocido como Excel. Este es un programa, de Microsoft Office, que se confeccionó con el claro objetivo de que sus usuarios pudieran trabajar con lo que son hojas de cálculo. Por tal motivo, es lógico que también permita la posibilidad de crear polígonos de frecuencia a la hora de comparar cifras y tomar decisiones en base a las mismas.

En concreto, para conseguir crear los mismos con Excel se tiene que partir de la existencia de una serie de gráficos que se hayan confeccionado previamente para seguidamente desarrollar un conjunto de acciones que den lugar a aquellos.

More Documents from "mary sol"