Pabloo.docx

  • Uploaded by: heber
  • 0
  • 0
  • October 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Pabloo.docx as PDF for free.

More details

  • Words: 3,410
  • Pages: 15
ESTADÍSTICA

SEGUNDO PARCIAL

BLOQUE III. APLICAS LA ESTADÍSTICA DESCRIPTIVA

MEDIDAS DEL CONJUNTO DE DATOS Se denominan estadísticas sumarias a aquellas que describen las características del conjunto de datos. Para la toma de decisiones, las medidas de tendencia central y las de dispersión son las más utilizadas. Tendencia Central. Es el punto medio de una distribución. Media Aritmética de una Población. Es lo que comúnmente conocemos como promedio, para obtenerla, se suman los valores y se divide el resultado entre el número de observaciones. Cálculo de la media a partir de datos no agrupados. Media aritmética de la población: 𝝁 = Media aritmética de la muestra:

̅= �

∑� � ∑� �

NOTACIÓN MATEMÁTICA n. Número de observaciones de una muestra N. Número de observaciones del total de la población. ̅ (x barra). Media de una muestra � µ (mu). Media de la población.  (Sigma). Indica que todos los valores dados se suman Cuando contamos con una serie de pocos datos, no resulta complicado llevar a cabo el cálculo de la media aritmética, sin embargo, cuando en lugar de pocos datos desagrupados tenemos una distribución de frecuencias perteneciente a una cantidad considerable de datos, se realiza de la siguiente forma: Cálculo de la media a partir de datos agrupados. Primero debemos obtener los puntos medios de cada una de las clases de nuestra distribución. A continuación se muestra una tabla con una distribución de frecuencias del saldo promedio mensual de 600 cuentas de cheques para ilustrar lo planteado.

SALDO MENSUAL DE CUENTAS DE CHEQUES Clase (dólares) Frecuencia 0- 49.99 78 50.00- 99.99 123 100.00-149.99 187 150.00-199.99 82 200.00-249.99 51 250.00-299.99 47 300.00-349.99 13 350.00-399.99 9 400.00-449.99 6 450.00-499.99 4 600 El punto medio de la primera clase (0- 49.99) sería 24.995, podemos redondear en 24.99 para mantener los mismos decimales, y sucesivamente, obtenemos los restantes puntos medios de cada clase. Al punto medio de cada clase se le conoce también como marca de clase (� . ��. =

�𝒊 +�𝒔 ). �

Posteriormente, se multiplica cada punto medio por su respectiva

frecuencia, se suman todos estos resultados y el resultante se divide entre el total de observaciones. A continuación la fórmula: Media aritmética de una muestra con datos agrupados: � ̅=

∑(�𝑿 � ) �

NOTACIÓN MATEMÁTICA ̅ (x barra). Media de la muestra �  (Sigma). “La suma de” f. frecuencia (número de observaciones) de cada clase x. Punto medio de cada clase de la muestra n. Número de observaciones de la muestra La siguiente tabla muestra el desarrollo de la fórmula a partir de los datos manejados en el ejemplo anterior:

Calculo de la media aritmética de la muestracon los datos agrupados de la tabla 3 -3 Clase(dólares) Punto Frecuencia ( f ) fxX (1) medio (x) (3) (3) x (2) (2) x 0- 49.99 25 78 = 1950 50.00- 99.99 75 x 123 = 9225 100.00-149.99 125 x 187 = 23375 x 150.00-199.99 175 82 = 14350 x 200.00-249.99 225 51 = 11475 250.00-299.99 275 x 47 = 12925 x 300.00-349.99 325 13 = 4225 x 350.00-399.99 375 9 = 3375 x 400.00-449.99 425 6 = 2550 450.00-499.99 475 4 = 01900 x  f= n= 600 85,350 (f X x ) [ 3 -3] x = (f X x ) n = 85.350 600 =142.25 Media de la muestra (dólares) Entonces, podemos concluir que: “El saldo promedio mensual de la muestra de 600 cuentas de cheques es de $142.25”. Vale la pena aclarar que, al no conocer cada uno de los datos puntuales de la muestra , estamos suponiendo que todos los valores de una clase son iguales a su punto medio, al tener en cuenta esto, queda claro que nuestros resultados son únicamente una aproximación del promedio del saldo mensual real. Mediana. Es un valor que mide la observación central del conjunto, es decir, la observación que se encuentra más al centro del conjunto de observaciones. Mediana de un conjunto de datos no agrupados. Primero se ordenan los datos del menor valor al mayor (o viceversa), si el conjunto de elementos contiene un número impar de

elementos, el que se encuentra justo en medio será la mediana. Si hay un número de elementos par, la mediana será el “promedio” de los dos valores que se encuentren en medio del conjunto de datos (Mediana de elementos pares=

������ ������ 1+������ ������ 2 ). 2

Matemáticamente, la mediana es: � � � ����� 𝒂=(

�+�

) �

-ésimo término del arreglo de datos

NOTACIÓN MATEMÁTICA n. Número de elementos del arreglo (conjunto de observaciones) Mediana de un conjunto de datos agrupados. Al saber que la mediana es el dato que se encuentra al centro de todo el conjunto de observaciones, en una distribución de frecuencias podemos determinar la mediana de la siguiente forma: Ejemplo. La distribución de frecuencias absolutas que se muestra a continuación resume los pesos de los 20 empleados del departamento de crédito y cobranza de una empresa comercial; determina la mediana de los pesos. Peso [54.0, 57.7 ) [57.7, 61.4 ) [61.4, 65.1 ) [65.1, 68.8 ) [68.8, 72.5]

Frecuencia 1 3 8 5 3

Frecuencia acumulada 1 4 12 17 20

1. Para determinar este valor, tomamos como base el total de observaciones (20) y se realiza el cálculo (20+1)/2=10.5, por lo tanto, se buscará la mediana en el dato que ocupe los lugares décimo (10º.) y décimo primero (11º.). Apoyándonos en las frecuencias acumuladas, encontramos que la tercera clase, [61.4, 65.1), es donde se encuentra ese valor del cálculo anterior, a esta clase se le define como clase mediana o intervalo de la mediana. 2. La fórmula empleada para el cálculo de la mediana de la muestra con datos agrupados es: � ̅ =(

� /�− 𝑭 ) �+ � � � � � �

NOTACIÓN MATEMÁTICA ̅ . Mediana de la muestra � n. Número de elementos de la distribución F. Suma de todas las frecuencias anteriores a la clase de la mediana fm0. Frecuencia de la clase de la mediana. w. ancho del intervalo de clase Lm0. Límite inferior de clase de la mediana

3. De acuerdo a los datos que nos pide la fórmula, tenemos: n= 20 F= 4 fm = 8 Lm0 = 61.4 w= 3.7 4. Sustituimos los valores en la fórmula: � � /�− � � � ̅ =( )� . �+ � � . �= ( ) � . �+ � � . �= � .� � �+ � � . �= ��. � � ���� � �

Moda. A diferencia de la media y de forma similar a la mediana, la moda no se calcula mediante un proceso aritmético como los ya desarrollados, especialmente en datos sin agrupar, la moda es el valor que más se repite en el conjunto de datos. Para efectuar el cálculo, en datos agrupados, la moda se determina por medio de intervalos modales, esto significa que a simple vista identificaremos cuál es el o los intervalos que tienen la mayor frecuencia. Cálculo de la moda de datos agrupados. �� � +( )� �= � � � � �+ �� NOTACIÓN MATEMÁTICA � . Moda de la muestra � � . Límite inferior del intervalo modal (intervalo de mayo frecuencia) � � d1. Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo anterior d2. Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo posterior w. Ancho del intervalo modal

Cuando tenemos agrupaciones de datos que nos presentan dos modas, se le conoce como distribución bimodal, se realiza el mismo procedimiento para obtener la moda en datos agrupados, salvo que los datos serán distintos en cada uno de los cálculos porque las modas se encontrarán en intervalos distintos. Dispersión. Separación entre los datos en una distribución. Rango. Es la diferencia entre el más alto y más pequeño de los valores observados. Rango= Valor de la observación más grande – Valor de la observación más pequeña. Dos medidas importantes para obtener descripciones más completas de la dispersión, son aquellas que manejan con respecto a alguna medida de tendencia central, éstas son la varianza y la desviación estándar. Ambas medidas proporcionan una distancia promedio de cualquier observación del conjunto de datos con respecto a la media. Fórmula para calcular la varianza: ���=

� ∑( �−� �)



��



=

�� ∑





NOTACIÓN MATEMÁTICA �

�� . Varianza de la población x. Elemento u observación µ. Media de la población N. Número total de elementos de la población . Suma de todos los valores (�− ��)�ó todos los valores x2.

La desviación estándar es la raíz cuadrada de la varianza, dado que las cantidades en la varianza suelen ser grandes, la desviación estándar nos proporciona números más “manejables”. Representa un "promedio" de la diferencia que hay entre la media y nuestros datos. 𝝈 = √��� NOTACIÓN MATEMÁTICA �

�� . Varianza de la población ��. Desviación estándar

Desarrollo Medidas de dispersión para datos estadísticos. Los estadísticos de tendencia central indican dónde se sitúa un grupo de datos; los de variabilidad o dispersión indican si esas puntuaciones o valores están próximas entre sí, o al contrario, están muy dispersas. Entre las medidas de dispersión o variación se abordará: el rango, la varianza, la desviación típica, la desviación media y el coeficiente de variación. El Rango. Una medida razonable de la variabilidad es la amplitud o rango de variación, que se obtiene de la resta del dato mayor y el dato menor. El rango se simboliza con R. Su fórmula de cálculo es R = dato mayor – dato menor Propiedades del rango • Es fácil de calcular y sus unidades son las mismas que las de la variable. • No utiliza todas las observaciones (sólo dos de ellas); • Se puede ver muy afectado por alguna observación extrema; Varianza. La varianza (S2), se define como la media de las diferencias cuadráticas de “n” valores respecto a su media aritmética. Para efectuar su cálculo y en función de cómo se disponga de la información, se dispone de las siguientes expresiones algebraicas: Para una población de datos no agrupados

Para una muestra de datos no agrupados. n

n

∑ ( x i − µ )2 2

σ =

i=1

N

∑ (x i − x ) 2

s =

2

i=1

n −1

Donde: µ : representa a la media poblacional y x la media muestral. N: el tamaño de la población y “n” representa el tamaño de la muestra. x i : representa a cualquiera de los datos en la muestra.

i : es un contador de valores. Para distribuciones de frecuencias poblacional agrupadas sin intervalos k

∑ f i (x i − µ )2 σ 2 = i=1

k

∑ fi i=1

Para distribuciones de frecuencias muestrales agrupadas sin intervalos n

∑ f i (x i − x ) s 2 = i=1

2

k

∑ fi − 1 i=1

Donde k representa el número de agrupaciones o valores diferentes que puede tomar la variable de estudio.

103 103

BLOQUE 3

APLICAS LA ESTADÍSTICA DESCRIPTIVA

103 103

Finalmente cuando se dispone de una agrupación de datos por intervalos: Para distribuciones de frecuencias poblacional agrupadas con intervalos

Para distribuciones de frecuencias muestrales agrupadas con intervalos n

k

∑ f i (mc i − x )

∑ f i (mc i − µ )2 σ 2 = i=1

s 2 = i=1

k

∑ fi

2

k

∑ fi − 1

i=1

i=1

K en estos casos representa el número de intervalos de clase. Esta medida es siempre una cantidad positiva, con propiedades para la realización de inferencia estadística. La desviación típica o desviación estándar. Puesto que la obtención de la varianza conlleva a registros cuadráticos de las variaciones, se pierde o altera la medición original, Por ejemplo al calcular la varianza de los pesos de algunas personas, la respuesta se expresa en pesos cuadrados ¿qué significa esto? Por tal motivo y con el propósito de recuperar las unidades originales de medición, se calcula la raíz cuadrada de la varianza, a la cual se le llama desviación típica o desviación estándar. s = s2 Propiedades de la varianza y de la desviación típica • Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una puntuación cambia, la varianza se modifica. La razón es que si se toma en cuenta su definición, la varianza está en función de cada una de las puntuaciones. • La desviación típica tiene la propiedad de que en el intervalo (x − 2s, x + 2s ) se encuentra, al menos, el 75% de las observaciones Incluso si se tienen muchos datos y estos provienen de una distribución simétrica unimodal, se puede llegar al 95 % de los datos contenidos en tal intervalo. •

No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central, de distribuciones de frecuencias que presentan asimetría.

El Coeficiente de variación como medida estadística de comparación. Se ha visto que las medidas de centralización y dispersión proporcionan información sobre una muestra. Se puede preguntar si tiene sentido usar estas magnitudes para comparar dos poblaciones. Por ejemplo, si el objetivo de investigación es comparar la variación de las estaturas de grupos de jóvenes de quinto semestre de un mismo Plantel. Con el cálculo respectivo de la desviación estándar y una sencilla comparación de resultados, se responde al planteamiento ¿Pero qué sucede si lo que se compara es la comparar estaturas con pesos? El coeficiente de variación permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre medias y desviación típica. Se define del siguiente modo: CV =

s x

y para el caso de una población estadística CV =

σ µ

Propiedades del coeficiente de variación. • Sólo se debe calcular para variables con todos los valores positivos. • Todo índice de variabilidad es esencialmente no negativo. • Las observaciones pueden ser positivas o nulas, pero su variabilidad debe ser siempre positiva. De aquí que sólo se debe trabajar con variables positivas, para la que se tiene con seguridad que x > 0.

104 104

BLOQUE 3

APLICAS LA ESTADÍSTICA DESCRIPTIVA

104 104

Ejemplo 1. Los siguientes datos representan la duración en segundos de 8 espacios comerciales televisivos, que fueron elegidos al azar y transmitidos por Telemax. 18 a)

25

30

20

15

25 28

15

Determine la media muestral. x=

18+ 25+ 30+ 20+ 15+ 25+ 28+ 15 8

176 = = 22 8

b) Calcular la varianza: n

∑ (x i − x ) 2 (18− 22 )2 + (25− 22 )2 + (30− 22 )2 + (20− 22 )2 + (15− 22 )2 + (25− 22 )2 + (28− 22 )2 + (15− 22 )2 s 2 = i=1 = n −1

8

=

c)

16 + 9 + 64 + 49 + 9 + 36 + 49 232 ≈ 33.14 = 8 8

Deducir el valor aproximado de la desviación estándar:

s = 33.14 ≈ 5.75 Ejemplo 2. Los siguientes datos resumidos en una distribución de frecuencias corresponden a la antigüedad laboral del total de 22 empleados de una empresa manufacturera:

Antigüedad

Número de empleados ( fa )

[ 0, 3 )

2

[ 3, 6 )

5

[ 6, 9 )

8

[ 9, 12 )

4

[ 12, 15 )

3

Total

105 105

BLOQUE 3

APLICAS LA ESTADÍSTICA DESCRIPTIVA

105 105

a)

Calcula la varianza poblacional.

Primero se agregan las cuatro columnas que permitan facilitar los cálculos. A continuación se muestra la extensión de la tabla:

Antiguedad

Número de empleados( fa )

mc

f(mc)

(mc − x )2

[ 0, 3 )

2

1.5

3

(1.5 – 8)2

[ 3, 6 )

5

[ 6, 9 )

4.5

8

7.5

2

22.5

(4.5 - 8)

60.0

(7.5 – 8)

61.25 2.0

2

9.0

4

10.5

42.0

(10.5- 8)

[ 12, 15)

3

13.5

40.5

(13.5- 8)2

Total

22

)2

84.5

2

[ 9, 12)

168.0

(

f mc − x

90.75 247.5

k

∑ f imc i i=1

µ=

k

=

∑ fi

168 = 7.64 22

i=1

k

∑ f i (mc i − µ )2 σ2 =

i=1

=

k

247.5

∑ fi

22

≈ 11.23

i=1

b)

Obtener la desviación estándar, se calcula la raíz cuadrada de la varianza y se toma la solución positiva.

σ = 11.78 ≈ 3.35 c)

Determinar el coeficiente de variación: Se aplica la fórmula respectiva:

CV =

106 106

BLOQUE 3

σ µ

=

3.35 ≈ 0.43 7.64

ó

43%

APLICAS LA ESTADÍSTICA DESCRIPTIVA

106 106

EJERCICIOS DE ESTADISTICA SEGUNDO PARCIAL. Todos los ejercicios ( a excepción de las preguntas de teoría) deben tener su respectivo desarrollo y/o explicación en notación matemática correcta, de lo contrario, no serán considerados para ser calificados

Resuelve el siguiente problema. 1. ¿Cuánto vale un café? La respuesta no es tan sencilla. Un grupo de jóvenes con conocimientos de mercadotecnia para la pequeña y mediana empresa quieren abrir una cafetería en un nuevo sector del municipio de Navojoa, caracterizado por el desarrollo urbano y nuevos fraccionamientos. Al realizar un estudio, observan que en un radio de veinte minutos caminando desde el local donde quiere abrir el negocio, hay 10 lugares donde se puede adquirir un café con las mismas características al que desean promocionar. Conformaron una lista de precios que enseguida se muestra: $20

$22

$20

$16

$20

$21

$24

$20

$22

$18

a) Calcula la media, la moda y la mediana. MEDIA=20.3 Moda= 20 Mediana 20 b) ¿Cuál precio consideras sea el más representativo para expresar, en lo general, el costo de un café? c) Para que este nuevo establecimiento ofrezca a sus clientes precios competitivos, ¿qué precio sugieres por café? Toma como referencia una medida de tendencia central.

2. Da respuesta a cada una de las siguientes preguntas: a) Distribución en la cual las tres medidas de centralización tienen el mismo valor b) Medida de centralización que puede calcularse para cualquier tipo de variable c) Tipos de variable en las que se puede calcular media, moda y mediana d) Medida que representa el equilibrio de los datos e) Medida estadística recomendable para representar a los datos cuando hay sesgo marcado en su distribución de frecuencias 3. Un estudiante en la clase de Estadística comenta que los cálculos de las medidas de tendencia central, son siempre aproximados, esto cuando se calculan en distribuciones de frecuencia de datos agrupados por intervalos. ¿Compartes la opinión del joven? ¿Por qué?

4. Los siguientes datos resumidos en una distribución de frecuencias, representan el tiempo (horas) de estudios semanales de estudiantes universitarios.

intervalos 0 1.4 2.8 4.2 5.6 7

fa 1.4 2.8 4.2 5.6 7 8.4

mc 5 7 8 4 2 1

0.7 2.1 3.5 4.9 6.3 7.7

f(mc) fa 3.5 14.7 28 19.6 12.6 7.7

5 12 20 24 26 27

Determina los valores aproximados de la media, la moda y la mediana. 5. El profesor de atletismo le pidió a cada uno de sus cinco alumnos de alto rendimiento, que realizaran el salto de longitud y se comprometió a que aquellos quienes su distancia de salto superara la media más una desviación estándar de los registros, le asignará una calificación de 100. Se realizan los saltos; la siguiente tabla muestra las longitudes alcanzadas por cada competidor:

a) Calcula la longitud media alcanzada por los atletas. b) Considera a estos datos estadísticos como una población y determina la desviación estándar.

MANUEL CARLOS LUIS SERGIO HUMBERTO

4.4 5.2 4.5 5.3 4.6

0.16 MEDIA 0.16 0.09 0.25 0.04 0.14 DESVIACION ESTANDAR

4.8

0.37

c) ¿Quién o quienes lograron el 100 de calificación? CARLOS LUIS HUMBERTO

6. En el Hospital “Dr. Ignacio Chávez” han nacido el día de hoy 7 bebés, cuyas medidas en cm son: 49, 52, 47,51, 52, 54 y 48. También se registraron sus pesos en kg que respectivamente son: 2.8, 3.5, 2.9, 4.7, 4.4, 3.9 y 3.3.

a) Determina para cada serie de datos la media y desviación estándar muestral. 49 52 47 51 52 54 48

2.040816327 MEDIA 2.469387755 11.75510204 0.326530612 2.469387755 12.75510204 5.897959184

VARIANZA 5.3877551 DESVIACION ESTANDAR 52.73857143 48.11857143 COEFICIENTE DE VARIACION 2.8 3.5 2.9 4.7 4.4 3.9 3.3

50.42857

2.31

0.045807365

0.710408163 MEDIA 0.020408163 0.551836735 1.11755102 0.573265306 0.066122449 0.11755102

VARIANZA 0.4510204 DESVIACION ESTANDAR 4.312857143 2.972857143 COEFICIENTE DE VARIACION b) Calcula el coeficiente de variación de cada muestra. c) ¿Cuál serie de datos presentó mayor variación? La segunda serie de datos

3.642857

0.67

0.183921569

More Documents from "heber"

Pabloo.docx
October 2019 11
Apartado B Gordillo-1.docx
October 2019 15
Albe.docx
October 2019 14
October 2019 11