2.1. Los siguientes datos se obtuvieron contando el número de vehículos que cruzan por un punto fijo de una avenida durante intervalos de un minuto. Los 54 conteos se hicieron a lo largo del mismo día. Construya una tabla de dos encabezados mostrando la frecuencia de cada medición obtenida.
28 32 24 26 23 23
Número de vehículos por minuto 30 25 36 24 27 33 26 25 20 28 20 27 31 23 34 25 24 22 26 28 38 30 37 21 28 31 38 28 32 39 26 29 33 28 20 25 34 24 26 31 27 22
Número de vehículos
frecuencia
Número de vehículos
frecuencia
20 21 22 23 24 25 26 27
3 1 3 3 4 4 5 6
30 31 32 33 34 35 36 37
2 3 3 2 2 0 1 1
28 29
6 2
38 39
2 1
29 27 32 27 22 27
a)
Porcentaje de minutos con 30 o mas vehículos. a = 17 x 100 / 54 = 31.5%
b)
Porcentaje de minutos con menos de 25 vehículos. b = 14 x 100 / 54 = 25.9%
c)
Porcentaje de minutos con mas de 28 y 32 o menos vehículos. c = 10 x 100 / 54 = 18.5%
2.2. A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en el jugo de toronja. 0,49 0,49 0,42 0,35 0,45 0,40 0,42 0,50 0,36 0,37 0,36
0,56 0,47 0,43 0,33 0,50 0,45 0,36 0,44 0,40 0,39 0,33
0,53 0,46 0,42 0,35 0,42 0,50 0,34 0,43 0,43 0,38 0,33
0,58 0,43 0,40 0,40 0,38 0,41 0,34 0,41 0,47 0,41
0,53 0,38 0,49 0,43 0,41 0,45 0,36 0,40 0,48 0,46
0,48 0,39 0,47 0,47 0,35 0,48 0,42 0,38 0,46 0,43
0,46 0,51 0,48 0,47 0,32 0,43 0,40 0,41 0,34 0,42
0,41 0,51 0,41 0,46 0,33 0,48 0,44 0,36 0,37 0,44
0,43 0,50 0,44 0,48 0,33 0,47 0,47 0,36 0,34 0,38
0,50 0,45 0,39 0,50 0,38 0,37 0,46 0,34 0,35 0,36
a)
¿Que inconveniente tendría en este caso una tabla como la del problema 2.1? R = La naturaleza de los datos ya no es discreta y hace difícil la clasificación de los datos.
b)
Elija límites de clases adecuados para los datos y construya una tabla de frecuencias con límites y valor medio de clase, frecuencias abs. y frecuencias rel., frecuencias abs. acumuladas y frecuencias rel. acumuladas. limite de clase (0,31 - 0,33] (0,33 - 0,35] (0,35 - 0,37] (0,37 - 0,39] (0,39 - 0,41] (0,41 - 0,43] (0,43 - 0,45] (0,45 - 0,47] (0,47 - 0,49] (0,49 - 0,51] (0,51 - 0,53] (0,53 - 0,55] (0,55 - 0,57] (0,57 - 0,59]
valor medio de clase 0,32 0,34 0,36 0,38 0,40 0,42 0,44 0,46 0,48 0,50 0,52 0,54 0,56 0,58
Frecuencia abs. 6 9 10 9 13 14 8 13 9 8 0 2 1 1
Frecuencia rel. 0,058 0,087 0,097 0,087 0,126 0,136 0,078 0,126 0,087 0,078 0 0,019 0,01 0,01
-1-
Frecuencia abs. acum.. 6 15 25 34 47 61 69 82 91 99 99 101 102 103
Frecuencia rel. acum.. 0,058 0,146 0,243 0,33 0,456 0,592 0,67 0,796 0,883 0,961 0,961 0,981 0,99 1
2.3. Los siguientes son conteos del número de cromosomas en una herbácea.
a)
24
28
28
28
27
28
29
29
29
30
29
30
30
29
31
29
31
24
28
29
28
24
28
29
31
31
24
28
29
30
29
28
30
33
28
34
38
28
32
33
28
31
32
34
39
40
31
35
27
28
31
35
30
29
24
28
31
32
28
32
28
29
30
33
41
30
29
42
28
29
32
33
30
28
28
31
32
28
29
30
28
28
31
34
34
28
36
31
36
35
Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo. número de cromosomas 24 25 26 27 28 29 30 31 32 33
b)
frecuencia 5 0 0 2 23 15 10 11 6 4
número de cromosomas 34 35 36 37 38 39 40 41 42
frecuencia 4 3 2 0 1 1 1 1 1
Construya una tabla de frecuencias que le permita contestar las siguientes preguntas: valor de la clase Frecuencia abs. Frecuencia rel. Frecuencia abs. acum. Frecuencia rel. acum. 24 5 0,06 5 0,06 25 0 0 5 0,06 26 0 0 5 0,06 27 2 0,02 7 0,08 28 23 0,26 30 0,33 29 15 0,17 45 0,5 30 10 0,11 55 0,61 31 11 0,12 66 0,73 32 6 0,07 72 0,8 33 4 0,04 76 0,84 34 4 0,04 80 0,89 35 3 0,03 83 0,92 36 2 0,02 85 0,94 37 0 0 85 0,94 38 1 0,01 86 0,96 39 1 0,01 87 0,97 40 1 0,01 88 0,98 41 1 0,01 89 0,99 42 1 0,01 90 1
1.
¿Qué porcentaje de células tienen 32 cromosomas o menos? De acuerdo con la frecuencia acumulada se obtiene que el 80% de las células tienen 32 cromosomas o menos
2.
¿Qué porcentaje de células tienen más de 28 cromosomas? De acuerdo con la frecuencia acumulada se obtiene que el 33.3% de las células tienen 28 cromosomas o menos, por lo tanto las células que tienen mas de 28 cromosomas es: 100 – 33.3 = 66.6%
-2-
3.1. En seguida se presenta el número de terremotos ocurridos en cada una de las horas lunares durante cierto tiempo. hora lunar (y) 0 1 2 3 4 5 6 7 8
hora lunar (y) 9 10 11 12 13 14 15 16 17
número de terremotos (x) 7 2 3 5 8 5 8 6 1
número de terremotos (x) 2 0 5 3 4 5 9 9 6
hora lunar (y) 18 19 20 21 22 23 24
número de terremotos (x) 5 9 2 2 5 2 7
Con estos datos evalúe:
25
8
x i = 120
a)
i =1 25
i =1 25
y i = 300
b)
i =1 5
y i = 10
i =1
y i = 81
x i y i = 162
k) i =4 8
− 5) = 28-40 = -12
8
xi
l)
i =1
i =4
3.2. Use la notación de sumatoria para abreviar las siguientes expresiones: 11
a) X8 + X9 + X10 + X11 =
xi i =8
5
x (2 i )
b) X2 + X4 + X6 + X8 + X10 = i =1
6
x ii
c) X1 + X22 + X33 + X44 + X55 + X66 = i =1
d) X1 + 2X2 + 3X3 + 4X4 =
4
i ⋅ xi i =1
10
e) 8X1 + 7X2 + 6X3 + 5X4 + 4X5 + 3X6 + 2X7 + 1X8 - X10 =
(9 − i )x i i =1
f)
x1 +
= 252 = 625
i =1 8
i =12 8
(y i
xi
j)
i =19 17
f)
2
5
y i = 147
e)
x i2 = 151
i)
i =1 25
d)
2.8y i = 2.8(25) (300) = 21000
h)
i =1 5
c)
y i − 5 = 28 – 5 = 23
g)
5 x 2 x3 x 4 x5 xi + + + = 2 3 4 5 i =1 i
-3-
y i = 27x22=594 i =4
3.3. Demuestre las siguientes propiedades: n
(x i
a)
n
+ yi ) =
i =1
n
xi + i =1
n
(x i
yi i =1
+ y i ) = x1 + y 1 + x 2 + y 2 + x 3 + y 3 +
+ xn + y n
i =1
Se puede ordenar de la forma :
(x1 + x 2 + x 3 +
+ x n ) + (y 1 + y 2 + y 3 +
n
+ yn ) =
n
xi + i =1
n
b)
(d + gx i ) = nd + g
i =1
yi i =1
n
xi i =1
n
(d + gx i ) = (d + gx 1 ) + (d + gx 2 ) +
+ (d + gx n ) = (d + d +
i =1
d ) + (gx 1 + gx 2 +
+ gx n )
n veces
= nd + g (x1 + x 2 +
+ x n ) = nd + g
n
xi i =1
3.4. el gerente de una tienda de auto servicio que permanecerá abierta de las 6 de la mañana a las 12 de la noche, cuenta un día el número de cliente que pasan por las cajas registradoras durante cada una de las 18 horas. Los resultados obtenidos son: 21, 45, 30, 48, 56, 77, 60, 59, 23, 42, 36, 49, 73, 96, 90, 71, 42, 23. Calcule media y mediana del número de clientes por hora. Mediana: (48+49) / 2 =48.5 Media: 52.27 3.5. Calcule media, moda y mediana del número de vehículos por minuto en el ejercicio 2.1. Localice estas medidas en el diagrama de puntos obtenidos en el ejercicio 2.6 y comente sobre su posición relativa. Número de vehículos 20 21 22 23 24 25 26 27 28 29
20
21
22
23
24 25
26
27 28
frecuencia 3 1 3 3 4 4 5 6 6 2
29
Número de vehículos 30 31 32 33 34 35 36 37 38 39
30 31
32
33
34
35
36
frecuencia 2 3 3 2 2 0 1 1 2 1
37
38
Mediana: 27 Media > moda > mediana
Moda: 27.5 Media: 27.8
-4-
39
3.12. Con los conteos de cromosomas del ejercicio 2.3 elaboramos la siguiente tabla e frecuencias: Número de cromosomas por planta (23,26] (26,29] (29,32] (32,35] (35,38] (38,41] (41,44] a)
Calcule media, mediana, varianza, desviación estándar planta usando la tabla. Intervalo Valor medio, Xi Frecuencia, ni (23-26] 24.5 5 (26-29] 27.5 40 (29-32] 30.5 27 (32-35] 33.5 11 (35-38] 36.5 3 (38-41] 39.5 3 (41-44] 42.5 1 = 90
Frecuencia 5 40 27 11 3 3 1
y coeficiente de variación del número de cromosomas por xi ni 122.5 1100 823.5 368.50 109.50 118.50 42.50 2685
2
xi ni 3001.25 30250 25116.75 12344.75 3996.75 4680.75 1806.25 81196.5
2
( xi - x ) 28.44 5.44 0.44 13.44 44.44 93.44 160.44
N
x i ni •
•
Media: x =
i =1
=
N
2685 = 29.8 cromosomas 90
Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (27.5 + 30.5) / 2 = 29 cromosomas 7
7
(x i • • • b)
Varianza: S
2
=
− x )2 n i
i =1
N −1 2 Desviación estándar: S = S =
x i 2 n i − N (x )2 =
i =1
= 12.29 cromosomas
N −1
2
Coeficiente de variación: C.V . = S = 3.48 = 0.117 x 29.8
Calcule estas medidas en los datos individuales y compárelas. Número de cromosomas frecuencia abs xi ni 24 5 120 25 0 0 26 0 0 27 2 54 28 23 644 29 15 435 30 10 300 31 11 341 32 6 192 33 4 132 34 4 136 35 3 105 36 2 72 37 0 0 38 1 38 39 1 39 40 1 40 41 1 41 42 1 42 = 90 2731
-5-
2
2
(xi - x ) ni 142.22 217.78 12 147.89 133.33 280.33 160.44 1094
xi ni (xi - x )2 (xi - x )2ni 2880 40.25 201.26 0 28.56 0 0 18.87 0 1458 11.19 22.37 18032 5.5 126.42 12615 1.81 27.11 9000 0.12 1.19 10571 0.43 4.73 6144 2.74 16.45 4356 7.05 28.21 4624 13.36 53.45 3675 21.67 65.02 2592 31.99 63.97 0 44.3 0 1444 58.61 58.61 1521 74.92 74.92 1600 93.23 93.23 1681 113.54 113.54 1764 135.85 135.85 83957 1086.32
N
x i ni
• •
2731 = = 30.3 cromosomas N 90 Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (29 + 30) / 2 = 29.5 cromosomas Media: x =
i =1
7
7
(x i • • •
Varianza: S
2
=
− x )2 n i
i =1
N −1 2 Desviación estándar: S = S =
x i 2 n i − N (x )2 =
i =1
= 12.2 cromosomas
N −1
2
Coeficiente de variación: C.V . = S = 3.47 = 0.115 x 30.3
Las diferencias observadas se deben al ancho elegido de los intervalos de clases. Se conoce cuantos datos existen en el intervalo pero no su distribución dentro de él, lo que lleva a errores en el cálculo de las medidas descriptivas.
3.14. En seguida se presentan los porcentajes de población y de inversión del gasto público del gobierno federal en cada una de las entidades federativas de la Republica Mexicana: Entidad Aguascalientes B. California Norte B. California Sur Campeche Chiapas Chihuahua Coahuila Colima
(X) 0,7 1,8 0,3 0,5 3,2 3,3 2,3 0,5
(Y) 0,5 1,9 1 1,2 5,4 4,8 2,3 0,8
Entidad (X) (Y) Distrito Federal 14,2 29,8 Durango 1,9 1,8 Guanajuato 4,7 2,1 Guerrero 3,3 2,9 Hidalgo 2,5 1,2 Jalisco 6,8 3,1 México 7,9 3,3 Michoacán 4,8 3,6
Entidad Morelos Nayarit Nuevo León Oaxaca Puebla Querétaro Quintana Roo S. Luis Potosí
(X) 1,3 1,1 3,4 4,5 5,2 1 0,2 2,7
(Y) 0,5 0,6 1,5 4,1 1,1 1 1 2
Entidad Sinaloa Sonora Tabasco Tamaulipas Tlaxcala Veracruz Yucatán Zacatecas
Para resolver se construye la siguiente tabla: xi Aguascalientes 0,7 B. California Norte 1,8 B. California Sur 0,3 Campeche 0,5 Chiapas 3,2 Chihuahua 3,3 Coahuila 2,3 Colima 0,5 Distrito Federal 14,2 Durango 1,9 Guanajuato 4,7 Guerrero 3,3 Hidalgo 2,5 Jalisco 6,8 México 7,9 Michoacán 4,8 Morelos 1,3 Nayarit 1,1 Nuevo León 3,4 Oaxaca 4,5 Puebla 5,2 Querétaro 1 Quintana Roo 0,2 S. Luis Potosí 2,7 Sinaloa 2,6 Sonora 2,3 Tabasco 1,6 Tamaulipas 3 Tlaxcala 0,9 Veracruz 7,9 Yucatán 1,6 Zacatecas 2 = 100
x 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125 3,125
2 2 yi (xi - x ) (yi - Y ) (xi - x ) (yi - Y ) Y 5,88063 0,5 3,125 6,890625 6,365625 1,75563 1,9 3,125 1,500625 1,623125 7,98063 1 3,125 4,515625 6,003125 6,89063 1,2 3,125 3,705625 5,053125 0,00563 5,4 3,125 5,175625 0,170625 0,03063 4,8 3,125 2,805625 0,293125 0,68063 2,3 3,125 0,680625 0,680625 6,89063 0,8 3,125 5,405625 6,103125 122,656 29,8 3,125 711,5556 295,425625 1,50063 1,8 3,125 1,755625 1,623125 2,48063 2,1 3,125 1,050625 -1,614375 0,03063 2,9 3,125 0,050625 -0,039375 0,39062 1,2 3,125 3,705625 1,203125 13,5056 3,1 3,125 0,000625 -0,091875 22,8006 3,3 3,125 0,030625 0,835625 2,80563 3,6 3,125 0,225625 0,795625 3,33063 0,5 3,125 6,890625 4,790625 4,10063 0,6 3,125 6,375625 5,113125 0,07563 1,5 3,125 2,640625 -0,446875 1,89063 4,1 3,125 0,950625 1,340625 4,30563 1,1 3,125 4,100625 -4,201875 4,51563 1 3,125 4,515625 4,515625 8,55563 1 3,125 4,515625 6,215625 0,18062 2 3,125 1,265625 0,478125 0,27562 8,2 3,125 25,75563 -2,664375 0,68063 2,5 3,125 0,390625 0,515625 2,32563 2,1 3,125 1,050625 1,563125 0,01562 3,2 3,125 0,005625 -0,009375 4,95063 0,4 3,125 7,425625 6,063125 22,8006 3,6 3,125 0,225625 2,268125 2,32563 1,2 3,125 3,705625 2,935625 1,26563 1,3 3,125 3,330625 2,053125 257,88 100 822,20 354,96
-6-
(X) 2,6 2,3 1,6 3 0,9 7,9 1,6 2
(Y) 8,2 2,5 2,1 3,2 0,4 3,6 1,2 1,3
a)
Calcule x , Sx, y Sy, C.V. (x) y C.V. (y).
Al observar la naturaleza de los datos se decide hacer un análisis estadístico poblacional, debido a que se considera al 100% de la población mexicana y se requieren las medidas descriptivas de la población. Para X
Para Y
N
xi
µx =
Promedio
N
i =1
=
N N
2 y
Varianza
=
i =1
N
Desviación estándar
X
Coeficiente de variación
b)
= 3.125
257.88 = 32
= 8.058
y
2
=
=
= 2.838
= 0.908
y
100 32
(y i − µ y )2
i =1
=
N
σX µx
C.V.(X) =
i =1
N
σ x2
=
yi
µy = N
− µ x )2
(x i
100 32
σ Y2
=
σY µy
C.V.(Y) =
= 3.125
822.20 32
= 26.522
= 5.15
= 1.648
Dibuje el diagrama de dispersión de datos y calcule SXY y rXY. Interprete el signo y la magnitud de rXY con la ayuda de su diagrama. 30 25
% Inversión
20 15 10 5 0 0
2
4
6
N
Covarianza:
N
xi y i
σ
XY
=
i =1
Coeficiente de correlación:
N
− µxµy =
r XY =
(x i
8
(
− µx ) yi − µy
10
)
i =1
=
N
σ
σ
XY
X
⋅σ Y
=
12
14
16 % Población
354.96 = 11.093 32
11.093
(2.838 )(5.15 )
= 0.758
Se puede observar claramente una tendencia directamente proporcional en el diagrama de dispersión, lo que queda demostrado con la magnitud y el signo del valor de rXY. 2
El coeficiente de determinación es (rXY) = 0.575; por lo tanto se puede afirmar que el 57.5% de la variación en el porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional; lo que es bastante aceptable para suponer un comportamiento lineal.
-7-
c)
Observe cuidadosamente su diagrama de dispersión. El punto (14.2, 29.8) corresponde al Distrito Federal, se aparta notablemente de la tendencia del resto de los datos. Elimine ese punto y repita los cálculos de los incisos a y b. Interprete los cambios en las medidas descriptivas. En particular observe la reducción en SY, C.V.(Y) y rXY. Al eliminar el valor del D.F. se obtienen los siguientes valores: 2 yi = 70.2 (yi - Y ) = 87.69 2 (xi - x ) = 131.27 (xi - x )(yi - Y ) = 244.3
n = 31 xi =85.8
Para X
Para Y
n
Promedio
n
xi
x=
i =1
n n
(x i
2
Varianza
Sy =
=
− x )2
i =1
n −1
Desviación estándar
C.V.(X) = n
xi y i − n ⋅ x ⋅ y S XY =
i =1
=
n −1
Coeficiente de correlación:
r XY =
131.27 = 30
= 4.375
(x i
yi
Y =
i =1
n n
= 2.091 = 0.755
− x )(y i − y )
i =1
=
n −1
2
Sy =
(y i
=
= S Y2
Sy =
SY y
C.V.(Y) =
= 2.264
70.2 31
− y )2
i =1
n −1
SX x
n
Covarianza:
= 2.767
S x2
Sy =
Coeficiente de variación
85.8 31
87.69 30
= 2.923 = 1.709 = 0.754
50 = 1.666 30
S XY 1.666 = (2.091 )(1.709 S X ⋅ SY
)
= 0.466
El coeficiente de determinación es (rXY)2 = 0.217; por lo tanto se puede afirmar que solo el 21.7% de la variación en el porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional. Con esta información se descarta la posibilidad de que exista una correlación lineal, tal como se observa en la siguiente tabla de dispersión: 9 8 7 % Inversión
6 5 4 3 2 1 0 0
1
2
3
4
5
6
7
8 % Población
Se observa que al eliminar el valor del Distrito Federal: x9, y9 (14.2, 29.8) se disminuye notablemente su contribución en 2 la sumatoria de (yi - Y ) con ello se trae la particular reducción de los valores de SY, C.V.(Y) y rXY.
-8-