Tarea 1.
Elaborado por: Dorys Lenith Viviescas Ortiz
Presentado a: Josefa Ramoni
Maestría en Biotecnología Universidad de Santander UDES Bucaramanga 2018
Solución
1. Datos Vinos. Para analizar la calidad del vino y los factores que se asocian a ella, se utiliza una muestra aleatoria de vinos de dos tipos diferentes (Cabernet y Shiraz), a los cuales se les mide no solo su calidad (Y), sino otros factores, según se muestra en la siguiente lista
Se pide: 1. Describir las características de los vinos, según su tipo. Estime y comente las estadísticas que considere convenientes. No olvide incluir el coeficiente de variación.
X1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1
Variable y x2 x4 x5 x6 x7 x8 x9 x10 x3 y x2 x4 x5 x6 x7 x8 x9 x10 x3
n 14 14 14 14 14 14 14 14 14 14 18 18 18 18 18 18 18 18 18 18
Media 15,69 3,83 7,31 4,32 1,89 2,43 0,37 13,36 0,05 88,43 15,09 3,81 7,27 4,36 1,68 2,68 0,37 15,22 0,05 100,33
D.E. 1,92 0,14 2,91 1,86 0,87 1,06 0,06 6,08 0,02 29,12 1,65 0,11 1,84 1,16 0,47 0,76 0,09 5,49 0,02 65,16
CV 12,26 3,53 39,77 42,99 45,70 43,72 15,61 45,55 43,72 32,93 10,94 2,95 25,35 26,65 28,27 28,16 23,59 36,09 28,16 64,94
Mín Máx 12,80 19,20 3,47 3,98 3,60 12,85 2,15 7,70 0,75 3,90 1,15 3,80 0,27 0,49 6,00 22,00 0,02 0,08 61,00 178,00 11,50 18,50 3,60 3,98 4,25 10,25 2,40 6,10 0,95 2,60 1,15 3,70 0,25 0,63 6,00 25,00 0,02 0,07 10,00 301,00
Mediana 15,50 3,87 6,10 3,65 1,57 2,20 0,37 11,50 0,04 80,00 15,30 3,76 7,65 4,58 1,73 2,80 0,37 16,00 0,06 89,00
En el estudio se utilizó una población total de 32 de los cuales 14 pertenecían al vino Cabernet y 18 al vino Shiraz, se puede concluir que en promedio el vino que presenta mejor calidad es el Shiraz, presentan un grado de acidez similar con poca variación.
2. Represente gráficamente el promedio de SO2 según tipo. ¿Qué observa? X1 0 1
Variable x3 x3
Versión Estudiantil
Media 88,43 100,33
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Promedio SO2 Estudiantil Versión Estudiantil Versión
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 100,93 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 97,65 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Media
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 94,38 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 91,11 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 87,83 Versión Estudiantil Versión Estudiantil Versión1Estudiantil Versión Estudiantil 0
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil x1
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
El promedio de SO2 del vino Shiraz es superior al de Caberet esto se debe principalmente a que se tomaron más muestras de este vino para analizar que del otro.
3. Represente gráficamente la proporción de cada tipo de vino en el estudio.
0
1
4. Utilice un diagrama de caja para representar el comportamiento de la calidad del vino (Y) según tipo.
20 18 12
14
16
calidad
0
1
2 0
1
Density
3
4
5. Elabore un histograma del pH de todos los vinos, sin separarlos por tipo.
3.5
3.6
3.7 ph
3.8
3.9
6. Estime la matriz de correlaciones entre las diferentes variables de cantidad.
|
y
x2
x3
x4
x5
x6
x7
-------------+--------------------------------------------------------------y | 1.0000 x2 | 0.2775 1.0000 x3 | -0.3759 -0.5820 1.0000 x4 | 0.7018 0.2132 -0.3915 1.0000 x5 | 0.7077 0.1521 -0.3709 0.9957 1.0000
x6 | 0.6512 0.2204 -0.3254 0.9454 0.9253 1.0000 x7 | 0.6813 0.0863 -0.3690 0.9367 0.9589 0.7797 1.0000 x8 | -0.1682 0.0955 0.4045 0.0155 0.0031 -0.0429 0.0372 x9 | 0.6170 -0.0489 -0.4960 0.7969 0.8260 0.6905 0.8472 x10 | 0.6813 0.0863 -0.3690 0.9367 0.9589 0.7797 1.0000
|
x8
x9
x10
-------------+--------------------------x8 | 1.0000 x9 | -0.4558 1.0000 x10 | 0.0372 0.8472 1.0000
2. Datos Pesonacer Para determinar los factores que inciden en el bajo peso al nacer de los niños, se tiene información acerca de un grupo de recién nacidos y sus madres. Las variables disponibles son:
Se pide:
1. Construya una tabla de contingencia con las variables LOWW y SMOKE. Comente los resultados
Smokeno fuma loww
0
1
Total
-----------+----------------------+---------0 1
normal bajo peso
629
99
728
55
15
70
-----------+----------------------+----------
Total
684
114
798
El peso bajo se incrementa en las madres que durante el periodo de gestación fuman, al igual se puede inferir que la mayoría de la población que se encuentra en el estudio presenta bajo peso al nacer.
2,000 0
1,000
mean of peso
3,000
4,000
2. Represente gráficamente el peso promedio de los niños, según si la madre fuma o no.
0
1
3. Describa las características básicas de los niños, según si tienen o no bajo peso al nacer. Comente. -> loww = 0
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+--------------------------------------------------------weeks |
729
39.04527
1.902683
32
45
peso |
730
3431.243
460.1855
2523.15
4791.15
mage |
730
27.01096
6.051665
15
42
------------------------------------------------------------------------------------> loww = 1 bao peso
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+--------------------------------------------------------weeks |
70
34.12857
4.975072
22
43
peso |
70
1922.94
619.9718
340.2
2494.8
mage |
70
25.91429
6.623942
16
40
Al nacer pres
0
1,000
2,000peso3,000
4,000
5,000
4. Utilice un diagrama de caja para representar el comportamiento del peso de los niños, según si la madre fuma o no.
0
1
6.0e-04 4.0e-04
0
2.0e-04
Density
8.0e-04
.001
1. Elabore un histograma del peso de los niños, sin separarlos en grupos por ningún criterio.
0
1000
2000
3000
4000
peso
2. Estime las correlaciones entre las variables cuantitativas
5000
|
mage
weeks
peso
-------------+--------------------------1.0000
weeks |
0.0210
1.0000
peso |
0.1691
0.5828
1.0000
0
1000
2000
peso
3000
4000
5000
mage |
20
25
30
35
40
45
weeks
3. Salinidad Se quiere estudiar la relación entre el pH (pH), la salinidad (Salinidad), el contenido de Zn (Zinc) y el contenido de K (Potasio) presentes en el suelo con la producción de biomasa de una Forrajera. Para ello se registraron 45 mediciones de la biomasa (gr) y de dichos valores característicos del suelo donde crecieron las plantas. Se pide: 1. Describa las características básicas de la muestra. No olvide calcula el coeficiente de variación. Comente stats |
biomasa
ph
salini~d
zinc
potasio
---------+-------------------------------------------------cv |
.5048059
.2722416
.1228984
.464068
.3731933
max |
2337.33
7.45
38
31.29
1441.67
min |
369.82
3.2
24
.21
350.73
mean |
1082.173
4.608889
30.26667
17.83089
797.3778
sd |
546.2872
1.254731
3.719726
8.274745
297.576
Se observa que en el estudio existen predominan los suelos ácidos, presentan alto contenido de potasio, y la biomasa forrajera presenta una producción moderada.
0
500
1,000
1,500
2,000
2,500
2. Utilice diagramas de caja para representar el comportamiento de las variables.
biomasa salinidad potasio
ph zinc
Density
0
2.0e-04
4.0e-04
6.0e-04
8.0e-04
3. Elabore un histograma de la biomasa.
500
1000
1500 biomasa
2000
2500
4. Calcule la matriz de correlaciones entre las variables. Elabore también diagramas de dispersión, colocando siempre la variable biomasa en el eje vertical y las restantes en el horizontal (puede elaborar una matriz de diagramas de dispersión) |
biomasa
ph
salini~d
zinc
potasio
-------------+--------------------------------------------biomasa |
1.0000
ph |
0.9281
1.0000
-0.0666
-0.0446
1.0000
zinc |
-0.7815
-0.7205
-0.4265
1.0000
potasio |
-0.0732
0.0324
-0.0196
0.0788
1.0000
3
25
4
30
5
ph
salinidad
6
35
7
8
40
salinidad |
1000
1500 biomasa
2000
500
2500
1000
1500 biomasa
2000
2500
1500 biomasa
2000
2500
0
1000 800 400
600
10
potasio
zinc
20
1200
1400
30
500
500
1000
1500 biomasa
2000
2500
500
1000