Problema No.1 En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación: Horas de uso 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320
a)
Diámetro (mm) 26.2 25.7 26.0 27.7 28.3 29.5 30.1 31.8 31.4 33.4 33.6 32.7 35.0 36.1 35.7 36.2 36.8 39.1 38.7 39.2
¿En este problema cuál variable se considera independiente y cuál dependiente?
R: La variable dependiente serán las horas de trabajo mientras que la independiente será el diámetro de la pieza. b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos) d) ¿La calidad de ajuste es satisfactoria? Argumente
e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa herramienta? f)
Señale el valor de la pendiente de la recta e interprételo en términos prácticos
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de ajuste.
grafica de dispersion 45 40
f(x) = 0.05x + 24.86 R² = 0.98
horas de trabajo
35 30 25 20 15 10 5 0
0
50
100
150
200
diametro de la pieza
250
300
350
a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las piezas. b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.
Gráfico de Diámetro vs Horas de uso
40
Diámetro
37 34 31 28 25 0
100
200 Horas de uso
300
400
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre las horas de uso y el diámetro está dada por: Diámetro = 24.8632 + 0.0464098*Horas de uso La cual se puede observar en el grafico del modelo ajustado: Gráfico del Modelo Ajustado Diámetro = 24.8632 + 0.0464098*Horas de uso 40
Diámetro
37 34 31 28 25 0
100
200 Horas de uso
300
400
Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables horas de uso y diámetro si existe una relación. Coeficientes Mínimos Cuadrados Parámetro Estimado Intercepto 24.8632 Pendiente 0.0464098
Estándar
Estadístico
Error T 0.323206 76.9267 0.00168629 27.5218
Valor-P 0.0000 0.0000
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación:
Análisis de Varianza Fuente Suma de Cuadrados Modelo 366.674 Residuo 8.71365 Total (Corr.) 375.388
Gl Cuadrado Medio 1 366.674 18 0.484092 19
Razón-F Valor-P 757.45
0.0000
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula. Verificación de supuestos: El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón definido.
Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8
residuo
0.4 0 -0.4 -0.8 -1.2 25
28
31 34 predicho Diámetro
37
40
El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna tendencia. Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8
residuo
0.4 0 -0.4 -0.8 -1.2 0
4
8 12 número de fila
16
20
d) el coeficiente de determinación R 2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro. e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 25.7 a 39.2 mm de diámetro. f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y) con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se varíen las horas de uso. g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste será mayor.
Problema No. 2 Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se muestra la temperatura y el consumo anual:
Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Temperatura 21 24 32 47 50 59 68 74 62 50 41 30
Consumo/1000 185.79 214.47 288.03 424.84 454.58 539.03 621.55 657.06 562.03 452.93 369.95 273.98
A) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso?
R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que temperatura es conveniente tratar el consumo.
B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de regresión que relacione el consumo de vapor ( y ) con la temperatura promedio ( x ). ¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es 55°F? R= 497.3545
C) ¿Qué cambio se espera en el consumo de vapor promedio cuando la temperatura mensual promedio cambia 1°F? R= 2.15% R= 108.7056 consumo/1000 D) Suponga que la temperatura mensual promedio es de 47°F. Calcule el vapor ajustado y el residual correspondiente. VAPOR= 424.84 RESIDUAL= -0.042718344
Problema No. 3
En un artículo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la x=viscosidad delaceite viscosidad del aceite. Los datos representativos, con y y=volumen del desgaste ( 10−4 mm ), son:
Y 240 181 193 155 172 110 113 75 94
x 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0
a) Construya un diagrama de dispersión de los datos. ¿Parecería plausible un modelo de regresión lineal simple? R= Si, parece correcto usar el diagrama
b) Ajuste el modelo de regresión lineal simple usando mínimos cuadrados.
c) Estime el desgaste por rozamiento cuando la viscosidad es
x=30 .
R= 62.3768 d) Obtenga el valor ajustado de correspondiente.
y
cuando
x=22.0
y calcule el residual
Y=172 Residual= 15.11749821
Problema No. 4 En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la siguiente tabla.
Tiempo (minutos) 10 15 20
Rendimiento (%) 64 81.7 76.2
8 12 13 15 12 14 20 19
68.5 77.9 82.2 74.2 70 76 83.2 85.3
a) ¿En este problema cuál variable se considera independiente y cuál dependiente? b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos). d) ¿La calidad del ajuste es satisfactoria? Argumente e) Destaque el valor de la pendiente de la recta e interprételo en términos prácticos.
f) Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta estimación.
a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en minutos. b) Diagrama de dispersión: se puede visualizar que no existe una relación ya que los puntos son muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendría que verificar los supuestos y comprobar si en verdad existe una relación entre el rendimiento y el tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran.
Gráfico de Rendimiento vs Tiempo
88
R e n d im ie n to
84 80 76 72 68 64 8
10
12
14 Tiempo
16
18
20
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre el tiempo y el porcentaje de rendimiento está dada por: del Modelo Ajustado RendimientoGráfico = 57.9578 + 1.19492*Tiempo Rendimiento = 57.9578 + 1.19492*Tiempo 88
La cual se puede observar en el grafico del modelo ajustado: Rendimiento
84 80 76 72 68 64 8
10
12
14 Tiempo
16
18
20
Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables tiempo y porcentaje de rendimiento si existe una relación. Coeficientes Mínimos Cuadrados Parámetro Estimado Intercepto 57.9578 Pendiente 1.19492
Estándar Estadístico Error T 6.28403 9.22303 0.414959 2.87962
Valor-P 0.0000 0.0164
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación: Análisis de Varianza Fuente Suma de Cuadrados Modelo 243.684 Residuo 293.872 Total (Corr.) 537.557
Gl Cuadrado Medio 1 243.684 10 29.3872 11
Razón-F Valor-P 8.29
0.0164
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula.
Gráfico de Residuos Rendimiento = 57.9578 + 1.19492*T iempo
Verificación de 7.5 supuestos: 4.5
re s id u o
El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de 1.5
forma aleatoria por toda la gráfica a lo largo de la banda horizontal. -1.5 -4.5 -7.5 67
70
73 76 predicho Rendimiento
79
82
El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna tendencia.
Gráfico de Residuos Rendimiento = 57.9578 + 1.19492*Tiempo 7.5
residuo
4.5 1.5 -1.5 -4.5
d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene -7.5
6 8 12 una buena calidad de0ajuste, ya2 que solo4 nosnúmero explica el 39.865% de10la variabilidad en Rendimiento. de fila
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de explicación del modelo. e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y) con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el tiempo. f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 8 a 20 min de Tiempo.
Problema No. 5 En un artículo de Journal of Environmental Energineering se reportan los resultados de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de la parte central de Rhode Island. Los datos que se presentan a continuación corresponden a la concentración de cloruros y (en mg/l) y al área de carretera de la vertiente x (en %). x 0.19 0.15 0.57 0.70 0.67 0.63 0.47 0.70 0.60 0.78 0.81 0.78
y 4.4 6.6 9.7 10.6 10.8 10.9 11.8 12.1 14.3 14.7 15.0 17.3
0.69 1.30 1.05 1.06 1.74 1.62
19.2 23.1 27.4 27.7 31.8 39.5
a) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso? R= Si, para ver la relación aunque presentan un índice de error alto
B) Ajuste el modelo de regresión lineal simple usando el método de mínimos cuadrados.
b) Estime la concentración de cloruros media de una vertiente que tiene 1% del área de carretera. R= 20.567
Encuentre el valor ajustado que corresponde a R= 10.13
x=0.47