Estadística Aplicada y Computacional EA-100 Capítulo 3 Teoría de Confiabilidad
Alberto Coronado Matutti Facultad de Ingeniería Mecánica Universidad Nacional de Ingeniería
1. Confiabilidad
2
1. Confiabilidad
Una medida importante de la calidad de los productos (sistemas) es su confiabilidad. Confiabilidad es la probabilidad de que un producto (sistema) funcione adecuadamente, bajo condiciones especificadas, durante un periodo dado de tiempo. Existen 3 elementos importantes: funcionamiento adecuado, condiciones especificadas y periodo dado de tiempo. 3
1. Confiabilidad
La ingeniería de confiabilidad es la disciplina que asegura que un producto (sistema) irá a funcionar adecuadamente, si es operado bajo las condiciones especificadas. Su objetivo principal es evitar fallas, aún cuando los productos (sistemas) irán a fallar tarde o temprano. En general, hay 3 pasos necesarios para lograr este objetivo. 4
1. Confiabilidad
El primero consiste en diseñar y construir (implementar) el producto (sistema) tal que se obtenga la máxima confiabilidad. Este paso es el más crítico y determina la confiabilidad inherente.
El segundo consiste en minimizar variaciones en las condiciones de operación del producto (sistema), para evitar degradar la confiabilidad inherente. 5
1. Confiabilidad
El tercero consiste en implementar operaciones apropiadas de mantenimiento. El mantenimiento permite aliviar la degradación de la performance y prolongar la vida útil del producto (sistema).
Los 3 pasos mencionados emplean una gran variedad de técnicas de confiabilidad: planeamiento, predicción, diseño robusto, análisis de fallas y efectos (FMEA), etc. 6
1. Confiabilidad
Definamos los siguientes términos: Estado binario, la función de un producto (sistema) puede ser éxito o fracaso. Multiestado, la función de un producto (sistema) puede ser éxito total, éxito parcial o fracaso. Aquí se considera degradación en la performance. Falla total, falla catastrófica que produce un alto en el funcionamiento. Ocurre en productos (sistemas) de estado binario. Falla parcial, la cual ocurre en productos (sistemas) multiestado.
7
1. Confiabilidad
Para sistemas de estado binario, la funcionalidad del producto (sistema) es usualmente objetiva y obvia. Por ejemplo, emitir luz es la función de un foco. Una falla ocurrirá cuando el foco se queme. Para sistemas multiestado, la definición de funcionalidad es frecuentemente subjetiva. Por ejemplo, el control remoto de un helicóptero puede tener un alcance de 100m, lo cual usualmente es arbitrario. 8
1. Confiabilidad
Si el producto es componente de un sistema, la funcionalidad es dictada por los requerimientos del sistema. El mismo componente usado en diversos sistemas puede tener diversos criterios de falla. La confiabilidad es una función del tiempo, asociada al periodo de vida útil del producto (sistema). 9
1. Confiabilidad
En confiabilidad, el tiempo puede tener diversas escalas, por ejemplo, tiempo calendario, kilometraje, ciclos on-off, etc. A veces es difícil elegir entre las diversas escalas, ya que todas parecen ser relevantes. Por ejemplo, el desgaste de la pintura de un vehículo está más relacionado al tiempo calendario (edad), que al kilometraje. 10
1. Confiabilidad
La confiabilidad es también una función de las condiciones de operación. Dichas condiciones pueden incluir, niveles y tipos de estrés, frecuencia de uso, perfiles de operación, etc.
Los estreses más comunes pueden ser mecánicos, eléctricos y térmicos.
11
2. Métricas de la confiabilidad
12
2. Métricas: función de densidad de probabilidad (pdf)
La función de densidad de probabilidad (pdf), denotada f(t), indica la distribución de fallas en función del tiempo y representa la velocidad absoluta de fallas. A mayor valor de f(t), habrá mayor cantidad de fallas en el intervalo cercano a t. Aún cuando f(t) no sea muy usada para medir confiabilidad, es una herramienta básica para derivar otras métricas. 13
2. Métricas: función de distribución acumulativa (cdf)
La función de distribución acumulativa (cdf), denotada F(t), es la probabilidad de que un producto falle en un tiempo dado t. Frecuentemente interpretada como la fracción de la población que irá a fallar en un tiempo t. Viene definida por:
14
2. Métricas: función de distribución acumulativa (cdf)
Por ejemplo, si el tiempo hasta ocurrir la falla de un producto está distribuido exponencialmente, tendremos:
15
2. Métricas: confiabilidad
La función de confiabilidad, denotada R(t), también llamada función de supervivencia, es interpretada como la fracción de la población que sobrevive un tiempo t. R(t) es la probabilidad de éxito, la cual es el complemento de F(t). Considerando la distribución exponencial: 16
2. Métricas: función de riesgo
La función de riesgo o razón de fallas, denotada h(t), mide la razón del cambio en la probabilidad de que un producto irá a fallar en el próximo intervalo de tiempo. Puede ser expresada como:
Para la distribución exponencial, dicha razón será constante: 17
2. Métricas: función de riesgo
La unidad de la función de riesgo es fallas por unidad de tiempo, tal como: fallas por hora. Por ejemplo, en la industria automotriz la unidad frecuentemente usada es “fallas por 1000 vehículos por mes”. En contraste a f(t), h(t) indica la velocidad relativa de fallas durante el siguiente intervalo de tiempo. 18
2. Métricas: función de riesgo
En general, habrá 3 tipos de razón de fallas, en términos de su tendencia en el tiempo: - Razón de falla decreciente - Razón de falla constante - Razón de falla creciente Estos 3 tipos corresponden a los 3 periodos de vida de un producto: - Periodo de fallas tempranas - Periodo de fallas aleatorias - Periodo de fallas por desgaste 19
2. Métricas: función de riesgo
Dichos periodos de vida usualmente son representados en la clásica curva de la bañera (bathtub):
20
2. Métricas: función de riesgo
Fallas tempranas (infantiles) son usualmente causadas por graves defectos latentes. Estos se convertirán en defectos patentes al inicio del tiempo de servicio.
Dichos defectos latentes son inducidos por: variaciones en el proceso de manufactura, fallas de material, errores de diseño o por el mal uso. 21
2. Métricas: función de riesgo
Cuando estos defectos no son identificados por inspecciones de calidad, el resultado será una falla temprana. Estos equipos pueden ser eliminados por periodos de prueba en los cuales son testados a niveles de operación normales. Periodos de prueba en torno a 48 horas son usualmente adecuados para eliminar una gran proporción de equipos con falla infantil. 22
2. Métricas: función de riesgo
Por ejemplo, en la industria automotriz la mortalidad infantil es apreciable. A veces se le conoce como “efecto del primer mes”. Usualmente, dicha mortalidad infantil producirá una razón de fallas decreciente, pero no siempre. En situaciones donde existen productos de baja calidad, la razón de fallas podría incluso aumentar.
23
2. Métricas: función de riesgo
En el periodo de fallas aleatorias, la razón de fallas se mantiene aproximadamente constante. Las fallas no siguen un patrón predecible y ocurren aleatoriamente debido a cambios inesperados en las condiciones de operación. Las condiciones que producen las fallas pueden ser mayores o menores a las especificadas en el diseño. 24
2. Métricas: función de riesgo
Por ejemplo, un relé electromagnético puede fallar debido a niveles altos o bajos de corriente eléctrica. Un nivel alto funde los contactos eléctricos, mientras que uno bajo aumenta la resistencia del contacto. Las fallas aleatorias pueden ser causadas por defectos de producción menores, los cuales tomarán más tiempo en presentarse. 25
2. Métricas: función de riesgo
Estas fallas no pueden ser eliminadas por periodos de prueba, ni buenas prácticas de mantenimiento preventivo. Mientras que la teoría de confiabilidad estudia los 3 tipos de falla, el mayor interés recae en el periodo de fallas aleatorias. En casos prácticos, este periodo (vida útil) es mucho más extenso que los otros 2.
26
2. Métricas: función de riesgo
Si la probabilidad de falla es demasiado grande, se debe modificar el diseño del equipo o sus condiciones de operación. Este periodo, al presentar razón de fallas constante, puede ser modelado adecuadamente por la distribución exponencial. Esta distribución, a pesar de su simplicidad es aplicable a una gran variedad de casos. 27
2. Métricas: función de riesgo
En sistemas complejos, cada componente tiene vida media diferente, aleatoriamente distribuida. La razón de fallas del sistema será constante conforme las partes falladas sean reemplazadas. Así, aún cuando hayan fallas debidas a desgaste, considerando la población total, dichas fallas ocurrirán a intervalos aleatorios. 28
2. Métricas: función de riesgo
Este comportamiento ha sido observado en diversos tipos de equipos, desde sistemas electrónicos, hasta motores de buses. La figura muestra el caso de una población de lámparas en una planta industrial.
29
2. Métricas: función de riesgo
En el periodo de fallas por desgaste, la razón de fallas aumenta con el tiempo. En este periodo, las fallas se atribuyen a la degradación y el desgaste, los cuales se acumulan y aceleran con el tiempo.
Cuando un producto entra a este periodo, la falla es inminente. Para minimizar los efectos de la falla, se hace necesario aplicar mantenimiento preventivo.
30
2. Métricas: función de riesgo
Muchos productos no presentan una curva de la bañera completa. Componentes mecánicos presentan mayormente el mecanismo de desgaste. Otros muestran un periodo de razón de fallas decreciente, seguido de un periodo creciente.
31
2. Métricas: función de riesgo
Fallas tempranas pueden ser pospuestas y la vida útil extendida por buenos diseños y prácticas de mantenimiento. Pero, la única manera de prevenir falla debido a desgaste es reemplazar o reparar los componentes antes que fallen.
32
2. Métricas: función de riesgo
Diversas distribuciones pueden ser usadas para caracterizar cada periodo. La mortalidad infantil puede ser representada por distribuciones Gamma o Weibull (β<1).
El periodo útil de vida por distribuciones exponenciales o Weibull (β=1). El periodo asociado al desgaste por distribuciones Gamma, normal o Weibull (β>1).
33
2. Métricas: función de riesgo acumulativa
La función de riesgo acumulativa se define por:
En el caso de la distribución exponencial:
H(t) y R(t) se relacionan por:
Si H(t) es muy pequeña, usando la expansión de Taylor: 34
2. Métricas: función de riesgo acumulativa
H(t) es una función creciente y la figura correspondiente a la curva de la bañera será la siguiente:
35
2. Métricas: percentil
El percentil, denotado tp, es el tiempo en el cual una fracción especificada p de la población irá a fallar.
Es la inversa de F(t):
Considerando la distribución exponencial:
Un percentil muy usado es , que corresponde al tiempo en el cual el 10% de la población irá a fallar. 36
2. Métricas: tiempo medio hasta la falla
El tiempo medio hasta la falla (MTTF) es la vida esperada E(T) de un producto no reparable:
Si el rango de T es positivo:
Considerando una distribución exponencial: 37
2. Métricas: tiempo medio entre fallas
El tiempo medio entre fallas (MTBF) es la vida esperada E(T) de un producto reparable:
38
2. Métricas: disponibilidad
Disponibilidad (availability, A) es el porcentaje del tiempo en el que el sistema está operativo: donde MTTR es el tiempo medio que se toma Tiempo de en reparar el sistema. indisponibilidad
Gmail
http://blogs.technet.com/b/whymicrosoft/archive/2011/12/21/availability-looking-behind-the-numbers.aspx
39
2. Métricas: varianza
La varianza, denotada V(T), es una medida de la dispersión de la distribución de la vida: Considerando la distribución exponencial:
En muchas aplicaciones se prefiere usar la desviación estándar, pues tiene las mismas unidades que T.
40
3. Distribución de Weibull
41
3. Distribución de Weibull
Las métricas definidas en la sección anterior para la distribución de Weibull serán:
42
3. Distribución de Weibull
Adicionalmente:
Donde la función gamma es definida por:
43
4. Sistemas en serie y paralelo
44
4. Sistemas en serie y paralelo
Un sistema es conformado por diversos componentes, sean eléctricos, mecánicos, informáticos, etc. La confiabilidad de sistemas depende básicamente de cómo los diversos componentes están conectados. Un sistema en serie falla apenas falla uno de sus componentes, mientras que un sistema en paralelo falla solo cuando todos sus componentes han fallado. 45
4. Sistemas en serie
La configuración más simple y quizá más común es la configuración en serie. Aquí el funcionamiento del sistema depende del funcionamiento de todos los componentes.
La falla de un componente implica la falla de todo el sistema. Usualmente, se considera que los componentes operan independientemente. 46
4. Sistemas en serie
Considerando la configuración:
La confiabilidad será:
Asumiendo distribuciones exponenciales:
RS(t) = R1(t)·R2(t)·R3(t) … Rn(t)
47
4. Sistemas en serie
Donde: λ = λ1+λ2+λ3 … λn = 1/Θ La razón de falla del sistema λ es igual a la suma de las razones individuales. La vida media del sistema Θ o tiempo medio entre fallas MTBF (mean time between failures) será: Θ = MTBF = 1/λ. La probabilidad del sistema de sobrevivir 1 MTBF sin fallas será: 48
4. Sistemas en paralelo
La configuración paralela es también relativamente frecuente. En este caso, para el sistema fallar todos los componentes deben fallar.
La probabilidad de falla (unreliability) de cada componente, considerando distribución exponencial será:
49
4. Sistemas en paralelo
La probabilidad de falla del sistema será: QS = Q1 ·Q2 … Qn
Por tanto, la confiabilidad del sistema será: R S = 1 – QS Considerando un sistema con 5 componentes paralelos con Ri=0.99:
50
4. Sistemas en serie y paralelo: Resumen
Considerando los sistemas en serie y paralelo mostrados. Suponiendo que los componentes fallan independientemente con igual probabilidad R(t), las confiabilidades de los sistemas Rs(t) serán:
51
4. Sistemas en serie y paralelo: Resumen
Para sistemas en serie, ya que Rs(t) disminuirá conforme n aumenta. Así, adicionar componentes en serie hace que el sistema sea más frágil. Para sistemas en paralelo, ya que Rs(t) aumentará conforme n aumenta. Así, adicionar componentes en paralelo aumentará la redundancia y por tanto la robustez del sistema. 52
4. Sistemas en serie y paralelo: ej. 1
Considerando el sistema mostrado, halle la confiabilidad del sistema:
53
4. Sistemas en serie y paralelo: ej. 1
Usando las relaciones de sistemas en serie y paralelo. Comenzando con las ramas ad y bd: Rad = R1 · R2 = (0.9)(0.8) = 0.72 Rbd = R3 · R4 · R5 = (0.8)(0.8)(0.9) = 0.576
Pero si Rad y Rbd están en paralelo, la probabilidad de falla de este subsistema (S1) será:
QS1 = Qad · Qbd = (1 – Rad)(1 – Rbd) = (1 – 0.72)(1 – 0.576) = (0.28)(0.424) = 0.119 54
4. Sistemas en serie y paralelo: ej. 1
La confiabilidad respectiva será: RS1 = 1 – QS1 = 1 – 0.119 = 0.881
Ahora la red será:
Definiendo RS2 como la confiabilidad combinada entre RS1 y R6: RS2 = RS1 · R6 = (0.881)(0.9) = 0.793 QS2 = 1 – RS2 = 1 – 0.793 = 0.207 Q7 = 1 – R7 = 1 – 0.9 = 0.1
55
4. Sistemas en serie y paralelo: ej. 1
Ya que QS2 y Q7 están en paralelo, la confiabilidad total del sistema será: QAC = QS2 · Q7 = (0.207)(0.1) = 0.0207 RAC = 1 – QAC = 1 – 0.0207 = 0.973
Así la confiabilidad del sistema será 0.973.
56