DISEÑO E IMPLEMENTACION DE UN SISTEMA DE CONTROL NO LINEAL POR MODO DESLIZANTE MULTIVARIABLE APLICADO A UN MANIPULADOR ROBOTICO TRANSLACIONAL DE 2DOF Ricardo Rodríguez Bustinza
[email protected] Universidad Nacional de Ingeniería Facultad de Ingeniería Mecánica – Escuela Profesional de Ingeniería Mecatrónica Lima – Perú
RESUMEN El presente trabajo de investigación trata sobre el control de trayectoria de un manipulador robótico translacional multivariable de 2DOF (Two-Degrees-of-Freedoms) que consta de un móvil accionado por una polea y un eslabón articulado en el CG (centro de gravedad) de dicho móvil. Este proceso será controlado mediante la técnica de control por modo deslizante. La acción de control esta orientada a controlar el movimiento translacional del móvil y el movimiento angular del brazo que es libre de girar en ambas direcciones. Las metas impuestas en este trabajo son: diseño, construcción, modelado, implementación y simulación en tiempo real del sistema, controlado con la ley de control por modo deslizante. Esta ley de control emplea la realimentación no lineal discontinua en una superficie dada que pertenece al espacio estado del sistema. Si una trayectoria de estado originada en esta superficie (como respuesta al comportamiento natural de la dinámica del sistema de lazo abierto) intente desviarse de la misma, entonces actúa una fuerza de control que evita tal desviación. Estudios de simulación demostraran que las señales de control diseñadas pueden hacer que las salidas sigan eficientemente a trayectorias de referencias arbitrarias, tal como se demuestra en los resultados obtenidos en tiempo real. El sistema del manipulador translacional, ha sido construido y diseñado, tomando como modelo al sistema del péndulo invertido.
Palabras claves:
Control Avanzado, Diseño e Implementación + Modelado + Controlador + Modo Deslizante + Sistema MRTM de 2DOF .
ejemplo controladores convencionales del tipo proporcionales derivativos).
INTRODUCCION Muchas aplicaciones de manipuladores robóticos solo tratan el problema del control de posición. Sin embargo, existen aplicaciones relacionadas con el seguimiento de trayectorias. Las estrategias de control de posición en general se emplean para trasladar la mano del manipulador de un lugar a otro. Las estrategias de control de trayectoria también se emplean para el traslado de la mano, pero este traslado se realiza cumpliendo ciertas especificaciones de diseño (por ejemplo, el tiempo de establecimiento del sistema de posicionamiento, o la precisión), las cuales no son fáciles de conseguir con las estrategias de control de posición (empleando por -1-
En este trabajo de investigación, el problema a resolver es diseñar e implementar un sistema de control por modo deslizante multivariable, para controlar el seguimiento de trayectorias arbitrarias en un manipulador robótico translacional de dos grados de libertad. Las variables a controlar son las trayectorias del carro y del brazo del manipulador. El sistema de control debe ser capaz de hacer que las variables controladas sigan la evolución de las trayectorias de referencia arbitrarias con mínimo sobre impulso, mínimo tiempo de estabilización y error en estado estable nulo. El control por modo
deslizante para un proceso multivariable, es un método que utiliza una superficie deslizante discontinua S, la cual garantiza la convergencia de la ley de control del sistema en un tiempo finito. Cuando se emplea el control por modo deslizante a los motores eléctricos, se presenta la ley de control de naturaleza discontinua. Para un sistema mecánico, la aplicación de la ley de control puede traer consigo el fenómeno ``chattering'', que se manifiesta en una oscilación sostenida de la señal de control, la cual puede ser dañina para el funcionamiento del sistema de control. MODELO DEL SISTEMA El sistema del Manipulador Robotico Translacional Multivariable de 2DOF que en adelante lo llamaremos (MRTM de 2DOF) es mostrado en la Fig. 1. M1 es un servomotor de DC con un mecanismo de reducción y un encoder óptico articulado a una polea de radio Rp. Esta polea usa un cable para transmitir la fuerza F1 que maneja el movimiento corredizo de un carro de masa MC montado a un par de rieles a lo largo del eje de x. M2 también es un servomotor DC con un encoder óptico empleado para manejar el movimiento rotatorio del brazo (libre de girar en ambas direcciones) del MRTM alrededor de un punto del pivote; se asume que tal punto es el CG (centro de gravedad) del carro.
respectivamente, y dos salidas: r y θ. Los parámetros K A1 y K A 2 son las ganancias de amplificación. Dinámica del Modelo y Ecuaciones de Energía Antes de generalizar la ecuación dinámica de Lagrange, se debe de construir las condiciones de energía necesarias para cada componente del sistema. El propósito de este modelo matemático es desarrollar y probar una ley de control que esta de acuerdo con la posición del carro y una posición vertical de equilibrio del manipulador robótico. Nosotros asumimos que las dos componentes de la salida y (r ,θ ) son medidas y que la fuerza u (u1 , u 2 ) es la entrada del control. Nuestro primer objetivo es encontrar la relación dinámica entre u (u1 , u 2 ) é y (r ,θ ) . Para esto, nosotros usamos las ecuaciones de Lagrange. Para expresar la energía en este sistema, introducimos las variables en la ecuación de Lagrange. El principio de Langrange nos permite escribir en forma directa las ecuaciones de movimientos de energía cinética T , energía potencial U y energía disipada D . En otros palabras, una vez que modelamos T , U y D , tendremos las ecuaciones dinámicas del sistema MRTM de 2DOF cuyos términos de las energías individuales componen en su conjunto la totalidad energética del sistema. T=
l 2θ& 2 ⎞ 1⎛ ⎜⎜ M c r& 2 + Jθ& 2 + m(r& 2 + r&ml cos θ θ& + )⎟ 2⎝ 4 ⎟⎠
1 mgl cos θ 2 1 D = Fc r& 2 + Cθ& 2 2
U=
(
Fig. 1. Sistema MRTM de 2DOF. En la Fig. 1, θ es la posición angular del brazo de longitud l y masa m, r es la posición del carro, F es la fuerza de fricción opuesta al movimiento del carro. El proceso de lazo cerrado para ser controlado representa un proceso con dos entradas; los voltajes de control K A1u1 y K A 2 u 2 aplicados a los terminales de armadura de M1 y M2 -2-
)
Las ecuaciones dinámicas de Lagrange son desarrolladas para las variables que intervienen en el sistema.
∂U ∂ ∂D d ∂T ∂T ( )−( )+( ) + ( ) = F1 ∂r ∂t ∂r& ∂r dt ∂r& ∂T ∂U ∂ ∂D d ∂T ( )−( )+( ) + ( ) = TL ∂θ ∂θ ∂t ∂θ& dt ∂θ& Desarrollamos las ecuaciones de Lagrange arriba indicadas, luego obtenemos las ecuaciones
parciales que describen a F1 (fuerza que desarrolla el eje del motor M1 para hacer girar la polea) y TL (torque que desarrolla el motor M2 para giro angular de la varilla). Sin embargo si nosotros estamos interesados en tener como fuerzas de control a los voltajes de armadura u1 y u 2 en lugar de F1 y TL , respectivamente, para esto es necesario modelar los subsistemas eléctricos servomotor-polea y servomotor–carro. Dando lugar a las ecuaciones dinámicas del sistema manipulador robótico de 2DOF.
u1 = m11 &r& + p11 r& + m12 cosθ θ&& + p12 sin θ θ& 2 u 2 = m22θ&& + p 22θ& + m21 cosθ &r& + d 21 sin θ
Tabla 1. de valores del sistema Valor 1.6462 0.0519 0.30 2.38e-4 3.0551e-4 5.38484e-4 9.5e-4 2.81 9.81 5.5 0.0565 0.0421 0.048 5.3 12.5
Símbolo Mc M l J Jeq Beq C Fc g KA Kb
La Tabla 1 muestra los valores de los parámetros del sistema manipulador que se utilizaron en la experiencia en tiempo real. Estos parámetros, han sido identificados previamente. El método de identificación desarrollado fue por medio del método grafico del ajuste de la curva de la velocidad de los servomotores DC, cuya data ha sido obtenida en virtud a las pruebas experimentales en lazo abierto usando la tarjeta de control LABPC+..
Símbolo Mc m L J Jeq Beq C Fc g KA Kb Km Rp Ra n
Tabla 2. de parámetros del sistema
Unidades Kg. Kg M Kgm2 Kgm2 Nms(rad)-1 Kgm2s-1 Kgs-1 ms-2 Sin unidades Vs(rad)-1 NmA-1 M
Km Rp Ra n
Descripción Masa del carro Masa del brazo Longitud del brazo Momento de inercia de la varilla Momento de inercia equivalente Fricción viscosa equivalente Coeficiente de fricción viscosa varilla Coeficiente de fricción del móvil Aceleración de la gravedad Constante de ganancia de amplificación Constante fuerza contraelectromotriz Constante de torque de motor Radio de la polea Resistencia de armadura Factor de reducción
CONTROL POR MODO DESLIZANTE El control por modo deslizante es un tipo particular de los sistemas de control de estructura variable que se caracteriza por presentar una ley de control de realimentación y una regla de decisión. esta regla de decisión, es una función de conmutación, tiene como entrada una medida del sistema actual y produce una salida particular de realimentación en un instante de tiempo. el resultado de este sistema de estructura variable que puede considerarse como una combinación de subsistemas donde cada subsistema tienen una estructura de control. Una de las ventajas de introducir una complejidad adicional al sistema es la habilidad de combinar las propiedades útiles de cada uno de las estructuras compuestas del sistema. en el control por modo deslizante, se diseña y construye un estado del sistema para quedar dentro de una vecindad de la función de conmutación. hay dos ventajas principales para este diseño. primero, la dinámica del sistema puede tolerar un cambio particular de la función de conmutación. segundo, la respuesta en lazo cerrado es totalmente insensible a una clase particular de incertidumbre. la propiedad de no
Ω
-3-
varianza la hace una candidata apropiada para aplicar metodología del control robusto. Por estas razones el control por modo deslizante se hace atractivo para un diseño del controlador. El acercamiento al diseño del control por modo deslizante consiste en dos componentes. Primero involucra el control de una función de conmutación para que el movimiento deslizante que satisfaga las especificaciones del diseño. Segundo se preocupa por la selección de una ley de control que hará la función de conmutación atractivo al estado del sistema. note que esta ley del control no es necesariamente discontinuo. De esta manera, la ecuación del sistema manipulador robótico, puede ser escrita de la siguiente forma matricial.
⎧ ⎡ r& ⎤ ⎡ u1 ⎤ ⎫ ⎡ &r&⎤ −1 ⎢θ&&⎥ = − M ⎨ P ⎢θ& ⎥ + Q + ⎢u ⎥ ⎬ ⎣ ⎦ ⎣ 2 ⎦⎭ ⎩ ⎣ ⎦
Si se logra que en el desarrollo del control que todas las trayectorias originales convergen a la intersección de estas superficies que empiezan allí, entonces para algún tiempo t 0 , S i (t 0 ) = 0 , i =1,2,...,n, se tendrá,
~ x& = −C i ~ x
Por lo tanto los errores de posición y velocidad convergen exponencialmente a cero. Escogemos la función de Lyapunov para nuestro análisis.
V (t , x) =
m12 ⎤ ⎡p ; P = ⎢ 11 ⎥ m22 ⎦ ⎣ p 21
1 T S MS 2
Analizando las derivadas para la superficie deslizante y función de Lyapunov, podemos +
−
seleccionar los controles u i , u i que satisfacen aseguran convergencia de todas las trayectorias a la intersección de las superficies de conmutación puede expresarse en una forma mas conveniente.
donde. ⎡m M = ⎢ 11 ⎣m21
para t < t 0
+
+
−
−
u i = (uˆ eq − Pˆ S ) i + u i
p12 ⎤ ⎡0 ⎤ ;Q = ⎢ ⎥ ⎥ p 22 ⎦ ⎣d 21 ⎦
u i = (uˆ eq − Pˆ S ) i + u i
además, r es la posición del carro, θ es la posición angular del carro, M (θ ) es la matriz de
donde uˆ eq es el estimado de u eq y Pˆ es el
inercia definida positiva, P (θ ,θ& ) es la matriz de Coriolis, Q (θ ) es la matriz de gravedad y (u1 , u 2 ) es el vector de fuerzas aplicadas al
nosotros debemos escoger u i y u i según.
estimado de P . Con esta opción de control, +
+ − u i + ε ≤ (uˆ eq − Pˆ S ) i ≤ u i − ε
−
i = 1,..., n
sistema. Escogemos K i de modo que.
Implementación de la Ley de Control Asumiremos que los vectores de posición y velocidad deseadas, son funciones continuamente diferenciables en el tiempo. La meta es que el sistema tenga que seguir la posición y velocidad actual de estos valores en tiempo real, lo que nos induce a considerar las siguientes superficies de conmutación.
S i = ( x& − x& d ) + C ( x − x d )
Ki ≥ (uˆ eq − Pˆ S )i + ε −
+
entonces con u i = K i y u i = − K i las desigualdades anteriores están satisfechas, y además obtenemos.
u oi =
1 + − (u i + u i ) = (uˆ eq − Pˆ S ) i 2
y
donde, C = diag (ci ) i =1,2 constante, S i es una trayectoria de la ecuación dinámica del sistema. Los vectores de error son definidos usualmente como ~ x = x − xd . y ~ x& = x& − x& d . -4-
U = diag ( K i ) +
−
De esta forma, se busca u i y u i . En síntesis, el control consiste en una estimación continua de u eq − PS y un termino discontinuo que tienda a
poner a cero uˆ eq − Pˆ S . Si consideraremos el diseño del controlador para el MRTM de 2DOF cuyo modelo es descrito anteriormente, configuramos las matrices M (θ ) , P(θ ,θ&) y Q(θ ) . Una apreciación bastante común es que el termino gravitatorio dado por la matriz Q puede ser calculada con precisión en el tiempo real. Por consiguiente, bajo esta criterio, escogemos nuestra estimación de u eq − PS . En el estado estacionario el error de convergencia es cero, x iguales a cero. entonces, consideramos a ~ x& y ~ Para una referencia constante, la estimación de u eq − PS será igual a la matriz de gravedad Q .
con salida a dos canales en cuadratura. Los actuadotes están compuesto por tarjetas similares, como son el generador de PWM que modula las señales de control para luego sean desfasadas en 90° y el amplificador de potencia que encargado de amplificar las señales que provienen del generador de PWM de modo que su salida genere el control de inversión del giro del servomotor DC. La tarjeta de adquisición de datos LABPC+ encargada de manejar los datos de entrada/salida del sistema y una computadora personal con microprocesador Pentium de 100 MHz. El sensado tiene el decodificador de cuadratura que se encarga de leer los datos del encoder óptico para emitir salidas UP/DOWN al circuito contador, que a su vez tiene una salida de 16 bits que son entradas digitales a la tarjeta LABPC+.
Seleccionamos K i 2
K i = ∑ ( M ij &x&dj − c j ~ x& j + Pij x& j − S j ) + ε i j =1
donde las limitadas.
matrices
My
P son entradas
La ley de control por modo deslizante es dado por:
u = Q (θ ) − Ksat ( S / φ )
donde sat (.) es la función de saturación que se define:
⎧S /φ si S / φ ≤ 1 sat ( S / φ ) = ⎨ ⎩sgn( S / φ ) otro caso
Fig. 2. Diagrama de bloque del sistema. Los circuitos utilizados en las pruebas experimentales son el generador de PWM (ver Fig. 3), el amplificador de potencia (ver Fig. 4) y la tarjeta de lectura de doble encoder y manejo de datos entrada/salida con la LABPC+ (ver Fig. 5).
La ecuación general de la ley de control con saturación es.
⎡ u1 ⎤ ⎡ 0 ⎤ ⎡ K 1 sat ( S1 / φ ) ⎤ ⎢u ⎥ = ⎢d ⎥ − ⎢ K sat ( S / φ )⎥ 2 ⎦ ⎣ 2 ⎦ ⎣ 21 ⎦ ⎣ 2 IMPLEMENTACION La implementación del sistema MRTM de 2DOF se muestra en la Fig. 2. Los componentes físicos (hardware) del sistema de control son: dos servomotores DC (modelos iguales) con encoder óptico incremental de 1250 cuentas por vuelta -5-
Fig. 3. Generador de PWM.
RESULTADOS EXPERIMENTALES Los resultados en tiempo real para el sistema MRTM de 2DOF, son mostrados en las figuras (7-12). Los parámetros de sintonía para la selección del control c1 , c 2 , ep1 , ep 2 , φ han sido fijados en el experimento con los valores: 98, 150, 0.1, 0.01 y 0.1 respectivamente. El desarrollo de los resultados experimentales se estructuran en dos experimentos: Experimento 1 Fig. 4. Amplificador de potencia. Las condiciones iniciales son x1 = 0m para el carro y x 2 = 0rad para la posición angular del brazo, son usadas para los dos experimentos. Las trayectorias constantes deseadas para el carro y brazo son x d 1 = 0.1m y x d 2 = (π / 4) rad respectivamente. El tiempo de prueba utilizado es de 50 seg.
Fig. 5. Sensado de posición.
La implementación del sistema de control real se observa en la Fig. 6. El sistema ha sido implementados en el laboratorio de proyectos de investigación en automatización y control de la Facultad de Ingeniería Eléctrica y Electrónica de la Universidad Nacional de Ingeniería.
La Fig. 7 muestra las salidas controladas para la posición del carro y posición angular brazo. El tiempo de establecimiento es en promedio de 3 seg. El sistema de control es capaz de hacer que las variables controladas sigan la evolución de las trayectorias de referencia arbitrarias con mínimo sobre impulso, mínimo tiempo de estabilización y error en estado estable nulo.
Fig. 7
Salidas controladas para la posición del carro y posición angular del brazo.
Fig. 6. Implementación del sistema real La Fig. 8, muestra la respuesta del sistema para la velocidad del carro y velocidad angular del brazo. Se observa que las amplitudes para ambos casos presentan una pequeña oscilación a lo largo -6-
de su recorrido que se debe al torque que producen los servomotores DC.
Fig. 8
Salidas de la velocidad para el carro y para el brazo.
La Fig. 9, muestra la ley de control del sistema. La oscilación auto sostenida de la ley de control es abrupta en un instante de tiempo corto. Se observa el gran esfuerzo que hacen los servomotores para que el sistema sea controlado (los ejes conmutan en ambos sentidos a una frecuencia de 40Hz).
Fig. 9
La Fig. 10, muestra la salida controlada realizando un seguimiento a la señal deseada. Las señales se han fijado a una frecuencia de f = 40Hz de ciclo senoidal y con amplitudes de 0.2m y πrad que indican el movimiento de translación del carro en 0.4m y para el movimiento angular para el brazo de 2πrad en ambos sentidos.
Señales de control para el servomotor 1 y servomotor 2.
Fig. 10 Salidas controladas con trayectoria senoidal para la posición del carro y posición angular del brazo. La Fig. 11, muestra la respuesta del sistema para la velocidad del carro y velocidad angular del brazo para la trayectoria senoidal.
Fig. 11 Salidas de la velocidad para el carro y para el brazo con trayectoria senoidal.
Experimento 2 Las trayectorias constantes deseadas para el carro y brazo son x d 1 = 0.2 cos(2 KπT / 40) m y
x d 2 = π cos(2 KπT / 40)rad respectivamente. El tiempo de prueba es de 50 seg.
-7-
La Fig. 12, muestra la ley de control del sistema para la trayectoria senoidal. Presenta oscilaciones auto sostenida de la ley de control para una frecuencia de 40Hz.
arbitrarias de referencia con mínimo sobre impulso, mínimo tiempo de estabilización y error en estado estable nulo.
REFERENCIAS
Fig. 12 Señales de control para el servomotor 1 y servomotor 2.
CONCLUSIONES En este trabajo de investigación el proceso ha sido construido totalmente por nosotros, con el propósito de implementar los experimentos relacionados con el sistema de control por modo deslizante. En su construcción se ha optado por utilizar materiales de aluminio en la fabricación de la riel, el carro, las poleas y el brazo. En lo que respecta a la parte mecánica se ha tomado en cuenta el buen diseño de los goznes motor-polea y motor-brazo, para evitar posibles desajustes que puedan ocasionar errores en la experiencia. Para el diseño del sistema de control se requiere tener el modelo del proceso porque se quiso experimentar la técnica de control por modo deslizante por ser esta técnica de control robusta. Los resultados obtenidos fueron satisfactorios según constan las simulaciones realizadas. El problema planteado para las posiciones del carro y del brazo sigan trayectorias arbitrarias usando control deslizante. Esta estrategia de control, como es habitual, requiere del modelo del proceso controlado. Las simulaciones realizadas han demostrado que el modelo derivado del modelo de la planta 2 es valido y cumple con las exigencias de un modelo no lineal multivariable con propósitos de control. Del mismo modo, tales simulaciones también han demostrado que el sistema de control no lineal multivariable empleando la técnica de modos deslizantes, cumple las condiciones de diseño impuestas previamente: seguimiento de las salidas controladas con respecto a señales -8-
1. Hassan K. Khalil ''Nonlinear Systems'', Prentice Hall, 1996 2. J. Jacques E. Slotine ''Applied Nonlinear Control'', Prentice Hall, 1991 3. C. Edwards and S. Spurgeon ''Sliding Mode Control'', Taylor and Francis, 1998 4. S. Nakamura ''Análisis y Visualización Grafica con Matlab'', Prentice Hall, 1991 5. G. Franklin 6 J.D Powell ''Control de Sistemas Dinámicos Realimentación'', Addison Wesley, 1991 6. A. Rojas Moreno ''Control Avanzado'', Publicación independiente, ISBN 99729318-0-3,2001 7. E. Bailey A. Araposthatis ''Simple Mode Sliding Control'', 1996 8. Koditschek D.E, Proc. 23rd I.E.E.E. Conf. On Decision and Control, Las Vegas, p. 733, 1984.