Control Automatico 2013_high.pdf

  • Uploaded by: Kelvin Skt
  • 0
  • 0
  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Control Automatico 2013_high.pdf as PDF for free.

More details

  • Words: 223,425
  • Pages: 726
La característica principal de esta obra es que se describe de manera detallada cómo diseñar, construir y probar experimentalmente varios sistemas de control. Para ello, primero se describe la tarea que debe realizar el sistema de control bajo estudio y se obtiene su modelo matemático. Luego, se explica de manera detallada cómo construir el prototipo experimental y cómo estimar los valores numéricos de los parámetros del modelo obtenido previamente (identificación experimental del modelo). Entonces se diseña el controlador correspondiente utilizando la teoría presentada en los primeros capítulos de la obra. Finalmente, se muestra cómo construir el controlador diseñado previamente utilizando electrónica analógica o digital y se presentan los resultados obtenidos experimentalmente.

CONTROL AUTOMÁTICO

El Centro de Innovación y Desarrollo Tecnológico en Cómputo del Instituto Politécnico Nacional, presenta un libro cuyo objetivo es el de contribuir hacia la reducción de la brecha existente entre la teoría y la práctica en la enseñanza del Control Automático. Por esta razón, aunque el contenido del libro es de nivel Licenciatura puede ser de gran utilidad incluso para aquellas personas involucradas en el proceso enseñanza-aprendizaje del Control Automático en el nivel de Posgrado.

El libro es especialmente útil para estudiantes y profesores en las carreras de Ingeniería Eléctrica, Electrónica, Mecánica, Mecatrónica e incluso Robótica.

CONTROL AUTOMÁTICO Teoría de diseño, construcción de prototipos, modelado, identificación y pruebas experimentales

Victor Manuel Hernández Guzmán Ramón Silva Ortigoza Roberto Valentín Carrillo Serrano

Victor Manuel Hernández Guzmán Ramón Silva Ortigoza Roberto Valentín Carrillo Serrano

Instituto Politécnico Nacional

COLECCIÓN CIDETEC

Victor Manuel Hernández Guzmán. Nació en Querétaro, Qro., México. Recibió el título de Ingeniero Industrial en Eléctrica por parte del Instituto Tecnológico de Querétaro en 1988, el grado de Maestro en Ciencias en Ingeniería Eléctrica (Control) por parte del Instituto Tecnológico de la Laguna, en Torreón, Coah., en 1991 y el grado de Doctor en Ciencias en Ingeniería Eléctrica (Mecatrónica) por parte del CINVESTAVIPN, en México, D.F., en 2003. Actualmente es Profesor en los programas de Licenciatura y Maestría en Instrumentación y Control de la Universidad Autónoma de Querétaro. Su trabajo de investigación trata sobre el control de robots manipuladores y sistemas electromecánicos. Tiene particular interés en la construcción de prototipos didácticos para la enseñanza de técnicas de control clásicas y modernas (no lineales).

Ramón Silva Ortigoza. Recibió el título de Licenciado en Electrónica por la Benemérita Universidad Autónoma de Puebla en 1999, y los grados de Maestro y Doctor en Ciencias en Ingeniería Eléctrica (Opción Mecatrónica) por el CINVESTAV-IPN, en 2002 y 2006, respectivamente. Actualmente, es Investigador del Departamento de Posgrado del Área de Mecatrónica en el CIDETEC del Instituto Politécnico Nacional, y miembro del Sistema Nacional de Investigadores. Es coautor del libro Control Design Techniques in Power Electronics Devices (SpringerVerlag, London, 2006), y coeditor del libro Mecatrónica (Colección CIDETEC, México, 2010). Se ha desempeñado como jurado en el Premio de Ingeniería de la Ciudad de México y Premio a la Investigación en el IPN , así como Evaluador de Programas de Posgrado presentados en el marco del PNPC de CONACYT . Sus áreas de interés incluyen el control de sistemas mecatrónicos, la robótica móvil y el control aplicado a electrónica de potencia.

Roberto Valentín Carrillo Serrano. Nació en Querétaro, Qro., México en 1976. Recibió el título de Ingeniero en Instrumentación y Control de Procesos por la Universidad Autónoma de Querétaro, donde también obtuvo los grados de Maestro en Ciencias en Instrumentación y Control Automático, y de Doctor en Ingeniería en 2000, 2008 y 2011 respectivamente. Trabajó en Kellogg de México de 1999 a 2006. Las áreas de interés del Dr. Carrillo Serrano son los robots manipuladores, control de máquinas eléctricas y control de sistemas mecatrónicos. Actualmente es Profesor en el programa de Licenciatura en Ingeniería en Automatización y de la Maestría en Instrumentación y Control Automático de la Universidad Autónoma de Querétaro, además de ser miembro del Sistema Nacional de Investigadores, México. En cuanto a publicaciones se refiere, estas se encuentran en estándares internacionales que pertenecen a la base de datos Journal Citation Reports (JCR) e ISI-Thomson.

Victor Manuel Hern´andez Guzm´an Ram´on Silva Ortigoza Roberto Valent´ın Carrillo Serrano

´ CONTROL AUTOMATICO Teor´ıa de dise˜no, construcci´on de prototipos, modelado, identificaci´on y pruebas experimentales

M´exico, D.F.

Enero 2013.

Control Autom´ atico Teor´ıa de dise˜ no, construcci´ on de prototipos, modelado, identificaci´ on y pruebas experimentales Autores: Victor Manuel Hern´ andez Guzm´ an Ram´ on Silva Ortigoza Roberto Valent´ın Carrillo Serrano Primera Edici´ on 2013 c 2013 D.R. Instituto Polit´ecnico Nacional Luis Enrique Erro s/n. Unidad Profesional “Adolfo L´ opez Mateos” Zacatenco, 07738, M´exico, D.F. CIDETEC Av. Juan de Dios B´ atiz S.N. esq. Miguel Oth´ on de Mendiz´ abal Col. Nueva Industrial Vallejo Del. Gustavo A. Madero C.P. 07700 ISBN: 978-607-414-362-1 Hecho en M´exico / Made in Mexico

V

A mi esposa, padres y hermanos. Victor.

Para mis maravillosos hijos, Rhomina y Joserham´on, y a mi madre. Ram´on.

A Dios, a mis padres, a mi esposa, a mis profesores y alumnos. Roberto.

Prefacio

El Control Autom´atico es una de las disciplinas que soporta de manera importante el tecnol´ogicamente avanzado modo de vida que conocemos hoy en d´ıa. Sus aplicaciones se encuentran en casi todas las actividades que el ser humano realiza en el siglo XXI: desde el funcionamiento del telescopio espacial Hubble y de numerosas naves espaciales hasta el refrigerador que se encuentra en los hogares asegurando la conservaci´on de los alimentos. Desde los dep´ositos de agua residenciales hasta las grandes industrias que producen todos los satisfactores de los seres humanos: autom´oviles, aviones, alimentos, bebidas y medicinas, por mencionar algunos. Aunque se sabe que las primeras aplicaciones del Control Autom´atico aparecieron hace m´as de 2000 a˜ nos, fue la Revoluci´on Industrial la que deton´o su desarrollo como un conjunto de conocimientos cient´ıficos destinados a resolver problemas tecnol´ogicos. Desde entonces, el uso del Control Autom´atico ha sido fundamental para que las actividades productivas del ser humano se hagan cada vez m´as eficaces incrementando la calidad y la repetitibilidad de los productos. Por esta raz´on, los cursos sobre Control Autom´atico se han hecho comunes en las carreras de Ingenier´ıa El´ectrica, Electr´onica, Mec´anica, Qu´ımica y, m´as recientemente, Mecatr´onica y Rob´otica. Sin embargo, el hecho de que las t´ecnicas de Control Autom´atico convencionales est´en soportadas por herramientas matem´aticas ha planteado tradicionalmente una dificultad en la ense˜ nanza de esta disciplina: para aprender a dise˜ nar sistemas de control primero se debe tener un buen conocimiento de c´omo se resuelven las ecuaciones diferenciales lineales de coeficientes constantes mediante el uso de la transformada de Laplace. Este hecho plantea un importante obst´aculo dado que la soluci´on de ecuaciones diferenciales es algo que normalmente es complicado para la mayor´ıa de los estudiantes de Licenciatura. El problema se complica m´as a´ un porque en Control Autom´atico lo m´as importante de resolver una ecuaci´on diferencial es saber interpretar el resultado cuando la mayor´ıa de los estudiantes de Licenciatura se quedan perdidos en c´omo resolver la ecuaci´on diferencial.

VIII

Prefacio

Otra dificultad en la ense˜ nanza del Control Autom´atico es c´omo mostrar la manera de relacionar los resultados matem´aticos con los aspectos pr´acticos de un sistema de control: ¿C´omo construir pr´acticamente un controlador que est´a expresado en t´erminos de la variable de Laplace (funci´on de transferencia)? ¿C´omo se construye un controlador usando electr´onica digital o usando electr´onica anal´ogica? ¿C´omo tomar en cuenta las ganancias de los sensores y de los amplificadores de potencia? ¿C´omo determinar esta ganancia en un amplificador de potencia basado en modulaci´on por ancho de pulso? ¿Qu´e efectos tienen estas ganancias en un sistema de control? La manera en que tradicionalmente se ha resuelto el problema de la pr´actica descrito en el p´arrafo anterior ha sido la compra de prototipos did´acticos comerciales. Sin embargo, esto tiene dos desventajas: 1) estos equipos normalmente son excesivamente caros pues son construidos en el extranjero y 2) muchos de los aspectos involucrados en el funcionamiento de un sistema de control permanecen “invisibles” para el estudiante; esto es debido a que estos equipos est´an dise˜ nados pensando que el estudiante de Control Autom´atico no tiene porqu´e saber c´omo se resuelven los detalles pr´acticos relacionados con la electr´onica y la programaci´on, por ejemplo, de los diferentes componentes de un sistema de control. Este es el caso de ¿C´omo construir un amplificador de potencia? ¿C´omo dise˜ nar y construir un controlador basado en amplificadores operacionales o un controlador basado en un microcontrolador? ¿Existen alternativas a la pr´actica com´ un de comprar sensores en el extranjero? La presente obra pone a la disposici´on de los estudiantes y de los profesores de nivel Licenciatura un material con el cual se pretende ayudar a resolver algunas de las dificultades arriba mencionadas. Con el fin de facilitar el aprendizaje de los aspectos te´oricos se incluye un cap´ıtulo dedicado exclusivamente a la soluci´on de ecuaciones diferenciales lineales y de coeficientes constantes usando la transformada de Laplace. Si bien ese cap´ıtulo puede ser visto como un curso de ecuaciones diferenciales, la principal diferencia respecto del curso de matem´aticas que sobre este tema se lleva en el tronco com´ un de Licenciatura (Ingenier´ıa) es que en nuestro libro se hace ´enfasis en la interpretaci´on de la soluci´on de una ecuaci´on diferencial. Adem´as se resalta el efecto que tienen los par´ametros de una ecuaci´on diferencial en la forma gr´afica de la soluci´on. Debemos subrayar que la experiencia de los autores es que los libros existentes sobre Control Autom´atico (incluso los m´as importantes) se limitan a presentar un breve prontuario de soluciones de ecuaciones diferenciales y no consiguen que el estudiante razone acerca de lo que est´a haciendo. Para salvar este problema, en el presente libro se recurre a ejemplificar cada tipo de ecuaci´on diferencial con una situaci´on pr´actica que cualquier estudiante de Licenciatura ha observado en alg´ un momento de su vida. Es decir, se recurre a la experiencia cotidiana del estudiante para que comprenda lo que significan los resultados matem´aticos. La problem´atica relacionada con los aspectos pr´acticos de los sistemas de control es resuelta mediante la aplicaci´on a varios sistemas de control experimentales. En cada uno de estos ejemplos se procede de igual manera. Primero

Prefacio

IX

se describe la tarea que ejecuta el sistema de control bajo estudio y luego se explica al lector c´omo construir cada uno de los componentes de dicho sistema de control. Posteriormente se muestra c´omo obtener el modelo matem´atico correspondiente para despu´es explicar a detalle c´omo obtener, de manera experimental, el valor num´erico de cada uno de los par´ametros del modelo. Entonces se usan las t´ecnicas de control presentadas previamente en los primeros cap´ıtulos del libro para dise˜ nar (matem´aticamente) el controlador correspondiente. Se presenta tambi´en la manera de construir el controlador usando electr´onica anal´ogica o digital y finalmente se presentan los resultados experimentales obtenidos al controlar el prototipo que se ha construido. A continuaci´on se explica c´omo est´a organizada la presente obra. En el cap´ıtulo 1 se presenta una panor´amica general del Control Autom´atico con el fin de que el lector entienda a grandes rasgos cu´al es el objetivo de dise˜ nar sistemas de control. Esto se realiza utilizando un ejemplo que cuyo funcionamiento es bien conocido por la mayor´ıa de las personas: el control de un ca˜ n´on antia´ereo. Tambi´en se presenta una breve historia del Control Autom´atico y se relaciona con el contenido de la obra para que el lector identifique cuales son las razones por las que cada herramienta de control ha sido desarrollada. En el cap´ıtulo 2 se aborda el problema de obtener el modelo matem´atico de sistemas f´ısicos comunes en Ingenier´ıa El´ectrica, Electr´onica, Mec´anica y Mecatr´onica. Una raz´on importante de incluir este tema es que el lector se d´e cuenta de que los sistemas de control est´an descritos por ecuaciones diferenciales lineales y de coeficientes constantes. Esto motiva el estudio de la soluci´on de las ecuaciones diferenciales en el cap´ıtulo 3, pues esto es importante para entender c´omo responde un sistema de control y qu´e hay que modificar en ´el para conseguir la respuesta deseada. En los cap´ıtulos 4 al 7 se presentan las herramientas utilizadas en el dise˜ no de sistemas de control cl´asico y moderno: criterios de estabilidad y error en estado estacionario (cap´ıtulo 4), la t´ecnica del lugar de las ra´ıces (cap´ıtulo 5), la t´ecnica de la respuesta en frecuencia (cap´ıtulo 6) y la t´ecnica de las variables de estado (cap´ıtulo 7). La exposici´on de estos temas est´a dirigida hacia su aplicaci´on en los ejemplos pr´acticos presentados en los u ´ltimos cap´ıtulos de la obra. De este modo, muchos de los ejemplos presentados en los primeros cap´ıtulos tratan sobre el dise˜ no de controladores que despu´es ser´an construidos y probados experimentalmente en los u ´ltimos cap´ıtulos. La estructura de los cap´ıtulos 8 al 14 es la misma, pues tienen el mismo objetivo: se presenta la aplicaci´on de las t´ecnicas de control desarrolladas en los cap´ıtulos 4 al 7 al an´alisis y dise˜ no de sistemas de control pr´acticos. Los controladores correspondientes son construidos al igual que el sistema de control completo, utilizando materiales de bajo costo y que son f´aciles de conseguir por un estudiante de licenciatura. Finalmente, se presentan los resultados obtenidos experimentalmente al probar los sistemas de control en la pr´actica. En el cap´ıtulo 8 se estudian y dise˜ nan varios circuitos electr´onicos realimentados, entre ellos algunos circuitos osciladores con forma de onda sinusoidal

X

Prefacio

basados en amplificadores operacionales (audiofrecuencia) y en transistores (radiofrecuencia). En los cap´ıtulos 9 y 10 se controla la velocidad y la posici´on, respectivamente, de un motor de corriente directa con escobillas e imanes permanentes. Un sistema de levitaci´on magn´etica es controlado en el cap´ıtulo 11 mientras que en el cap´ıtulo 12 se controla un mecanismo muy popular en Control Autom´atico y que es conocido como Ball and Beam. Finalmente, en los cap´ıtulos 13 y 14 se presentan dos mecanismos que incluyen p´endulos: el p´endulo de Furuta y el p´endulo con rueda inercial. Por u ´ltimo, se debe decir que la importancia de todos estos prototipos experimentales es reconocida en los cursos de control en todo el mundo y por eso han sido seleccionados como bancos de prueba en la presente obra. El primer autor reconoce y agradece el apoyo de sus dos coautores. Su colaboraci´on ha sido de gran valor no s´olo en la elaboraci´on de la presente obra sino, adem´as, en diversas actividades de investigaci´on que han realizado desde que eran estudiantes de Doctorado (con el segundo autor) y desde que el tercer autor realiz´o sus estudios de Maestr´ıa y Doctorado, los cuales el primer autor tuvo la fortuna de dirigir. Un reconocimiento y un agradecimiento especial para los Drs. Hebertt Sira Ram´ırez (Director de tesis) y Gerardo Silva Navarro, ambos investigadores del CINVESTAV-IPN quienes fueron fundamentales en los estudios de Doctorado del primer autor. Tambi´en se reconoce y agradece al Dr. V´ıctor Santib´an ˜ez del Instituto Tecnol´ogico de la Laguna con quien el primer autor ha mantenido una importante colaboraci´on cient´ıfica desde 2004 en el ´area de control de robots manipuladores. Un reconocimiento a la importante colaboraci´on cient´ıfica con los Drs. Ricardo Campa (Instituto Tecnol´ogico de la Laguna) y Arturo Zavala R´ıo (IPICYT). Las ideas que han motivado este trabajo tomaron forma durante los cursos que sobre Control Autom´atico ha impartido el primer autor a nivel Licenciatura y Maestr´ıa en la Facultad de Ingenier´ıa de la Universidad Aut´onoma de Quer´etaro, Instituci´on a la que est´a adscrito desde 1995. Se agradece a esta Instituci´on el apoyo recibido durante todos estos a˜ nos. Un agradecimiento al Sistema Nacional de Investigadores por el apoyo econ´omico recibido desde 2005 y al CIDETEC del Instituto Polit´ecnico Nacional por facilitar los medios editoriales requeridos para la impresi´on de este libro. Una menci´on especial para mi esposa Judith de quien siempre he recibido el apoyo necesario para realizar no s´olo esta obra sino todo el trabajo de investigaci´on que he desarrollado desde que decid´ı hacer mis estudios de Doctorado. El segundo autor reconoce y agradece la invitaci´on del primer autor para participar en la elaboraci´on de este y otros proyectos ambiciosos, acad´emicos y de investigaci´on. Su apoyo ha sido fundamental en el desarrollo profesional del segundo autor y en la formaci´on conjunta de estudiantes de nivel maestr´ıa. El segundo autor agradece de forma muy especial a los Doctores Gilberto Silva Ortigoza y Hebertt Sira Ram´ırez, investigadores de la BUAP y del CINVESTAV-IPN, por ser sus mentores; el primero a lo largo de toda su trayectoria y el segundo en sus estudios de formaci´on de posgrado. Tambi´en, se reconoce y agradece la importante colaboraci´on acad´emica con las

Prefacio

XI

Doctoras Magdalena Marciano Melchor (CIDETEC-IPN), Griselda Salda˜ na Gonz´alez (Universidad Tecnol´ogica de Puebla) y Mariana Marcelino Aranda (UPIICSA-IPN). El segundo autor agradece el apoyo recibido por parte del CIDETEC del Instituto Polit´ecnico Nacional, Centro de Investigaci´on al que est´a adscrito desde 2006, el soporte econ´omico recibido de la SIP y de los programas EDI y COFAA del Instituto Polit´ecnico Nacional, as´ı como del Sistema Nacional de Investigadores. Menci´on especial merecen mis hijos, Rhomina y Joserham´on, por su apoyo moral y ser la inspiraci´on que me permite esforzarme cada d´ıa para dar siempre lo mejor. El tercer autor agradece primeramente al Dr. V. M. Hern´andez Guzm´an la atenta invitaci´on a participar en la realizaci´on de la presente obra. Al Consejo Nacional de Ciencia y Tecnolog´ıa que me bec´o para mis estudios de Maestr´ıa y Doctorado (per´ıodo de realizaci´on de la presente obra). A mi segunda casa, la Universidad Aut´onoma de Quer´etaro, espacio para la docencia, investigaci´on y difusi´on de la cultura que me ha ense˜ nado a ser un mejor ser humano, manteni´endome d´ıa con d´ıa en constante superaci´on en todos los sentidos. A Dios, a mis padres Valent´ın y Alicia, y a mi esposa Lizbeth, por el apoyo recibido en todo momento.

V. M. Hern´andez Guzm´an R. Silva Ortigoza R. V. Carrillo Serrano

Quer´etaro, Qro., FI-UAQ. M´exico, D.F., Instituto Polit´ecnico Nacional. Quer´etaro, Qro., FI-UAQ. Enero de 2013.

´Indice general

1.

Introducci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1. Sistema de control de un ca˜ n´on antia´ereo . . . . . . . . . . . . . . . . . . . 2 1.2. Historia del Control Autom´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3. Prototipos did´acticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.

Modelado matem´ atico de sistemas f´ısicos . . . . . . . . . . . . . . . . . . 2.1. Energ´ıa y variables generalizadas del sistema . . . . . . . . . . . . . . . . 2.2. Almacenadores de energ´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Sistemas mec´anicos traslacionales . . . . . . . . . . . . . . . . . . . . 2.2.2. Sistemas mec´anicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3. Sistemas el´ectricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Disipadores de energ´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Sistemas mec´anicos traslacionales . . . . . . . . . . . . . . . . . . . . 2.3.2. Sistemas mec´anicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3. Sistemas el´ectricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Fuentes de energ´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. Sistemas mec´anicos traslacionales . . . . . . . . . . . . . . . . . . . . 2.4.2. Sistemas mec´anicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3. Sistemas el´ectricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Convertidores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Transformadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2. Adaptadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7. Caso de estudio. Un convertidor electr´onico de potencia de CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 2.8. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15 16 19 20 22 24 27 27 29 29 30 31 31 31 32 32 37 42 83 87 88

XIV

´Indice general

2.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.

Base matem´ atica: ecuaciones diferenciales . . . . . . . . . . . . . . . . . 97 3.1. Ecuaci´on diferencial de primer orden . . . . . . . . . . . . . . . . . . . . . . . 99 3.2. Un integrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 3.3. Ecuaci´on diferencial de segundo orden . . . . . . . . . . . . . . . . . . . . . . 112 3.4. Ra´ıces reales diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.5. Ra´ıces reales repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 3.6. Ra´ıces complejas conjugadas diferentes . . . . . . . . . . . . . . . . . . . . . 134 3.7. Ra´ıces complejas conjugadas repetidas . . . . . . . . . . . . . . . . . . . . . 140 3.8. Una ecuaci´on diferencial general . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 3.9. Polos y ceros en sistemas de orden superior . . . . . . . . . . . . . . . . . 150 3.9.1. Cancelaci´on polo-cero y modelos reducidos . . . . . . . . . . . 150 3.9.2. Polos dominantes y modelos reducidos . . . . . . . . . . . . . . . 152 3.10. El principio de superposici´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 3.11. Caso de estudio. Un convertidor electr´onico de potencia de CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 160 3.12. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 3.13. Preguntas de Repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 3.14. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 4.

Criterios de estabilidad y error en estado estacionario . . . . . 177 4.1. Diagramas de bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 4.2. Regla de los signos para determinar la ubicaci´on de las ra´ıces de un polinomio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 4.2.1. Polinomios de segundo grado . . . . . . . . . . . . . . . . . . . . . . . 187 4.2.2. Polinomios de primer grado . . . . . . . . . . . . . . . . . . . . . . . . . 190 4.2.3. Polinomios de grado 3 o mayor . . . . . . . . . . . . . . . . . . . . . . 190 4.3. Criterio de estabilidad de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 4.4. Error en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 4.4.1. Referencia tipo escal´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 4.4.2. Referencia tipo rampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 4.4.3. Referencia tipo par´abola . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 4.5. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 4.6. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 4.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

´Indice general

5.

XV

Dise˜ no usando la respuesta en el tiempo . . . . . . . . . . . . . . . . . . . 221 5.1. Dise˜ no con el lugar de las ra´ıces . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 5.1.1. Reglas para construir el lugar de las ra´ıces. . . . . . . . . . . . 225 5.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 5.2.1. Control proporcional de posici´on . . . . . . . . . . . . . . . . . . . . 232 5.2.2. Control proporcional-derivativo (PD) de posici´on . . . . . . 235 5.2.3. Control de posici´on usando un compensador de adelanto238 5.2.4. Control proporcional-integral (PI) de velocidad . . . . . . . . 241 5.2.5. Control proporcional-integral-derivativo (PID) de posici´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 5.2.6. Asignaci´on de los polos de lazo cerrado deseados . . . . . . 257 5.2.7. Control proporcional-integral-derivativo (PID) de un sistema de levitaci´on magn´etica . . . . . . . . . . . . . . . . . . . . . 264 5.2.8. Control de un sistema ball and beam . . . . . . . . . . . . . . . . 268 5.3. Caso de estudio. Notas adicionales sobre el control PID de posici´on de un motor de CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 5.4. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 5.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 5.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 6.

Dise˜ no usando la respuesta en frecuencia . . . . . . . . . . . . . . . . . . 291 6.1. Un circuito RC de corriente alterna . . . . . . . . . . . . . . . . . . . . . . . . 292 6.1.1. Representaciones gr´aficas comunes . . . . . . . . . . . . . . . . . . . 294 6.1.2. Modelo matem´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 6.1.3. Componentes de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 301 6.1.4. Relaci´on entre la respuesta en la frecuencia y en la respuesta en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 6.2. Sistemas arbitrarios de orden n . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 6.3. Gr´aficas polares y de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 6.4. Gr´aficas de respuesta en frecuencia. Ejemplos . . . . . . . . . . . . . . . 319 6.4.1. Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 6.4.2. Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 6.4.3. Ejemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 6.5. Criterio de estabilidad de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . 325 6.5.1. Recorridos cerrados alrededor de polos y ceros . . . . . . . . 326 6.5.2. Trayectoria de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 6.5.3. Polos y ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 6.5.4. Criterio de Nyquist. Caso especial . . . . . . . . . . . . . . . . . . . 331 6.5.5. Criterio de Nyquist. Caso general . . . . . . . . . . . . . . . . . . . . 332 6.6. M´argenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 6.7. Relaci´on entre las caracter´ısticas de respuesta en la frecuencia y en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 6.7.1. Respuesta en lazo abierto . . . . . . . . . . . . . . . . . . . . . . . . . . . 337

XVI

´Indice general

6.7.2. Respuesta en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . 337 6.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 6.8.1. Ejemplo de an´alisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 6.8.2. Un sistema ball and beam . . . . . . . . . . . . . . . . . . . . . . . . . . 344 6.8.3. Control PD de posici´on de un motor de CD . . . . . . . . . . . 355 6.8.4. Redise˜ no del control PD de posici´on de un motor de CD363 6.8.5. Control PID de posici´on de un motor de CD . . . . . . . . . . 368 6.9. Caso de estudio. Control PID de un sistema de levitaci´on magn´etica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376 6.10. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 6.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 6.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 7.

La t´ ecnica de las variables de estado . . . . . . . . . . . . . . . . . . . . . . . 393 7.1. Representaci´on en variables de estado . . . . . . . . . . . . . . . . . . . . . . 394 7.2. Linealizaci´on aproximada de ecuaciones de estado no lineales . . 399 7.2.1. Procedimiento para ecuaciones de primer orden sin entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400 7.2.2. Procedimiento general para ecuaciones de orden arbitrario y n´ umero de entradas arbitrario . . . . . . . . . . . . 402 7.3. Algunos resultados del ´algebra lineal . . . . . . . . . . . . . . . . . . . . . . . 407 7.4. Soluci´on de una ecuaci´on din´amica, lineal e invariante en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 7.5. Estabilidad de una ecuaci´on din´amica . . . . . . . . . . . . . . . . . . . . . . 412 7.6. Controlabilidad y observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 413 7.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 7.6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416 7.7. Funci´on de transferencia de una ecuaci´on din´amica . . . . . . . . . . 418 7.8. Una de las ecuaciones din´amicas que corresponden a una funci´on de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423 7.9. Ecuaciones din´amicas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . 425 7.10. Control por realimentaci´on del estado . . . . . . . . . . . . . . . . . . . . . . 428 7.11. Observadores de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 7.12. El principio de separaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 7.13. Caso de estudio. El p´endulo con rueda inercial . . . . . . . . . . . . . . 438 7.13.1. Obtenci´on de la forma en (7.75) . . . . . . . . . . . . . . . . . . . . . 438 7.13.2. Control por realimentaci´on del estado . . . . . . . . . . . . . . . . 439 7.14. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440 7.15. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441 7.16. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445

´Indice general

8.

XVII

Circuitos electr´ onicos realimentados . . . . . . . . . . . . . . . . . . . . . . . 447 8.1. Circuitos electr´onicos para reducir no linealidades . . . . . . . . . . . 448 8.1.1. Reducci´on de la distorsi´on en amplificadores . . . . . . . . . . 449 8.1.2. Reducci´on de la zona muerta en amplificadores. . . . . . . . 451 8.2. Construcci´on anal´ogica de controladores . . . . . . . . . . . . . . . . . . . . 456 8.3. Dise˜ no de osciladores con forma de onda sinusoidal . . . . . . . . . . 458 8.3.1. Dise˜ no basado en un amplificador operacional. Puente de Wien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459 8.3.2. Dise˜ no basado en un amplificador operacional. Red RC de defasaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468 8.3.3. Dise˜ no basado en un transistor . . . . . . . . . . . . . . . . . . . . . . 472 8.4. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 8.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 9.

Control de velocidad de un motor de CD . . . . . . . . . . . . . . . . . . 499 9.1. Modelo matem´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 9.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 9.3. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 9.4. Identificaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 9.5. Control de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 9.5.1. Un controlador PI modificado . . . . . . . . . . . . . . . . . . . . . . . 509 9.5.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 512 9.6. Prototipo experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515 9.6.1. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518 9.6.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 518 9.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 9.8. C´alculo num´erico de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522 9.9. Programaci´on del microcontrolador PIC16F877A . . . . . . . . . . . . 523 9.10. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527 9.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529 10. Control de posici´ on de un motor de CD . . . . . . . . . . . . . . . . . . . 531 10.1. Identificaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532 10.2. Control sin perturbaciones externas (Tp = 0) . . . . . . . . . . . . . . . . 535 10.2.1. Control proporcional con realimentaci´on de velocidad . . 535 10.2.2. Control con un compensador de adelanto . . . . . . . . . . . . . 537 10.3. Control bajo el efecto de perturbaciones externas . . . . . . . . . . . . 540 10.3.1. Un controlador PID modificado . . . . . . . . . . . . . . . . . . . . . 541 10.3.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 544 10.3.3. Un controlador PID cl´asico . . . . . . . . . . . . . . . . . . . . . . . . . 549 10.4. Seguimiento de trayectorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553

XVIII ´Indice general

10.5. C´alculo num´erico de los algoritmos de control . . . . . . . . . . . . . . . 555 10.6. Construcci´on del sistema de control . . . . . . . . . . . . . . . . . . . . . . . . 556 10.7. Programaci´on del microcontrolador PIC16F877A . . . . . . . . . . . . 559 10.8. Control basado en una computadora personal . . . . . . . . . . . . . . . 562 10.9. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571 10.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573 11. Control de un sistema de levitaci´ on magn´ etica . . . . . . . . . . . . . 575 11.1. Modelo matem´atico no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578 11.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581 11.2.1. Obtenci´on de un modelo en variables de estado . . . . . . . . 581 11.2.2. Aproximaci´on lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583 11.3. Construcci´on del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 11.3.1. Esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 11.3.2. Electroim´an . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 11.3.3. Sensor de posici´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 11.3.4. Controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 11.3.5. Lazo de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587 11.3.6. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 587 11.4. Identificaci´on experimental de los par´ametros del modelo . . . . . 587 11.4.1. Resistencia del electroim´an, R . . . . . . . . . . . . . . . . . . . . . . 587 11.4.2. Inductancia del eletroim´an, L(y) . . . . . . . . . . . . . . . . . . . . 587 11.4.3. Ganancia del sensor de posici´on, As . . . . . . . . . . . . . . . . . 588 11.4.4. Masa de la esfera, m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 589 11.5. Dise˜ no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590 11.5.1. Un controlador proporcional . . . . . . . . . . . . . . . . . . . . . . . . 593 11.5.2. Un controlador proporcional-integral-derivativo (PID) . . 594 11.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595 11.7. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 11.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601 12. Control de un sistema Ball and Beam . . . . . . . . . . . . . . . . . . . . . 603 12.1. Modelo matem´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 12.2. Construcci´on del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608 12.2.1. Medici´on de la posici´on x del bal´ın . . . . . . . . . . . . . . . . . . 609 12.2.2. Medici´on de la inclinaci´on θ de la varilla . . . . . . . . . . . . . 612 12.2.3. Interfaces y amplificador de potencia . . . . . . . . . . . . . . . . . 612 12.3. Identificaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614 12.3.1. Sistema de medici´on de la inclinaci´on θ de la varilla . . . 614 12.3.2. Sistema de medici´on de la posici´on x del bal´ın . . . . . . . . 614 12.3.3. Subsistema motor-varilla . . . . . . . . . . . . . . . . . . . . . . . . . . . 614

´Indice general

XIX

12.3.4. Din´amica del bal´ın . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615 12.4. Dise˜ no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617 12.5. Construcci´on del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620 12.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621 12.7. Control basado en el microcontrolador PIC16F877A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 630 12.7.1. Construcci´on del sistema de control . . . . . . . . . . . . . . . . . . 630 12.7.2. Dise˜ no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633 12.7.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . 633 12.7.4. Programa utilizado en el microcontrolador PIC16F877A 635 12.8. Un sistema de medici´on mejorado para la posici´on del bal´ın . . . 639 12.9. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641 12.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643 13. Control de un p´ endulo de Furuta . . . . . . . . . . . . . . . . . . . . . . . . . . 645 13.1. Modelo matem´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 13.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 13.3. Construcci´on del p´endulo de Furuta e indentificaci´on de sus par´ametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 13.4. Dise˜ no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656 13.5. Construcci´on del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657 13.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 13.7. Resumen del cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 13.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 14. Control de un p´ endulo con rueda inercial . . . . . . . . . . . . . . . . . . 669 14.1. P´endulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670 14.2. Modelo matem´atico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672 14.3. Controlador no lineal para levantar el p´endulo . . . . . . . . . . . . . . 674 14.4. Controlador para atrapar el p´endulo . . . . . . . . . . . . . . . . . . . . . . . 678 14.5. Construcci´on del p´endulo con rueda inercial e identificaci´on de sus par´ametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 680 14.6. Construcci´on del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687 14.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691 14.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699 14.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701 ´ Indice alfab´ etico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703

1 Introducci´ on

Las aplicaciones del control autom´atico en la actualidad son muy extensas, variadas e importantes. Quiz´a una de las m´as populares es la del control de robots manipuladores en la industria de manufactura. Desde la l´ıneas de ensamble de autom´oviles hasta las celdas robotizadas de soldadura. Las razones principales para este ´exito es la alta calidad del trabajo, el ahorro de tiempo y la reducci´on del costo de producci´on.

2

1 Introducci´ on

Objetivos del cap´ıtulo Comprender de manera intuitiva los conceptos b´ asicos de realimentaci´ on y control en lazo cerrado, as´ı como los objetivos de un sistema de control. Conocer la historia del Control Autom´ atico para comprender por qu´e se desarrollaron este conjunto de herramientas de dise˜ no. Relacionar los cap´ıtulos de la presente obra con los hechos hist´ oricos que motivaron los conocimientos descritos en cada cap´ıtulo. Con el fin de explicar de qu´e se trata el Control Autom´atico (o simplemente control) y cu´al es su prop´osito, a continuaci´on se describe c´omo funciona el sistema de control del direccionamiento de un ca˜ n´on antia´ereo. Las razones de haber elegido este ejemplo son las siguientes. i) Se trata de un sistema cuyo objetivo y funcionamiento b´asico pueden ser entendidos f´acilmente por la mayor´ıa de las personas debido a la gran cantidad de pel´ıculas, video-juegos, programas de televisi´on, etc., que de alguna manera u otra muestran para qu´e sirve este sistema de control. ii) Es un problema hist´oricamente muy importante pues motiv´o el desarrollo de gran parte de las ideas y t´ecnicas b´asicas del Control Autom´atico durante la Segunda Guerra Mundial. Este ejemplo tambi´en ser´a utilizado para que el lector pueda relacionar el contenido del presente libro con algunos de los aspectos de los sistemas de control.

1.1.

Sistema de control de un ca˜ n´ on antia´ ereo

En la figura 1.1 se muestra un esquema de este sistema de control. El ca˜ n´on antia´ereo debe apuntar hacia un avi´on y derribarlo. Para conseguir esto, el ca˜ n´on debe tener varios movimientos independientes que permitan ajustar su orientaci´on (θ) en el plano horizontal y su inclinaci´on respecto de la horizontal. Con el fin de simplificar la descripci´on del problema, en lo que sigue s´olo se considerar´a el control de la orientaci´on en el plano horizontal θ. Para ajustar la orientaci´on θ del ca˜ n´on se utiliza un motor el´ectrico. Esto se consigue acoplando mec´anicamente el motor al ca˜ n´on mediante un juego de engranes. El conjunto motor-ca˜ n´on funciona, a grandes rasgos, del siguiente modo. Si se aplica un voltaje positivo al motor entonces el ca˜ n´on recibe un par en sentido antihorario, por lo que el ca˜ n´on tiende a moverse en sentido antihorario. Si se aplica un voltaje negativo al motor entonces el ca˜ n´on recibe un par en sentido horario, por lo que el ca˜ n´on tiende a moverse en sentido horario. Si el voltaje que se aplica al motor es igual a cero, entonces el par aplicado sobre el ca˜ n´on es igual a cero, por lo que el ca˜ n´on tiende a detenerse. La posici´on del avi´on se determina mediante el uso de un radar y se usa este dato como el valor θd que se desea alcance la orientaci´on del ca˜ n´on θ. Es decir, se desea conseguir que θ = θd lo m´as r´apido posible para, una vez conseguido

1.1 Sistema de control de un ca˜ n´ on antia´ereo

3

can à óon antiaeóreo

radar

ò

òd

motor

v

engranes

òd

ò

controlador amplificador de potencia

Figura 1.1. Sistema de control de un ca˜ n´ on antia´ereo. ò

òd

òd

ò

(a) θd > θ, v > 0, el ca˜ n´ on se mueve en sentido antihorario.

(b) θd < θ, v < 0, el ca˜ n´ on se mueve en sentido horario.

Figura 1.2. El ca˜ n´ on antia´ereo siempre debe moverse hacia la orientaci´ on deseada.

esto, disparar1 . De acuerdo al funcionamiento descrito en el p´arrafo anterior, una manera sencilla de conseguir esto es aplicando al motor un voltaje v que sea calculado de acuerdo a la siguiente regla: v = kp (θd − θ)

(1.1)

donde kp es una constante positiva. La operaci´on presentada en (1.1) es realizada utilizando equipo electr´onico de baja potencia (una computadora o un microcontrolador, por ejemplo) y se debe utilizar un amplificador de potencia para satisfacer los requerimientos del motor el´ectrico. En este caso se est´a suponiendo que el amplificador de potencia ofrece una amplificaci´on unitaria 1

Sin embargo, en una situaci´ on real, es necesario que la orientaci´ on del ca˜ n´ on vaya adelante de la posici´ on del avi´ on con el fin de compensar el tiempo que la bomba tarda en viajar desde que es disparada hasta que llega a donde est´ a el avi´ on. Aqu´ı se est´ a despreciando este efecto con el fin de simplificar la exposici´ on.

4

1 Introducci´ on

en voltaje, pero realiza una gran amplificaci´on en corriente el´ectrica (v´ease el cap´ıtulo 9, secci´on 9.2). De acuerdo a la figura 1.2 se puede presentar alguna de las siguientes situaciones: Si θ < θd , entonces v > 0 y el ca˜ n´on gira en sentido antihorario de modo que θ se aproxima a θd . Si θ > θd , entonces v < 0 y el ca˜ n´on gira en sentido horario de modo que θ se aproxima a θd . Si θ = θd , entonces v = 0 y el ca˜ n´on no gira por lo que la condici´on θ = θd se puede mantener para siempre. A partir de este razonamiento se concluye que la regla presentada en (1.1) para determinar el voltaje que se ha de aplicar al motor tiene buenas posibilidades de funcionar en la pr´actica. A la regla en (1.1) se le conoce como ley de control o, simplemente, controlador. En la figura 1.3 se muestra un diagrama de bloques de los componentes del sistema de control de un ca˜ n´on antia´ereo. N´otese que la construcci´on del controlador en (1.1) requiere que la posici´on del ca˜ n´on θ (tambi´en conocida como la salida) sea usada para generar el voltaje v (tambi´en conocido como la entrada) que se aplica al motor. Este hecho define los conceptos de realimentaci´on y de sistema en lazo cerrado. Esto indica que el sistema de control compara la posici´on del motor (θ, salida) con la posici´on deseada o referencia (θd ) y aplica al motor un voltaje v que depende de la diferencia existente entre estas variables (v´ease (1.1)).

òd

+ à

controlador

kp

amplificador de potencia

v

motor can à oón

ò

â1

Figura 1.3. Diagrama de bloques del sistema de control de un ca˜ n´ on antia´ereo.

Si se define el error de posici´on como la diferencia θd − θ, se dice que el error en estado estacionario2 del sistema de control de posici´on es cero porque, de acuerdo a lo arriba explicado, θd − θ = 0 puede mantenerse para siempre. Sin embargo, el t´ermino “en estado estacionario” indica que esto se conseguir´a cuando el tiempo sea suficientemente grande como para que el ca˜ n´on deje de moverse. As´ı que a´ un queda el problema de determinar c´omo evolucionar´a el movimiento del ca˜ n´on conforme θ se aproxima a θd . A esto se le conoce como la respuesta transitoria del sistema de control 3 . En la figura 2 3

V´ease el cap´ıtulo 4 V´eanse los cap´ıtulos 3, 5 y 6

1.1 Sistema de control de un ca˜ n´ on antia´ereo

5

1.4 se muestran varios ejemplos de c´omo puede ser la respuesta transitoria. N´otese que si kp es grande en (1.1) entonces el voltaje v que se aplica al motor es mayor por lo que el par sobre el ca˜ n´on tambi´en es mayor y, por tanto, girar´a m´as r´apido. Entonces, el tiempo que debe transcurrir para que θ alcance a θd ser´a menor. Sin embargo, un movimiento r´apido del ca˜ n´on y la inercia propia del mismo pueden provocar que cuando θ alcance a θd la velocidad del ca˜ n´on sea diferente de cero θ˙ 6= 0 por lo que el ca˜ n´on continuar´a movi´endose y cambiar´a el signo de θd − θ. Entonces la posici´on θ puede efectuar varias oscilaciones alrededor de θd antes de que el ca˜ n´on se detenga. Esto significa que el valor de kp tiene un efecto importante sobre la forma de la respuesta transitoria por lo que debe ser calculada de modo que se obtenga la respuesta transitoria deseada (r´apida y sin oscilaciones). Incluso, para conseguir esto, en ocasiones no ser´a suficiente con ajustar el valor de kp y deber´a modificarse la regla en (1.1), es decir se deber´a utilizar otro controlador (v´eanse los cap´ıtulos 5, 6, 7 y 10). Es m´as, el error en estado estacionario puede ser diferente de cero (θ 6= θd cuando el motor alcanza el reposo) debido a perturbaciones externas (el viento, por ejemplo, puede desviar al ca˜ n´on de su posici´on u orientaci´on deseada) o por efectos tales como la fricci´on existente entre las partes m´oviles de todo el mecanismo. Esto significa que incluso la b´ usqueda de un error en estado estacionario que sea cero o, al menos, suficientemente peque˜ no puede ser una raz´on para buscar un nuevo controlador.

òd ò

0

0

tiempo

Figura 1.4. Tres formas posibles de la respuesta transitoria en el control de un ca˜ n´ on antia´ereo.

6

1 Introducci´ on

Un aspecto muy importante en el dise˜ no del sistema de control es la estabilidad del mismo. El concepto de estabilidad puede interpretarse a groso modo recordando lo que ocurre en un p´endulo simple (v´ease la figura 1.5). Si la posici´on deseada del p´endulo es θ = 0 entonces basta con dejar que el p´endulo se mueva libremente (con un par externo igual a cero, T (t) = 0) y el p´endulo oscilar´a hasta que, por efecto de la fricci´on, alcanzar´a el reposo en θ = 0. Entonces se dice que, bajo esta situaci´on, el p´endulo es estable porque alcanza la posici´on deseada θ = 0 en estado estacionario a partir de cualquier posici´on inicial suficientemente cercana. Por otro lado, si se desea que el p´endulo alcance la posici´on θ = π es claro que, por efecto de la gravedad, el p´endulo siempre se aleja de esa configuraci´on por cercana que se elija la posici´on inicial respecto de ese valor deseado θ = π. Entonces se dice que bajo esa situaci´on el p´endulo es inestable4 . N´otese que, de acuerdo a esta descripci´on intuitiva, el sistema de control de un ca˜ n´on antia´ereo es inestable si la ley de control en (1.1) utiliza una constante kp negativa: en este caso el ca˜ n´on se mover´a de modo que θ se aleja de θd . Por tanto, el valor de la constante kp tambi´en determina la estabilidad del sistema de control y debe elegirse de manera que la asegure 5 . N´otese que si el sistema de control es inestable (kp negativa) entonces el error en estado estacionario nunca ser´a cero a pesar de que la regla en (1.1) indica que el motor se detiene cuando θ = θd . Esto se debe a que, incluso si θ = θd desde el principio, la medici´on de la posici´on θ siempre est´a contaminada de ruido el cual producir´a que θ 6= θd en (1.1) y esto ser´a suficiente para que, de acuerdo a lo explicado previamente, θ se aleje de θd . T(t)

l

ò

g

m

d Figura 1.5. P´endulo simple.

Otro factor importante en el sistema de control de un ca˜ n´on antia´ereo es el movimiento que describe el avi´on por derribar. Es claro que si la direcci´on 4

5

Este es precisamente el t´ermino que coloquialmente se usa pare describir que el p´endulo no puede permanecer en θ = π para siempre V´eanse los cap´ıtulos 3, 4, 5, 6, 7

1.1 Sistema de control de un ca˜ n´ on antia´ereo

7

θd , que indica en donde se encuentra el avi´on, es constante entonces el avi´on ser´a derribado m´as f´acilmente que si el avi´on se aleja a gran velocidad (cuando θd cambia r´apidamente) o cuando el avi´on acelera para escapar (cuando la segunda derivada de θd es grande). Por tanto, la ley de control en (1.1) debe ser dise˜ nada de manera que el sistema de control responda correctamente bajo cualquiera de las tres situaciones anteriormente descritas. En caso que θd tenga una forma diferente a las consideradas, se supone que el sistema de control responder´a correctamente si responde bien ante las tres situaciones antes consideradas. Esta es la idea detr´as del dise˜ no del error en estado estacionario del sistema, descrito en el cap´ıtulo 4. De acuerdo a lo anterior, se puede decir que las tres caracter´ısticas fundamentales de un sistema de control son la respuesta transitoria, la respuesta en estado estacionario (o error en estado estacionario) y la estabilidad. El controlador debe ser dise˜ nado de manera que estas tres partes fundamentales de la respuesta de un sistema de control cumplan con las especificaciones requeridas: rapidez y pocas oscilaciones (respuesta transitoria), que la posici´on del ca˜ n´on alcance (o sea muy cercana a) la posici´on deseada cuando el tiempo sea suficientemente grande (respuesta en estado estacionario) y que el sistema de control sea estable. Para conseguir esto, las t´ecnicas de control estudiadas en la presente obra se basan en el estudio del modelo matem´atico del sistema de control completo. De acuerdo a lo expuesto en el cap´ıtulo 2, este modelo matem´atico est´a dado en t´erminos de una ecuaci´on diferencial ordinaria, lineal y de coeficientes constantes. Por esta raz´on, en el cap´ıtulo 3 se estudia la soluci´on de este tipo de ecuaciones diferenciales para definir las propiedades que determinan su estabilidad as´ı como la forma transitoria de la soluci´on y el valor final de la misma. El conocimiento de c´omo es la soluci´on de estas ecuaciones diferenciales es fundamental para los m´etodos de dise˜ no de controladores que se estudian en este libro. Los m´etodos de dise˜ no que se usan en esta obra pueden dividirse en cl´asicas y modernas. Las t´ecnicas de control cl´asicas son estudiadas en los cap´ıtulos 3, 4, 5, 6 y existen dos metodolog´ıas diferentes: las t´ecnicas de respuesta en el tiempo (cap´ıtulo 5) y las t´ecnicas de la respuesta en la frecuencia (cap´ıtulo 6). Las t´ecnicas de control cl´asico est´an basadas en el uso de la transformada de Laplace para resolver y analizar ecuaciones diferenciales. Las t´ecnicas de la respuesta en el tiempo se basan en determinar la forma de la respuesta temporal de un sistema de control a partir de la ubicaci´on de los polos de la funci´on de transferencia correspondiente (cap´ıtulo 3) y el m´etodo principal de dise˜ no es el Lugar de las Ra´ıces (cap´ıtulo 5). Las t´ecnicas de la respuesta en la frecuencia explotan la idea fundamental detr´as de la Transformada de Fourier: los sistemas de control (lineales) funcionan como filtros de tal manera que, ante una orden, la respuesta del sistema de control est´a b´asicamente dada como esa orden filtrada por el sistema de control. Es por esta raz´on que las herramientas fundamentales de dise˜ no para esta t´ecnica son las gr´aficas polares y de Bode (cap´ıtulo 6) ampliamente utilizadas en el dise˜ no y an´alisis de filtros (pasa altas, pasa bajas, pasa banda, etc.). En los cap´ıtulos 8, 9, 10,

8

1 Introducci´ on

11 y 12 se presentan algunas aplicaciones experimentales de las t´ecnicas de control cl´asico. Por otro lado, las t´ecnicas modernas que se abordan en este libro est´an representadas por las basadas en las variables de estado (cap´ıtulo 7) las cuales, a diferencia de las t´ecnicas cl´asicas permiten estudiar el comportamiento del “interior” del sistema de control. Esto significa que las variables de estado suministran m´as informaci´on que puede ser aprovechada para conseguir mejores resultados. Ejemplos de aplicaciones de estas t´ecnicas son mostrados en los cap´ıtulos 13 y 14.

1.2.

Historia del Control Autom´ atico

Una vez que se ha descrito a groso modo qu´e es lo que se persigue al dise˜ nar un sistema de control as´ı como algunos conceptos u ´tiles para conseguirlo, a continuaci´on se presenta una breve historia del Control Autom´atico. El objetivo es que el lector se d´e cuenta de c´omo han sido formulados estos conceptos y, adem´as, pueda apreciar cu´ales han sido las necesidades ingenieriles que han motivado estas ideas. Tambi´en se indican las partes del presente libro en donde se abordan los principales conceptos y t´ecnicas de los sistemas de control. El contenido de esta secci´on est´a basado en la informaci´on reportada en [1]. El Control Autom´atico se ha usado desde hace m´as de 2000 a˜ nos. Se tiene conocimiento de la existencia de relojes de agua, construidos por Ktesibios, hacia el a˜ no 270 antes de Cristo, as´ı como una variedad de mecanismos ingeniosos construidos en Alejandr´ıa y descritos por Her´on. Sin embargo, desde el punto de vista de la ingenier´ıa, el avance m´as importante en Control Autom´atico se debi´o a James Watt en 1789 al introducir un regulador de velocidad para su m´aquina de vapor. Sin embargo, a pesar de su importancia, el regulador de velocidad de Watt ten´ıa varios problemas. Se observaba que en ocasiones la velocidad variaba de manera oscilatoria en lugar de permanecer constante o crec´ıa sin l´ımite. Tratando de determinar bajo qu´e condiciones se pod´ıa asegurar un funcionamiento estable, entre 1826 y 1851 J.V. Poncelet y G.B. Airy mostraron que era posible utilizar ecuaciones diferenciales para representar el funcionamiento completo de la m´aquina de vapor junto con el regulador de velocidad (v´ease el cap´ıtulo 2 para el problema del modelado de sistemas f´ısicos). En esas fechas los matem´aticos sab´ıan que la estabilidad de una ecuaci´on diferencial estaba determinada por la ubicaci´on de las ra´ıces de la ecuaci´on caracter´ıstica correspondiente y se sab´ıa que hab´ıa inestabilidad si la parte real de una ra´ız era positiva (v´ease el cap´tulo 3, secci´on 3.8). Sin embargo, no era sencillo calcular el valor num´erico de dichas ra´ıces y en ocasiones ni siquiera era posible. As´ı, en 1868 J.C. Maxwell mostr´o la manera de determinar la estabilidad de las m´aquinas de vapor con el regulador de Watt simplemente examinando los coeficientes de la ecuaci´on diferencial que la representa. Sin embargo, este resultado s´olo era u ´til para ecuaciones diferenciales de segundo,

1.2 Historia del Control Autom´ atico

9

tercero y cuarto orden. M´as tarde, entre 1877 y 1895 y de manera independiente, E.J. Routh y A. Hurwitz dedujeron un m´etodo para determinar la estabilidad de sistemas de cualquier orden, resolviendo el problema que Maxwell hab´ıa dejado abierto. Este m´etodo ahora es conocido como el Criterio de Routh o de Routh-Hurwitz (v´ease el cap´ıtulo 4, secci´on 4.3). Durante gran parte del siglo XIX se desarrollaron muchas aplicaciones relacionadas con el Control Autom´atico entre las cuales estaban el control de temperatura, de presi´on, de nivel de l´ıquidos y la velocidad de m´aquinas rotativas. Por otro lado, se empez´o a usar el vapor para mover grandes ca˜ nones y para actuar sobre el sistema de direcci´on de barcos cada vez m´as grandes. Incluso, por esa ´epoca, en Francia se introdujeron los t´erminos de servomotor y servomecanismo para describir un movimiento generado por un servidor o esclavo. Sin embargo, la mayor´ıa de los controladores de ese entonces eran del tipo encendido-apagado y fueron personas como E. Sperry y M.E. Leeds quienes se dieron cuenta de que los mejores operadores humanos empleaban el sentido de anticipaci´on disminuyendo la potencia conforme la variable a controlar se acercaba a su valor deseado. Fue N. Minorsky quien en 1922 present´o un an´alisis claro de los sistemas de control de posici´on y formul´o lo que hoy en d´ıa se conoce como controlador PID (v´ease el cap´ıtulo 5, secci´on 5.2.5). Este controlador fue deducido observando la manera en que el piloto humano de un barco controla su direcci´on. Por otro lado, desde 1920 la amplificaci´on hab´ıa producido muchos problemas a las compa˜ n´ıas telef´onicas ya que se distorsionaba fuertemente la se˜ nal de audio. Fue en esa ´epoca que H.S. Black encontr´o que si una peque˜ na cantidad de la se˜ nal obtenida a la salida de un amplificador se utilizaba para ser realimentada a la entrada del mismo se pod´ıa reducir la distorsi´on producida por el amplificador. Durante el desarrollo de este trabajo, Black fue ayudado por H. Nyquist quien, a partir de esas experiencias, public´o en 1932 un trabajo titulado “Regeneration Theory” en donde estableci´o las bases de lo que ahora es conocido como el An´alisis de Nyquist (v´ease el cap´ıtulo 6, secci´on 6.5). Durante el per´ıodo 1935-1940, las compa˜ n´ıas telef´onicas deseaban ampliar el ancho de banda de sus sistemas de comunicaci´on para aumentar el n´ umero de sus usuarios. Para esto necesitaban que sus l´ıneas telef´onicas presentaran una buena caracter´ıstica de respuesta en frecuencia (v´ease el cap´ıtulo 6): una ganancia constante sobre un amplio rango de frecuencias con un peque˜ no ´angulo de atraso y una aguda pendiente de atenuaci´on a partir de una determinada frecuencia de corte. Motivado por este problema, H. Bode estudi´o la relaci´on existente entre una caracter´ıstica de atenuaci´on dada y el m´ınimo corrimiento de fase que se le puede asociar. Como resultado introdujo los conceptos de margen de ganancia y margen de fase (v´ease el cap´ıtulo 6, secci´on 6.6) y empez´o a manejar el punto (−1, 0) del plano complejo como un punto cr´ıtico en lugar del punto (+1, 0) manejado por Nyquist. Detalles completos del trabajo de Bode aparecieron en 1945 en su libro “Network Analysis and Feedback Amplifier Design”.

10

1 Introducci´ on

Pero fue la Segunda Guerra Mundial la que hizo que el trabajo en sistemas de control se concentrara en unos pocos problemas espec´ıficos. El m´as importante de estos fue el relacionado con el direccionamiento de ca˜ nones antia´ereos. El trabajo en este problema motiv´o el desarrollo de nuevas ideas en el control de servomecanismos. G. S. Brown del Instituto Tecnol´ogico de Massachusetts mostr´o que muchos sistemas el´ectricos y mec´anicos pueden ser representados y manipulados usando diagramas de bloques (v´ease el cap´ıtulo 4, secci´on 4.1) y A. C. Hall mostr´o en 1943 que manejando los bloques como funciones de transferencia (v´ease el cap´ıtulo 3) pod´ıa obtenerse la funci´on de transferencia del sistema completo para finalmente usar el criterio de estabilidad de Nyquist y determinar los m´argenes de ganancia y de fase. Los investigadores en el Instituto Tecnol´ogico de Massachusetts usaron circuitos de adelanto (v´ease el cap´ıtulo 10, secci´on 10.2.2) en el trayecto directo para modificar el desempe˜ no del sistema de control, mientras que en el Reino Unido se usaron varios lazos internos para modificar la respuesta del sistema de control. Hacia el final de la Segunda Guerra Mundial las t´ecnicas de respuesta en frecuencia basadas en el m´etodo de Nyquist y las gr´aficas de Bode ya estaban bien establecidas, describiendo el desempe˜ no del sistema de control en t´erminos de ancho de banda, frecuencia de resonancia, margen de fase y margen de ganancia (v´ease el cap´ıtulo 6). El enfoque alternativo a estas t´ecnicas se basaba en la soluci´on de las ecuaciones diferenciales usando la Transformada de Laplace y describ´ıan el desempe˜ no del sistema de control en t´erminos del tiempo de subida, sobre paso, error en estado estacionario y el amortiguamiento (v´ease el cap´ıtulo 3, secci´on 3.3). Muchos ingenieros prefer´ıan este m´etodo porque los resultados estaban expresados en t´erminos “reales”. Pero este enfoque ten´ıa la desventaja de que no exist´ıa una manera sencilla que permitiera al dise˜ nador relacionar los cambios en los par´ametros con cambios en la manera en que respond´ıa el sistema. Fue precisamente el m´etodo del Lugar de las Ra´ıces (v´ease el cap´ıtulo 5, secciones 5.1 y 5.2) introducido en 1948 y 1950 por W. Evans el que permiti´o librar estos obst´aculos. As´ı, hacia esas fechas las ahora llamadas t´ecnicas de control cl´asico estaban bien establecidas y estaban orientadas a sistemas que pod´ıan ser descritos por ecuaciones diferenciales lineales con coeficientes constantes y con una sola entrada. Entonces vino la era de los vuelos supers´onicos y espaciales. Era necesario utilizar modelos f´ısicos detallados representables en ecuaciones diferenciales que pod´ıan ser lineales o no lineales. Los ingenieros que trabajaban en las industrias aeroespaciales encontraron que siguiendo las ideas de Poincar´e era posible formular ecuaciones diferenciales generales en t´erminos de un conjunto de ecuaciones diferenciales de primer orden y as´ı empez´o a nacer lo que hoy se conoce como la t´ecnica de las variables de estado (v´ease el cap´ıtulo 7). Un gran impulsor de esta t´ecnica fue R. Kalman quien, alrededor de 1960, present´o los conceptos de controlabilidad y observabilidad (v´ease la secci´on 7.6).

1.3 Prototipos did´ acticos

11

Finalmente, se debe decir que a partir de esas fechas se han detectado nuevos problemas en los sistemas de control que han motivado la introducci´on de diversas t´ecnicas de control que a´ un hoy en d´ıa se siguen desarrollando. Por ejemplo, las no linealidades encontradas en los servomecanismos ha motivado el desarrollo de las t´ecnicas de control no lineal. El control de aviones supers´onicos, que deben operar bajo amplios rangos de temperatura, presi´on, velocidad, etc., motiv´o el desarrollo de control adaptable. La introducci´on de sistemas de control basados en radar motiv´o el desarrollo de t´ecnicas de control para sistemas en tiempo discreto, etc.

1.3.

Prototipos did´ acticos

En las secciones previas se ha mencionado que el Control Autom´atico ha sido desarrollado con el fin de resolver problemas de ingenier´ıa importantes. Sin embargo, la ense˜ nanza de las t´ecnicas del Control Autom´atico necesita que el estudiante pueda practicar aplicando sus conocimientos de manera experimental. Como es dif´ıcil hacer uso de instalaciones industriales complejas o de laboratorios de alta tecnolog´ıa con este prop´osito, en la ense˜ nanza del Control Autom´atico se recurre a los llamados “prototipos did´acticos”. Un prototipo did´actico es un dispositivo que tiene dos caracter´ısticas principales: i) es suficientemente sencillo como para que pueda ser construido y ser puesto en marcha usando diferentes controladores, e ii) que sea un modelo suficientemente complejo como para que se puedan apreciar los diferentes aspectos de un sistema de control. A continuaci´on se listan los prototipos did´acticos usados en este libro y se indica cuales son las herramientas del Control Autom´atico que son utilizadas en dichos prototipos: Circuitos electr´onicos osciladores basados en amplificadores operacionales y transistores (cap´ıtulo 8). Respuesta en frecuencia, criterio de estabilidad de Nyquist y criterio de estabilidad de Routh. Motores de CD con escobillas e im´an permanente (cap´ıtulos 9 y 10). Dise˜ no de varios controladores b´asicos en servomecanismos utilizando la respuesta en el tiempo: proporcional, proporcional-derivativo, proporcional-integral, proporcional-integral-derivativo, compensadores de adelanto, controladores con dos grados de libertad. Sistema de levitaci´on magn´etica (cap´ıtulo 11). Dise˜ no de un controlador PID usando el concepto de aproximaci´on lineal de un sistema no lineal y el m´etodo del lugar de las ra´ıces. Sistema “ball and beam” (cap´ıtulo 12). Dise˜ no de un sistema multilazo usando la respuesta en frecuencia (criterio de Nyquist y gr´aficas de Bode) y el lugar de las ra´ıces. P´endulo de Furuta (cap´ıtulo 13). Dise˜ no de un controlador por realimentaci´on del estado usando la t´ecnica de la variable de estado. Se utiliza una aproximaci´on lineal de un sistema no lineal.

12

1 Introducci´ on

P´endulo con rueda inercial (cap´ıtulo 14). Dise˜ no de dos controladores por realimentaci´on del estado usando la t´ecnica de la variable de estado. Uno de los controladores es dise˜ nado utilizando el modelo no lineal completo del mecanismo y es utilizado para dar al lector una peque˜ na introducci´on al control de sistemas no lineales.

1.4.

Resumen del cap´ıtulo

En el presente cap´ıtulo se ha explicado de manera intuitiva cu´al es la idea fundamental de controlar un sistema en lazo cerrado. Para esto se ha descrito c´omo funciona el sistema de control de un ca˜ n´on antia´ereo. Tambi´en se ha explicado, mediante el mismo ejemplo, qu´e es lo que se busca cuando se dise˜ na un sistema de control. Se ha presentado una breve descripci´on de la historia del Control Autom´atico para que el lector entienda que todos los conceptos detr´as de las herramientas de los sistemas de control han sido motivados por problemas tecnol´ogicos importantes. Esta descripci´on hist´orica ha sido utilizada para indicar en que partes de la presente obra se abordan las diferentes herramientas del Control Autom´atico.

1.5. 1. 2. 3.

4. 5. 6. 7. 8.

Preguntas de repaso

¿Para qu´e podr´ıa el lector usar el Control Autom´atico? ¿Podr´ıa hacer una lista del equipo dom´estico que utilice la realimentaci´on? Investigue como funciona un reloj de pared (que utiliza un p´endulo) ¿C´omo cree que intervenga la realimentaci´on en el funcionamiento de estos relojes? ¿Por qu´e es hist´oricamente importante el regulador de velocidad de Watt para una m´aquina de vapor? ¿Qu´e significa que un sistema de control sea inestable? ¿Qu´e entiende por rapidez de respuesta? ¿Por qu´e se dice que un p´endulo invertido es inestable? ¿Por qu´e se desarrollaron primero las t´ecnicas de respuesta en frecuencia antes de las t´ecnicas de respuesta en el tiempo?

Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Magazine, pp. 17-25, June 1996. 2. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004. 3. D.A. Mindell, Anti-aircraft fire control and the develoment of integrated systems at Sperry, 1925-1940, IEEE Control Systems Magazine, pp. 108-113, April 1995. 4. S.W. Herwald, Recollection of the early development of servomechanism and control systems, IEEE Control Systems Magazine, pp. 29-32, november 1984. 5. D.S. Bernstein, Feedback control: an invisible thread in the history of technology, IEEE Control Systems Magazine, pp. 53-68, April 2002. 6. W. Oppelt, On the early growth of conceptual thinking in the control system theory- The German role up to 1945, IEEE Control Systems Magazine, pp. 16-22, November 1984. 7. S. Bennett, Nicolas Minorsky and the automatic steering of ships, IEEE Control Systems Magazine, pp. 10-15, November 1984.

2 Modelado matem´ atico de sistemas f´ısicos

El modelado matem´atico de sistemas f´ısicos consiste en obtener un conjunto de ecuaciones que, al ser resueltas, muestran c´omo evolucionan las variables importantes del sistema. Esto se consigue describiendo matem´aticamente, y por separado, a cada una de las partes que componen al sistema por modelar. Finalmente, estos modelos matem´aticos aislados deben ser conectados de acuerdo a la configuraci´on que mantienen dentro del sistema completo, respetando las leyes de la naturaleza que los rigen.

16

2 Modelado matem´ atico de sistemas f´ısicos

Objetivos del cap´ıtulo Darse cuenta de que el modelo matem´ atico de los sistemas f´ısicos est´ a constituido por ecuaciones diferenciales. Aprender a obtener el modelo matem´ atico de sistemas mec´ anicos, el´ectricos y electromec´ anicos. Identificar a los sistemas f´ısicos como la interconexi´ on de procesadores de energ´ıa. Identificar las analog´ıas entre sistemas de diferente naturaleza, a partir de la manera en que procesan la energ´ıa. Tradicionalmente, cuando se aborda el modelado de sistemas f´ısicos se recurre a los m´etodos espec´ıficos desarrollados para cada tipo de sistema. Es decir, los sistemas el´ectricos son modelados usando los m´etodos desarrollados en la teor´ıa de circuitos el´ectricos y cuando se trata de sistemas mec´anicos se usan los m´etodos desarrollados en ingenier´ıa mec´anica. Sin embargo, proceder de esta manera tiene varias desventajas: i) la persona no especializada en el tema en cuesti´on debe simplemente aceptar (sin muchas explicaciones) los m´etodos de modelado desarrollados en esa rama del conocimiento, ii) el estudiante no se da cuenta de que las leyes f´ısicas utilizadas para el modelado de sistemas de diferente naturaleza est´an relacionadas por analog´ıas; aunque en todo curso de control autom´atico siempre se tratan de resaltar las analog´ıas, ´estas tienen que ser explicadas a partir de las ecuaciones resultantes del modelado y no se puede ver que es la esencia del fen´omeno la que tiene su contraparte en sistemas de diferente naturaleza. Una manera de estudiar el modelado de sistemas f´ısicos de diferente naturaleza bajo una perspectiva unificada es utilizando un concepto que es com´ un a varios ´ambitos de la ingenier´ıa: la energ´ıa del sistema. Por esta misma raz´on en esta obra el modelado de sistemas se limita a sistemas el´ectricos y mec´anicos los cuales pueden estudiarse usando conceptos generales de energ´ıa que son comunes a todos estos sistemas. La idea fundamental del uso de la energ´ıa para el modelado es que los componentes de cada sistema bajo estudio suministran, almacenan o disipan energ´ıa y cuando se unen para formar un sistema complejo es cuesti´on de determinar c´omo esa energ´ıa es transmitida de un componente a otro. Este enfoque de usar la energ´ıa para el modelado (y, por tanto, el presente cap´ıtulo) est´a basado en las ideas introducidas en [1].

2.1.

Energ´ıa y variables generalizadas del sistema

En dos sistemas que se encuentran conectados el intercambio de energ´ıa se realiza a trav´es de un puerto, el cual puede ser conceptualmente descrito como formado por dos terminales comunes a ambos sistemas (v´ease la figura 2.1). La energ´ıa es intercambiada entre estos sistemas atrav´es de dos variables

2.1 Energ´ıa y variables generalizadas del sistema

17

generalizadas que se identifican bajo los conceptos generales de esfuerzo e y flujo f . Estas variables, al ser generalizadas, est´an definidas en cualquier sistema independientemente de su naturaleza. Por tanto, no se confundan estas variables con las variables esfuerzo y flujo definidas en resistencia de materiales (esfuerzo) y mec´anica de fluidos (flujo). Las variables generalizadas de esfuerzo y flujo pueden ser distinguidas a partir de la manera en que son medidas. El esfuerzo es medido utilizando un instrumento que se conecta entre ambas terminales del puerto (en la literatura en ingl´es se usa el t´ermino across para describir estas variables). Ejemplos de estas variables son el voltaje (sistemas el´ectricos), la presi´on (sistemas de fluidos) y la velocidad (sistemas mec´anicos): estas variables se miden entre dos puntos porque necesitan ser medidas respecto a un valor de referencia. El flujo es medido utilizando un instrumento que se conecta a lo largo de una de las terminales del puerto (en la literatura en ingl´es se usa el t´ermino through para describir estas variables). En este caso no se necesita especificar un valor de referencia sino que se mide la variable que fluye a trav´es del sistema. Ejemplos de estas variables son el flujo de fluidos (sistemas de fluidos), la corriente el´ectrica (sistemas el´ectricos) y la fuerza (sistemas mec´anicos).

f

Sistema 1

e

Sistema 2

puerto Figura 2.1. Dos sistemas conectados a trav´es de un puerto.

En este enfoque en el cual lo sistemas son considerados como procesadores de energ´ıa, el producto de las variables de esfuerzo y flujo es igual a la potencia instant´anea (w) intercambiada a trav´es del puerto: w = ef Para cada uno de los componentes del sistema se debe definir una convenci´on de signos para las variables generalizadas de esfuerzo y de flujo (v´ease la figura 2.2). De este modo, si la potencia w tiene signo positivo para el componente i entonces este componente recibe energ´ıa en ese instante. Si la potencia w tiene signo negativo para el elemento i entonces el componente entrega energ´ıa a los otros componentes del sistema en ese instante. La energ´ıa intercambiada (E) en el intervalo de tiempo [0, t] est´a dada como la integral de la potencia inst´antanea:

18

2 Modelado matem´ atico de sistemas f´ısicos

f

Componente i

e

Figura 2.2. Sentidos definidos como positivos para las variables de esfuerzo y flujo.

E=

Z

t

ef dt

(2.1)

0

Si la energ´ıa E es positiva para el componente i, entonces E representa la energ´ıa que este componente ha recibido en el intervalo de tiempo [0, t], pero si E es negativa entonces E representa la cantidad de energ´ıa que el componente ha entregado a los otros componentes del sistema en el intervalo de tiempo [0, t]. Ejemplo 2.1 En un circuito el´ectrico, la potencia (w) est´ a dada como el producto de la corriente el´ectrica i (A, Amperes) a trav´es del circuito y el voltaje v (V, volts) medido entre las terminales del circuito, mientras que la energ´ıa (E) intercambiada (puede ser recibida o entregada dependiendo del signo de E) en el intervalo de tiempo [0, t] se calcula como la integral de la potencia: Z t iv dt w = iv, E = 0

En un sistema mec´ anico traslacional, la potencia (w) est´ a dada como el producto de la fuerza aplicada F (N, Newton) y la velocidad v (m/s, metros/segundo), mientras que la energ´ıa (E) intercambiada en el intervalo de tiempo [0, t] se calcula como la integral de la potencia: Z t F v dt w = F v, E = 0

En un sistema mec´ anico rotativo, la potencia (w) est´ a dada como el producto del par aplicado T (Nm, Newton×metro) y la velocidad angular ω (rad/s, radian/segundo), mientras que la energ´ıa (E) intercambiada en el intervalo de tiempo [0, t] se calcula como la integral de la potencia: Z t T ω dt w = T ω, E = 0

En un sistema de fluidos, la potencia (w) est´ a dada como el producto de la presi´ on P (N/m2 , Newton/metro2 ) y el flujo del fluido Q (m3 /s, metro3 /segundo), mientras que la energ´ıa (E) intercambiada en el intervalo de tiempo [0, t] se calcula como la integral de la potencia:

2.2 Almacenadores de energ´ıa

w = P Q,

E=

Z

19

t

P Q dt

0

Se recomienda hacer el an´ alisis dimensional correspondiente en cada caso para verificar que la energ´ıa siempre est´ a dada en Joules=Newton×metro y la potencia en Joules/segundo. Los componentes de un sistema pueden clasificarse de la siguiente manera, de acuerdo a la acci´on que realizan sobre la energ´ıa E que intercambian: Almacenadores de energ´ıa. Disipadores de energ´ıa. Fuentes de energ´ıa. Convertidores. A continuaci´on se estudia cada una de estas funciones.

2.2.

Almacenadores de energ´ıa

Existen dos maneras de almacenar la energ´ıa: i) mediante el almacenamiento de esfuerzo e ii) mediante el almacenamiento de flujo. Estas dos maneras de almacenar la energ´ıa definen dos nuevas variables: la acumulaci´on de esfuerzo (ea ) y la acumulaci´on de flujo (fa ): Z t dea e dt, e = ea = dt 0 Z t dfa f dt, f = fa = dt 0 N´otese que a partir de estas expresiones tambi´en se puede escribir: e dt = dea ,

f dt = dfa

lo cual, al ser sustituido en (2.1) da origen a las siguientes expresiones para la energ´ıa almacenada en t´erminos de la acumulaci´on de esfuerzo: Z ea (t) f dea (2.2) E= ea (0)

y para la energ´ıa almacenada en t´erminos de la acumulaci´on de flujo: Z fa (t) e dfa E=

(2.3)

fa (0)

Para poder calcular la integral en (2.2) es necesario que el flujo f se pueda escribir como funci´on de la acumulaci´on de esfuerzo ea , es decir que se pueda escribir:

20

2 Modelado matem´ atico de sistemas f´ısicos

f = φ(ea ) Por otro lado, para poder calcular la integral en (2.3) es necesario que el esfuerzo e se pueda escribir como funci´on de la acumulaci´on de flujo fa , es decir que se pueda escribir: e = ϕ(fa ) En cada caso, las funciones φ y ϕ se conocen como las funciones constitutivas del componente del sistema que realiza la acci´on de almacenamiento de esfuerzo o de flujo. A continuaci´on se estudian los componentes que realizan el almacenamiento de esfuerzo o de flujo en sistemas de diferente naturaleza. 2.2.1.

Sistemas mec´ anicos traslacionales

Almacenamiento de flujo En la figura 2.3 se muestra un cuerpo r´ıgido (sin flexibilidad) de masa m (positiva) que se mueve con velocidad v12 (v12 = e, esfuerzo) bajo el efecto de una fuerza F (F = f , flujo). Se supone que no existe fricci´on entre el cuerpo y el medio que lo rodea. Los sentidos mostrados para la fuerza y la velocidad son los sentidos que se definen como positivos para este tipo de componente de sistema. Bajo estas condiciones, la Segunda Ley de Newton [2], p´ag. 89, establece que: F = ma

(2.4)

donde a = dvdt12 es la aceleraci´on del cuerpo. La siguiente manera de definir el momentum p: p = mv12

(2.5)

es muy conveniente porque se puede integrar (2.5) y (2.4) para concluir que el momentum es la acumulaci´on de flujo (p = fa ), es decir que se puede escribir: Z t F dt + p(0) p= 0

A partir de (2.5) se concluye que la funci´on constitutiva es: v12 = ϕ(p) =

1 p, m

(e = ϕ(fa ))

Entonces, sustituyendo v12 = e, p = fa y v12 = p/m en (2.3) y suponiendo que p(0) = 0, se encuentra que la energ´ıa almacenada est´a dada como: Z p 1 1 2 1 2 E= p dp = p = mv12 m 2m 2 0 lo cual constituye la expresi´on bien conocida para la energ´ıa cin´etica.

2.2 Almacenadores de energ´ıa

21

v 12 F

m

2

1 Figura 2.3. Un cuerpo r´ıgido de masa m como almacenador de flujo en sistemas mec´ anicos traslacionales.

Almacenamiento de esfuerzo En la figura 2.4 se muestra un resorte que se deforma (se comprime o se estira) a una velocidad v12 (v12 = e, esfuerzo) bajo el efecto de una fuerza F (F = f , flujo). N´otese que aunque la fuerza F se aplica en el extremo 1 del resorte, debe considerarse que una fuerza del mismo valor y de sentido contrario aparece en el extremo 2 del resorte para que sea posible la deformaci´on. Adem´as, v12 = v1 − v2 donde v1 y v2 son las velocidades de los extremos 1 y 2 del resorte, respectivamente. Los sentidos mostrados para la fuerza y las velocidades son los que se definen como positivos para este tipo de componente de sistema. N´otese que la velocidad v12 indica que el extremo 1 del resorte se aproxima al extremo 2 del resorte. Se supone que el resorte no tiene masa y que la deformaci´on no es permanente ni produce calor. El almacenamiento de energ´ıa en un resorte se realiza mediante el desplazamiento neto del resorte respecto de su estado nominal. El estado nominal del resorte puede ser definido como aquel en el cual el resorte no est´a ni estirado ni comprimido, pero en algunos casos tambi´en puede ser definido como aquel en el cual el sistema mec´anico completo est´a en reposo aunque el resorte este comprimido o estirado en esa situaci´on de reposo. Por tanto, la acumulaci´on de esfuerzo se define como el desplazamiento neto (ea = x12 ):

v 12 F

1

2 v1

F v2

Figura 2.4. Un resorte como almacenador de esfuerzo en sistemas mec´ anicos traslacionales.

x12 =

Z

0

t

v12 dt + x12 (0)

(2.6)

22

2 Modelado matem´ atico de sistemas f´ısicos

donde x12 = x1 − x2 con x1 y x2 las posiciones de los extremos 1 y 2 del resorte, respectivamente. De acuerdo al sentido de la velocidad v12 que se ha definido en la figura 2.4 se concluye que el desplazamiento neto x12 es positivo cuando el resorte est´a comprimido. En el caso de un resorte lineal la funci´on constitutiva responde a la Ley de Hooke [2], p´ag. 640: F = k x12 ,

(f = φ(ea ))

(2.7)

donde k es una constante positiva que se conoce como la constante de rigidez del resorte. Entonces, sustituyendo x12 = ea , F = f y F = k x12 en (2.2) y suponiendo que x12 (0) = 0, se encuentra que la energ´ıa almacenada en el resorte est´a dada como: Z x12 1 k x12 dx12 = k x212 E= 2 0 2.2.2.

Sistemas mec´ anicos rotativos

Almacenamiento de flujo En la figura 2.5 se muestra un cuerpo r´ıgido (sin flexibilidad) que gira con velocidad angular ω12 (ω12 = e, esfuerzo) bajo el efecto de un par T (T = f , flujo). Se supone que no existe fricci´on entre el cuerpo y el medio que lo rodea. Los sentidos mostrados para el par y la velocidad angular son los sentidos que se definen como positivos para este tipo de componente de sistema. De acuerdo a la Segunda Ley de Newton [2], p´ag. 122:

2

T ! 12 Eje de rotación

1 Figura 2.5. Un cuerpo r´ıgido rotativo de inercia I como almacenador de flujo en sistemas mec´ anicos rotativos.

T = Iα

(2.8)

donde α = dωdt12 es la aceleraci´on angular del cuerpo e I es el momento de inercia (constante positiva). El momentum angular h se define de la siguiente manera conveniente:

2.2 Almacenadores de energ´ıa

h = Iω12

23

(2.9)

porque integrando (2.8) y (2.9) se encuentra que el momentum angular es la acumulaci´on de flujo (h = fa ) porque se puede escribir: h=

Z

t

T dt + h(0)

0

A partir de (2.9) se concluye que la funci´on constitutiva es: ω12 = ϕ(h) =

1 h, I

(e = ϕ(fa ))

Entonces, sustituyendo ω12 = e, h = fa y ω12 = h/I en (2.3) y suponiendo que h(0) = 0, se encuentra que la energ´ıa almacenada est´a dada como: E=

Z

0

h

1 1 2 1 2 h dh = h = Iω12 I 2I 2

lo cual constituye la expresi´on bien conocida para la energ´ıa cin´etica. Almacenamiento de esfuerzo En la figura 2.6 se muestra un resorte que se deforma (mediante una flexion angular) a una velocidad ω12 (ω12 = e, esfuerzo) bajo el efecto de un par T (T = f , flujo). N´otese que aunque el par T se aplica en el extremo 1 del resorte, debe considerarse que un par del mismo valor y de sentido contrario aparece en el extremo 2 del resorte para que sea posible la deformaci´on. Adem´as, ω12 = ω1 − ω2 con ω1 y ω2 las velocidades de los extremos 1 y 2 del resorte, respectivamente. Los sentidos mostrados para la fuerza y las velocidades son los que se definen como positivos para este tipo de componente de sistema. Se supone que el resorte no tiene momento de inercia (o masa) y que la deformaci´on no es permanente ni produce calor. El almacenamiento de energ´ıa en un resorte se realiza mediante el desplazamiento angular neto del resorte respecto de su estado nominal. El estado nominal del resorte puede ser definido como aquel en el cual el resorte no est´a flexionado en ni en sentido horario ni antihorario, pero en algunos casos tambi´en puede ser definido como aquel en el cual el sistema mec´anico completo est´a en reposo aunque el resorte este flexionado en esa situaci´on de reposo. Por tanto, la acumulaci´on de esfuerzo se define como el desplazamiento angular neto (ea = θ12 ):

θ12 =

Z

t

ω12 dt + θ12 (0)

(2.10)

0

donde θ12 = θ1 − θ2 con θ1 y θ2 las posiciones angulares de los extremos 1 y 2 del resorte, respectivamente. De acuerdo al sentido de la velocidad ω12 que

24

2 Modelado matem´ atico de sistemas f´ısicos

se ha definido en la figura 2.6 se concluye que el desplazamiento angular neto θ12 es positivo cuando el resorte se flexiona de modo que θ1 > θ2 . En el caso de un resorte lineal, la funci´on constitutiva responde a la Ley de Hooke: T = k θ12 ,

(f = φ(ea ))

(2.11)

donde k es una constante positiva que se conoce como la constante de rigidez torsional del resorte. Entonces, sustituyendo θ12 = ea , T = f y T = k θ12 en (2.2) y suponiendo que θ12 (0) = 0, se encuentra que la energ´ıa almacenada en el resorte est´a dada como: Z θ12 1 2 k θ12 dθ12 = k θ12 E= 2 0 2.2.3.

Sistemas el´ ectricos

Almacenamiento de esfuerzo En la figura 2.7 se muestra un inductor a trav´es del cual circula una corriente el´ectrica i (i = f , flujo) bajo el efecto de un voltaje v12 (v12 = e, esfuerzo) aplicado entre sus extremos. Se supone que no existen efectos par´asitos, es decir, el inductor no tiene resistencia el´ectrica interna ni existe capacitancia entre sus espiras. Los sentidos mostrados para la corriente el´ectrica y el voltaje son los sentidos que se definen como positivos para este tipo de componente de sistema. Faraday fue el primero en darse cuenta de que un inductor (y en general cualquier circuito el´ectrico suficientemente largo, dado que un inductor es un conductor el´ectrico arrollado sobre un n´ ucleo) tiene propiedades an´alogas a las que tiene el momentum en sistemas mec´anicos. Lo que Faraday llam´o el

T !1

! 12

!2 T

1

2

Figura 2.6. Un resorte como almacenador de esfuerzo en sistemas mec´ anicos rotativos.

1

i +

à

2

v 12 Figura 2.7. Un inductor como almacenador de esfuerzo en sistemas el´ectricos.

2.2 Almacenadores de energ´ıa

25

“momentum electrodin´amico” es m´as conocido actualmente como el flujo concatenado λ y es igual al flujo magn´etico que es encerrado por el inductor. Faraday encontr´o que el flujo concatenado es proporcional a la corriente i que fluye a trav´es del inductor y a una constante positiva L que depende de la forma geom´etrica en que el conductor est´a arrollado para formar el inductor. La constante L recibe el nombre de inductancia. Por tanto, se puede escribir: λ = Li

(2.12)

El flujo concatenado determina el voltaje que se produce en los extremos de un inductor mediante lo que hoy se conoce como la Ley de Faraday [2], p´ag. 606, [3], p´ag. 325: v12 =

dλ di =L dt dt

(2.13)

Esto significa que el flujo concatenado representa la acumulaci´on de voltaje o esfuerzo (λ = ea ). Z t v12 dt + λ(0) λ= 0

Por tanto, a partir de la expresi´on en (2.12) se concluye que: i = φ(λ) =

1 λ, L

(f = φ(ea ))

Entonces, sustituyendo i = f , λ = ea e i = λ/L en (2.2) y suponiendo que λ(0) = 0, se encuentra que la energ´ıa almacenada est´a dada como: E=

Z

0

λ

1 1 2 1 λ dλ = λ = Li2 L 2L 2

(2.14)

lo cual constituye la expresi´on bien conocida para la energ´ıa magn´etica almacenada en un inductor. Almacenamiento de flujo Un capacitor se forma donde quiera que se encuentren dos conductores el´ectricos con potenciales el´ectricos diferentes, separados por un material no conductor a una distancia suficientemente peque˜ na como para que se genere un campo el´ectrico entre ellos. Cada uno de los conductores el´ectricos recibe el nombre placa. En la figura 2.8 se muestra un capacitor a trav´es del cual circula una corriente el´ectrica i (i = f , flujo) bajo el efecto de un voltaje v12 (v12 = e, esfuerzo) aplicado entre sus terminales. Se supone que no existen efectos par´asitos, es decir que no existe corriente de fuga entre las placas del capacitor y que no existen efectos inductivos debidos a las placas del capacitor. Debido a la diferencia de potencial que existe entre los conductores se

26

2 Modelado matem´ atico de sistemas f´ısicos

producir´a una acumulaci´on de carga el´ectrica. Se usa la letra q para representar dicha carga el´ectrica, la cual es igual pero de signo contrario en cada uno de los conductores. Con el fin de cuantificar la cantidad de carga el´ectrica que puede ser almacenada, se define la capacitancia C (constante positiva) del siguiente modo [3], p´ag. 121: C=

q v12

(2.15)

La capacitancia C depende de la forma geom´etrica y la cercan´ıa de los conductores (placas), as´ı como de las propiedades diel´ectricas del material no conductor colocado entre ellos. La corriente el´ectrica se define a partir de la carga el´ectrica del siguiente modo: i=

dq dt

(2.16)

Por tanto, la carga el´ectrica representa la acumulaci´on de flujo (de corriente el´ectrica) (q = fa ): Z t i dt + q(0) q= 0

A partir de la expresi´on en (2.15) se concluye que v12 = ϕ(q) =

1 q, C

(e = ϕ(fa ))

Entonces, sustituyendo v12 = e, q = fa y v12 = q/C en (2.3) y suponiendo que q(0) = 0, se encuentra que la energ´ıa almacenada est´a dada como: Z q 1 1 2 E= q dq = q C 2C 0 lo cual constituye la expresi´on bien conocida para la energ´ıa el´ectrica almacenada en un capacitor.

1

i

2 + v 12

à

Figura 2.8. Un capacitor como almacenador de flujo en sistemas el´ectricos.

2.3 Disipadores de energ´ıa

2.3.

27

Disipadores de energ´ıa

Un disipador es un componente que b´asicamente convierte la energ´ıa en otra forma de energ´ıa (generalmente t´ermica) la cual no es recuperable por el sistema. A diferencia de los almacenadores de energ´ıa, la disipaci´on de energ´ıa s´olo se realiza mediante un u ´nico proceso. As´ı, un disipador es un componente cuya funci´on constitutiva relaciona de manera est´atica (sin integrales de por medio) a las variables generalizadas de esfuerzo y de flujo: e = ϕ(f ) En este caso no hay energ´ıa almacenada y s´olo se puede hablar de que la potencia instantanea que se disipa est´a dada por el producto de las variables generalizadas de esfuerzo y flujo: w = ef

(2.17)

A continuaci´on se estudian los componentes disipadores de energ´ıa en sistemas de diferente naturaleza. 2.3.1.

Sistemas mec´ anicos traslacionales

Cualquier objeto mec´anico que requiere de la aplicaci´on permanente de una fuerza para poder mantener un valor de velocidad presenta efectos disipativos. Normalmente la disipaci´on de potencia ocurre porque la energ´ıa cin´etica est´a siendo convertida en energ´ıa t´ermica por efecto de la fricci´on, la cual aparece siempre que dos cuerpos hacen contacto mientras existe movimiento relativo entre ellos. La funci´on constitutiva de un disipador mec´anico general est´a dada como: v12 = ϕ(F ) donde v12 (e, esfuerzo) es la velocidad relativa entre los cuerpos y F (f , flujo) es la fuerza aplicada. Un caso particular muy importante de fricci´on es la fricci´on viscosa, la cual est´a representada por una funci´on constitutiva lineal de la forma: v12 =

1 F, b

fricci´on viscosa

(2.18)

donde b es una constante positiva conocida como el coeficiente de fricci´on viscosa. Este tipo de fricci´on ocurre, por ejemplo, cuando una placa plana y llena de orificios se desplaza dentro de una c´amara cerrada llena de aire, como se muestra en la figura 2.9. Debido a que el aire debe fluir a trav´es de los orificios conforme la placa se mueve a velocidad v12 , es necesario aplicar una fuerza F para mantener la velocidad del movimiento. Adem´as, v12 = v1 − v2 donde v1 y v2 son las velocidades de los extremos 1 y 2 del dispositivo,

28

2 Modelado matem´ atico de sistemas f´ısicos

respectivamente. Los sentidos de la fuerza y las velocidades mostrados en la figura 2.9 son los definidos como positivos. Aunque el dispositivo mostrado en la figura 2.9 puede no estar colocado f´ısicamente entre dos cuerpos que hacen contacto, la fricci´on viscosa generalmente est´a presente y es com´ un tomarla en cosideraci´on. De acuerdo a (2.17), la potencia disipada por efecto de la fricci´on viscosa est´a dada como: w=

1 2 2 F = bv12 b

v 12

v1

F

F

1 2 v2 Figura 2.9. La fricci´ on viscosa se produce como resultado de la resistencia al flujo del aire a trav´es de los orificios.

Tambi´en existen otros tipos de fricci´on que con frecuencia aparecen en la pr´actica. Dos de ellas son la fricci´on est´atica y la fricci´on de Coulomb. Las funciones constitutivas en cada caso son: F = ±Fs |v12 =0 ,

fricci´on est´atica (2.19) ½ +1, si v12 > 0 F = Fc signo(v12 ), signo(v12 ) = , fricci´on de Coulomb −1, si v12 < 0 (2.20)

La fricci´on est´atica representa una fuerza que tiende a prevenir el movimiento s´olo en el momento en que ´este est´a a punto de iniciar. Esta es la raz´on por la que en la ecuaci´on (2.19) la contante Fs se eval´ ua en v12 = 0. La fricci´on de Coulomb, en cambio, s´olo aparece cuando el movimiento se est´a realizando (v12 6= 0) y es constante para velocidades del mismo signo. En la figura 2.10 se muestran gr´aficamente las funciones constitutivas en (2.18), (2.19) y (2.20). Dado que las fuerzas de fricci´on est´atica y de Coulomb no tienden a cero cuando la velocidad tiende a cero, estas fricciones son las responsables de algunos problemas en sistemas de control de posici´on: la diferencia entre la posici´on que se desea alcanzar y la posici´on realmente alcanzada por el mecanismo es diferente de cero, lo que se conoce como “un error en estado

2.3 Disipadores de energ´ıa

F

F

29

F Fs

Fc

b

v 12

v 12 à Fs

v 12 à Fc

Figura 2.10. Funciones constitutivas definidas en (2.18), (2.19) y (2.20).

estacionario diferente de cero”. Por otro lado, dado que las fricciones est´atica y de Coulomb tienen funciones constitutivas no lineales y discontinuas, no pueden ser manejadas usando t´ecnicas de control por sistemas lineales ni por las t´ecnicas de control para sistemas no lineales “suaves”. Esta es la raz´on por las que con frecuencia no son consideradas en el modelado de sistemas. Sin embargo, hay que tener presente que en cualquier situaci´on experimental se observar´an los efectos de estas dos fricciones. Se sugiere consultar [4] si se desea conocer algunos m´etodos para medir los par´ametros de distintos tipos de fricci´on. 2.3.2.

Sistemas mec´ anicos rotativos

Los disipadores en sistemas mec´anicos rotativos (v´ease la figura 2.11) son id´enticos a los disipadores en sistemas mec´anicos traslacionales. La u ´nica diferencia es que las variables generalizadas de esfuerzo y flujo est´an expresadas en t´erminos de velocidad angular ω12 (ω12 = e, esfuerzo) y par T (T = f , flujo): 1 T, fricci´on viscosa b T = ±Ts |ω12 =0 , fricci´on est´atica

ω12 =

T = Tc signo(ω12 ),

2.3.3.

signo(ω12 ) =

(2.21) ½

+1, si ω12 > 0 , fricci´on de Coulomb −1, si ω12 < 0

Sistemas el´ ectricos

El componente disipador en sistemas el´ectricos es aquel en el cual es necesario aplicar un voltaje v12 (v12 = e, esfuerzo) entre sus terminales para mantener el flujo de una corriente i (i = f , flujo) a trav´es de ´el. La funci´on constitutiva correspondiente relaciona de manera est´atica estas dos variables

30

2 Modelado matem´ atico de sistemas f´ısicos

!2 T

T !1

! 12 Figura 2.11. Un disipador en sistemas mec´ anicos rotativos.

y est´a definida por la Ley de Ohm [2], p´ag. 530, en el caso de que el disipador sea lineal: v12 = iR

(2.22)

donde R es una constante positiva conocida como la resistencia el´ectrica del disipador. En la figura 2.12 se muestra una resistencia el´ectrica por la que fluye una corriente i y se aplica un voltaje v12 . Los sentidos mostrados son los definidos como positivos. De acuerdo a w = ef , la potencia disipada en una resistencia el´ectrica est´a dada como: w = i2 R =

1 2 v R 12

v 12 1

i

+

à

2

Figura 2.12. Una resistencia como disipador en sistemas el´ectricos.

2.4.

Fuentes de energ´ıa

Las fuentes de energ´ıa pueden ser de dos tipos: fuentes de esfuerzo (e) y fuentes de flujo f . En las figuras 2.13(a) y 2.13(b) se muestran ambos tipos de fuentes y los sentidos definidos como positivos para el esfuerzo y el flujo. Tambi´en se muestran dos dibujos en los que especifica que una fuente de esfuerzo (o de flujo) entrega un esfuerzo (o un flujo) que es independiente (constante) del flujo (o esfuerzo) a trav´es de la fuente. M´as a´ un, cuando la potencia w = ef es positiva, entonces w es la potencia que la fuente entrega a los otros componentes del sistema; cuando la potencia w = ef es negativa, entonces w es la potencia que la fuente recibe desde los otros componentes del sistema.

2.4 Fuentes de energ´ıa f

e

+

Recibe potencia

e1

à

31

e1

Entrega potencia f

(a) f

+ f1

f1

e

à

Recibe potencia

Entrega potencia e

(b) Figura 2.13. Fuentes de esfuerzo y de flujo.

2.4.1.

Sistemas mec´ anicos traslacionales

Una fuente de fuerza es una fuente de flujo, por lo que la fuente entrega una fuerza cuyo valor es independiente de la velocidad (esfuerzo) del componente del sistema sobre el cual se est´a aplicando dicha fuerza. Una fuente de velocidad es una fuente de esfuerzo, por lo que la velocidad que produce es independiente de la fuerza (flujo) ejercida sobre el componente del sistema correspondiente. Claramente es mucho m´as f´acil visualizar lo que es una fuente de fuerza que una fuente de velocidad. Sin embargo, algunos fen´omenos pueden ser modelados de manera conveniente como fuentes de velocidad. 2.4.2.

Sistemas mec´ anicos rotativos

Las fuentes se definen como en el caso de sistemas mec´anicos traslacionales, pero en t´erminos de par (flujo) y velocidad angular (esfuerzo). 2.4.3.

Sistemas el´ ectricos

Una fuente de corriente el´ectrica es una fuente de flujo, por lo que la fuente entrega una corriente el´ectrica cuyo valor es independiente del voltaje (esfuerzo) entre sus terminales. Una fuente de voltaje es una fuente de esfuerzo, por lo que el voltaje entre sus terminales es independiente de la corriente el´ectrica a trav´es de ella. Tal como sucede en los sistemas mec´anicos, es m´as f´acil visualizar una clase de fuentes: el concepto de fuente de voltaje es m´as claro que el de una fuente de corriente el´ectrica. Sin embargo, el uso de fuentes de corriente es un artificio muy u ´til para modelar algunos efectos que se presentan, por ejemplo, en circuitos electr´onicos.

32

2 Modelado matem´ atico de sistemas f´ısicos

2.5.

Convertidores

Los convertidores son componentes que simplemente permiten que la energ´ıa fluya a trav´es de ellos sin almacenarla ni disiparla. Estos componentes est´an conectados a trav´es de dos puertos (v´ese la figura 2.14). Cada puerto esta definido por una variable generalizada de esfuerzo y una de flujo. El papel de los convertidores es modificar las variables de esfuerzo y de flujo en el segundo puerto respecto de las variables de esfuerzo y de flujo que existen en el primer puerto. Este proceso es realizado de manera que la energ´ıa en el segundo puerto es igual a la energ´ıa en el primer puerto. Esos componentes se pueden clasificar en dos tipos: i) los transformadores, en los cuales las variables de esfuerzo y de flujo en ambos puertos son de la misma naturaleza e ii) los adaptadores, en lo cuales las variables de esfuerzo y flujo en un puerto son de naturaleza diferente a las del otro puerto.

f2

f1

Puerto 1

e1

Convertidor

e2

Puerto 2

Figura 2.14. Un convertidor tiene dos puertos.

2.5.1.

Transformadores

Sistemas el´ ectricos Un transformador el´ectrico esta formado por dos inductores (conductores el´ectricos) enrollados firmemente sobre un mismo n´ ucleo de material ferromagn´etico (v´ease la figura 2.15). Esto significa que los inductores est´ an magn´eticamente acoplados pero el´ectricamente aislados. Cada inductor define un puerto. En el puerto 1, v1 representa la variable de esfuerzo e i1 representa la variable de flujo. En el puerto 2, v2 representa la variable de esfuerzo e i2 representa la variable de flujo. Las direcciones indicadas representan los sentidos definidos como positivos de estas variables. El punto colocado en la parte superior de cada inductor se usa como una convenci´on para indicar que los inductores se enrollan en la misma direcci´on. Si no fuera este el caso entonces los puntos se colocar´an en extremos opuestos de los inductores. El inductor conectado al puerto 1 consta de n1 vueltas y el inductor conectado al puerto 2 consta de n2 vueltas.

2.5 Convertidores

33

Como los inductores est´an acoplados magn´eticamente, el flujo concatenado por el inductor 1, λ1 , y por el inductor 2, λ2 , dependen ahora de las corrientes en ambos inductores: λ1 = L1 i1 + M12 i2 , λ2 = M21 i1 + L2 i2

(2.23) (2.24)

donde L1 , L2 son las inductancias de los inductores 1 y 2, mientras que M12 y M21 son las inductancias mutuas existentes entre ambos circuitos. Siempre se cumple que M12 = M21 = M . Los signos positivos en las expresiones anteriores son debidos a que las orientaciones de las corrientes son tales que la corriente positiva entra a los arrollamientos por los extremos marcados con un punto. Despejando i2 de (2.23) y sustituyendo en (2.24) se obtiene: ¶ µ L1 L2 L2 i1 (2.25) λ1 + M − λ2 = M M Se define el coeficiente de acoplamiento como: k=√

M L1 L2

Si los circuitos est´an completamente desacoplados entonces k = 0, pero si los dos circuitos est´an perfectamente acoplados de modo que todo el flujo que es encerrado por el inductor 1 tambi´en es encerrado por el inductor 2, entonces k = 1. Este caso es obtenido con muy buen grado de aproximaci´on en la pr´actica si el n´ ucleo sobre el cual se enrollan los dos inductores es de material ferromagn´etico con un valor grande de permeabilidad magn´etica µ. √ Suponiendo que este es el caso, es decir que M = L1 L2 , entonces (2.25) se convierte en: r L2 λ1 (2.26) λ2 = L1

i2

+

v2 à

n2

i1

+ v1

n1

à

Figura 2.15. Transformador el´ectrico.

34

2 Modelado matem´ atico de sistemas f´ısicos

Por otro lado, dividiendo (2.24) entre (2.23), con M12 = M21 = M , y usando (2.26): r λ2 L2 M i1 + L2 i2 = = λ1 L1 i1 + M i2 L1 A partir de esto se puede escribir: √ i2 L1 L2 − M q = i1 2 L2 − L L1 M √ √ r √L1 ( L1 L2 − M ) L1 L2 √ = = L2 L1 L2 − M

(2.27)

La inductancia de cada circuito est´a dada como: n21 A l n22 A L2 = µ l L1 = µ

donde A, l y µ son, respectivamente, el area, la longitud media y la permeabilidad magn´etica del n´ ucleo. Por tanto r L1 n1 = (2.28) L2 n2 Usando esto y (2.13) se obtiene, de (2.26): v2 =

n2 v1 n1

y de (2.27): i2 =

n1 i1 n2

Lo cual significa que la potencia en ambos puertos es igual porque: w2 = v2 i2 =

n2 n1 v1 i1 = v1 i1 = w1 n1 n2

Sistemas mec´ anicos traslacionales En la figura 2.16 se muestra un transformador mec´anico traslacional as´ı como las variables definidas y los sentidos definidos positivos de las mismas. Se trata de una palanca con brazos de longitud a y b. Las posiciones x1 y x2 se obtienen por simple geometr´ıa:

2.5 Convertidores

x1 = a sin(α),

35

x2 = b sin(α)

Derivando respecto al tiempo y dividiendo ambos resultados se obtiene la relaci´on entre esfuerzos: v2 =

b v1 a

La relaci´on entre las fuerzas (flujos) en cada puerto se obtiene usando el principio del trabajo virtual: F1 δx1 = F2 δx2 δx1 = aδ sin(α), a F2 = F1 b

δx2 = bδ sin(α)

N´otese que la potencia en ambos puertos es igual: b ³a ´ F1 = F1 v1 = w1 w2 = v2 F2 = v1 a b

F2

b

v2 a

ë

v1 F1 Figura 2.16. Transformador mec´ anico traslacional.

Sistemas mec´ anicos rotativos En la figura 2.17 se muestran dos ruedas dentadas de radios r1 y r2 unidas, cada una, a un eje rotativo. La rueda de radio r1 tiene n1 dientes mientras que la rueda de radio r2 tiene n2 dientes. En la figura 2.17 tambi´en se muestran los sentidos definidos como positivos de los pares y las velocidades angulares

36

2 Modelado matem´ atico de sistemas f´ısicos

en cada rueda. El hecho de que las ruedas sean dentadas evita que las ruedas puedan patinar. Esto asegura que la longitud de arco de c´ırculo s generado por un ´angulo θ1 descrito en el eje 1 sea igual a la longitud de arco generado por un ´angulo θ2 en el eje 2. Existe una relaci´on geom´etrica que relaciona al radio de un c´ırculo, el ´angulo descrito por el mismo y la longitud del arco de c´ırculo generado. Aplicando esta relaci´on en ambos ejes se tiene: s = θ1 r1 ,

s = θ2 r2

(2.29)

donde θ1 y θ2 deben estar dados en radianes. De lo anterior se obtiene: θ1 r1 = θ2 r2

(2.30)

T2

T1 ò1 s ò2

!1

r1

!2

r2

n1

n2

F

Figura 2.17. Caja de engranes.

Por otro lado, se sabe que el paso de los engranes α (ancho de cada diente) es igual en ambos ejes, pues esto es necesario para que dichos dientes se adapten correctamente al girar. Esto significa que: p1 = αn1 ,

p2 = αn2

p1 = 2πr1 ,

p2 = 2πr2

donde p1 y p2 representan los per´ımetros de cada una de las ruedas dentadas. Combinando estas expresiones se tiene: n1 r1 = r2 n2 Combinando (2.30) y (2.31): θ1 =

n2 θ2 n1

Derivando respecto al tiempo se obtiene:

(2.31)

2.5 Convertidores

ω1 =

n2 ω2 n1

37

(2.32)

donde ω1 y ω2 son las velocidades angulares de cada rueda. Por otro lado, la fuerza F aplicada en el punto donde hacen contacto las ruedas es igual para ambas. Esta fuerza satisface: T1 = F r1 ,

T2 = F r2

donde T1 y T2 son los pares aplicados a cada eje. Despejando F e igualando: T1 =

n1 r1 T2 = T2 r2 n2

(2.33)

Usando (2.33) y (2.32) se encuentra que la potencia en ambos puertos es igual: w1 = T1 ω1 = 2.5.2.

n1 n2 T2 ω2 = T2 ω2 = w2 n2 n1

Adaptadores

Sistemas mec´ anicos Considere el sistema pi˜ n´on-cremallera mostrado en la figura 2.18. El puerto 1 est´a definido en t´erminos de variables rotativas: la velocidad angular ω1 es el esfuerzo y el par T1 es el flujo, mientras que el puerto 2 est´a definido en t´erminos de variables de traslaci´on: la velocidad v2 es el esfuerzo y la fuerza F2 es el flujo. Por definici´on, el par T1 y la fuerza F2 se relacionan a trav´es de: T1 = rF2

(2.34)

donde r es el radio del pi˜ n´on, mientras que la velocidad angular ω1 y la velocidad v2 se relacionan a trav´es de (v´ease (2.29)): v2 = rω1

(2.35)

Por tanto, la potencia en ambos puertos es igual: 1 w1 = T1 ω1 = rF2 v2 = F2 v2 = w2 r Los sentidos mostrados en la figura 2.18 son los definidos como positivos. Sistemas electromec´ anicos En la figura 2.19 se muestra una espira cuadrada de area A = l2 colocada dentro de un campo magn´etico B. Por la espira circula una corriente el´ectrica i, en el sentido indicado, por efecto de una fuente de voltaje externa de valor E.

38

2 Modelado matem´ atico de sistemas f´ısicos

!1

r

T1

v2

F2

Figura 2.18. Pi˜ n´ on-cremallera.

B

N

S àv+ R

L

à

i +

E

(a) Vista superior.

F

B ò

N

S l F (b) Vista frontal. Figura 2.19. Motor el´ectrico de CD.

La resistencia R y la inductancia L mostradas en la figura 2.19(a) representan la resistencia del cobre y la inductancia de la espira. La fuerza que ejerce el campo magn´etico sobre una corriente el´ectrica de longitud l est´a dada como [2], p´ag. 541:

2.5 Convertidores

¯ F¯ = il¯ u×B

39

(2.36)

donde u ¯ es un vector unitario en el mismo sentido de la corriente el´ectrica y se usa la barra arriba de las variables para indicar que se trata de vectores. El s´ımbolo “×” representa el producto vectorial. Por tanto, bajo la situaci´on mostrada en la figura 2.19(b), es decir cuando θ = 90◦ , el campo magn´etico ejerce sobre los lados izquierdo y derecho de la espira la fuerza: F = ilB en el sentido indicado. Esto significa que sobre el eje de la espira se ejerce un par de valor: l T = 2 F = iBl2 = iBA 2 donde se ha considerado que el par debido a la fuerza en cada lado es lF/2 (fuerza por radio) y que hay dos fuerzas aplicadas de la misma magnitud: una aplicada sobre el lado izquierdo y otra sobre el lado derecho de la espira. El lector puede verificar que, de acuerdo a (2.36), las fuerzas sobre los lados de la espira que est´an atr´as y adelante no producen ning´ un par de giro. Todo ˙ es lo anterior significa que la espira gira con una velocidad angular ω = −θ, decir, en sentido contrario al definido para θ en la figura 2.19(b) donde θ es el ´angulo formado por las direcciones del campo magn´etico y la perpendicular a la espira. De acuerdo a la Ley de Faraday [3], p´ag. 325, este movimiento induce un voltaje v en las terminales de la espira el cual est´a dado de acuerdo a (2.13), es decir: v=

dλ dt

donde λ es el flujo magn´etico concatenado por la espira el cual est´a dado por: λ = BA cos(θ) Por tanto, usando estas dos expresiones se encuentra: v = −BAθ˙ sin(θ) = BAω sin(θ) N´otese que, de acuerdo a la Ley de Lenz [3], p´ag. 327, el voltaje inducido v tiene una polaridad tal (v´ease la figura 2.19(a)) que se opone a la causa que lo produce la cual en este caso es, a fin de cuentas, la corriente que circula i. Ahora suponga que se colocan varias espiras con diferentes inclinaciones, de manera que un conmutador mec´anico autom´aticamente conecte y desconecte las espiras de tal modo que siempre est´e conectada s´olamente la espira para la cual θ = 90◦ . Entonces, el voltaje en las terminales del conjunto est´a dado como: v = BAω

40

2 Modelado matem´ atico de sistemas f´ısicos

Lo que se acaba de describir es el funcionamiento de un motor el´ectrico de CD (corriente directa). Sean el voltaje v y la corriente i las variables de esfuerzo y flujo, respectivamente, del puerto 1 y sean la velocidad angular ω y el par T las variables de esfuerzo y flujo, respectivamente, del puerto 2. Las relaciones entre las variables de ambos puertos est´an dadas por: v = BAω 1 i= T BA

(2.37)

Si se considera que en el puerto 1 se aplica un par T a una velocidad ω, produciendo en el puerto 2 un voltaje v y una corriente el´ectrica i, entonces se tiene un generador el´ectrico de CD y ambas expresiones en (2.37) a´ un son v´alidas. N´otese que en cualquiera de estos casos, la potencia en ambos puertos es igual: w1 = vi =

1 T BAω = T ω = w2 BA

En situaciones m´as generales se acostumbra escribir las expresiones en (2.37) del siguiente modo: v = ke ω

(2.38)

T = km i

(2.39)

donde ke > 0 y km > 0 se conocen, respectivamente, como la constante de fuerza contra electromotriz y la constante de par. Estas constantes se introducen para tomar en consideraci´on la presencia de varias espiras en serie y otras variantes en la construcci´on de motores y generadores de CD. Se puede usar el hecho de que la potencia en ambos puertos es igual: w1 = vi = ke ω

1 T = T ω = w2 km

para mostrar que ke = km en cualquier motor (generador) de CD. Sin embargo, hay que tener cuidado con las unidades: ke = km se cumple siempre que estas constantes se expresen en el sistema internacional de unidades (metrokilogramo-segundo). Sistemas electromec´ anicos: fuerza debida a un campo magn´ etico En la figura 2.20 se muestra una barra de material ferromagn´etico colocada a una distancia x de un electroim´an. El electroim´an consiste de un inductor arrollado sobre un n´ ucleo del mismo material ferromagn´etico que la barra. Por el inductor circula una corriente el´ectrica i por efecto de un voltaje v aplicado en sus terminales. La inductancia L(x) es dependiente de la posici´on x de la barra debido a lo siguiente. De acuerdo a (2.12), el flujo magn´etico est´a dado como el producto

2.5 Convertidores

41

x

i

+

F

v

à

õ

Figura 2.20. Fuerza debida un campo magn´etico.

de la inductancia y la corriente el´ectrica λ = L(x)i. Por otro lado, si la barra se aproxima al n´ ucleo entonces el espacio entre ambos disminuye. Como el aire presenta mayor resistencia al paso del flujo magn´etico que la resistencia que presenta un material ferromagn´etico, entonces el flujo magn´etico aumenta al disminuir x. Si la corriente el´ectrica se mantiene constante mientras se reduce x entonces, de acuerdo a λ = L(x)i un aumento del flujo λ solo puede ser debido a un aumento en la inductancia L(x), es decir, que la inductancia cambia al cambiar x. Por efecto del campo magn´etico generado por la corriente i, la barra recibe una fuerza de atracci´on F hacia el n´ ucleo del electroim´an. A continuaci´on se obtiene una expresi´on para esta fuerza. Suponga que la barra sufre un desplazamiento dx. El trabajo mec´anico debido a este desplazamiento es: dEM = F dx

(2.40)

De acuerdo a (2.14), la energ´ıa almacenada en el campo magn´etico est´a dada como: Em =

1 L(x)i2 2

(2.41)

Como la corriente se mantiene constante y s´olo hay un cambio en la posici´on de la barra, entonces el cambio en la energ´ıa magn´etica est´a dado por: dEm =

1 2 i dL(x) 2

(2.42)

Los cambios en las energ´ıas mec´anica y magn´etica deben ser suministrados por la fuente de voltaje conectada a la inductancia, es decir: dEv = dEm + dEM

(2.43)

donde dEv es el trabajo suministrado por la fuente de voltaje. Este trabajo debe ser realizado compensando el voltaje inducido en la inductancia el cual, de acuerdo a (2.13) y λ = L(x)i, est´a dado como:

42

2 Modelado matem´ atico de sistemas f´ısicos

v=

dλ dL(x) =i dt dt

Por tanto: dEv = vidt = i2 dL(x)

(2.44)

Sustituyendo (2.42) y (2.44) en (2.43): 1 1 dEM = i2 dL(x) − i2 dL(x) = i2 dL(x) 2 2 es decir, la mitad del trabajo realizado por la fuente de voltaje se dedica a cambiar la energ´ıa magn´etica y la otra mitad se dedica a realizar el trabajo mec´anico, es decir; dEm = dEM

(2.45)

Por otro lado, como el cambio en la energ´ıa magn´etica s´olo se debe al cambio en la posici´on x, entonces se puede escribir: dEm =

∂Em dx ∂x

Entonces, de acuerdo a esto, (2.40), (2.45) y (2.41) se concluye que: F =

∂Em 1 ∂L(x) = i2 ∂x 2 ∂x

(2.46)

El desarrollo aqu´ı presentado se basa en las ideas reportadas en [5], cap. 5.

2.6.

Ejemplos

Una vez que se han establecido las funciones constitutivas de cada elemento de sistema se debe abordar el problema de conectar varios de estos elementos para obtener el modelo matem´atico de sistemas m´as o menos complejos. La clave para interconectar los elementos de un sistema mec´anico es considerar que todos ellos se conectan mediante uniones r´ıgidas. Esto significa que la velocidad a ambos lados de una uni´on es igual. Para ser m´as claros, a continuaci´on se presentan varios ejemplos. Ejemplo 2.2 Considere el sistema masa-resorte-amortiguador mostrado en la figura 2.21(a) donde se aplica una fuerza externa F (t) sobre el cuerpo de masa m. Este sistema quiz´ a sea el m´ as sencillo desde el punto de vista del modelado, pero es muy importante desde el punto de vista de control porque representa el comportamiento b´ asico de los sistemas de control de posici´ on. En la figura 2.21(b) se muestra el diagrama de cuerpo libre correspondiente. N´ otese que en cada uni´ on entre componentes existen dos fuerzas iguales

2.6 Ejemplos

43

aplicadas en sentidos contrarios. Esto es con el fin de satisfacer la Tercera Ley de Newton [2], p´ ag. 88, que establece que a cada acci´ on (del cuerpo A sobre el cuerpo B) corresponde una reacci´ on (del cuerpo B sobre el cuerpo A). Las ruedas debajo del cuerpo se usan para indicar que no existe fricci´ on con el suelo sobre el cual se apoya. Esto tambi´en significa que el efecto de la gravedad no interviene. Sin embargo, equivalentemente se podr´ıa eliminar el amortiguador colocado en el extremo derecho para ser sustituido por fricci´ on entre el cuerpo y el suelo. El modelado de la fricci´ on entre el cuerpo y el suelo se realiza de manera id´entica a como se considera el amortiguador en el procedimiento que sigue.

K

F (t)

b m (a)

vK FK

F (t)

vb

vm Fb m

FK

Fb

(b) Diagrama de cuerpo libre. Figura 2.21. Sistema masa-resorte-amortiguador.

La nomenclatura utilizada es la siguiente: vm = dxdtm , donde xm es la posici´ on del cuerpo. dxb vb = dt , donde xb es la posici´ on del extremo m´ ovil del amortiguador. vK = dxdtK , donde xK es la posici´ on del extremo m´ ovil del resorte. Usando la figura 2.21(b), as´ı como (2.4), (2.7), (2.18) se obtienen las siguientes expresiones: masa: resorte:

dvm = F (t) + FK − Fb dt KxK = FK

m

amortiguador:

bvb = Fb

(2.47) (2.48) (2.49)

N´ otese que, de acuerdo a la convenci´ on de signos mostrada en la figura 2.3, las fuerzas que act´ uan sobre la masa m y que tienen el mismo sentido que vm en la figura 2.21(b) aparecen con signo positivo en (2.47) y por esa misma raz´ on Fb aparece afectada por un signo negativo. Los signos a ambos lados de las expresiones en (2.48) y (2.49) respetan las convenciones de signos definidas en las figuras 2.4 y 2.9, respectivamente. N´ otese que uno de los extremos del resorte y del amortiguador est´ a en reposo y que son los extremos m´ oviles los

44

2 Modelado matem´ atico de sistemas f´ısicos

que en las figuras 2.4 y 2.9 tienen una velocidad y una fuerza aplicadas en el mismo sentido. N´ otese tambi´en que se ha definido: dxK (2.50) dt Considerando que los diferentes elementos de sistema se conectan mediante uniones r´ıgidas, de acuerdo a la figura 2.21(b) se puede escribir: vK =

vK = −vm = −vb

(2.51)

De acuerdo a esto se concluye que se puede escribir: xK = −xm + c1 = −xb + c2 donde c1 y c2 son dos constantes. Si se usa la convenci´ on de definir xK = 0, xm = 0 y xb = 0 como aquellos puntos ocupados por el extremo m´ ovil del resorte, el centro del cuerpo de masa m y el extremo m´ ovil del amortiguador, respectivamente, cuando el sistema est´ a en reposo con F (t) = 0, entonces se puede decir que c1 = c2 = 0 y, por tanto: xK = −xm = −xb Usando estas relaciones, tambi´en se puede escribir (2.47), (2.48), (2.49) como: dxm d2 xm +b + Kxm = F (t) (2.52) dt2 dt Esta u ´ltima expresi´ on es una ecuaci´ on diferencial ordinaria, de segundo orden, lineal y de coeficientes constantes, que representa el modelo matem´ atico del sistema masa-resorte-amortiguador. Esto significa que si se conocen los par´ ametros m, b y K, as´ı como las condiciones iniciales xm (0), dxdtm (0) y la fuerza externa aplicada F (t) como una funci´ on del tiempo, entonces se puede resolver dicha ecuaci´ on diferencial para obtener la posici´ on xm (t) y la velocidad dxdtm (t) del cuerpo como funciones del tiempo. Dicho de otro modo, se puede conocer la posici´ on y la velocidad del cuerpo en cualquier instante de tiempo presente o en el futuro, es decir, para todo t ≥ 0. Finalmente, cuando se estudia la soluci´ on de las ecuaciones diferenciales es conveniente expresar una ecuaci´ on diferencial de manera que el coeficiente de la potencia mayor sea igual a la unidad, es decir, es m´ as conveniente escribir (2.52) como: m

x ¨m + donde x ¨m =

d2 xm dt2

y x˙ m =

K 1 b x˙ m + xm = F (t) m m m

(2.53)

dxm dt .

Ejemplo 2.3 En la figura 2.22(a) se muestra un sistema masa-resorteamortiguador con un resorte y un amortiguador colocados en un mismo extremo del cuerpo de masa m. El objetivo de este ejemplo es mostrar que el modelo matem´ atico en este caso es id´entico al obtenido en el ejemplo previo. La nomenclatura utilizada es la siguiente:

2.6 Ejemplos

45

v = dx on del cuerpo. dt , donde x es la posici´ b v1 = dxdtK = dx , donde x = xb representan la posici´ on del extremo m´ ovil K dt del resorte y del amortiguador, respectivamente. De acuerdo a la figura 2.22(b) y a (2.4), (2.7), (2.18), se obtienen las siguientes expresiones: dv = F (t) + FK + Fb dt resorte: KxK = FK amortiguador: bv1 = Fb masa:

(2.54)

m

K m

F(t)

b (a)

v1

FK Fb

FK Fb

v m

F(t)

v1 (b) Diagrama de cuerpo libre. Figura 2.22. Sistema masa-resorte-amortiguador.

N´ otese que, de acuerdo a la convenci´ on de signos mostrada en la figura 2.3, todas las fuerzas en (2.54) aparecen afectadas por un signo positivo porque tienen el mismo sentido que v en la figura 2.22(b). Por otro lado, al existir una uni´ on r´ıgida y de acuerdo a los sentidos definidos en la figura 2.22(b) se tiene que: v = −v1

(2.55)

Del mismo modo a como se hizo en el ejemplo previo, si x = 0, xK = 0 y xb = 0 se definen, respectivamente, como el centro del cuerpo m y el extremo m´ ovil del resorte y del amortiguador cuando el sistema completo est´ a en reposo con F (t) = 0, entonces se puede escribir: xK = xb = −x

(2.56)

46

2 Modelado matem´ atico de sistemas f´ısicos

No es dif´ıcil darse cuenta que combinando las expresiones en (2.54) y usando (2.56), (2.55) se obtiene: x ¨+

b K 1 x˙ + x = F (t) m m m

2

atico es id´entico al mostrado en donde x ¨ = ddt2x y x˙ = dx dt . Este modelo matem´ (2.53) si se considera que x = xm . Ejemplo 2.4 En la figura 2.23(a) se muestran dos cuerpos unidos por un resorte cuando se aplica una fuerza externa F (t) sobre el cuerpo de la izquierda. Esta situaci´ on representa el caso pr´ actico en el que el cuerpo 1 transmite movimiento al cuerpo 2 pero ambos cuerpos est´ an conectados mediante una pieza mec´ anica que presenta flexibilidad. Esta flexibilidad no es introducida de manera intencional sino que es un problema no deseado que aparece debido a la rigidez finita del material con el que est´ a hecha la pieza mec´ anica que une a los cuerpos 1 y 2. Con frecuencia es muy importante estudiar cual es el efecto de esta flexibilidad en el desempe˜ no del sistema de control y por eso debe ser tomada en consideraci´ on durante el modelado. Los amortiguadores se introducen para considerar el efecto de la fricci´ on de cada cuerpo con sus soportes (o el suelo).

F (t)

K

m1

m2

b1

F b1

v b1

F (t)

b2 v m1

(a) vK

F K1

v m2

K

m1 F b1

v b2

F b2

m2 F K1

F K2

F K2

F b2

v1 v2 (b) Diagrama de cuerpo libre. Figura 2.23. Dos cuerpos unidos por un resorte.

El diagrama de cuerpo libre correspondiente se muestra en la figura 2.23(b). La nomenclatura utilizada es la siguiente: vm1 = dxdtm1 , donde xm1 es la posici´ on del cuerpo 1. dxm2 vm2 = dt , donde xm2 es la posici´ on del cuerpo 2. vb1 = dxdtb1 , donde xb1 es la posici´ on del extremo m´ ovil del amortiguador 1.

2.6 Ejemplos

47

vb2 = dxdtb2 , donde xb2 es la posici´ on del extremo m´ ovil del amortiguador 2. 1 on del extremo del resorte unido al cuerpo v1 = dx dt , donde x1 es la posici´ 1. 2 v2 = dx on del extremo del resorte unido al cuerpo dt , donde x2 es la posici´ 2. Usando la figura 2.23(b), as´ı como (2.4), (2.7), (2.18), se obtienen las siguientes expresiones: dvm1 = F (t) + Fb1 − FK1 dt dvm2 = FK2 − Fb2 masa 2: m2 dt resorte: KxK = FK1 = FK2 amortiguador 1: b1 vb1 = Fb1 masa 1:

m1

amortiguador 2:

(2.57) (2.58)

b2 vb2 = Fb2

Las fuerzas que tienen el mismo sentido que vm1 y vm2 , y que act´ uan sobre cada uno de los cuerpos, aparecen afectadas con un signo positivo y con un signo negativo en caso contrario. N´ otese tambi´en que se ha definido: vK =

dxK = v1 − v2 dt

Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.23(b) se tiene que: vm1 = −vb1 = v1 vm2 = vb2 = v2

(2.59)

De acuerdo a esto, si se definen xm1 = 0, xm2 = 0, xb1 = 0, xb2 = 0, x1 = 0, x2 = 0 como aquellos puntos ocupados por el centro del cuerpo 1, el centro del cuerpo 2, el extremo m´ ovil del amortiguador 1, el extremo m´ ovil del amortiguador 2, el extremo del resorte que est´ a unido al cuerpo 1 y el extremo del resorte que est´ a unido al cuerpo 2, respectivamente, cuando todo el sistema est´ a en reposo con F (t) = 0, entonces se concluye que: xm1 = −xb1 = x1 , xm2 = xb2 = x2 Por tanto, las expresiones en (2.57) y (2.58) se pueden escribir como: masa 1: masa 2:

dvm1 = F (t) + b1 vb1 − KxK dt dvm2 = KxK − b2 vb2 m2 dt

m1

(2.60)

48

2 Modelado matem´ atico de sistemas f´ısicos

Usando (2.59) y (2.60) se obtiene: d2 xm1 dxm1 = F (t) − b1 − KxK 2 dt dt d2 xm2 dxm2 m2 = KxK − b2 dt2 dt

masa 1:

m1

masa 2:

Por otro lado, de acuerdo al p´ arrafo que sigue a (2.6) se tiene que xK = x1 − x2 , por lo que se puede escribir: masa 1: masa 2:

d2 xm1 dxm1 = F (t) − b1 − K(x1 − x2 ) dt2 dt d2 xm2 dxm2 m2 = K(x1 − x2 ) − b2 dt2 dt m1

Finalmente, usando de nuevo (2.60) se obtiene que el modelo matem´ atico correspondiente est´ a dado por las dos siguientes ecuaciones diferenciales, las cuales deben ser resueltas simult´ aneamente: masa 1: masa 2:

b1 dxm1 K 1 d2 xm1 + + (xm1 − xm2 ) = F (t) 2 dt m1 dt m1 m1 d2 xm2 b2 dxm2 K + − (xm1 − xm2 ) = 0 2 dt m2 dt m2

Estas dos ecuaciones diferenciales no pueden ser combinadas para obtener una sola ecuaci´ on diferencial, ya que las variables xm1 y xm2 son linealmente independientes, es decir, no se cuenta con ninguna expresi´ on algebraica que relacione a estas variables. Ejemplo 2.5 En la figura 2.24(a) se muestran dos cuerpos conectados a tres resortes y un amortiguador. En este caso, el amortiguador representa la fricci´ on existente entre los dos cuerpos y, por esto, no puede ser sustituido por la posible fricci´ on existente entre cada cuerpo y el suelo (si no estuvieran colocadas las ruedas debajo de cada cuerpo). El diagrama de cuerpo libre correspondiente se muestra en la figura 2.24(b). La nomenclatura utilizada es la siguiente: 1 x˙ 1 = dx on del cuerpo 1. dt , donde x1 es la posici´ dx2 x˙ 2 = dt , donde x2 es la posici´ on del cuerpo 2. vb1 = dxdtb1 , donde xb1 es la posici´ on del extremo del amortiguador que est´ a conectado al cuerpo 1. vb2 = dxdtb2 , donde xb2 es la posici´ on del extremo del amortiguador que est´ a conectado al cuerpo 2. on del extremo del resorte unido al cuerpo 1. v1 = dx dt , donde x es la posici´ dy v2 = dt , donde y es la posici´ on del extremo del resorte unido al cuerpo 2. vK1 = dxdtK1 , donde xK1 es la posici´ on del extremo m´ ovil del resorte conectado s´ olo al cuerpo 1.

2.6 Ejemplos

F(t)

x1

K1

x2

K2

m1

49

K3

m2

b (a)

F K2

v K1

F K2

x1 F K1

F K2

m1 F K1 F(t)

x2

F K2

v1

v2

Fb

m2

F K3

F K3

v K3

Fb Fb

v b1

Fb

v b2

(b) Diagrama de cuerpo libre. Figura 2.24. Sistema con dos cuerpos y tres resortes.

vK3 = dxdtK3 , donde xK3 es la posici´ on del extremo m´ ovil del resorte conectado s´ olo al cuerpo 2. Usando la figura 2.24(b), as´ı como (2.4), (2.7), (2.18), se obtienen las siguientes expresiones: masa 1: masa 2:

m1 x ¨1 = F (t) + FK1 − FK2 − Fb m2 x ¨2 = FK2 − FK3 + Fb

(2.61) (2.62)

resorte entre cuerpos: K2 xK2 = FK2 resorte izquierdo: K1 xK1 = FK1 resorte derecho: amortiguador:

K3 xK3 = FK3 b(vb1 − vb2 ) = Fb

Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.24(b) se tiene que: x˙ 1 = −vK1 = v1 = vb1

(2.63)

x˙ 2 = vb2 = v2 = vK3

De acuerdo a esto, si se definen x1 = 0, x2 = 0, xb1 = 0, xb2 = 0, x = 0, y = 0, xK1 = 0, xK3 = 0 como aquellos puntos ocupados por el centro del cuerpo 1, el centro del cuerpo 2, el extremo del amortiguador conectado al cuerpo 1, el extremo del amortiguador conectado al cuerpo 2, el extremo del resorte central que est´ a unido al cuerpo 1, el extremo del resorte central que est´ a unido al cuerpo 2, el extremo m´ ovil del resorte de la izquierda y el extremo m´ ovil del

50

2 Modelado matem´ atico de sistemas f´ısicos

resorte de la derecha, respectivamente, cuando todo el sistema est´ a en reposo con F (t) = 0, entonces se concluye que: x1 = −xK1 = x = xb1

(2.64)

x2 = xb2 = y = xK3

Por tanto, las expresiones en (2.61) y (2.62) se pueden escribir como: masa 1: masa 2:

m1 x ¨1 = F (t) + K1 xK1 − K2 xK2 − b(vb1 − vb2 ) m2 x ¨2 = K2 xK2 − K3 xK3 + b(vb1 − vb2 )

Usando (2.63) y (2.64) se obtiene: masa 1: masa 2:

m1 x ¨1 = F (t) − K1 x1 − K2 xK2 − b(x˙ 1 − x˙ 2 ) m2 x ¨2 = K2 xK2 − K3 x2 + b(x˙ 1 − x˙ 2 )

Por otro lado, de acuerdo al p´ arrafo que sigue a (2.6) se tiene que xK2 = x1 − x2 , por lo que se puede escribir: masa 1: masa 2:

m1 x ¨1 = F (t) − K1 x1 − K2 (x1 − x2 ) − b(x˙ 1 − x˙ 2 ) m2 x ¨2 = K2 (x1 − x2 ) − K3 x2 + b(x˙ 1 − x˙ 2 )

Finalmente, se obtiene que modelo matem´ atico correspondiente est´ a dado por las dos siguientes ecuaciones diferenciales, las cuales deben ser resueltas simult´ aneamente: masa 1: masa 2:

b (x˙ 1 − x˙ 2 ) + m1 b x ¨2 − (x˙ 1 − x˙ 2 ) + m2 x ¨1 +

K1 x1 + m1 K3 x2 − m2

K2 1 (x1 − x2 ) = F (t) m1 m1 K2 (x1 − x2 ) = 0 m2

Tal como ocurre en el ejemplo anterior, estas dos ecuaciones diferenciales no pueden ser combinadas para obtener una sola ecuaci´ on diferencial, ya que las variables x1 y x2 son linealmente independientes, es decir, no se cuenta con ninguna expresi´ on algebraica que relacione a estas variables. N´ otese tambi´en que los t´erminos correspondientes al resorte central y al amortiguador aparecen con signo contrario en cada una de estas ecuaciones diferenciales. Esto es debido a que la fuerza que produce el resorte central o el amortiguador sobre el cuerpo 1 es en sentido contrario a la fuerza que ejerce sobre el cuerpo 2. Ejemplo 2.6 En la figura 2.25(a) se muestra un cuerpo rotativo unido a dos muros a trav´es de un resorte y un amortiguador. Sobre este cuerpo se aplica un par externo T (t). En este caso, el amortiguador representa la fricci´ on existente entre el cuerpo y los rodamientos sobre los que se apoya. El resorte representa la flexibilidad del eje o flecha del cuerpo giratorio. El diagrama de cuerpo libre correspondiente se muestra en la figura 2.25(b). La nomenclatura utilizada es la siguiente:

2.6 Ejemplos

51

on angular del cuerpo. θ˙ = dθ dt , donde θ es la posici´ b ωb = dθ , donde θ es la posici´ on angular del extremo m´ ovil del amortib dt guador. θK = dθdtK , donde θK es la posici´ on angular del extremo m´ ovil del resorte. Usando la figura 2.25(b), as´ı como (2.8), (2.11), (2.21), se obtienen las siguientes expresiones: cuerpo giratorio: I θ¨ = T (t) + Tb − TK resorte: KθK = TK amortiguador:

(2.65)

bωb = Tb

b

K

I T(t) (a)

Tb

b

ò ò TK

Tb

TK

òK

I !b

T(t) (b) Diagrama de cuerpo libre.

Figura 2.25. Sistema masa-resorte-amortiguador rotativo.

N´ otese que los pares que se aplican sobre el cuerpo I y tienen el mismo ˙ aparecen afectados por un signo positivo en sentido que la velocidad angular θ, (2.65). En caso contrario aparecen afectados por un signo negativo, como es el caso de TK . Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.25(b) se tiene que: θ˙ = −ωb = θ˙K

(2.66)

De acuerdo a esto, si se definen θ = 0, θb = 0, θK = 0 como las posiciones angulares del cuerpo, el extremo m´ ovil del amortiguador y el extremo m´ ovil del resorte, respectivamente, cuando todo el sistema est´ a en reposo con T (t) = 0, entonces se concluye que: θ = −θb = θK Por tanto, las expresiones en (2.65) se pueden escribir como:

(2.67)

52

2 Modelado matem´ atico de sistemas f´ısicos

I θ¨ = T (t) + bωb − KθK = T (t) − bθ˙ − Kθ Finalmente, se obtiene que el modelo matem´ atico correspondiente est´ a dado por la siguiente ecuaci´ on diferencial: b K 1 θ¨ + θ˙ + θ = T (t) I I I

(2.68)

N´ otese que este modelo matem´ atico es id´entico al presentado en (2.53) para un sistema masa-resorte-amortiguador traslacional si se sustituye la inercia por la masa, la posici´ on angular θ por la posici´ on xm y el par externo T (t) por la fuerza externa F (t). Ejemplo 2.7 En la figura 2.26(a) se muestran dos cuerpos rotativos unidos por una cremallera. Sobre el cuerpo rotativo de la izquierda se aplica un par externo T (t). As´ı que se puede pensar que el cuerpo de la izquierda es un motor el cual debe transmitir movimiento al cuerpo rotativo de la derecha a trav´es de una cremallera. Siguiendo las convenciones de signo mostradas en las figuras 2.3, 2.5, 2.9 y 2.18 se obtienen los diagramas de cuerpo libre mostrados en las figuras 2.26(b) y 2.26(c). En la figura 2.26(b) se muestra la parte correspondiente a la conexi´ on de los dos cuerpos rotativos mediante dos adaptadores tipo pi˜ no ´n-cremallera, mientras que en la figura 2.26(c) se muestra el diagrama de cuerpo libre de cada uno de los cuerpos rotativos1 . La nomenclatura utilizada es la siguiente: on de la cremallera de masa m. vm = dxdtm , donde xm es la posici´ dθ1 ω1 = dt , donde θ1 es la posici´ on angular del cuerpo rotativo 1. 2 ω2 = dθ , donde θ es la posici´ on angular del cuerpo rotativo 2. 2 dt v1 es la velocidad traslacional que se produce en la cremallera como resultado de que el cuerpo 1 gira con velocidad ω1 . v2 es la velocidad traslacional que se produce en la cremallera como resultado de que el cuerpo 2 gira con velocidad ω2 . ωb1 = dθdtb1 , donde θb1 es la posici´ on angular del extremo m´ ovil del amortiguador unido al cuerpo rotativo 1 (fricci´ on del cuerpo 1 con los rodamientos). ωb2 = dθdtb2 , donde θb2 es la posici´ on angular del extremo m´ ovil del amortiguador unido al 2 (fricci´ on del cuerpo 2 con los rodamientos). b on del extremo del amortiguador unido a vb = dx dt , donde xb es la posici´ la cremallera m. Este amortiguador representa la fricci´ on de la cremallera con el suelo. 1

En un sistema pi˜ n´ on-cremallera debe utilizarse el principio de que a toda fuerza (o par) de acci´ on corresponde una fuerza (o par) de reacci´ on s´ olo en uno de los puertos, pues el par (o fuerza) en uno de los puertos es simplemente el reflejo de la fuerza (o par) en el otro puerto. V´ease tambi´en el ejemplo 2.9

2.6 Ejemplos

53

Motor

T(t)

I1

I2

Cremallera

m

(a)

T2

!1

T1

r

r

F1

F2

F1

w2

m

vm

v1

F2

v2

Fb

vb Fb (b) Diagrama de cuerpo libre.

T1 !1

T b1

b1

I1

! b1 T b1

T(t)

T2 !2

T b2

b2

I2 T b2 ! b2 (c) Diagrama de cuerpo libre (cont.). Figura 2.26. Dos cuerpos rotativos unidos por una cremallera.

Usando las figuras 2.26(b) y 2.26(c), as´ı como (2.4), (2.8), (2.18), (2.21), (2.34), (2.35) se obtienen las siguientes expresiones: inercia 1: inercia 2:

dω1 = T (t) + T1 − Tb1 dt dω2 = T2 − Tb2 I2 dt I1

(2.69) (2.70)

54

2 Modelado matem´ atico de sistemas f´ısicos

dvm = F1 − F2 + Fb dt amortiguador izquierdo: b1 ωb1 = Tb1 masa:

m

amortiguador derecho: b2 ωb2 = Tb2 amortiguador central: bvb = Fb pi˜ no ´n-cremallera izquierda: T1 = rF1 , pi˜ no ´n-cremallera derecha:

T2 = rF2 ,

(2.71)

v1 = rω1 v2 = rω2

(2.72) (2.73)

N´ otese que las fuerzas que tienen el mismo sentido que ω1 , ω2 y vm aparecen afectadas con un signo positivo en (2.69), (2.70), (2.71) y con un signo negativo en caso contrario. Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a las figuras 2.26(b) y 2.26(c) se tiene que: vm = −v1 = v2 = −vb ω1 = ωb1 , ω2 = ωb2

(2.74) (2.75)

De acuerdo a esto, si se definen xm = 0, θ1 = 0, θ2 = 0, xb = 0, θb1 = 0, θb2 = 0 como las posiciones de la cremallera, el cuerpo rotativo 1, el cuerpo rotativo 2 y los extremos m´ oviles de los amortiguadores conectados a la cremallera y a los cuerpos rotativos 1 y 2, respectivamente, cuando todo el sistema est´ a en reposo con T (t) = 0, entonces se concluye que: xm = −xb θ1 = θb1 ,

(2.76) θ2 = θb2

Por tanto, las expresiones en (2.69), (2.70) y (2.71) se pueden escribir como: inercia 1: inercia 2: masa:

dω1 = T (t) + rF1 − b1 ωb1 dt dω2 = rF2 − b2 ωb2 I2 dt dvm m = F1 − F2 + bvb dt I1

(2.77) (2.78) (2.79)

Recordando que v1 = −v2 , se pueden usar (2.72) y (2.73) para encontrar que ω1 = −ω2 . Entonces se puede usar este resultado as´ı como (2.75) para, restando (2.78) a (2.77), encontrar: (I1 + I2 )

dω1 = T (t) + r(F1 − F2 ) − (b1 + b2 )ω1 dt

(2.80)

Por otro lado, usando −vm = v1 = rω1 = vb se puede escribir (2.79) como −mr

dω1 = F1 − F2 − bvm dt

2.6 Ejemplos

55

Despejando F1 − F2 de esta expresi´ on y sustituyendo en (2.80) se obtiene finalmente: (I1 + I2 + mr2 )

dω1 = T (t) − (b1 + b2 + r2 b)ω1 dt

Esta ecuaci´ on diferencial representa el modelo matem´ atico del sistema en la figura 2.26(a). En este caso se pudieron combinar tres ecuaciones diferenciales distintas en una sola ecuaci´ on diferencial. Esto es debido a que las tres variables ω1 , ω2 y vm son linealmente dependientes pues est´ an relacionadas mediante las expresiones algebraicas −vm = rω1 = −rω2 . N´ otese tambi´en c´ omo el radio de los pi˜ nones interviene para adaptar i) la masa de la cremallera a la inercia equivalente que se produce sobre el eje de la inercia 1 e ii) la fricci´ on equivalente que sobre el eje de la inercia 1 produce la fricci´ on de la cremallera con el suelo. Ejemplo 2.8 En la figura 2.27(a) se muestran dos cuerpos rotativos unidos por un resorte. Sobre el cuerpo de la izquierda se aplica un par externo T (t). Entonces, el sistema mostrado en la figura 2.27(a) representa el caso de un motor (cuerpo de la izquierda) que mueve a una carga (cuerpo de la derecha) y que el eje que une a ambos cuerpos es flexible. Esta flexibilidad normalmente no es introducida intencionalmente, sino que es una caracter´ıstica no deseada que surge como resultado de la rigidez finita de los materiales con que se construye el eje que une al motor y la carga. En situaciones como esta es muy importante tomar en cuenta dicha flexibilidad para estudiar como afecta al desempe˜ no del sistema de control. Siguiendo las convenciones de signo mostradas en las figuras 2.5, 2.6 y 2.11 se obtiene el diagrama de cuerpo libre mostrado en la figura 2.27(b). La nomenclatura utilizada es la siguiente: 2 ω2 = dθ on angular del cuerpo 1. dt , donde θ2 es la posici´ dθ5 ω5 = dt , donde θ5 es la posici´ on angular del cuerpo 2. dθ1 ω1 = dt , donde θ1 es la posici´ on angular del extremo m´ ovil del amortiguador conectado al cuerpo 1. 6 ω6 = dθ on angular del extremo m´ ovil del amortidt , donde θ6 es la posici´ guador conectado al cuerpo 2. dθ4 3 ω3 = dθ dt y ω4 = dt , donde θ3 y θ4 son las posiciones angulares de los extremos del resorte.

Usando la figura 2.27(b), as´ı como (2.8), (2.11), (2.21), se obtienen las siguientes expresiones: cuerpo 1: cuerpo 2:

I1 ω˙ 2 = T (t) + T1 − T3 I2 ω˙ 5 = T4 − T6

amortiguador izquierdo: amortiguador derecho: resorte:

b1 ω 1 = T 1 b2 ω 6 = T 6

KxK = T3 = T4 ,

xK = θ3 − θ4

(2.81) (2.82)

56

2 Modelado matem´ atico de sistemas f´ısicos

b1

b2

K I2

I1 T(t) (a)

!2

!1 T1

T1

T3

!4

T3

T6

T4

T6

I2

I1 T(t)

!3

!5 T4 (b) Diagrama de cuerpo libre.

!6

Figura 2.27. Dos cuerpos rotativos unidos por un resorte.

donde la u ´ltima expresi´ on se obtiene de acuerdo al p´ arrafo que sigue a (2.10). N´ otese que, en las expresiones (2.81) y (2.82), los pares que tienen el mismo sentido que ω2 y ω5 aparecen afectadas con un signo positivo y con un signo negativo en caso contrario. Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.27(b) se tiene que: ω2 = −ω1 = ω3 ,

ω5 = ω 6 = ω 4

(2.83)

De acuerdo a esto, si se definen ω2 = 0, ω5 = 0, ω1 = 0, ω6 = 0, ω3 = 0 y ω4 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo m´ ovil del amortiguador izquierdo, del extremo m´ ovil del amortiguador derecho y de los extremos izquierdo y derecho del resorte, respectivamente, cuando todo el sistema est´ a en reposo con T (t) = 0, entonces se concluye que: θ2 = −θ1 = θ3 ,

θ5 = θ 6 = θ 4

(2.84)

Por tanto, las expresiones en (2.81) y (2.82) se pueden escribir como: cuerpo 1: cuerpo 2:

I1 ω˙ 2 = T (t) + b1 ω1 − K(θ3 − θ4 ) I2 ω˙ 5 = K(θ3 − θ4 ) − b2 ω6

Usando (2.83) y (2.84) se encuentra finalmente que el modelo matem´ atico est´ a dado por las siguientes dos ecuaciones diferenciales que deben ser resueltas simult´ aneamente: cuerpo 1: cuerpo 2:

I1 θ¨2 + b1 θ˙2 + K(θ2 − θ5 ) = T (t) I2 θ¨5 + b2 θ˙5 − K(θ2 − θ5 ) = 0

Estas dos ecuaciones diferenciales no pueden ser agrupadas en una sola porque las variables θ2 y θ5 son linealmente independientes, es decir, no se cuenta con una expresi´ on algebraica que relacione a estas dos variables.

2.6 Ejemplos

57

Ejemplo 2.9 En la figura 2.28(a) se muestran dos cuerpos rotativos unidos a trav´es de una caja de engranes. Sobre el cuerpo de la izquierda se aplica un par externo T (t), por lo que este sistema puede ser interpretado como un motor el´ectrico (cuerpo de la izquierda) que transmite movimiento a una carga (cuerpo de la derecha) a trav´es de una caja de engranes. Siguiendo las convenciones de signo mostradas en las figuras 2.5, 2.11, 2.17 se obtiene el diagrama de cuerpo libre mostrado en la figura 2.28(b)2 . La nomenclatura utilizada es la siguiente: ω = dθ on angular del cuerpo 1. dt , donde θ es la posici´ dθ4 ω4 = dt , donde θ4 es la posici´ on angular del cuerpo 2. ωb1 = dθdtb1 , donde θb1 es la posici´ on angular del extremo m´ ovil del amortiguador conectado al cuerpo 1. ωb2 = dθdtb2 , donde θb2 es la posici´ on angular del extremo m´ ovil del amortiguador conectado al cuerpo 2. ωn1 y ωn2 son las velocidades angulares en las ruedas dentadas que resultan del movimiento de los cuerpos 1 y 2. Tn1 y Tn2 son los pares que aparecen en las ruedas dentadas como resultado del movimiento de los cuerpos 1 y 2.

b 1 T(t)

n1

b2

I1 I2 n2 (a)

T b1 !

T b1

T n1 I1

! b1

T(t)

! n1 T n2

T3 !4

I2 ! n2 (b) Diagrama de cuerpo libre.

T b2

T b2

! b2

Figura 2.28. Dos cuerpos unidos a trav´es de una caja de engranes.

Usando la figura 2.28(b), as´ı como (2.8), (2.21), (2.32), (2.33) se obtienen las siguientes expresiones: cuerpo 1: 2

I1 ω˙ = T (t) − Tb1 − Tn1

(2.85)

En una caja de engranes debe utilizarse el principio de que a todo par de acci´ on corresponde un par de reacci´ on s´ olo en uno de los puertos, pues el par en uno de los puertos es simplemente el reflejo del par en el otro puerto. V´ease tambi´en el ejemplo 2.7

58

2 Modelado matem´ atico de sistemas f´ısicos

cuerpo 2: I2 ω˙ 4 = T3 + Tb2 amortiguador izquierdo: b1 ωb1 = Tb1 amortiguador derecho: engranes:

Tn1

b2 ωb2 = Tb2 n1 n2 = Tn2 , ωn1 = ωn2 , n2 n1

(2.86)

Tn2 = T3

(2.87)

donde la u ´ltima expresi´ on se debe a que, de acuerdo a la tercera ley de Newton, una acci´ on del cuerpo A sobre el cuerpo B produce una reacci´ on (en sentido contrario) del cuerpo B sobre el cuerpo A. N´ otese que, en las expresiones (2.85) y (2.86) los pares que tienen el mismo sentido que ω y ω4 aparecen afectadas con un signo positivo y con un signo negativo en caso contrario. Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.28(b) se tiene que: ω = ωb1 = −ωn1 ,

ω4 = −ωb2 = −ωn2

(2.88)

De acuerdo a esto, si se definen θ = 0, θ4 = 0, θb1 = 0, θb2 = 0, θn1 = 0, θn2 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo m´ ovil del amortiguador izquierdo, del extremo m´ ovil del amortiguador derecho, de la rueda dentada 1 y de la rueda dentada 2 cuando todo el sistema est´ a en reposo con T (t) = 0, entonces se concluye que: θ = θb1 = −θn1 ,

θ4 = −θb2 = −θn2

(2.89)

Por tanto, usando (2.88) y (2.89) las expresiones en (2.85) y (2.86) se pueden escribir como: n1 cuerpo 1: I1 ω˙ = T (t) − b1 ω − T3 (2.90) n2 (2.91) cuerpo 2: I2 ω˙ 4 = T3 − b2 θ˙4 Por otro lado, de (2.87) y (2.88) se tiene ω = nn21 ω4 . Usando esto, despejando T3 de (2.91), sustituyendo en (2.90) y despu´es de acomodar t´erminos se encuentra: Ã Ã µ ¶2 ! µ ¶2 ! n2 n2 n2 ¨ T (t) (2.92) I2 + I1 θ4 + b2 + b1 θ˙4 = n1 n1 n1 N´ otese que las dos ecuaciones diferenciales en (2.90) y (2.91) se han podido combinar en una sola ecuaci´ on gracias a que las variables ω y ω4 son linealmente dependientes pues est´ an relacionadas a trav´es de ω = nn12 ω4 . Esta ecuaci´ on diferencial representa el modelo matem´ atico buscado: si se conoce el par externo aplicado T (t) entonces se puede conocer la posici´ on θ4 del cuerpo 2 al resolver la ecuaci´ on diferencial anterior. Ejemplo 2.10 En la figura 2.29(a) se muestra el mismo mecanismo de la figura 2.26(a) (estudiado en el ejemplo 2.7) pero ahora la cremallera es flexible. Esta flexibilidad no se introduce de manera intencional, sino que es un

2.6 Ejemplos

59

problema no deseado que aparece debido a la rigidez finita del material con el que est´ a hecha la cremallera. Para encontrar el modelo matem´ atico en este caso se puede aprovechar el desarrollo realizado en el ejemplo 2.7. Es decir, se puede partir de las ecuaciones (2.77), (2.78) y (2.79), las cuales se reescriben a continuaci´ on para facilitar la referencia: inercia 1: inercia 2: masa:

dω1 = T (t) + rF1 − b1 ωb1 dt dω2 = rF2 − b2 ωb2 I2 dt dvm m = F1 − F2 + bvb dt I1

considerando ahora que, de acuerdo a la figura 2.29(b) y las convenciones en la figura 2.4 y (2.7): F1 = K1 (xA − xB ),

F2 = K2 (xC − xD )

con: dxB A vA = dx dt y vB = dt , donde xA y xB son las posiciones de los extremos del resorte de la izquierda. dxD C vC = dx dt y vD = dt , donde xC y xD son las posiciones de los extremos del resorte de la derecha.

I1

xm

K1

A

I2

K2

m

D

C

B (a)

v AB F1

F1

vA

K1

vB

v CD F2

F2

vC

K2

vD

(b) Flexibilidad en la cremallera. Figura 2.29. Sistema de transmisi´ on tipo cremallera con flexibilidad.

Entonces, usando esto y (2.74) y (2.75) se encuentra:

60

2 Modelado matem´ atico de sistemas f´ısicos

dω1 = T (t) + rK1 (xA − xB ) − b1 ω1 dt dω2 = rK2 (xC − xD ) − b2 ω2 I2 dt m¨ xm = K1 (xA − xB ) − K2 (xC − xD ) − bx˙ m

inercia 1:

I1

inercia 2: masa:

(2.93) (2.94) (2.95)

Por otro lado, de acuerdo a (2.72), (2.73), (2.74), (2.76) y considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas se encuentra que: xB = xC = xm ,

xA = −rθ1 ,

xD = rθ2

(2.96)

donde θ1 y θ2 son las posiciones angulares de las ruedas dentadas 1 y 2 definidas de acuerdo a la figura 2.26(b). Sustituyendo (2.96) en (2.93), (2.94) y (2.95): inercia 1: inercia 2: masa:

I1 θ¨1 + b1 θ˙1 − rK1 (−rθ1 − xm ) = T (t) I2 θ¨2 + b2 θ˙2 − rK2 (xm − rθ2 ) = 0 m¨ xm + bx˙ m − K1 (−rθ1 − xm ) + K2 (xm − rθ2 ) = 0

El modelo matem´ atico est´ a dado por estas tres ecuaciones diferenciales que deben ser resueltas simult´ aneamente. En este caso no se pueden combinar estas tres ecuaciones para obtener una sola ecuaci´ on diferencial equivalente debido a que las variables θ1 , θ2 y xm son linealmente independientes pues no se cuenta con una expresi´ on algebraica que relacione a estas tres variables. N´ otese que desde el punto de vista del modelado este es el efecto que introducen los dos resortes considerados en este ejemplo. Comp´ arese con el modelo matem´ atico obtenido en el ejemplo 2.7.

b1

n1

I1 T(t)

b2

K I2 n2 (a)

T n2

K !A

!B

T n2

(b) Flexibilidad en los engranes. Figura 2.30. Sistema de transmisi´ on con flexibilidad en la caja de engranes.

Ejemplo 2.11 En la figura 2.30(a) se muestran dos cuerpos giratorios conectados a trav´es de una caja de engranes y un resorte. El cuerpo del lado

2.6 Ejemplos

61

izquierdo recibe un par externo T (t). Por tanto, este ejemplo representa el caso de un motor (cuerpo izquierdo) que transmite movimiento a una carga (cuerpo derecho) a trav´es de una caja de engranes cuyos dientes son flexibles. Esta flexibilidad es un problema no deseado que, sin embargo, aparece en la pr´ actica debido a la rigidez finita del material con el que se hacen los engranes (acero). Para resolver este problema se puede aprovechar el desarrollo presentado en el ejemplo 2.9 para modelar el sistema mostrado en la figura 2.28(a). Por tanto, se puede regresar a las expresiones en (2.90) y (2.91), las cuales se reescriben a continuaci´ on para facilitar la referencia: cuerpo 1:

I1 ω˙ = T (t) − b1 ω −

cuerpo 2:

I2 ω˙ 4 = Tn2 − b2 θ˙4

n1 Tn2 n2

(2.97) (2.98)

pero ahora, de acuerdo a las figuras 2.30(b) y 2.6 y a (2.11): Tn2 = K(θA − θB ) donde ωA = θ˙A y ωB = θ˙B con θA y θB las posiciones angulares de los extremos del resorte. Por otro lado, de acuerdo a (2.87) se tiene que θ = nn21 θA , porque ωA = −ωn2 y ωn1 = −θ, donde θ y θA son las posiciones angulares del cuerpo 1 y del extremo del resorte conectado a la rueda dentada 2, seg´ un se define en la figura 2.30(b). N´ otese adem´ as que θB = θ4 . Sustituyendo todo esto en (2.97) y (2.98) se encuentra: ¶ µ n1 n1 ¨ ˙ K θ − θ4 = T (t) cuerpo 1: I1 θ + b 1 θ + n2 n2 µ ¶ n1 ˙ ¨ cuerpo 2: I2 θ 4 + b 2 θ 4 − K θ − θ4 = 0 n2 Estas dos ecuaciones diferenciales deben ser resueltas simult´ aneamente y representan el modelo matem´ atico buscado. N´ otese que estas dos ecuaciones diferenciales no pueden ser combinadas en una sola debido a que las variables θ y θ4 son linealmente independientes, es decir no se cuenta con una expresi´ on algebraica que relacione a estas variables. Esta es la principal diferencia con el problema resuelto en el ejemplo 2.9 y es debida a la introducci´ on del resorte en el presente ejemplo. Ejemplo 2.12 (tomado de [6], pp. 122). En la figura 2.31 se muestra un servomecanismo, es decir, se trata de un motor de CD con escobillas que se usa para mover un cuerpo de masa M atrav´es de una caja de engranes y de un adaptador del tipo pi˜ no ´n-cremallera. El cuerpo M se mueve sobre un plano horizontal, por lo que no es necesario tomar en consideraci´ on el efecto de la gravedad. Siguiendo las convenciones de signo mostradas en las figuras 2.5, 2.3, 2.11, 2.9, 2.17, 2.18, 2.19 se obtienen los diagramas de cuerpo libre mostrados en la figura 2.32. En la figura 2.32(a) se desglosan los componentes

62

2 Modelado matem´ atico de sistemas f´ısicos

el´ectricos del motor de CD, en la figura 2.32(b) se desglosan los componentes mec´ anicos del motor y la caja de engranes mientras que en la figura 2.32(c) se muestran los elementos que componen al sistema pi˜ no ´n-cremallera3 . N´ otese que se considera fricci´ on entre el motor y sus rodamientos as´ı como la fricci´ on entre el pi˜ no ´n y sus rodamientos y fricci´ on entre el cuerpo M y su soporte (o el suelo). La nomenclatura utilizada es la siguiente: on angular del motor. θ˙m = dθdtm , donde θm es la posici´ dθP ωP = dt , donde θP es la posici´ on angular del pi˜ no ´n. , donde x es la posici´ o n del cuerpo M . x˙ = dx dt ωb1 = dθdtb1 , donde θb1 es la posici´ on angular del extremo m´ ovil del amortiguador conectado al motor. on angular del extremo m´ ovil del amorωb2 = dθdtb2 , donde θb2 es la posici´ tiguador conectado al pi˜ no ´n. vb3 = dxdtb3 , donde xb3 es la posici´ on del extremo m´ ovil del amortiguador conectado al cuerpo M . ω1 y ω2 son las velocidades angulares en las ruedas dentadas resultantes del movimiento del motor y del pi˜ no ´n. u es el voltaje aplicado a la armadura del motor e i es la corriente que circula a trav´es de la armadura del motor. 3

V´eanse los pies de p´ agina correspondientes a los ejemplos 2.9 y 2.7

n1

+ u à

Piñon

Motor

b1

r

n2

Cremallera

M

b2

Figura 2.31. Servomecanismo.

2.6 Ejemplos

R + u

i

à

L + eb à

T

b1

n1 r IP

Im

b2

n2

M

b3 (a)

b1

T b1 T b1 ! b1

T1 !1 n 1

T

òm

T2 !2

Im n2

(b)

T b2

!P

!P

T b2

r

IP

! b2

T2

TP

v

F F x

M

F b3

v b3

F b3

(c) Figura 2.32. Diagrama de cuerpo libre correspondiente a la figura 2.31.

63

64

2 Modelado matem´ atico de sistemas f´ısicos

F , TP y v son la fuerza, el par y la velocidad traslacional que se producen en el sistema pi˜ no ´n-cremallera como resultado del movimiento del pi˜ no ´n y la masa M . Usando la figura 2.32, as´ı como (2.4), (2.8), (2.18), (2.21), (2.32), (2.33), (2.34), (2.35) se obtienen las siguientes expresiones: inercia motor: Im θ¨m = T − T1 − Tb1 inercia pi˜ no ´n: IP θ¨P = T2 + Tb2 + TP masa M : Mx ¨ = −F − Fb3

(2.99) (2.100) (2.101)

amortiguador masa M : b3 vb3 = Fb3 n1 n2 engranes: T1 = T 2 , ω1 = ω2 n2 n1 pi˜ no ´n-cremallera: v = rωP , TP = rF

(2.102)

amortiguador motor: amortiguador pi˜ no ´n:

b1 ωb1 = Tb1 b2 ωb2 = Tb2

(2.103)

N´ otese que, en las expresiones (2.99), (2.100) y (2.101), las fuerzas que tienen el mismo sentido que θ˙m , ωP y x˙ aparecen afectadas con un signo positivo y con un signo negativo en caso contrario. Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.32 se tiene que: v = x˙ = vb3 θ˙m = ωb1 = −ω1 ,

ω2 = ωb2 = −ωP

(2.104) (2.105)

De acuerdo a esto, si se definen x = 0, xb3 = 0, θm = 0, θb1 = 0, θb2 = 0 como las posiciones del cuerpo M , el extremo m´ ovil del amortiguador conectado al cuerpo M , el rotor del motor, el extremo m´ ovil del amortiguador conectado al rotor del motor y el extremo m´ ovil del amortiguador conectado al pi˜ no ´n, respectivamente, cuando todo el sistema est´ a en reposo con T = 0, entonces se concluye que: x = xb3

(2.106)

θm = θb1

(2.107)

Por tanto, las expresiones en (2.99), (2.100) y (2.101) se pueden escribir como: inercia motor: inercia pi˜ no ´n: masa M : Usando (2.104) y (2.105):

n1 T2 − b1 ωb1 Im θ¨m = T − n2 IP θ¨P = T2 + b2 ωb2 + rF Mx ¨ = −F − b3 vb3

2.6 Ejemplos

n1 T2 − b1 θ˙m n2 inercia pi˜ no ´n: IP θ¨P = T2 − b2 ωP + rF masa M : Mx ¨ = −F − b3 x˙ inercia motor:

Im θ¨m = T −

65

(2.108) (2.109) (2.110)

Por otro lado, de acuerdo a (2.102), (2.103), (2.104) y (2.105) se encuentra que θ˙m = nn12r x. ˙ Usando esto, despejando T2 de (2.109) y sustituyendo en (2.108): Im

n2 n1 n2 x ¨ + b1 x˙ = T − [IP ω˙ P + b2 ωP − rF ] n1 r n1 r n2

(2.111)

De (2.103) y (2.104) se tiene que x˙ = rωP . Usando esto en (2.111) y sustituyendo F de (2.110) se encuentra: ¶ µ ¶ µ n2 n2 n1 n1 n1 n1 Im x ¨ + b1 x˙ = T − IP + rM x ¨− b2 + rb3 x˙ n1 r n1 r n2 r n2 n2 r n2 Agrupando t´erminos se obtiene finalmente: ! ! Ã µ Ã µ ¶2 ¶2 n2 n2 1 1 n2 + IP 2 + M x ¨ + b1 + b2 2 + b3 x˙ = T Im n1 r r n1 r r n1 r (2.112) Por otro lado, usando la Ley de voltajes de Kirchhoff (v´ease el ejemplo 2.14) al circuito de la figura 2.32(a) se obtiene: L

di + Ri + eb = u dt

(2.113)

Usando (2.38), (2.39) y θ˙m = nn12r x˙ se encuentra que el voltaje inducido y el par generado est´ an dados como: n2 x, ˙ eb = ke θ˙m = ke n1 r

T = km i

Entonces, usando este resultado, (2.113) y (2.112) se encuentra, finalmente, que el modelo matem´ atico buscado est´ a representado por las dos ecuaciones diferenciales siguientes, las cuales deben ser resueltas simult´ aneamente: n2 di + Ri + ke x˙ = u (2.114) dt n1 r à µ ! ! à µ ¶2 ¶2 n2 n2 n2 1 1 Im + IP 2 + M x ¨ + b1 + b2 2 + b3 x˙ = km i n1 r r n1 r r n1 r L

(2.115) Otra manera de expresar este modelo matem´ atico es mediante una sola ecuaci´ on diferencial obtenida al combinar (2.114) y (2.115). Para esto, der´ıvese

66

2 Modelado matem´ atico de sistemas f´ısicos

di una vez respecto al tiempo a (2.115). Esto produce la aparici´ on de dt en el miembro derecho de la ecuaci´ on resultante. A continuaci´ on se sustituye el vadi obtenido al despejar de (2.114). Con esto se obtiene una ecuaci´ on lor de dt d3 x diferencial en t´erminos de de dt3 , x ¨, x˙ e i. Para eliminar i, se despeja esta variable de (2.115) y se sustituye. As´ı, se obtiene una ecuaci´ on diferencial de tercer orden en la variable x con el voltaje u como excitaci´ on. De este modo el modelo matem´ atico queda representado por una sola ecuaci´ on diferencial a partir de la cual se puede conocer la posici´ on x de la masa M si se conoce el voltaje u aplicado al motor. Se deja como ejercicio para el lector el realizar el procedimiento descrito.

Ejemplo 2.13 En la figura 2.33(a) se muestra un p´endulo simple donde θ representa la posici´ on angular del p´endulo respecto de la vertical y θ˙ = dθ dt . Se supone que toda la masa m del p´endulo est´ a concentrada en el extremo y que la varilla, de longitud l, no tiene masa (o ´esta es despreciable comparada con la masa m). El diagrama de cuerpo libre correspondiente se muestra en la figura 2.33(b). El p´endulo puede ser considerado un cuerpo rotativo de inercia: I = ml2 la cual corresponde a la inercia de una part´ıcula de masa m que describe un movimiento circular con un radio constante l [7], cap. 9. Se considera que sobre el p´endulo act´ uan tres pares: 1) el par externo T (t), 2) el par debido a la fricci´ on, Tb , existente en el punto de donde se sostiene el p´endulo y 3) el par debido a la fuerza de gravedad, Tg . De acuerdo a las figuras 2.33(a) y 2.33(b), el par Tg est´ a aplicado en sentido contrario a como se define θ y su magnitud es igual a: Tg = peso del p´endulo × brazo de palanca = mg × d, d = l sin(θ) = mgl sin(θ)

(2.116)

Usando la figura 2.33(b), as´ı como (2.8), (2.21), se obtienen las siguientes expresiones: cuerpo giratorio: amortiguador:

I θ¨ = T (t) + Tb − Tg

(2.117)

bωb = Tb

N´ otese que los pares que se aplican sobre el cuerpo I y tienen el mismo sentido ˙ aparecen afectados por un signo positivo en (2.117). que la velocidad angular θ, En caso contrario aparecen afectados por un signo negativo, como es el caso de Tg . Considerando que todos los elementos del sistema se conectan mediante uniones r´ıgidas entonces, de acuerdo a la figura 2.33(b) se tiene que: θ˙ = −ωb

(2.118)

2.6 Ejemplos

67

T(t)

l

ò

g

Tb

m

b d (a)

ò ò Tg

Tb

I !b

T(t)

(b) Diagrama de cuerpo libre. Figura 2.33. P´endulo simple.

Por tanto, si se definen θ = 0, θb = 0 (con ωb = θ˙b ) como las posiciones angulares del p´endulo y el extremo m´ ovil del amortiguador, respectivamente, cuando todo el sistema est´ a en reposo con T (t) = 0, entonces se concluye que: θ = −θb

(2.119)

Entonces, las expresiones en (2.117) y (2.116) se pueden escribir como: I θ¨ = T (t) + bωb − mgl sin(θ) = T (t) − bθ˙ − mgl sin(θ) Finalmente, se obtiene que el modelo matem´ atico correspondiente est´ a dado por la siguiente ecuaci´ on diferencial: ml2 θ¨ + bθ˙ + mgl sin(θ) = T (t) N´ otese que esta es una ecuaci´ on diferencial de segundo orden pero no lineal, caracter´ıstica que es debida al hecho de que aparece la funci´ on sin(θ). En la secci´ on 7.2 del cap´ıtulo 7 se explica la manera de manipular este tipo de ecuaciones diferenciales. M´ as a´ un, en los cap´ıtulos 11, 13 y 14 se muestra como dise˜ nar controladores para este tipo de ecuaciones diferenciales. Ejemplo 2.14 En la figura 2.34(a) se muestra un circuito RLC conectado en serie y alimentado con una fuente de voltaje. La manera de relacionar a los elementos del circuito en este tipo de conexi´ on el´ectrica es usando la Ley de Kirchhoff de voltajes [8], p´ ag. 67: Propiedad 2.1 Ley de Kirchhoff de voltajes. La suma de los voltajes alrededor de un trayecto cerrado es igual a cero. Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene el diagrama mostrado en la figura 2.34(b). Entonces, a partir de esta figura y

68

2 Modelado matem´ atico de sistemas f´ısicos

L

C +

vi

R

à (a)

+

vC à

+

C

+

à

vL L

i

vi

à

R

(b)

+

vR

à

Figura 2.34. Circuito RLC conectado en serie.

usando (2.12), (2.13), (2.15), (2.16), (2.22) as´ı como la Ley de Kirchhoff de voltajes se obtiene: vi = v L + v R + v C Z t q i(r)dr, si q(0) = 0 (2.120) vC = , q = C 0 dλ vL = , λ = Li (2.121) dt dq (2.122) vR = iR, i = dt N´ otese que la corriente el´ectrica que circula por todos los componentes del circuito es la misma. Por tanto: vi = L

dq 1 d2 q +R + q 2 dt dt C

(2.123)

o bi´en: vi = L

1 di + Ri + dt C

Z

t

i(r)dr

(2.124)

0

El modelo matem´ atico correspondiente est´ a representado por cualquiera de las expresiones en (2.123) o (2.124). A partir de (2.122) se observa que existe una relaci´ on algebraica (y lineal, adem´ as) entre el voltaje en una resistencia y la corriente a trav´es de la misma: vR = iR. N´ otese que la resistencia R es el factor constante que relaciona

2.6 Ejemplos

69

corriente y voltaje en una resistencia viR = R. Este hecho motiva el cuestionarse si acaso existe una relaci´ on similar entre la corriente y el voltaje en un inductor y en un capacitor. Sin embargo, a partir de (2.120) y (2.121) se observa que, a menos que se introduzca alg´ un artificio matem´ atico, esto no es posible por que est´ an de por medio una derivada y una integral. Entonces, el artificio matem´ atico que se usa es la transformada de Laplace ya que ´esta tiene las siguientes propiedades: ¾ ½Z t ½ ¾ 1 dx x(r)dr = X(s), si x(0)=0 (2.125) = sX(s), L L dt s 0 donde X(s) es la transformada de Laplace de x(t), es decir L{x(t)} = X(s). Por tanto, a partir de (2.120) y (2.121) se obtiene, mediante el uso de la transformada de Laplace y considerando todas las condiciones iniciales iguales a cero: 1 I(s) sC VL (s) = sLI(s)

VC (s) =

donde L{vC (t)} = VC (s), L{vL (t)} = VL (s) y L{i(t)} = I(s). Por tanto, ahora se tiene una relaci´ on algebraica entre las transformadas de Laplace de los voltajes y las corrientes en un inductor y un capacitor. Al factor que relaciona a estas variables se le denomina “impedancia” y se representa como: Z(s) =

V (s) I(s)

(2.126)

Es decir, la impedancia de un inductor es: ZL (s) =

VL (s) = sL I(s)

(2.127)

mientras que la impedancia en un capacitor es: ZC (s) =

1 VC (s) = I(s) sC

(2.128)

Entonces, usando la transformada de Laplace y el concepto de impedancia se puede escribir el modelo matem´ atico en (2.124) como: 1 I(s) sC Vi (s) = ZL (s)I(s) + RI(s) + ZC (s)I(s) Vi (s) = (ZL (s) + R + ZC (s))I(s) Vi (s) = sLI(s) + RI(s) +

lo cual motiva el definir la impedancia total del circuito serie como:

70

2 Modelado matem´ atico de sistemas f´ısicos

Zt (s) = ZL (s) + R + ZC (s) 1 Vi (s) Zt (s) = sL + R + , Zt (s) = sC I(s)

(2.129)

Con lo anterior se prueba una propiedad importante en circuitos el´ectricos conectados en serie: Propiedad 2.2 La impedancia total de un circuito serie es igual a la suma de las impedancias de todos los elementos conectados en serie. El concepto de impedancia es muy importante en circuitos el´ectricos y es una de las herramientas que normalmente se utilizan para modelar y analizar circuitos en ingenier´ıa. Es decir, las expresiones en (2.129) tambi´en representan el modelo matem´ atico del circuito en la figura 2.34(a). Ejemplo 2.15 En la figura 2.35(a) se muestra un circuito RLC conectado en paralelo y alimentado con una fuente de corriente. La manera de relacionar los componentes del circuito en este tipo de conexi´ on el´ectrica es usando la Ley de Kirchhoff de corrientes [8], p´ ag. 68: Propiedad 2.3 Ley de Kirchhoff de corrientes.. La suma de las corrientes que entran a un nodo es igual a la suma de las corrientes que salen del mismo nodo.

L

ii

C

R

(a)

+ ii

iL

L

iC

C

iR

(b)

R

v

à

Figura 2.35. Circuito RLC conectado en paralelo.

Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene el diagrama mostrado en la figura 2.35(b). Entonces, a partir de esta figura y

2.6 Ejemplos

71

usando (2.12), (2.13), (2.15), (2.16), (2.22) as´ı como la Ley de Kirchhoff de corrientes se obtiene: ii = iL + iR + iC Z t dv iC (r)dr, si q(0) = 0 ⇒ iC = C q = vC, q = dt 0 Z 1 t diL iL = v(r)dr, v = L L 0 dt v iR = R

(2.130) (2.131) (2.132)

N´ otese que el voltaje es el mismo en todos los componentes del circuito. Por tanto, el modelo matem´ atico est´ a representado por: Z t v dv 1 v(r)dr + + C (2.133) ii = L 0 R dt A partir de (2.130) y (2.131) se obtiene, mediante el uso de la transformada de Laplace (v´ease (2.125)) y considerando todas las condiciones iniciales iguales a cero: IC (s) = sCV (s) 1 V (s) IL (s) = sL donde L{iC (t)} = IC (s), L{iL (t)} = IL (s) y L{v(t)} = V (s). Al factor que relaciona a las transformadas de Laplace de la corriente y el voltaje en un elemento de circuito se le denomina “admitancia” y se representa como: Y (s) =

I(s) V (s)

(2.134)

Es decir, la admitancia de un inductor es: YL (s) =

1 IL (s) = V (s) sL

(2.135)

mientras que la admitancia en un capacitor es: YC (s) =

IC (s) = sC V (s)

(2.136)

Entonces, usando la transformada de Laplace y el concepto de admitancia se puede escribir el modelo matem´ atico en (2.133) como: 1 1 V (s) + V (s) + sCV (s) sL R 1 Ii (s) = YL (s)V (s) + V (s) + YC (s)V (s) R 1 Ii (s) = (YL (s) + + YC (s))V (s) R Ii (s) =

72

2 Modelado matem´ atico de sistemas f´ısicos

lo cual motiva el definir la admitancia total del circuito en paralelo como: YT (s) = YL (s) + YT (s) =

1 + YC (s) R

1 1 + + sC, sL R

YT (s) =

Ii (s) V (s)

(2.137)

Con lo anterior se prueba una propiedad importante en circuitos el´ectricos conectados en paralelo: Propiedad 2.4 La admitancia total de un circuito en paralelo es igual a la suma de las admitancias de todos los elementos conectados en paralelo. El concepto de admitancia es muy importante en circuitos el´ectricos y es la otra herramienta que normalmente se utiliza para modelar y analizar circuitos en ingenier´ıa. Es decir, las expresiones en (2.137) tambi´en representan el modelo matem´ atico del circuito en la figura 2.35(a). A partir de las definiciones de impedancia y admitancia en (2.126) y (2.134) es claro que la admitancia es la inversa de la impedancia, es decir: Y (s) =

1 Z(s)

(2.138)

Esto tambi´en se comprueba al comparar las definiciones de impedancia y admitancia en un inductor y un capacitor mostradas en (2.127), (2.128), (2.135) y (2.136). Entonces, a partir de (2.137) se puede escribir: 1 1 1 1 = + + , ZT (s) ZL (s) R ZC (s)

YT (s) =

1 ZT (s)

donde ZT (s) representa la impedancia total del circuito conectado en paralelo mostrado en la figura 2.35(a). No debe relacionarse ZT (s) con Zt (s) definida en (2.129) como la impedancia total del circuito conectado en serie mostrado en la figura 2.34(a). Generalizando la expresi´ on anterior al caso en que se tienen n elementos de circuito conectados en paralelo, se encuentra la siguiente expresi´ on general para el c´ alculo de la impedancia total de n elementos conectados en paralelo: 1 1 1 1 = + + ... + ZT (s) Z1 (s) Z2 (s) Zn (s)

(2.139)

En el caso en que s´ olo dos elementos de circuito est´ an conectado en paralelo es f´ acil comprobar que la expresi´ on anterior se reduce a: ZT (s) =

Z1 (s)Z2 (s) Z1 (s) + Z2 (s)

(2.140)

2.6 Ejemplos

I(s)

R

73

C +

+

V i (s)

C

V o (s)

R

à

à Figura 2.36. Circuito RC serie-paralelo.

Ejemplo 2.16 Considere el circuito mostrado en la figura 2.36. Si Vo (s) es el voltaje en las terminales de los elementos de circuito conectados en paralelo y si Zp (s) es la impedancia total de estos dos elementos conectados en paralelo, se puede escribir: Vo (s) I(s) 1 R sC R Zp (s) = 1 = RCs + 1 R + sC Zp (s) =

(2.141)

donde se ha usado (2.140) para calcular la impedancia de dos elementos conectados en paralelo. N´ otese que I(s) es la corriente total a trav´es de los dos elementos conectados en paralelo. Por otro lado, si Zsp (s) es la impedancia total del circuito serie-paralelo, es decir, la impedancia medida en las terminales donde se aplica el voltaje Vi (s), entonces se puede escribir: Zsp (s) =

Vi (s) I(s)

Zsp (s) = R +

(2.142)

1 R + sC RCs + 1

donde se ha usado el hecho de que la impedancia total de elementos conectados en serie es igual a la suma de las impedancias de cada elemento y que la impedancia de los dos elementos en paralelo est´ a dada en (2.141). Combinando las expresiones en (2.141) y (2.142) obtiene: Zp (s) Vo (s) = GT (s) = = Vi (s) Zsp (s) R+

R RCs+1 1 R sC + RCs+1

por lo que se puede escribir: Ts Vo (s) = GT (s) = 2 2 , Vi (s) T s + 3T s + 1

T = RC

(2.143)

N´ otese que GT (s) no es una impedancia ya que est´ a dada como el cociente de dos impedancias y el cociente de dos voltajes.

74

2 Modelado matem´ atico de sistemas f´ısicos

Ejemplo 2.17 Considere el circuito mostrado en la figura 2.37. A continuaci´ on se muestra como obtener la relaci´ on F (s) = VV21 (s) (s) . Primero se definen los tres trayectos cerrados (o mallas) mostrados en la figura 2.37, por los cuales circulan las corrientes de malla I1 (s), I2 (s) e I3 (s). A continuaci´ on se utiliza la siguiente regla para aplicar la Ley de Kirchhoff de voltajes: “Considere la malla i. La suma algebraica de los voltajes en todos los elementos de circuito en la malla i se iguala a cero. El voltaje en un elemento de circuito es el producto de su impedancia por la suma algebraica de las corrientes de malla en ese elemento de circuito. La corriente de malla i siempre se ve afectada con un signo “+” y las corrientes que van en sentido opuesto se afectan con un signo “−”. El voltaje en una fuente de voltaje se afecta con un signo “+” si la corriente de la malla i pasa atrav´es de la fuente de un signo “+” a un signo “−” y se afecta con un signo “−” en caso contrario. ” Esta regla constituye la base del m´etodo de an´ alisis de mallas utilizado para el an´ alisis de circuitos en ingenier´ıa. Se recomienda consultar las referencias [9] y [8] para una exposici´ on m´ as amplia del m´etodo. Usando esta regla en cada una de las mallas mostradas en la figura 2.37 se obtiene:

C

C

C

+ V 1(s)

+

I1

R

I2

R

I3

R

à

V 2(s) à

Figura 2.37. Red RC de defasaje.

1 + (I1 (s) − I2 (s))R = V1 (s) (2.144) sC 1 (I2 (s) − I1 (s))R + I2 (s) + (I2 (s) − I3 (s))R = 0 sC 1 + V2 (s) = 0, V2 (s) = RI3 (s) (I3 (s) − I2 (s))R + I3 (s) sC I1 (s)

De la tercera ecuaci´ on en (2.144) se obtiene: µ ¶ 1 1 I2 (s)R = R+ V2 (s) + V2 (s) R sC

(2.145)

on mostrada en (2.144) Sustituyendo esto e I3 (s) = V2R(s) en la segunda ecuaci´ se obtiene una expresi´ on que permite calcular I1 (s) en funci´ on de V2 (s) solamente. Sustituyendo este valor de I1 (s) e I2 (s) dado en (2.145) en la primera

2.6 Ejemplos

75

ecuaci´ on mostrada en (2.144) se obtiene V1 (s) como funci´ on de V2 (s) solamente. Finalmente, acomodando t´erminos convenientemente se obtiene la expresi´ on buscada: V2 (s) R3 C 3 s3 = 3 3 3 = F (s) V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

(2.146)

Ejemplo 2.18 Un convertidor electr´ onico de potencia de CD/CD es un circuito que en su entrada recibe un voltaje de CD y en su salida entrega otro voltaje de CD pero de valor diferente al recibido en su entrada. En la figura 2.38(a) se muestra el circuito de un convertidor electr´ onico de potencia de CD/CD tipo Boost o elevador de voltaje. Esto significa que el voltaje de CD en la salida del convertidor es mayor que el voltaje de CD en su entrada. Se puede observar que la construcci´ on del sistema se realiza mediante dispositivos semiconductores (transistor-diodo). El transistor Q tiene dos posibles estados: el estado apagado (corte) u = 0, y el estado encendido (saturaci´ on) u = 1. En el estado apagado el diodo D se polariza directamente, y permite el paso de la energ´ıa entre la fuente de voltaje E y la carga del sistema R. En el estado encendido el diodo D se polariza inversamente, y en consecuencia no existe conexi´ on entre la fuente de voltaje E y la carga del sistema R. El modelo matem´ atico asociado al convertidor de potencia de CD/CD Boost est´ a definido por: di = E − (1 − u)υ dt υ dυ = (1 − u)i − C dt R L

(2.147) (2.148)

donde i es la corriente el´ectrica a trav´es del inductor L, v es el voltaje en las terminales del capacitor C y la constante E representa el voltaje de CD que se aplica en la entrada del sistema. Este sistema tiene por salida v, el cual tiene la caracter´ıstica de satisfacer la siguiente desigualdad υ ≥ E. La entrada de control u representa la funci´ on de posici´ on del interruptor, la cual es una se˜ nal que s´ olo toma el valor de 0 o de 1. Para la obtenci´ on del modelo matem´ atico del convertidor de potencia de CD/CD Boost (2.147)-(2.148) y el an´ alisis del mismo, se introduce el concepto de interruptor ideal, mostrado en la figura 2.38(b). En este circuito el interruptor ideal tiene dos posibles posiciones: el caso en el cual u = 0 que corresponde al circuito equivalente mostrado en la figura 2.39(a), asociado al hecho de que el transistor Q este apagado. Mientras que para el caso u = 1, el circuito equivalente que se obtiene es el mostrado en la figura 2.39(b), estando el transistor Q encendido. Partiendo de los circuitos equivalentes mostrados en las figuras 2.39(a) y 2.39(b), el empleo de la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kirchhoff de Corrientes (LCK), se procede a la obtenci´ on del modelo matem´ atico asociado al convertidor de potencia de CD/CD Boost:

76

2 Modelado matem´ atico de sistemas f´ısicos

L

i

D

E (a) Construcci´ on transistor-diodo.

del

L

i

R

v

Q

convertidor

mediante

u

E

v

u

R

C

(b) Convertidor con interruptor ideal. Figura 2.38. Convertidor de potencia conmutado de CD/CD Boost.

L

i

a

E

v

I

R

C

(a) Interruptor colocado en u = 0.

i E

L a

v

I

C

R

(b) Interruptor colocado en u = 1. Figura 2.39. Circuitos equivalentes del convertidor de CD/CD Boost.

Para el caso en el cual u = 0, el circuito equivalente es el mostrado en la figura 2.39(a). Aplicando la LVK a la malla I y la LCK al nodo a de mencionada figura, se obtienen respectivamente las relaciones din´ amicas que gobiernan a la corriente i y al voltaje v: di = E−υ dt υ dυ = i− C dt R L

(2.149) (2.150)

Para el caso en el cual u = 1, se obtiene el circuito equivalente mostrado en la figura 2.39(b). De igual manera, aplicando la LVK a la malla I y

2.6 Ejemplos

77

la LCK al nodo a de la figura en cuesti´ on, las ecuaciones que se obtienen para la corriente i y el voltaje v, respectivamente son: di =E dt υ dυ =− C dt R L

(2.151) (2.152)

Mediante simple inspecci´ on se pueden relacionar las ecuaciones obtenidas en los circuitos equivalentes, mostrados en las figuras 2.39(a) y 2.39(b), a trav´es de la variable u, de la siguiente manera: di = E − (1 − u)υ dt υ dυ = (1 − u)i − C dt R L

(2.153) (2.154)

ya que cuando u = 0 o u = 1, se generan los sistemas (2.149)-(2.150) y (2.151)-(2.152), respectivamente. De esta forma, el modelo matem´ atico del convertidor de potencia de CD/CD Boost est´ a determinado por el sistema de ecuaciones diferenciales no lineales (2.153)-(2.154). A este conjunto de ecuaciones se le denomina modelo conmutado, que hace referencia al hecho de que la posici´ on del interruptor u s´ olo puede tomar el valor de 0 o de 1. Con la intenci´ on de conocer el valor en estado estacionario de las variables asociadas al sistema (2.153)-(2.154), se parte del modelo promedio del convertidor. En este modelo se supone que la conmutaci´ on (encendido-apagado) del transistor ocurre a muy alta frecuencia de modo que se puede expresar el modelo en t´erminos de variables promedio, es decir: di = E − (1 − uav )υ dt υ dυ = (1 − uav )i − C dt R L

(2.155) (2.156)

donde i y υ representan, respectivamente, la corriente y el voltaje promedio en el inductor y el capacitor. Mientras que la entrada uav ahora denota la entrada de control promedio, la cual puede tomar valores en el intervalo continuo [0,1), siendo esta la funci´ on de posici´ on promedio del interruptor. Como consecuencia de imponer que la entrada del convertidor sea uav = di U = constante, se encuentra que en estado estacionario (cuando dt = 0 y dυ dt = 0) el sistema (2.155)-(2.156) genera que: · ¸· ¸ · ¸ 0 (1 − U ) E i = (2.157) 0 (1 − U ) − R1 υ As´ı, resolviendo (2.157) se encuentra que en estado estacionario i y υ satisfacen las siguientes relaciones:

78

2 Modelado matem´ atico de sistemas f´ısicos

1 E R (1 − U )2 E υ= (1 − U ) i=

(2.158) (2.159)

De esta manera, a partir de las relaciones en estado estacionario, determinadas por (2.158)-(2.159), es claro que se tiene la siguiente relaci´ on est´ atica (en estado estacionario) promedio: H(U ) =

υ 1 = E (1 − U )

(2.160)

υ es mayor o igual a uno, De (2.160) se puede observar que el cociente E pues U ∈ [0, 1), de ah´ı que a este convertidor se le conozca como elevador de voltaje. Finalmente, en la figura 2.40 se puede observar la curva caracter´ıstica est´ atica del convertidor Boost, donde claramente se ve cumplida la desigualdad υ ≥ E. 10 9 8

H(U)

7 6 5 4 3 2 1 0

0

0.2

0.4

0.6

0.8

1

U Figura 2.40. Ganancia de voltaje est´ atico del convertidor de potencia Boost.

Ejemplo 2.19 El circuito de un convertidor de potencia de CD/CD tipo Boost-Boost ideal, es decir sintetizado con interruptores, se muestra en la figura 2.41. Mientras que el circuito pr´ actico es el que se muestra en la figura 2.42. En el sistema mostrado en la figura 2.41 las entradas u1 y u2 s´ olo pueden tomar el valor de 0 o de 1, que corresponden f´ısicamente a la posici´ on de los interruptores (v´ease la figura 2.41). Estas posiciones en la pr´ actica se efect´ uan por medio de transistores en modo de operaci´ on de corte/saturaci´ on, como se ilustra en figura 2.42. Cabe mencionar que el estado de corte de los transistores equivale al caso en el que u1 = 0, u2 = 0, y el estado de saturaci´ on de los transistores equivale a tener u1 = 1, u2 = 1 en la figura 2.41.

2.6 Ejemplos

79

Figura 2.41. Circuito del convertidor de potencia de CD/CD Boost-Boost ideal.

Figura 2.42. Circuito del convertidor de potencia de CD/CD Boost-Boost real.

El resto de las variables involucradas en el sistema de la figura 2.41 son: i1 , υ1 , i2 y υ2 , las cuales corresponden a las corrientes y voltajes, respectivamente, asociados a L1 , C1 , L2 y C2 . Asimismo, la constante E representa el voltaje de CD aplicado a la entrada del convertidor y υ2 la salida, misma que entrega un voltaje amplificado que satisface la siguiente relaci´ on: υ2 ≥ E, lo cual quedar´ a demostrado cuando se realice un an´ alisis en estado permanente del sistema Boost-Boost, a partir de la obtenci´ on de su modelo matem´ atico. Partiendo de la figura 2.41 o 2.42 se procede a obtener el modelo matem´ atico que describe la evoluci´ on del sistema a lo largo del tiempo con la ayuda de la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kirchhoff de Corrientes (LCK). Para esto, se consideran los cuatro casos diferentes que pueden suscitarse de los dos posibles estados que toma cada transistor (encendido o apagado), generando cuatro circuitos equivalentes, cada uno representado por subsistemas de ecuaciones diferenciales lineales de cuarto orden. Finalmente, estos subsistemas se hacen comulgar en un solo sistema diferencial de cuarto orden no lineal que constituye el modelo matem´ atico final del convertidor Boost-Boost. A continuaci´ on se muestra tal proceso. a) Para el caso en el cual los transistores Q1 y Q2 est´ an encendidos, i. e., u1 = 1 y u2 = 1 (v´ease la figura 2.41), el circuito equivalente es el que muestra en la figura 2.43(a). Aplicando la LVK a las mallas I y II de la figura 2.43(a) se obtienen las ecuaciones que gobiernan a las corrientes i1 e i2 , respectivamente determinadas por: di1 = E, dt di2 = υ1 . L2 dt L1

(2.161) (2.162)

Por otro lado, aplicando la LCK a los nodos A y B de la figura 2.43(a), se obtienen las ecuaciones diferenciales asociadas a los voltajes υ1 y υ2 , dadas

80

2 Modelado matem´ atico de sistemas f´ısicos

por: dυ1 υ1 =− − i2 , dt R1 dυ2 υ2 C2 =− . dt RL

C1

(2.163) (2.164)

b) Para el caso en el que Q1 est´ a encendido y Q2 apagado, i. e., u1 = 1 y u2 = 0, a partir de la figura 2.41, el circuito equivalente es el que muestra en la figura 2.43(b). Aplicando la LVK a las mallas I y II de la figura 2.43(b) se obtienen las ecuaciones para i1 e i2 respectivamente: di1 = E, dt di2 = υ1 − υ2 . L2 dt L1

(2.165) (2.166)

De igual forma, aplicando la LCK en los nodos A y B de la figura 2.43(b), se obtienen las ecuaciones que gobiernan a los voltajes υ1 y υ2 : dυ1 υ1 − i2 , =− dt R1 υ2 dυ2 = i2 (t) − . C2 dt RL C1

(2.167) (2.168)

c) Cuando Q1 est´ a apagado y Q2 encendido, i. e., u1 = 0 y u2 = 1, el circuito resultante es el que muestra en la figura 2.43(c) y aplicando la LVK en las mallas I y II, se logra el planteamiento de las ecuaciones que describen el comportamiento de las corrientes i1 e i2 respectivamente: di1 = −υ1 + E, dt di2 = υ1 . L2 dt L1

(2.169) (2.170)

Asimismo, vali´endose de la LCK para los nodos A y B de la figura 2.43(c), se tiene lo siguiente: dυ1 υ1 = i1 − − i2 , dt R1 dυ2 υ2 C2 =− . dt RL C1

(2.171) (2.172)

d) Finalmente, cuando u1 = 0 y u2 = 0, el cual corresponde al caso en el que los transistores se encuentran apagados, el circuito equivalente es el que se muestra en la figura 2.43(d). Para obtener las ecuaciones que gobiernan a los voltajes y corrientes ilustrados en la figura 2.43(d), de igual forma, se aplica la LVK para las mallas I y II obteniendo lo siguiente:

2.6 Ejemplos

di1 = −υ1 + E, dt di2 = υ1 − υ 2 . L2 dt L1

81

(2.173) (2.174)

Mientras que, aplicando la LCK para los nodos A y B, se tiene: dυ1 = i1 − dt dυ2 C2 = i2 − dt

C1

υ1 − i2 , R1 υ2 . RL

(2.175) (2.176)

As´ı, mediante inspecci´ on, al comparar las ecuaciones (2.161)-(2.162), (2.165)-(2.166), (2.169)-(2.170) y (2.173)-(2.174), se producen como resultado las ecuaciones que gobiernan el comportamiento de i1 e i2 , determinadas respectivamente por (2.177) y (2.179). Realizando un proceso similar para las variables υ1 y υ2 , determinadas por las ecuaciones (2.163)-(2.164), (2.167)(2.168), (2.171)-(2.172) y (2.175)-(2.176), se obtienen las ecuaciones (2.178) y (2.180) respectivamente. De esta manera, el modelo matem´ atico del convertidor Boost-Boost queda determinado por el sistema de ecuaciones diferenciales de cuarto orden no lineal, siguiente: di1 dt dυ1 C1 dt di2 L2 dt dυ2 C2 dt L1

= −(1 − u1 )υ1 + E, = (1 − u1 )i1 −

υ1 − i2 , R1

= υ1 − (1 − u2 )υ2 , = (1 − u2 )i2 −

υ2 . RL

(2.177) (2.178) (2.179) (2.180)

As´ı, las ecuaciones (2.177)-(2.180) constituyen el modelo matem´ atico del convertidor de potencia Boost-Boost. Si se desea corroborar que estas ecuaciones reproducen los cuatro modos de operaci´ on del convertidor (o circuitos equivalentes de la figura 2.43), basta con asignarle los valores correspondientes a las entradas u1 y u2 . Con la finalidad de conocer las propiedades del convertidor de potencia Boost-Boost en estado estacionario se parte de su modelo promedio asociado, el cual se obtiene suponiendo que ambos transistores conmutan a alta frecuencia y est´ a determinado como: d¯i1 = −(1 − u1av )¯ υ1 + E, dt υ¯1 ¯ d¯ υ1 = (1 − u1av )¯i1 − − i2 , C1 dt R1 d¯i2 L2 = υ¯1 − (1 − u2av )¯ υ2 , dt L1

(2.181) (2.182) (2.183)

82

2 Modelado matem´ atico de sistemas f´ısicos

(a) Circuito equivalente del convertidor de potencia Boost-Boost cuando u1 = 1 y u2 = 1.

(b) Circuito equivalente del convertidor de potencia Boost-Boost cuando u1 = 1 y u2 = 0.

(c) Circuito equivalente del convertidor de potencia Boost-Boost para u1 = 0 y u2 = 1.

(d) Circuito equivalente del convertidor de potencia Boost-Boost cuando u1 = 0 y u2 = 0. Figura 2.43. Modos de operaci´ on del convertidor de potencia de CD/CD BoostBoost.

C2

d¯ υ2 υ¯2 = (1 − u2av )¯i2 − , dt RL

(2.184)

donde ¯i1 , υ¯1 , ¯i2 y υ¯2 representan las corrientes y los voltajes promedio asociados a L1 , C1 , L2 y C2 respectivamente. Las entradas u1av y u2av representan las entradas de control promedio, las cuales pueden tomar valores en el intervalo continuo [0, 1), siendo estas las funciones de posici´ on promedio de los interruptores. De esta manera, partiendo del modelo promedio (2.181)-(2.184), se procede a obtener los valores en estado estacionario del sistema que aparecen cuando las entradas del convertidor u ¯1av y u ¯2av son constantes en alg´ un valor dentro ¯ υ1 d¯i2 del intervalo [0, 1). Esto se consigue suponiendo que ddti1 = 0, d¯ dt = 0, dt = 0

2.7 Caso de estudio

y

83

d¯ υ2 dt

= 0, para encontrar:      0 −(1 − u ¯1av ) 0 0 −E ¯ı1 1   υ¯1   0   (1 − u −1 0 ¯1av ) − R1 ,   =    0 1 0 −(1 − u ¯2av )   ¯ı2   0  υ¯2 0 0 0 (1 − u ¯2av ) − R1L

Resolviendo para ¯i1 , υ¯1 , ¯i2 y υ¯2 , se obtiene lo siguiente:    E R1 +RL (1−¯u2av )2  ¯ı1 R1 RL (1−¯ u1av )2 (1−¯ u2av )2  E  υ¯1     1−¯ u1av  = . E 1  ¯ı2    RL (1−¯ u1av )(1−¯ u2av )2 E υ¯2

(2.185)

(1−¯ u1av )(1−¯ u2av )

De esta manera, (2.185) permite conocer de manera directa los valores que toman las variables promedio ¯i1 , υ¯1 , ¯i2 y υ¯2 , en estado estacionario. Asimismo, a partir de la u ´ltima relaci´ on en (2.185) se puede observar que la salida satisface la desigualdad υ¯2 ≥ E, pues recordemos que u1av ∈ [0, 1) y u1av ∈ [0, 1).

2.7. Caso de estudio. Un convertidor electr´ onico de potencia de CD a CD tipo resonante serie de alta frecuencia Muchos equipos en la actualidad utilizan para su funcionamiento una gran diversidad de circuitos electr´onicos los cuales, precisamente debido a su gran diversidad, necesitan ser alimentados con diferentes niveles de voltaje de corriente directa (CD). Para alimentar estos equipos se puede utilizar un gran transformador que cuente con varias derivaciones en el secundario de modo que a partir de cada una de ellas se pueda utilizar un arreglo rectificadorfiltro para obtener un voltaje de CD diferente. Sin embargo, este m´etodo ya no es utilizado porque requiere de componentes (inductores y capacitores) de valores grandes, resultando en equipos voluminosos, adem´as de producir la p´erdida de grandes cantidades de energ´ıa. La estrategia utilizada actualmente para resolver este problema consiste en contar con varios circuitos electr´onicos de potencia que mediante dispositivos de conmutaci´on obtienen, a su salida, valores de voltaje de CD diferentes a partir de un u ´nico voltaje de CD de suministro. Estos circuitos reciben el nombre de convertidores electr´onicos de potencia de CD a CD y resuelven el problema arriba mencionado reduciendo las p´erdidas de energ´ıa y el volumen de los equipos. De hecho, la miniaturizaci´on de los equipos electr´onicos modernos se debe en gran parte al uso de convertidores electr´onicos de potencia. En los ejemplos 2.18 y 2.19 se han modelado algunos de los convertidores electr´onicos de potencia utilizados en la actualidad.

84

2 Modelado matem´ atico de sistemas f´ısicos i

C

v -

+

+

L

R

C0

E

v0

-

(a) Serie

i0

i

v -

L0

+

E

+

L

C0

R

v0 -

(b) Paralelo Figura 2.44. Convertidores electr´ onicos de potencia de CD a CD tipo resonante.

Otro tipo especial de convertidores electr´onicos de potencia son aquellos que se denominan resonantes, los cuales se clasifican a su vez en serie y paralelo seg´ un la manera en que se conectan sus componentes (v´ease la figura 2.44). En particular, el convertidor resonante serie de CD a CD mostrado en la figura 2.44(a) funciona del siguiente modo. La red de conmutaci´on constituye un inversor que entrega un voltaje de potencia alterno y cuadrado (que toma valores de ±E) a la entrada del circuito resonante serie. En la forma m´as b´asica de funcionamiento de un convertidor resonante serie, la frecuencia de la se˜ nal de voltaje entregada por el inversor es igual a la frecuencia de resonancia del circuito serie LC. De este modo, los transistores con los que se construye la red de conmutaci´on se encienden y apagan por parejas, Q1 , Q3 y Q2 , Q4 , cuando la corriente a trav´es de ellos es igual a cero (v´eanse los interruptores en la parte izquierda de la figura 2.45; los diodos colocados en paralelo a los transistores son utilizados cuando el circuito no funciona en resonancia tal como se explica la secci´on 3.11 del cap´ıtulo 3). Esto es muy conveniente pues evita la fatiga de los transistores alargando la vida u ´til de los mismos. Por otro lado, como el circuito LC serie funciona en resonancia, la corriente i a trav´es del circuito adquiere una forma de onda sinusoidal la cual es rectificada y filtrada por la parte derecha del circuito de la figura 2.44(a). De este modo, la carga alimentada por el circuito (representada por la resistencia R) recibe en sus terminales el voltaje de CD representado por v0 . En la figura 2.46 se muestra el diagrama el´ectrico de un convertidor resonante serie de CD a CD presentando el inversor de manera simplificada como

2.7 Caso de estudio

C +và

L

Q1

Q4

+

E

à

ï

i

D1

D4

Q3

Q2

ï

ï

D3

D2

ï

C0

R

85

+ v0 à

Figura 2.45. Convertidor resonante serie de CD a CD mostrando la disposici´ on de dispositivos en el inversor.

L

C

+

i

+

E(t)

v-

-

Co

R

v0 Figura 2.46. Circuito simplificado de un convertidor resonante serie de CD a CD.

una fuente de voltaje alterno y cuadrado E(t) que toma valores ±E. N´otese que, debido a la presencia de los diodos rectificadores, el funcionamiento del circuito puede ser separado en dos casos: 1) cuando i > 0, figura 2.47(a), y 2) cuando i < 0, figura 2.47(b). A partir de la figura 2.47(a) se obtienen las ecuaciones para i > 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto cerrado de la izquierda se obtiene: di + v + v0 , i > 0 dt Es importante resaltar que se ha tomado en consideraci´on el sentido indicado para la corriente i, as´ı como la polaridad indicada para v0 . Por otro lado, de acuerdo a (2.120) la relaci´on entre el voltaje y la corriente en el capacitor resonante est´a dada como: dv = i, i > 0 C dt Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo com´ un a ambos capacitores se obtiene: E(t) = L

86

2 Modelado matem´ atico de sistemas f´ısicos

i = C0

L

i>0

C

v

-

+

+

i +

C0

-

E(t)

dv0 v0 + , dt R

R

v0

(a) i > 0

L

v-

-

+

i +

C0

R

v0 +

-

E(t)

C

(b) i < 0 Figura 2.47. Circuitos equivalentes para i > 0 e i < 0.

Por otro lado, a partir de la figura 2.47(b) se obtienen las ecuaciones para i < 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto cerrado de la izquierda se obtiene: di + v − v0 , i < 0 dt N´otese que v0 est´a afectado por un signo “−” porque la polaridad indicada para este voltaje est´a en sentido opuesto al definido por el sentido de la corriente el´ectrica i. Sin embargo, la relaci´on entre el voltaje y la corriente en el capacitor resonante no sufre cambios: E(t) = L

dv = i, i < 0 dt Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo com´ un a ambos capacitores se obtiene: C

v0 dv0 − C0 , i<0 R dt N´otese que el sentido correcto de la corriente en el capacitor C0 y en la resistencia es de la terminal marcada con “+” a la terminal marcada con “−”, es decir, es contrario al sentido indicado para i. i=−

2.8 Resumen del cap´ıtulo

87

Comparando estos dos conjuntos de ecuaciones, se puede obtener un u ´nico conjunto de ecuaciones que representa a ambos casos i > 0 e i < 0: E(t) = L C

di + v + v0 sign(i) dt

dv =i dt

abs(i) = C0

(2.186) (2.187)

v0 dv0 + dt R

(2.188)

donde: sign(i) =

½

+1, i > 0 −1, i < 0

(2.189)

mientras que abs(i) representa el valor absoluto de i, es decir abs(i) = i si i > 0 y abs(i) = −i si i < 0. Las ecuaciones en (2.186)-(2.188) constituyen el modelo matem´atico del convertidor electr´onico de potencia de CD a CD tipo resonante serie. En la secci´on 3.11 del cap´ıtulo 3 se retomar´a el estudio de este tipo de convertidor electr´onico de potencia. A partir del estudio del modelo (2.186)-(2.188) se ver´a c´omo funciona este circuito y se explicar´a por qu´e recibe el calificativo de “alta frecuencia”. Para m´as informaci´on sobre el modelado de este tipo de convertidores electr´onicos de potencia se recomienda consultar [10].

2.8.

Resumen del cap´ıtulo

El modelo matem´atico de un sistema f´ısico es una ecuaci´on o un conjunto de ecuaciones diferenciales que describen la evoluci´on de las variables importantes del sistema f´ısico cuando son sometidas a condiciones espec´ıficas. Tal descripci´on ser´a obtenida mediante la soluci´on de dichas ecuaciones diferenciales en el cap´ıtulo 3. Se ha mostrado que el modelo matem´atico de los sistemas mec´anicos, el´ectricos y electromec´anicos puede ser obtenido utilizando el concepto de energ´ıa, cantidad f´ısica que los ingenieros est´an acostumbrados a manejar. De acuerdo a este enfoque, se puede considerar que las partes que componen a los sistemas f´ısicos son procesadores de energ´ıa y el modelo matem´atico describe c´omo intercambian la energ´ıa dichos componentes. Comparando la manera en que los sistemas procesan la energ´ıa se pueden establecer analog´ıas entre sistemas de diferente naturaleza. Por ejemplo, la masa y la inercia (sistemas mec´anicos) son an´alogas a la inductancia (sistemas el´ectricos), un resorte (sistemas mec´anicos) es an´alogo a un capacitor (sistemas el´ectricos), y la fricci´on viscosa (sistemas mec´anicos) es an´aloga a la resistencia (sistemas el´ectricos). Adem´as, una caja de engranes y una barra apoyada en un punto (sistemas mec´anicos) son an´alogas a un transformador (sistemas

88

2 Modelado matem´ atico de sistemas f´ısicos

el´ectricos), mientras que un sistema pi˜ n´on-cremallera (sistemas mec´anicos) es an´alogo a un motor el´ectrico (sistemas electromec´anicos). En lo que resta de la presente obra, el modelo matem´atico del sistema a controlar ser´a utilizado para dise˜ nar un controlador (otra ecuaci´on diferencial en general). El objetivo es que al conectar el controlador en realimentaci´on con el sistema a controlar se genere otra ecuaci´on diferencial (en lazo cerrado) cuyas propiedades (estudiadas en el cap´ıtulo 3) aseguren que la variable que interesa controlar evolucione en el tiempo de la manera deseada.

2.9. 1.

2.

3. 4.

5.

6.

7.

Preguntas de repaso

¿Cu´ales son las leyes fundamentales de la f´ısica que se usan para describir la interconexi´on de componentes en sistemas mec´anicos y en sistemas el´ectricos? ¿Por qu´e el modelo obtenido en el ejemplo 2.7 es una ecuaci´on diferencial de primer orden mientras que el modelo obtenido en el ejemplo 2.8 est´a constituido por dos ecuaciones diferenciales de segundo orden cada una? N´otese que en el ejemplo 2.7 hay tres cuerpos mientras que en el ejemplo 2.8 hay dos cuerpos involucrados. ¿Por qu´e el modelo en (2.92) no tiene el t´ermino correspondiente a θ4 , es decir, a la posici´on? ¿Por qu´e los modelos matem´aticos de un circuito RL y de un circuito RC son ecuaciones diferenciales de primer orden mientras que el modelo matem´atico de un circuito RLC es una ecuaci´on diferencial de segundo orden? En la secci´on 2.2.3 se menciona que “Faraday fue el primero en darse cuenta de que un inductor (y en general cualquier circuito el´ectrico suficientemente largo) tiene propiedades an´alogas a las que tiene el momentum en sistemas mec´anicos”. ¿Puede explicar a qu´e se refiere esta afirmaci´on? ¿Ha observado que cuando se trata de desconectar un circuito altamente inductivo salta una chispa? ¿Recuerda lo que establece la Primera Ley de Newton? Se ha visto que en un motor el´ectrico de CD se cumple que ke = km . Por otro lado, es claro que el subsistema el´ectrico debe transmitir energ´ıa al subsistema mec´anico para realizar el movimiento. ¿Puede dar el ejemplo de una situaci´on en la que el subsistema mec´anico transmite energ´ıa al subsistema el´ectrico? ¿Qu´e papel juega en este caso el hecho de que ke = km ? Se ha visto que una caja de engranes es an´aloga al transformador el´ectrico ¿Podr´ıa listar las caracter´ısticas existentes entre las corrientes y voltajes en ambos devanados de un transformador el´ectrico? ¿Algo similar puede establecerse para las velocidades y pares en ambos lados de la caja de engranes? ¿Podr´ıa listar las ventajas, desventajas y aplicaciones de estas caracter´ısticas en una caja de engranes y en un transformador el´ectrico?

2.10 Ejercicios propuestos

8.

9.

10.

De acuerdo a la pregunta anterior ¿Por qu´e un autom´ovil debe viajar m´as lentamente para subir una pendiente muy pronunciada pero puede viajar m´as r´apido en terrenos planos? Si un transformador el´ectrico puede elevar el voltaje eligiendo una taza n1 /n2 apropiada ¿Por qu´e se usan circuitos electr´onicos basados en transistores para amplificar se˜ nales en sistemas de comunicaciones (que procesan corriente alterna) en lugar de transformadores el´ectricos? Si un transformador el´ectrico y una caja de engranes conservan la potencia en ambos puertos ¿De qu´e manera intervienen las p´erdidas en ambos dispositivos? ¿A qu´e se pueden deber dichas p´erdidas?

2.10. 1.

Ejercicios propuestos

Considere el sistema masa-resorte-amortiguador mostrado en la figura 2.22(a) y estudiado en el ejemplo 2.3. Ahora suponga que este mecanismo est´a girado 90◦ en sentido horario, es decir, que ahora existe el efecto de la gravedad sobre la direcci´on del desplazamiento del resorte y del amortiguador (la masa cuelga del techo a trav´es del resorte y del amortiguador). Demuestre que el modelo matem´atico correspondiente es: y¨ +

2.

3. 4. 5.

b K 1 y˙ + y = F (t) m m m

donde y = x − x0 con x0 = mg/K y g la aceleraci´on de la gravedad. ¿Qu´e significa esto? Considere el sistema mec´anico del ejemplo 2.9. Suponga que sobre el cuerpo de la derecha se aplica un par externo de perturbaci´on Tp (t). Tambi´en suponga que el par externo aplicado T (t) es producido por un motor el´ectrico de CD como en el ejemplo 2.12. Obtenga el modelo matem´atico correspondiente y comp´arelo con el obtenido en (9.9) y (9.10) del cap´ıtulo 9. Realice las manipulaciones algebraicas que sobre el modelo (2.114) y (2.115) se sugieren en el u ´ltimo p´arrafo del ejemplo 2.12. Realice las manipulaciones algebraicas del ejercicio anterior sobre el modelo obtenido en el ejercicio 2 de esta secci´on. Considere el circuito el´ectrico mostrado en la figura 2.48. Demuestre que el voltaje v indicado en la figura es igual a: v=

6.

89

1 (v1 − v2 ) 2

Considere el circuito RC mostrado en la figura 2.49. Demuestre que el voltaje en la resistencia est´a dado como: Vo (s) =

s vc (0) 1 Vi (s) − 1 s + RC s + RC

90

7.

8.

2 Modelado matem´ atico de sistemas f´ısicos

donde Vo (s) y Vi (s) son las transformadas de Laplace de vo y vi , mientras que vc (0) es el voltaje inicial (cuando t = 0) en el capacitor. Un volt´ımetro anal´ogico de corriente directa es b´asicamente un motor de CD con un resorte firmemente unido entre su eje de giro y un punto fijo a la parte no m´ovil del volt´ımetro. Esto significa que dicho motor de CD est´a restringido a girar menos de una vuelta. En base a esta descripci´on obtenga el modelo matem´atico de un volt´ımetro anal´ogico de CD. Considere el sistema conmutado mostrado en la figura 2.50, el cual representa a un convertidor de potencia de CD/CD tipo Buck. Esta topolog´ıa tambi´en es conocida como reductora de voltaje, porque la salida de voltaje υ es menor o igual que el voltaje de entrada E, i.e., υ ≤ E. El objetivo de control de este sistema consiste en conseguir que el voltaje de salida del convertidor υ, se estabilice a un valor de voltaje deseado υ¯ ≤ E, mediante el dise˜ no adecuado de u. Demuestre que el modelo matem´atico del convertidor de potencia de CD/CD Buck, est´a determinado por: L

di = −υ + uE dt

R

R +

v1

+ à

à +

v à Figura 2.48. Circuito del ejercicio 5.

C +

à

+

vi

+ à

vo

R à

Figura 2.49. Circuito RC.

v2

2.10 Ejercicios propuestos

Q

L

i

E

91

v

D

C

R

(a) Construcci´ on del convertidor mediante transistor-diodo.

i

u E

L v

u

C

R

(b) Representaci´ on ideal del convertidor. Figura 2.50. Diagrama electr´ onico del convertidor de potencia de CD/CD Buck.

C

9.

υ dυ = i− dt R

(2.190)

Las variables i, υ representan la corriente presente en el inductor L y el voltaje entre las terminales del capacitor C, respectivamente. Mientras que E representa el voltaje de entrada al sistema y R es la resistencia de salida del sistema. Finalmente, la variable u denota la funci´on de posici´on del interruptor o conmutador, la cual act´ ua como variable de control y s´olo toma el valor de 0 o de 1. El sistema Convertidor de potencia Buck-Motor de CD, mostrado en la figura 2.51, representa una forma de conveniente de alimentar a un motor de CD. El objetivo de control de este sistema consiste en lograr que la velocidad angular de la flecha del motor ω, se estabilice a un valor de velocidad deseada ω ¯ a trav´es del voltaje υ, obtenido del convertidor de potencia Buck, mediante el dise˜ no adecuado de u. Partiendo del hecho de que el modelo matem´atico de un motor de CD esta determinado por: dia = υ − Ra ia − ke ω, dt dω = km ia − Bω. J dt

La

Demuestre que el modelo matem´atico del sistema Convertidor de potencia Buck-Motor de CD, representado idealmente en la figura 2.51(b), est´a determinado por el siguiente sistema de ecuaciones diferenciales lineales: di = −υ + Eu, dt υ dυ = i − ia − , C dt R L

(2.191)

92

2 Modelado matem´ atico de sistemas f´ısicos

dia = υ − Ra ia − ke ω, dt dω = km ia − Bω. J dt

La

donde: • i es la corriente presente en el inductor del convertidor Buck. • υ es el voltaje de salida del convertidor y a su vez es el voltaje aplicado en las terminales de armadura del motor. • u representa la funci´on de posici´on del interruptor o conmutador, la cual act´ ua como variable de control y s´olo toma el valor de 0 o de 1. • L denota la inductancia del convertidor Buck. • C representa la capacitancia del convertidor Buck. • E es el voltaje de alimentaci´on del sistema convertidor Buck-Motor de CD. • R denota la resistencia de salida del convertidor. • ia es la corriente el´ectrica de armadura. • ω es la velocidad angular del rotor del motor. • La representa la inductancia de armadura. • Ra es la resistencia de armadura.

Q D

Convertidor Buck

!

Motor de CD

(a) Construcci´ on del sistema convertidor Buck-Motor de CD mediante transistor-diodo.

!

Convertidor Buck

Motor de CD

(b) Representaci´ on ideal del sistema convertidor BuckMotor de CD. Figura 2.51. Diagrama electr´ onico del sistema convertidor de potencia de CD/CD Buck-Motor de CD.

2.10 Ejercicios propuestos

10.

11.

12.

93

• J es la inercia del rotor del motor. • ke representa la constante de fuerza contra-electromotriz. • km representa la constante de par del motor. • B es la constante de fricci´on viscosa del motor. Considere el circuito RLC en serie del ejemplo 2.14, cuyo modelo matem´atico est´a dado en (2.123). La Energ´ıa almacenada en el circuito es igual a la energ´ıa magn´etica de el inductor m´as la energ´ıa el´ectrica en el 1 2 capacitor E = 12 Li2 + 2C q . Compruebe que E˙ = ivi − Ri2 . ¿Qu´e significa cada t´ermino de esta expresi´on? Considere el sistema inercia-resorte-amortiguador del ejemplo 2.6, cuyo modelo matem´atico est´a dado en (2.68). La Energ´ıa almacenada en el sistema es igual a la energ´ıa cin´etica m´as la energ´ıa en el resorte E = 1 1 ˙2 2 ˙ ˙2 ˙ e significa cada t´ermino 2 I θ + 2 Kθ . Compruebe que E = T θ − bθ . ¿Qu´ de esta expresi´on? Considere el modelo en (2.114),(2.115), correspondiente al sistema electromec´anico del ejemplo 2.12. La energ´ıa almacenada en este sistema es igual a la energ´ıa magn´etica en el inductor de armadura m´as la energ´ıa cin´etica del mecanismo. ¿Puede proceder como en los dos ejemplos previos para e significa cada uno de encontrar la expresi´on correspondiente a dE dt ? ¿Qu´ los t´erminos que aparecen en dE ? ¿Puede identificar a los t´erminos que dt representan el intercambio de energ´ıa entre los subsistemas el´ectrico y mec´anico?

Referencias

1. P.E. Wellstead, Physical system modelling, Academic Press, Londres, 1979. 2. M. Alonso and E.J. Finn, F´ısica, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1995. 3. R.K. Wangsness, Campos Electromagn´eticos, Limusa-Noriega Editores, M´exico, D.F., 1987. 4. R. Kelly, J. Llamas, and R. Campa, A measurement procedure for viscous and coulomb friction, IEEE Transactions on Instrumentation and Measurement, vol. 49, no. 4, pp. 857-861, 2000. 5. C.T.A. Johnk, Teor´ıa electromagn´etica: campos y ondas, Limusa-Noriega Editores, M´exico, D.F., 1993. 6. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 7. F. W. Sears, M. W. Zemansky y H. D. Young, F´ısica Universitaria, 6a. Edici´ on, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1988. 8. M.E. Van Valkenburg, An´ alisis de redes, Limusa-Noriega Editores, M´exico, D.F., 1994. 9. W. H. Hayt y J. E. Kemmerly, An´ alisis de circuitos en ingenier´ıa, McGraw-Hill, M´exico, D.F., 1985. 10. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud diferencial: dise˜ no y construcci´ on, Tesis Maestr´ıa en Ciencias, CINVESTAV-IPN (Zacatenco), Febrero (2002).

3 Base matem´ atica: ecuaciones diferenciales

[V]

50

E(t)

0

-50 0

0.5

1 t [s]

1.5

2 -4

x 10

30

[Watt]

P(t)

20 10 0

0

2

4 t [s]

6

8 -4

x 10

1.5 i(t)

[A]

0.5 -0.5 v(t)

-1.5 -500

-250

0 [V]

250

500

Las ecuaciones diferenciales describen el comportamiento de los sistemas f´ısicos y de los sistemas de control en lazo cerrado. Por ejemplo, en los circuitos el´ectricos y electr´onicos, resolviendo las ecuaciones diferenciales correspondientes se puede contar con una descripci´on cuantitativa y cualitativa de las corrientes en los inductores y los voltajes en los capacitores. A partir de estos valores se pueden calcular otras variables importantes como la potencia y la energ´ıa.

98

3 Base matem´ atica: ecuaciones diferenciales

Objetivos del cap´ıtulo En el cap´ıtulo 2 se ha mostrado que la evoluci´ on de los sistemas f´ısicos que interesa controlar en esta obra est´ a descrita por ecuaciones diferenciales ordinarias, lineales y de coeficientes constantes. Es de mucha utilidad identificar cuales son las propiedades que determinan la forma de la soluci´ on de este tipo de ecuaciones diferenciales porque, seg´ un se ver´ a en cap´ıtulos posteriores, el dise˜ no de un controlador consiste en construir un dispositivo que modifique convenientemente esas propiedades para conseguir una respuesta satisfactoria. El presente cap´ıtulo pretende que el lector aprenda lo siguiente respecto de las ecuaciones diferenciales ordinarias, lineales y de coeficientes constantes: Qu´e es la respuesta forzada y qu´e es la respuesta natural, y que la soluci´ on completa de la ecuaci´ on diferencial est´ a dada como la suma de estas respuestas. C´ omo depende la soluci´ on de la ecuaci´ on diferencial de las ra´ıces del polinomio caracter´ıstico (o, equivalentemente, de los polos de la funci´ on de transferencia). Identificar gr´ aficamente c´ omo es la soluci´ on de las ecuaciones diferenciales de primero y segundo orden e interpretar con ejemplos pr´ acticos el significado de dichas formas gr´ aficas. A partir de este estudio, ser capaz de comprender cu´ ales son las posibles formas gr´ aficas de las ecuaciones diferenciales de orden arbitrario. Identificar cu´ ales son las caracter´ısticas que determinan la forma de la respuesta transitoria, el valor final de la respuesta y la estabilidad de la ecuaci´ on diferencial. Identificar el principio de superposici´ on como la propiedad fundamental que determina la linealidad de una ecuaci´ on diferencial. Las t´ecnicas de control que se utilizan en esta obra requieren del modelo matem´atico del proceso f´ısico a controlar. Estos modelos matem´aticos resultan ser ecuaciones diferenciales. El dise˜ no del controlador se realiza buscando que la ecuaci´on diferencial que representa al sistema controlado en lazo cerrado tenga las propiedades matem´aticas que aseguran que el sistema de control responder´a como se desea. Por tanto, es importante saber cu´ales son las caracter´ısticas de una ecuaci´on diferencial que determinan como es su soluci´on. Aunque existen varios enfoques para estudiar ecuaciones diferenciales, sin embargo el uso de la transformada de Laplace es el m´etodo preferido en la teor´ıa de control cl´asico. Es por esta raz´on que en este cap´ıtulo se estudian las ecuaciones diferenciales ordinarias, lineales, de coeficientes constantes usando la transformada de Laplace. La transformada de Laplace se define del siguiente modo. Suponga que se tiene una funci´on del tiempo f (t), la transformada de Laplace de f (t) se representa por F (s) y se puede calcular como [2], p´ag. 185,[3], p´ag. 285: Z ∞ f (t)e−st dt F (s) = L{f (t)} = 0

3.1 Ecuaci´ on diferencial de primer orden

99

El resultado fundamental de la transformada de Laplace que se utiliza en la soluci´on de ecuaciones diferenciales ordinarias, lineales, de coeficientes constantes es el siguiente [2], p´ag. 192,[3], p´ag. 293: ( ) dn f (t) L = dtn sn F (s) − sn−1 f (0) − sn−2 f (1) (0) − · · · − sf (n−2) (0) − f (n−1) (0) (3.1) donde el exponente entre par´entesis indica el orden de la derivada respecto al tiempo. Tambi´en es u ´til la siguiente propiedad [2], p´ag. 193,[3], p´ag. 293: ) (Z t F (s) f (τ )dτ = L (3.2) s 0 Otro resultado importante es el teorema del valor final [1], p´ag. 25, [3], p´ag. 304: l´ım f (t) = l´ım sF (s)

t→∞

s→0

(3.3)

expresi´on que es v´alida si dichos l´ımites existen.

3.1.

Ecuaci´ on diferencial de primer orden

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, de coeficientes constantes de primer orden: y˙ + a y = k u,

y(0) = y0

(3.4)

donde k y a son constantes reales, y0 se conoce como el valor inicial o la conon diferencial dici´on inicial de y(t) y y˙ = dy dt . El objetivo de resolver esta ecuaci´ es, conociendo los valores de a, k y de la funci´on del tiempo u, obtener y como una funci´on del tiempo que al ser sustituida en (3.4) satisfaga la igualdad ah´ı establecida. Usando (3.1) en (3.4) se obtiene: sY (s) − y0 + a Y (s) = k U (s)

(3.5)

Despejando Y (s) se puede escribir: Y (s) =

1 k U (s) + y0 s+a s+a

(3.6)

Para continuar es necesario especificar la funci´on del tiempo u. Suponga que: u = A,

U (s) =

A s

(3.7)

100

3 Base matem´ atica: ecuaciones diferenciales

donde A es una constante. Por tanto, ahora se puede escribir (3.6) como: Y (s) =

kA 1 + y0 s(s + a) s + a

(3.8)

De acuerdo al m´etodo de expansi´on en fracciones parciales [2], Cap. 4, [3], p´ag. 319, si a 6= 0 entonces se debe escribir: B C kA = + s(s + a) s+a s

(3.9)

donde B y C son dos constantes. El valor de B se obtiene multiplicando ambos lados de (3.9) por el factor (s + a) y evaluando las expresiones resultantes en s = −a: ¯ ¯ ¯ ¯ ¯ ¯ B C kA = + (s + a)¯¯ (s + a)¯¯ (s + a)¯¯ s(s + a) s+a s s=−a s=−a s=−a es decir:

B=

¯ kA ¯¯ kA =− s ¯s=−a a

(3.10)

El valor de C se calcula multiplicando ambos lados de (3.9) por el factor s y evaluando las expresiones resultantes en s = 0: ¯ ¯ ¯ ¯ B ¯¯ C ¯¯ kA ¯ = + s¯ s s s(s + a) ¯s=0 s + a ¯s=0 s s=0

es decir:

¯ kA ¯¯ kA C= = ¯ s + a s=0 a

(3.11)

Sustituyendo (3.9), (3.10), (3.11) en (3.8) se tiene: Y (s) = −

kA 1 y0 kA 1 + + a s+a a s s+a

(3.12)

A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que: L{eβt } =

1 s−β

(3.13)

donde β es cualquier constante real. Usando (3.13) se encuentra que la transformada inversa de Laplace de (3.12) est´a dada como: y(t) = −

kA −at kA e + + y0 e−at a a

la cual constituye la soluci´on de (3.4).

(3.14)

3.1 Ecuaci´ on diferencial de primer orden

101

Ejemplo 3.1 Para comprobar que (3.14) es la soluci´ on de (3.4) se procede −at del siguiente modo. Primero se obtiene la derivada de y(t) = − kA + kA a e a + −at y0 e , es decir: y(t) ˙ = kAe−at − ay0 e−at y se sustituye y(t) ˙ e y(t) en (3.4) para obtener: ¶ µ kA −at kA e + + y0 e−at = kA = ku y(t) ˙ + ay(t) = kAe−at − ay0 e−at + a − a a porque en (3.7) se ha definido u = A. Esto significa que la expresi´ on para y(t) presentada en (3.14) satisface a (3.4) y, por tanto, se ha comprobado que (3.14) es la soluci´ on de (3.4). Este procedimiento debe seguirse para comprobar la soluci´ on de cualquier ecuaci´ on diferencial. La soluci´on dada en (3.14) se puede descomponer en dos partes: y(t) = yn (t) + yf (t) ¶ µ kA + y0 e−at yn (t) = − a kA yf (t) = a

(3.15) (3.16) (3.17)

donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta forzada, respectivamente. La respuesta forzada yf (t) recibe este nombre porque es debida u ´nicamente a la presencia de la funci´on del tiempo u. Por otro lado, la respuesta natural yn (t) recibe dicho nombre porque est´a determinada u ´nicamente por la estructura (o naturaleza) de la ecuaci´on diferencial, es decir, por los t´erminos y˙ +ay presentes en el lado izquierdo de (3.4). Todo esto se explica del siguiente modo. Considere el procedimiento de soluci´on previo suponiendo por un momento que y0 = 0. La expansi´on en fracciones parciales presentada en (3.9) y la subsecuente aplicaci´on de la transformada inversa de Laplace muestran que y(t) es obtenida como la suma de varias funciones del tiempo cuyas “formas” 1 . N´otese que la presencia de la primera dependen de las fracciones 1s y s+a 1 de estas fracciones, s , en (3.9) es debida a que U (s) = As est´a presente en (3.8) lo cual, a su vez, se debe a que u = A donde A es una constante. N´otese 1 que la respuesta forzada yf (t) es una constante que resulta del t´ermino kA a s 1 en (3.12), es decir, tiene su origen en la fracci´on s . Esto confirma que yf (t) depende u ´nicamente de la funci´on del tiempo u. Por otro lado, la presencia de 1 la fracci´on s+a es debida a los t´erminos y˙ +ay ya que L{y˙ +ay} = (s+a)Y (s). De acuerdo a (3.13) esta fracci´on da origen a la funci´on e−at que conforma a la respuesta natural yn (t). Esto confirma que yn (t) est´a determinada u ´nicamente por la estructura (o naturaleza) de la ecuaci´on diferencial. Una consecuencia importante de este hecho es que yn (t) siempre estar´a dada en este ejemplo como una funci´on de la forma e−at sin importar cual sea el valor de u. El lector

102

3 Base matem´ atica: ecuaciones diferenciales

puede repasar el procedimiento seguido para resolver la ecuaci´on diferencial y darse cuenta que la condici´on inicial y0 siempre aparecer´a en la soluci´on y(t) como parte de la respuesta natural yn (t). Antes de continuar, un poco de nomenclatura. En sistemas de control y y u se conocen como la salida y la entrada, respectivamente. El polinomio que surge de aplicar la transformada de Laplace a la ecuaci´on diferencial, es decir s + a que tiene su origen en L{y˙ + ay} = (s + a)Y (s), se conoce como el polinomio caracter´ıstico. La soluci´on en (3.14) o, equivalentemente, en (3.15) puede tener uno de los siguientes comportamientos. 1. 2. 3.

Si a > 0, es decir si la ra´ız del polinomio caracter´ıstico s = −a es negativa, entonces l´ımt→∞ yn (t) = 0 y l´ımt→∞ y(t) = yf (t). Si a < 0, es decir si la ra´ız del polinomio caracter´ıstico s = −a es positiva, entonces yn (t) y y(t) crecen sin l´ımite conforme el tiempo crece. El caso en el que a = 0, es decir cuando la ra´ız del polinomio caracter´ıstico est´a en s = 0, no puede ser estudiado con las f´ormulas desarrolladas hasta aqu´ı y se estudia como un caso especial en la siguiente secci´on. Sin embargo, con el fin de presentar un resumen de todos los casos, aqu´ı se anticipa lo que se va a encontrar en la siguiente secci´on. Cuando la ra´ız del polinomio caracter´ıstico est´a en s = −a = 0, la respuesta natural permanece constante yn (t) = y0 , ∀t ≥ 0 y la respuesta forzada es la Rt integral de la entrada yf (t) = k 0 u(t)dt.

Estudio gr´ afico de la soluci´ on

En esta secci´on se estudia la forma gr´afica de la soluci´on en (3.15). De acuerdo a lo que se acaba de estudiar, si a > 0 entonces la respuesta natural tiende a cero conforme el tiempo crece: l´ımt→∞ yn (t) = 0 y, por tanto, para tiempos muy grandes la soluci´on de la ecuaci´on diferencial es igual a la respuesta forzada u ´nicamente: l´ımt→∞ y(t) = yf (t) = kA a . Esto significa que mientras m´as r´apido desaparezca la respuesta natural yn (t) (lo cual ocurre conforme a > 0 es mayor) m´as r´apido la soluci´on completa y(t) alcanzar´a a la respuesta forzada yf (t). Por tanto, se puede pensar que la respuesta natural es el medio que permite que la soluci´on completa y(t) transite desde el valor inicial y(0) = y0 hasta la respuesta forzada yf (t). La existencia de tal intermediario se justifica recordando que la soluci´on de la ecuaci´on diferencial ordinaria en (3.4), es decir y(t), es una funci´on continua del tiempo. Esto significa que no pueden existir brincos discontinuos en y(t) y, por tanto, no se puede saltar jam´as desde el valor y(t) = y0 a y(t) = yf (t) 6= y0 en un intervalo de tiempo de duraci´on cero. En la figura 3.1 se muestra graficada la soluci´on en (3.15) cuando y0 = 0 y a > 0, es decir: y(t) =

¢ kA ¡ 1 − e−at a

(3.18)

3.1 Ecuaci´ on diferencial de primer orden

103

Se define la constante de tiempo: τ=

1 a

(3.19)

como una medida de la rapidez con la que desaparece la respuesta natural, es decir, la rapidez con la que y(t) alcanza a la respuesta forzada yf (t). Mediante sustituci´on directa de (3.19) en (3.18), es sencillo comprobar que: y(τ ) = 0.632

kA a

(3.20)

Finalmente, es importante se˜ nalar que y(t) crece sin l´ımite si a < 0. Si a = 0 entonces se tiene el caso estudiado en la secci´on 3.2, es decir y(t) = kAt crece sin l´ımite al aumentar el tiempo.

y(t) kA a

0:632 kA a

ü

ü

ü

ü

ü

ü

tiempo

ü

Figura 3.1. Estudio gr´ afico de y(t) en (3.18).

Funci´ on de transferencia Suponga que la condici´on inicial es cero, y0 = 0, entonces (3.6) se puede escribir como: Y (s) =

k U (s) s+a

104

3 Base matem´ atica: ecuaciones diferenciales

o tambi´en: Y (s) k = G(s) = U (s) s+a

(3.21)

La funci´on G(s) se conoce como la funci´on de transferencia de la ecuaci´on diferencial en (3.4). El polinomio que divide en G(s), es decir s + a, se conoce como el polinomio caracter´ıstico y sus ra´ıces se conocen como los polos de G(s). En este caso solo existe un polo en s = −a. De acuerdo al estudio previo se pueden hacer las siguientes afirmaciones en lo que se refiere a la salida y(t) de la funci´on de transferencia G(s): Si el polo ubicado en s = −a es negativo (a > 0) entonces al crecer el tiempo la respuesta natural yn (t) desaparece y la respuesta total y(t) alcanza a la respuesta forzada yf (t). Si u(t) = A es una constante, entonces yf (t) = kA a . La rapidez con la que y(t) alcanza a yf (t) (rapidez con la que yn (t) desaparece) es mayor conforme el polo en s = −a est´a colocado m´as hacia la izquierda del punto s = 0. Esta rapidez se puede cuantificar usando la constante de tiempo τ = a1 . Una constante de tiempo grande implica una respuesta lenta y una constante de tiempo peque˜ na implica una respuesta r´apida. Si k = a > 0 entonces se dice que la funci´on de transferencia G(s) es de ganancia unitaria en estado estacionario, porque si u(t) = A es una constante entonces se puede usar el teorema del valor final (3.3) para encontrar que: l´ım y(t) = l´ım sY (s) = l´ım s

t→∞

s→0

s→0

k k A = A=A s+a s a

(3.22)

En general, la ganancia en estado estacionario de la funci´on de transferencia en (3.21) se calcula como el cociente ka . Si el polo ubicado en s = −a es positivo (a < 0) entonces al crecer el tiempo la respuesta total y(t) crece sin l´ımite. N´otese que esto implica que el polo est´a colocado en el lado derecho del plano s (v´ease la figura 3.2). El caso cuando el polo est´a ubicado en s = a = 0, no puede ser estudiado con las f´ormulas desarrolladas hasta aqu´ı y se estudia como un caso especial en la siguiente secci´on. Sin embargo, de nuevo, con el fin de presentar un resumen de todos los casos aqu´ı se anticipa lo que se va a encontrar en la siguiente secci´on. Cuando el polo est´a ubicado en s = a = 0, la respuesta natural no desaparece pero no crece R t sin l´ımite y la respuesta forzada es la integral de la entrada yf (t) = k 0 u(t)dt.

Ejemplo 3.2 Suponga que se tiene un tanque que almacena un l´ıquido incompresible como el agua (v´ease la figura 3.3). El tanque es de paredes paralelas, es decir de secci´ on constante cuya a ´rea es representada por C. El l´ıquido es

3.1 Ecuaci´ on diferencial de primer orden

105

Im (s)

0

àa a>0

àa a<0

Re (s)

Figura 3.2. Ubicaci´ on de polos de la funci´ on de transferencia en (3.21). Es costumbre representar un polo en el plano s usando una cruz “×”.

introducido al tanque a raz´ on de un flujo de entrada (en m3 /s) representado por qi . El l´ıquido sale del tanque a trav´es de una v´ alvula de salida cuya resistencia hidr´ aulica es R. La rapidez con la que sale el l´ıquido del tanque est´ a dada por el flujo de salida (en m3 /s) el cual se representa por qo . El nivel del agua dentro del tanque es h. El modelo matem´ atico que describe este sistema se obtiene a partir de la Ley de Conservaci´ on de la Materia, ya que al ser el agua incompresible esta ley puede ser expresada en t´erminos de la masa o del volumen del agua. Suponga que durante un intervalo de tiempo de duraci´ on ∆t, entra un volumen de l´ıquido ∆V (entra) y sale un volumen de l´ıquido ∆V (sale). La rapidez con la que se incrementa el volumen de l´ıquido en el tanque durante ese intervalo de tiempo se puede calcular como: ∆V (dentro del tanque) ∆V (entra) ∆V (sale) = − ∆t ∆t ∆t

(3.23)

Por otro lado, se tienen las siguientes relaciones: ∆V (dentro del tanque) = C∆h ∆V (entra) = qi ∆t ∆V (sale) = qo ∆t Sustituyendo en (3.23) y suponiendo peque˜ nos incrementos tales que ∆t → dt, ∆h → dh: C

dh = qi − qo dt

(3.24)

Por otro lado, si el flujo a trav´es de la v´ alvula de salida es laminar, entonces se cumple [1], p´ ag. 155: qo =

h R

(3.25)

Para entender el porqu´e de esta expresi´ on considere los siguientes casos.

106

3 Base matem´ atica: ecuaciones diferenciales

qi

h R qo Figura 3.3. Sistema de nivel de l´ıquido.

a) Suponga que la v´ alvula de salida se mantiene con la misma abertura, es decir que R se mantiene constante. Ahora suponga que aumenta el nivel de l´ıquido en el tanque, es decir que h crece. La experiencia y la expresi´ on en (3.25) nos indican que el flujo de salida qo aumenta bajo esta situaci´ on. b) Suponga que se mantiene constante el nivel de l´ıquido h, usando una bomba hidr´ aulica para compensar exactamente el l´ıquido que sale, y que se cierra, poco a poco, la v´ alvula de salida, es decir que R aumenta. La experiencia y la expresi´ on en (3.25) indican que el flujo de salida qo disminuye bajo esta situaci´ on. Sustituyendo (3.25) en (3.24): C

h dh = qi − dt R

Entonces, el modelo matem´ atico del sistema de nivel de la figura 3.3 queda expresado como: C

dh 1 + h = qi dt R

Dividiendo entre C, se puede expresar este modelo como la siguiente ecuaci´ on diferencial ordinaria, lineal, de coeficientes constantes, de primer orden: dh + ah = kqi dt 1 1 a= , k= RC C

(3.26)

La raz´ on por la cual esta ecuaci´ on diferencial es el modelo de este sistema de nivel de l´ıquido es porque mediante su soluci´ on se puede conocer como evoluciona el nivel h(t) en el tiempo, si se conocen el flujo del l´ıquido que se introduce qi (t), el area de la secci´ on del tanque C, si se tiene informaci´ on a cerca de que tan grande es la abertura de la v´ avula de salida, es decir si se conoce R, y si se conoce el nivel inicial.

3.1 Ecuaci´ on diferencial de primer orden

107

Ejemplo 3.3 Considere el tanque que contiene agua mostrado en la figura 3.3. En el ejemplo 3.2 se encontr´ o que el modelo matem´ atico correspondiente es: dh + ah = kqi dt 1 1 a= > 0, k = RC C

(3.27)

N´ otese que esta ecuaci´ on diferencial se puede escribir como la ecuaci´ on en (3.4) si se considera que y = h, u = qi y y0 = h0 . Esto significa que si qi = A, entonces la soluci´ on h(t) tiene la misma forma que (3.14), es decir: h(t) = −

kA −at kA e + + h0 e−at , a a

h0 = h(0)

(3.28)

A continuaci´ on se explica c´ omo la expresi´ on en (3.28) describe correctamente la evoluaci´ on del nivel de l´ıquido ante diferentes situaciones. 1.

2.

Suponga que el tanque est´ a inicialmente vac´ıo (h0 = 0) y que se empieza a introducir l´ıquido con un flujo constante de valor A > 0. De acuerdo a lo anteriormente expuesto, el nivel del l´ıquido en el tanque h(t) es descrito gr´ aficamente como en la figura 3.1 considerando que h(t) = y(t) (n´ otese 1 que a = RC > 0). A partir de esta figura y la soluci´ on en (3.28) se pueden estudiar varios casos. Para comprobar que el comportamiento descrito en (3.28) es correcto, el lector puede usar su experiencia previa para verificar que lo descrito a continuaci´ on verdaderamente se observa en un dep´ osito de agua: Si A es mayor entonces el nivel final alcanzado por el l´ıquido h(∞) = kA en es mayor. a = RA tambi´ Si la v´ alvula de salida se ajusta a con una abertura menor (R mayor) entonces el nivel final alcanzado por el l´ıquido l´ımt→∞ h(t) = kA a = RA es mayor. El a ´rea de la secci´ on transversal del tanque no tiene efecto en el valor final del nivel alcanzado, es decir, el nivel final es igual para un tanque muy delgado y para uno muy grueso. Si el producto RC es mayor, entonces a es menor, por lo que la respuesta es m´ as lenta, es decir, debe transcurrir m´ as tiempo para alcanzar el nivel h(τ ) = 0.632 kA = 0.632RA y, por tanto, el nivel final a = RA. Esto se debe a que la funci´ o n e−at tiende l´ımt→∞ h(t) = kA a 1 a cero m´ as lentamente cuando a = RC > 0 es menor. N´ otese que un valor grande de RC puede obtenerse incrementando C (el a ´rea de la secci´ on transversal del tanque), es decir usando un tanque m´ as grueso, o disminuyendo la abertura de la v´ alvula de salida (aumentando R). Suponga que no se introduce l´ıquido al tanque, es decir, que qi (t) = A = 0 y que el tanque inicialmente contiene una cantidad determinada de agua, es decir que h0 > 0. A partir de la soluci´ on en (3.28) y usando la experiencia del lector se puede verificar (v´ease la figura 3.4) que el nivel del

108

3 Base matem´ atica: ecuaciones diferenciales 1 tanque decrece (n´ otese que a = RC > 0) hasta que el tanque se vac´ıa l´ımt→∞ h(t) = 0. Esto ocurre m´ as r´ apido si el producto RC es menor (cuando a es mayor) y m´ as lentamente cuando RC es mayor (cuando a es menor).

h0

h(t)

R 1C 1

R 2C 2

tiempo

Figura 3.4. Comportamiento del nivel cuando h0 > 0 y qi (t) = A = 0 (R1 C1 < R2 C2 ).

3.

4.

El caso cuando a < 0 no es posible en un sistema de nivel de l´ıquido porque C y R s´ olo pueden ser positivas (no existen a ´reas de secciones transversales negativas ni aberturas negativas). Sin embargo, la situaci´ on en la que a < 0 ocurre con frecuencia en sistemas de control realimentados, debido a la interconexi´ on de diversos componentes. El caso cuando a = 0 se estudia a continuaci´ on.

3.2.

Un integrador

Considere la siguiente ecuaci´on diferencial: y˙ = ku

(3.29)

donde k es una constante real diferente de cero. N´otese que esta ecuaci´on se obtiene a partir de (3.4) cuando a = 0. Integrando directamente: Z t Z y(t) ku dt dy = y(0)

y(t) = k

0

Z

0

t

u(t) dt + y(0)

(3.30)

3.2 Un integrador

y(t) = yn (t) + yf (t) yn (t) = y(0),

yf (t) = k

Z

109

t

u(t) dt

0

En este caso yn (t) permanece constante cuando el tiempo crece. N´otese que si u = A es constante, entonces la respuesta forzada crece sin l´ımite yf (t) = kA t. En la figura 3.5 se muestra graficada la soluci´on y(t) = y(0) + kA t, para los casos a) y(0) 6= 0 y u = A =constante positiva, y b) y(0) 6= 0 y u = A = 0. A los sistemas f´ısicos representados por este tipo de ecuaci´on diferencial se les llama “integradores” porque, si y(0) = 0 la soluci´on y(t) (salida) es la integral de la entrada u. Ejemplo 3.4 Considere el tanque con agua mostrado en la figura 3.3. Suponga que la v´ alvula de salida est´ a totalmente cerrada por lo que R → ∞. Entonces, el modelo en (3.26) se reduce a: dh = kqi dt 1 porque a = RC → 0 cuando R → ∞. Entonces, la evoluci´ on del nivel en el tiempo esta descrita por (3.30), es decir:

h(t) = h(0) + k

Z

t

qi (t) dt

0

Por tanto, el sistema de nivel de l´ıquido se comporta en este caso como un integrador. Si qi = A > 0, entonces: h(t) = h(0) + kAt

(3.31)

Se puede hacer uso de la figura 3.5, haciendo h(t) = y(t) y qi (t) = u, para apreciar gr´ aficamente la soluci´ on en (3.31) en los casos i) h(0) > 0 y qi = A =constante positiva, e ii) h(0) > 0 y qi = A = 0. N´ otese que el nivel permanece constante si no se introduce l´ıquido (cuando A = 0) y que el nivel crece sin l´ımite cuando A > 0 es constante. El lector puede usar su experiencia previa para comprobar que estas dos situaciones verdaderamente suceden en un sistema de nivel de l´ıquido real. Ejemplo 3.5 La ecuaci´ on diferencial en (3.29) tambi´en puede resolverse usando expansi´ on en fracciones parciales, es decir, usando el m´etodo de la secci´ on 3.1. Usando (3.1) en (3.29) se obtiene: sY (s) − y0 = k U (s) Despejando Y (s) se puede escribir: Y (s) =

1 k U (s) + y0 s s

(3.32)

110

3 Base matem´ atica: ecuaciones diferenciales y(t)

kA

y0

0

0

tiempo

(a) y0 6= 0 y u = A =constante positiva y(t)

y0

tiempo

(b) y0 6= 0 y u = A = 0 Figura 3.5. Soluci´ on de la ecuaci´ on diferencial en (3.29).

Para continuar es necesario especificar la funci´ on del tiempo u. Suponga que: u = A,

U (s) =

A s

donde A es una constante. Por tanto, ahora se puede escribir (3.32) como: Y (s) =

kA 1 + y0 s2 s

(3.33)

De acuerdo al m´etodo de expansi´ on en fracciones parciales [2], Cap. 4, [3], Cap 7, se debe escribir:

3.2 Un integrador

kA B C = + 2 2 s s s

111

(3.34)

donde B y C son dos contantes. El valor de C se obtiene multiplicando ambos lados de (3.34) por s2 y evaluando en s = 0, es decir: ¯ ¯ ¯ ¯ B 2 ¯¯ C 2 ¯¯ 2 kA ¯ = s ¯ + 2s ¯ s 2¯ s s=0 s s s=0 s=0

De donde se obtiene que C = kA. Para calcular B se multiplican ambos lados de (3.34) por s2 , se deriva una vez respecto a s y se eval´ ua en s = 0: µ µ µ ¶¯ ¶¯ ¶¯ ¯ d B 2 ¯¯ d C 2 ¯¯ d 2 kA ¯ = + s 2 ¯ s ¯ s ¯ ds s ds s ds s2 s=0 s=0 s=0

De donde se obtiene que B = 0. Por tanto, usando estos valores y (3.34) se puede escribir (3.33) como: Y (s) =

kA 1 + y0 s2 s

(3.35)

A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que: L{t} =

1 s2

(3.36)

Usando (3.36) se encuentra que la transformada inversa de Laplace de (3.35) est´ a dada como: y(t) = kAt + y0

(3.37)

la cual constituye la soluci´ on de (3.29). Esta soluci´ on se puede descomponer en dos partes: y(t) = yn (t) + yf (t) yn (t) = y0 yf (t) = kAt

(3.38)

donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta forzada, respectivamente. Tal como se explic´ o en la secci´ on 3.1, la respuesta natural yn (t) recibe dicho nombre porque est´ a determinada u ´nicamente por la estructura (o naturaleza) de la ecuaci´ on diferencial, es decir, por la transformada de Laplace de y˙ presente en el lado izquierdo de (3.29). Esto da origen al t´ermino 1s y0 en (3.35), lo cual permite tener yn (t) = y0 en (3.38). La respuesta forzada yf (t) es debida a la excitaci´ on (entrada) u = A. Sin embargo, en este caso la respuesta forzada tambi´en recibe el efecto de la transformada de Laplace del t´ermino y˙ presente en el lado izquierdo de (3.29), pues ambos generan el t´ermino kA s2 , del cual se obtiene yf (t) = kAt.

112

3 Base matem´ atica: ecuaciones diferenciales

El polinomio caracter´ıstico de la ecuaci´ on diferencial en (3.29) es s y, por tanto, s´ olo tiene una ra´ız en s = 0. Por tanto, la funci´ on de transferencia correspondiente G(s) (cuando y0 = 0): k Y (s) = G(s) = U (s) s

(3.39)

s´ olo tiene un polo en s = 0. N´ otese que la entrada U (s) = As tambi´en tiene un polo en s = 0. La combinaci´ on de estos dos polos repetidos en (3.33) produce una respuesta forzada de la forma yf (t) = kAt (un polinomio del tiempo de primer grado), cuando la entrada es u = A (un polinomio del tiempo de grado cero). N´ otese que la respuesta forzada correspondiente a la ecuaci´ on diferencial en (3.4) tiene la forma yf (t) = kA a (un polinomio del tiempo de grado cero) cuando la entrada es u = A (un polinomio del tiempo de grado cero). A partir de estos dos ejemplos se llega a la siguiente conclusi´ on importante: “La respuesta forzada de una ecuaci´ on diferencial de primer orden excitada con una entrada constante, tambi´en ser´ a constante si el polinomio caracter´ıstico no tiene ra´ıces en s = 0.” En la figura 3.2 se muestra la ubicaci´ on en el plano s del polo de la funci´ on de transferencia en (3.39), es decir, el polo en s = 0. El lector debe aprender a relacionar la ubicaci´ on en el plano s de los polos de la funci´ on de transferencia correspondiente con la forma en el tiempo de la soluci´ on y(t) correspondiente (v´eanse los casos listados antes del ejemplo 3.2).

3.3.

Ecuaci´ on diferencial de segundo orden

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes, de segundo orden: y¨ + 2ζωn y˙ + ωn2 y = kωn2 u,

y(0) = y0 ,

y(0) ˙ = y˙ 0

(3.40)

donde ωn y k son constantes reales positivas. Sup´ongase que u = A es una constante. Usando (3.1) y U (s) = A/s se puede escribir: s2 Y (s) − sy0 − y˙ 0 + 2ζωn (sY (s) − y0 ) + ωn2 Y (s) = kωn2 U (s) para obtener: Y (s) = k

(s2

y0 (s + 2ζωn ) + y˙ 0 ωn2 A + 2 + 2ζωn s + ωn2 )s s + 2ζωn s + ωn2

(3.41)

Suponga primero que las condiciones iniciales son cero y˙ 0 = 0, y0 = 0, entonces: Y (s) = k

A ωn2 (s2 + 2ζωn s + ωn2 )s

3.3 Ecuaci´ on diferencial de segundo orden

113

Suponga tambi´en que 0 ≤ ζ < 1 es una constante real, entonces: s2 + 2ζωn s + ωn2 = (s − a)(s − a ¯)

Ahora, n´otese que:

√ j = −1

(3.42)

a = σ + jωd , a ¯ = σ − jωd , p 2 ωd = ωn 1 − ζ > 0, σ = −ζωn ≤ 0

s2 + 2ζωn s + ωn2 = (s − [σ + jωd ])(s − [σ − jωd ]) = (s − σ)2 + ωd2 De acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe escribir: Y (s) = k

Aωn2 Aωn2 Bs + C D = k = + (s2 + 2ζωn s + ωn2 )s [(s − σ)2 + ωd2 ]s (s − σ)2 + ωd2 s (3.43)

donde B, C y D son constantes que deben ser calculadas. La transformada inversa de (3.43) est´a dada como: # " e−ζωn t sin (ωd t + φ) (3.44) y(t) = kA 1 − p 1 − ζ2 p 1 − ζ2 φ = arctan ζ Que constituye la soluci´on de (3.40) cuando las condiciones iniciales son cero y˙ 0 = 0, y0 = 0. A continuaci´on se presenta el procedimiento detallado que se utiliza para obtener (3.44) a partir de (3.43). El lector que no est´e interesado en los detalles t´ecnicos de este procedimiento puede pasar directamente a la ecuaci´on (3.49). Multiplicando ambos miembros de (3.43) por el factor (s − σ)2 + ωd2 y evaluando en s = a (v´ease (3.42)) se puede escribir: ¯ ¯ ¯ ¯ Aωn2 Bs + C 2 2 ¯ 2 2 ¯ [(s − σ) + ω ] [(s − σ) + ω ] k = d d 2 2 ¯ ¯ [(s − σ)2 + ωd ]s (s − σ)2 + ωd s=a s=a ¯ ¯ D + [(s − σ)2 + ωd2 ]¯¯ s s=a

para obtener:

k

Aωn2 = B(σ + jωd ) + C σ + jωd

Multiplicando el lado izquierdo por (σ − jωd )/(σ − jωd ): kAωn2

(σ − jωd ) = Bσ + C + jBωd σ 2 + ωd2

114

3 Base matem´ atica: ecuaciones diferenciales

Igualando partes imaginarias se tiene: B=−

kAωn2 σ 2 + ωd2

(3.45)

Igualando partes reales se tiene: Bσ + C =

kAωn2 σ σ 2 + ωd2

Sustituyendo (3.45): C=

2kAωn2 σ σ 2 + ωd2

(3.46)

Usando (3.45) y (3.46) se puede escribir: kAω 2

2kAω 2 σ

− σ2 +ωn2 s + σ2 +ωn2 Bs + C d d = (s − σ)2 + ωd2 (s − σ)2 + ωd2 =−

kAωn2 (s − σ) 1 kAωn2 σ + 2 2 2 2 2 2 (σ + ωd ) [(s − σ) + ωd ] (σ + ωd ) [(s − σ)2 + ωd2 ]

Usando las transformaciones inversas [4], cap. 32: ) ( s − σ = eσt cos(ωd t) L−1 (s − σ)2 + ωd2 ( ) ωd −1 L = eσt sin(ωd t) (s − σ)2 + ωd2 se obtiene: ( L−1

Bs + C (s − σ)2 + ωd2

)

=− =

=

kAωn2 σt e σ 2 + ωd2

kAωn2 σ kAωn2 σt e cos(ω t) + eσt sin(ωd t) d 2 σ 2 + ωd ωd (σ 2 + ωd2 )

kAωn2 σt σ e [− cos(ωd t) + sin(ωd t)] σ 2 + ωd2 ωd sµ ¶ 2 σ [sin β cos(ωd t) + cos β sin(ωd t)] +1 ωd

N´otese que en el u ´ltimo paso se han usado algunas relaciones de la figura 3.6(a). Por otro lado, se puede seguir reduciendo: 1 [sin(β − ωd t) + sin(β + ωd t)] + 2 1 + [sin(ωd t − β) + sin(ωd t + β)] 2 = sin(ωd t + β)

sin β cos(ωd t) + cos β sin(ωd t) =

3.3 Ecuaci´ on diferencial de segundo orden

115

û=! d

ì

à1

ñ2 + 1



ì

CA (à ) CO (à )

û !d

(a)

(b)

Figura 3.6. Relaciones importantes para el ejemplo de la secci´ on 3.3.

porque sin(−x) = − sin(x). Con esto se obtiene: r³ ´ 2 ) ( σ +1 ω d Bs + C 2 eσt sin(ωd t + β) L−1 = kAω n (s − σ)2 + ωd2 σ 2 + ωd2 Por otro lado, de la figura 3.6(a): −1 −1 −1 p = −ζ = 2 σ/ωd √ (−ζωn )/(ωn 1 − ζ ) 1−ζ 2 p 2 1−ζ β = π + arctan ζ

tan β =

donde se ha tomado en consideraci´on el signo del cateto adyacente y del cateto opuesto para determinar que β representa un ´angulo en el tercer cuadrante (ver figura 3.6(b)). Esto permite hacer la siguiente simplificaci´on [4], cap. 5: sin(ωd t + β) = sin (ωd t + π + φ) = − sin (ωd t + φ) p 1 − ζ2 φ = arctan ζ por lo que ahora se puede reescribir:

L−1

(

Bs + C (s − σ)2 + ωd2

)

= −kAωn2



σ ωd

σ2

p

´2

+

+1

ωd2

eσt sin (ωd t + φ)

σ 2 + ωd2 σt e sin (ωd t + φ) ωd (σ 2 + ωd2 ) 1 = −kAωn2 p eσt sin (ωd t + φ) ωd σ 2 + ωd2 =

−kAωn2

116

3 Base matem´ atica: ecuaciones diferenciales −1

L

(

Bs + C (s − σ)2 + ωd2

)

= −kA p

1 1 − ζ2

eσt sin (ωd t + φ)

(3.47)

p donde se ha usado σ = −ζωn y ωd = ωn 1 − ζ 2 . Por otro lado, el valor de D en (3.43) se obtiene f´acilmente multiplicando ambos miembros de dicha expresi´on por el factor s y evaluando en s = 0: ¯ ¯ kA ωn2 ¯ = kA (3.48) D= 2 2 s + 2ζωn s + ωn ¯s=0 Usando (3.43), (3.47) y (3.48) se encuentra la soluci´on buscada: # " e−ζωn t sin (ωd t + φ) y(t) = kA 1 − p 1 − ζ2

Si ahora se considera que las condiciones iniciales no son cero entonces: # " e−ζωn t sin (ωd t + φ) + p(t) (3.49) y(t) = kA 1 − p 1 − ζ2 donde:

−1

p(t) = L

½

y0 (s + 2ζωn ) + y˙ 0 s2 + 2ζωn s + ωn2

¾

(3.50)

La transformaci´on inversa de Laplace que define a p(t) puede ser obtenida usando un procedimiento similar al que se acaba de mostrar. M´as a´ un, el lector puede darse cuenta que p(t) est´a dada por una funci´on de la forma presentada en (3.47) y que su coeficiente depende de y0 y y˙ 0 . La soluci´on dada en (3.44) se puede descomponer en dos partes: y(t) = yn (t) + yf (t) −ζωn t

e yn (t) = −kA p yf (t) = kA

1 − ζ2

(3.51) sin (ωd t + φ)

(3.52) (3.53)

donde yn (t) y yf (t) constituyen la respuesta natural y la respuesta forzada, respectivamente. N´otese que de acuerdo a (3.43) y (3.47), la respuesta natural en (3.52) es debida u ´nicamente a la estructura (o naturaleza) de la ecuaci´on diferencial pues depende del polinomio caracter´ıstico s2 + 2ζωn s + ωn2 = (s − σ)2 + ωd2 que resulta de aplicar la transformada de la Laplace al t´ermino y¨ + 2ζωn y˙ + ωn2 y. As´ı que sin importar cual sea el valor de u, la respuesta natural yn (t) tendr´a la forma presentada en (3.52). Por otro lado, n´otese que la respuesta forzada en (3.53) debe su origen al t´ermino D/s en (3.43) el cual, a su vez, es introducido por la presencia de la funci´on constante u = A,

3.3 Ecuaci´ on diferencial de segundo orden

117

ya que U (s) = A/s. N´otese que de acuerdo al p´arrafo que sigue a (3.50), cuando las condiciones iniciales son diferentes de cero ´estas s´olo afectan a la respuesta natural en el sentido de que su coeficiente se ver´a afectado por las condiciones iniciales y0 y y˙ 0 , pero la “forma” de la funci´on del tiempo siempre ser´a e−ζωn t sin (ωd t + φ). De hecho, p(t) forma parte de la respuesta natural cuando las condiciones iniciales son diferentes de cero. El lector puede revisar el procedimiento presentado despu´es de (3.44) para comprobar que en el caso en que −1 < ζ < 0 con k y ωn positivos, la soluci´on en (3.51) o, equivalentemente, en (3.44) se transforma en: y(t) = yn (t) + yf (t) e−ζωn t yn (t) = kA p 1 − ζ2

Ã

Ãp !! 1 − ζ2 sin ωd t − arctan abs(ζ)

(3.54)

yf (t) = kA

donde abs(·) representa la funci´on valor absoluto. Utilizando (3.51) cuando 0 ≤ ζ < 1 y (3.54) cuando −1 < ζ < 0 se concluye que la soluci´on de la ecuaci´on diferencial en (3.40) tiene uno de los siguientes comportamientos. 1.

2.

3.

Si 0 < ζ < 1, es decir si las dos ra´ıces del polinomio caracter´ıstico, ubicadas en s = −ζωn ± jωd , tienen parte real negativa −ζωn < 0, entonces l´ımt→∞ yn (t) = 0 y l´ımt→∞ y(t) = yf (t). Si −1 < ζ < 0, es decir si las dos ra´ıces del polinomio caracter´ıstico, ubicadas en s = −ζωn ±jωd , tienen parte real positiva −ζωn > 0, entonces yn (t) y y(t) crecen sin l´ımite, de manera oscilatoria, conforme el tiempo crece. Si ζ = 0, es decir si las dos ra´ıces del polinomio caracter´ıstico, ubicadas en s = −ζωn ± jωd , tienen parte real cero −ζωn = 0, entonces de (3.51) se obtiene: y(t) = yn (t) + yf (t) yn (t) = −kA cos(ωn t),

4.

(3.55) yf (t) = kA

cuando las condiciones iniciales son cero, es decir, yn (t) es una funci´on oscilatoria cuya amplitud no aumenta pero tampoco disminuye. Esto significa que aunque y(t) no crece sin l´ımite, sin embargo no alcanzar´a de manera permanente a la respuesta forzada yf (t). El comportamiento obtenido cuando ζ est´a fuera del rango −1 < ζ < 1 es estudiado en las secciones que siguen bajo los casos en los que las ra´ıces del polinomio caracter´ıstico son reales y repetidas o reales y diferentes.

Finalmente, n´otese que de acuerdo a lo anteriormente expuesto y a (3.49), (3.50), la soluci´on de una ecuaci´on diferencial de segundo orden puede presentar oscilaciones sostenidas (ζ = 0) a´ un cuando la entrada o excitaci´on sea cero (u = 0) si las condiciones iniciales son diferentes de cero. Esto explica el

118

3 Base matem´ atica: ecuaciones diferenciales

funcionamiento de los circuitos osciladores presentados en el cap´ıtulo 8 (v´ease el u ´ltimo p´arrafo de la secci´on 8.3.1). Estudio gr´ afico de la soluci´ on A continuaci´on se estudia de manera gr´afica la soluci´on presentada en (3.51) para la ecuaci´on diferencial en (3.40). Recu´erdese que se supone que 0 ≤ ζ < 1, que ωn , k son constantes positivas y que las condiciones iniciales son cero y0 = 0, y˙ 0 = 0. N´otese que la respuesta natural tiende a cero conforme el tiempo crece si 0 < ζ < 1: ! Ã e−ζωn t sin (ωd t + φ) = 0 (3.56) l´ım yn (t) = l´ım −kA p t→∞ t→∞ 1 − ζ2 porque ζωn > 0. Recu´erdese tambi´en que en el caso en que las condiciones iniciales no son cero, la respuesta natural tambi´en tiende a cero al crecer el tiempo. Por tanto, para tiempos muy grandes la soluci´on de la ecuaci´on diferencial es igual a la respuesta forzada u ´nicamente: l´ım y(t) = yf (t) = kA

t→∞

(3.57)

Esto significa que mientras m´as r´apido desaparezca la respuesta natural yn (t) (lo cual ocurre conforme el producto ζωn > 0 es mayor) m´as r´apido la soluci´on completa y(t) alcanzar´a a la respuesta forzada yf (t). Tal como se mencion´o para las ecuaciones diferenciales de primer orden, la respuesta natural permite que la respuesta total y(t) transite de manera continua desde el valor dictado por las condiciones iniciales (iguales a cero en este caso) hasta la respuesta forzada yf (t). Dos caracter´ısticas importantes de la respuesta en (3.51) son el tiempo de subida tr y el sobre paso Mp , las cuales se indican en la figura 3.7. La manera de medir el sobre paso es mediante la expresi´on: yp − yf × 100 yf

Mp ( %) =

(3.58)

donde yf = kA representa la respuesta forzada. Recu´erdese que se supone que y0 = y˙ 0 = 0. A partir del an´alisis detallado de la expresi´on en (3.51) se puede demostrar que [1], p´ag. 232: !# " Ãp 1 − ζ2 1 (3.59) π − arctan tr = ωd ζ −√

Mp ( %) = 100 × e

ζ 1−ζ 2

π

En las figuras 3.8 y 3.9 se muestra como se ve afectada la soluci´on en (3.51) cuando los par´ametros ζ y ωn cambian. N´otese que el sobre paso Mp es afectado exclusivamente por ζ mientras que el tiempo de subida tr es afectado principalmente por ωn , aunque ζ tambi´en tiene un peque˜ no efecto sobre tr .

3.3 Ecuaci´ on diferencial de segundo orden

119

y(t) yp yf

tr

tiempo

Figura 3.7. Caracter´ısticas de y(t) en (3.51).

Finalmente, es importante se˜ nalar que cuando u = A = 0 pero alguna de las condiciones iniciales y˙ 0 o y0 es diferente de cero, la forma de la respuesta y(t) es como la funci´on del tiempo en (3.52) y su aspecto gr´afico es como la parte oscilatoria sin la componente constante (alrededor de y = 0) en cualquiera de las figuras 3.7, 3.8 o 3.9. Esto es debido a la funci´on p(t) que aparece en (3.49). Funci´ on de transferencia Suponga que las condiciones iniciales son y0 = 0, y˙ 0 = 0, entonces (3.41) se puede escribir como: kωn2 U (s) + 2ζωn s + ωn2

(3.60)

kωn2 Y (s) = G(s) = 2 U (s) s + 2ζωn s + ωn2

(3.61)

Y (s) =

s2

o tambi´en:

donde G(s) es la funci´on de transferencia de la ecuaci´on diferencial en (3.40). N´otese que G(s) definida en (3.61) tiene un polinomio caracter´ıstico (polinomio en el denominador) de segundo grado por lo que G(s) tiene dos polos

120

3 Base matem´ atica: ecuaciones diferenciales

y(t) 2kA

ð=0 0:1 0:2 0:3 0:4 0:5 0:6

kA

0:7 1:0

2:0

tiempo Figura 3.8. Efecto sobre la soluci´ on en (3.51) al usar diferentes valores de ζ. El valor de ωn permanece constante.

(ra´ıces del polinomio caracter´ıstico). Por tanto, G(s) es una funci´on de transferencia de segundo orden. De acuerdo a (3.42) estos polos est´an ubicados en s = a y en s = a ¯, donde: a = σ + jωd ,

a ¯ = σ − jωd

Es importante subrayar que estos polos son complejos conjugados s´olo bajo la suposici´on de que −1 < ζ < 1. El lector puede verificar que los polos son reales si ζ no satisface la condici´on anterior. Ese caso es estudiado en las secciones que siguen. De acuerdo al estudio realizado en las secciones previas se pueden hacer las siguientes afirmaciones en lo que se refiere a la salida y(t) de la funci´on de transferencia G(s): Si los polos tienen parte real negativa σ = −ζωn < 0, es decir ζ > 0, entonces al crecer el tiempo la respuesta natural yn (t) desaparece y la respuesta total y(t) alcanza a la respuesta forzada yf (t). Cuando la entrada es una constante u(t) = A, entonces la respuesta forzada es yf (t) = kA. La rapidez con la que yn (t) desaparece es mayor conforme el producto ζωn es mayor. En la figura 3.10 se muestra c´omo la respuesta del sistema de segundo orden permanece envuelta por dos funciones exponenciales cuya rapidez de decaimiento est´a determinada por el producto ζωn .

3.3 Ecuaci´ on diferencial de segundo orden

121

y(t) !n 3

!n 2

!n 1

kA

tiempo Figura 3.9. Efecto sobre la soluci´ on en (3.51) al usar diferentes valores de ωn : ωn2 = 2ωn1 , ωn3 = 3ωn1 . El valor de ζ permanece constante.

y(t) ò

e àð! nt kA 1 + p 1àð 2

ó

kA

ò

kA 1 à

e àð! nt p 1àð 2

ó

tiempo Figura 3.10. Envoltura exponencial de la respuesta de un sistema de segundo orden ante una entrada constante cuando las condiciones iniciales son cero.

122

3 Base matem´ atica: ecuaciones diferenciales

El tiempo de subida tr disminuye si se incrementa ωn . Esto se puede comprobar al observar que si ωn aumenta entonces, de acuerdo a (3.42), ωd aumenta y, de acuerdo a (3.59), tr disminuye. El sobre paso Mp disminuye si ζ aumenta. De acuerdo a la figura 3.11: i) el tiempo de subida tr disminuye conforme los polos complejos conjugados est´ an m´as alejados de s = 0 porque ωn crece p (v´ease (3.59) junto con ωd = ωn 1 − ζ 2 ), ii) el par´ametro ζ aumenta (y por tanto, el sobre paso Mp disminuye) conforme la ubicaci´on de los polos complejos conjugados forma un ´angulo θ mayor porque ζ = sin(θ), iii) la rapidez con la que yn (t) desaparece es mayor conforme los polos complejos conjugados est´an ubicados m´as hacia la izquierda del punto s = 0 porque el producto ζωn es mayor. Si k = 1 entonces se dice que la funci´on de transferencia G(s) es de ganancia unitaria en estado estacionario, porque cuando u = A es una constante se puede usar el teorema del valor final (3.3) para encontrar que: l´ım y(t) = l´ım sY (s) = l´ım s

t→∞

s→0

s→0

kωn2 A kωn2 A = A(3.62) = s2 + 2ζωn s + ωn2 s ωn2

La constante k representa la ganancia en estado estacionario de la funci´on Im (s)

j! d

!n ò à ð! n

Re (s)

Figura 3.11. Uno de los polos de G(s) en (3.61) cuando 0 < ζ < 1.

de transferencia en (3.61). Si −1 < ζ < 0 entonces la parte real de los polos σ = −ζωn es positiva por lo que la respuesta total y(t) crece sin l´ımite al crecer el tiempo. N´otese que esto implica que los polos complejos conjugados se encuentran en el lado derecho del plano s. El coeficiente ζ recibe el nombre de factor de amortiguamiento porque es el que determina que tan oscilatoria es la respuesta y(t) (v´ease (3.59), para el sobre paso, y la figura 3.8).

3.3 Ecuaci´ on diferencial de segundo orden

123

La constante ωd se conoce como la frecuencia natural amortiguada porque, de acuerdo a lo visto previamente (v´ease (3.51)), ωd es la frecuencia de oscilaci´on de y(t) cuando el amortiguamiento ζ es diferente de cero. N´otese que la frecuencia de oscilaci´on ωd es la parte imaginaria de los polos de la funci´on de transferencia en (3.61) (v´ease (3.42)). La constante ωn se conoce como la frecuencia natural no amortiguada porque, de acuerdo a (3.51) y (3.55), ωn es la frecuencia de oscilaci´on de la respuesta cuando el amortiguamiento es cero. Ejemplo 3.6 Considere el sistema masa-resorte-amortiguador mostrado en la figura 3.12. En el ejemplo 2.3 de la secci´ on 2.6 en el cap´ıtulo 2 se muestra que la posici´ on x del carrito est´ a determinada por la siguiente ecuaci´ on diferencial de segundo orden: m¨ x = −Kx − bx˙ + f

(3.63)

donde K es la constante de rigidez del resorte, b es el coeficiente de fricci´ on viscosa del amortiguador, m es la masa del carrito y f es una fuerza externa. La expresi´ on en (3.63) se puede escribir como: x ¨+

b K 1 x˙ + x = f m m m

lo cual, a su vez, se puede escribir como la expresi´ on en (3.40): x ¨ + 2ζωn x˙ + ωn2 x = kωn2 f b K 1 2ζωn = , ωn2 = , k = m m K

(3.64)

donde x juega el papel de la salida y mientras que f juega el papel de la entrada u. Por tanto, x(t) tiene la forma mostrada para y(t) en (3.51) si 0 ≤ ζ < 1 cuando las condiciones iniciales son cero. N´ otese que todas las constantes en (3.63) son positivas: la masa m, el coeficiente de fricci´ on viscosa b y la constante de rigidez del resorte K s´ olo pueden ser positivas. De acuerdo a (3.64), el factor de amortiguamiento est´ a dado como: b ζ= √ 2 mK

(3.65)

Por tanto, si se aplica una fuerza constante f = A se pueden usar los resultados en las figuras 3.7, 3.8 y 3.9 para concluir lo siguiente. Si no hay fricci´ on, es decir si b = 0, entonces ζ = 0 y el carrito osci1 lar´ a permanentemente alrededor de la posici´ on xf = kA = K A. En el caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de las condiciones iniciales x˙ 0 o x0 sea diferente de cero, entonces el carrito tambi´en oscilar´ a permanentemente pero alrededor de la posici´ on x = 0, como lo describe la funci´ on p(t) que aparece en (3.49).

124

3 Base matem´ atica: ecuaciones diferenciales

Si la fricci´ on b > 0 se incrementa poco a poco, entonces ζ > 0 tambi´en se incrementa y el carrito oscilar´ a cada vez menos veces porque el sistema masa-resorte-amortiguador estar´ a cada vez m´ as amortiguado (cuando ζ = 1 el sistema tiene dos ra´ıces reales repetidas y ya no presenta oscilaciones, como se ve en las secciones siguientes). En todos estos casos, cuando el 1 A. En carrito deje de oscilar se detendr´ a en la posici´ on x = xf = kA = K el caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de las condiciones iniciales x˙ 0 o x0 sea diferente de cero, entonces el carrito tambi´en oscilar´ a cada vez menos (conforme ζ > 0 se aproxima a 1) y se detendr´ a en la posici´ on x = 0. De nuevo, esto est´ a descrito por la funci´ on p(t) que aparece en (3.49). N´ otese que de acuerdo a (3.65) el amortiguamiento ζ tambi´en aumenta si decrece la masa m o la constante de rigidez del resorte K. Para entender la raz´ on de esto consid´erese el caso contrario: valores mayores de m y K producen fuerzas m´ as grandes (m¨ x para la masa y Kx para el resorte) que, por tanto, pueden vencer con mayor facilidad a la fuerza de fricci´ on (bx) ˙ y por ello el movimiento puede permanecer durante m´ as tiempo. Debido a que el tiempo de subida qtr depende inversamente de la frecuencia

as r´ıgido (con natural no amortiguada ωn = K m , entonces un resorte m´ una K mayor) o una masa m´ as peque˜ na producen respuestas m´ as r´ apidas (tr menores). Por otro lado, el hechoq que la frecuencia de oscilaci´ on p K 2 est´e dada por ωd = ωn 1 − ζ con ωn = m es el principio mediante el cual se ajusta la cadencia o ritmo de un reloj mec´ anico mediante el uso de un sistema masa-resorte-amortiguador oscilatorio: si el reloj se “atrasa” hay que aumentar su frecuencia de oscilaci´ on (ritmo o cadencia), lo cual se consigue tensando m´ as el resorte para aumentar K. Se hace lo contrario si el reloj se “adelanta”.

El caso cuando −1 < ζ < 0 no es posible en este ejemplo porque todas las constantes b, m y K son positivas. Sin embargo, la situaci´ on en la que −1 < ζ < 0 ocurre con frecuencia en sistemas de control realimentados, debido a la interconexi´ on de diversos componentes.

x K m

f

b

Figura 3.12. Sistema masa-resorte-amortiguador.

3.4 Ra´ıces reales diferentes

3.4.

125

Ra´ıces reales diferentes

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes de orden n: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = ku

(3.66)

donde los coeficientes ai , i = 0, . . . , n − 1, son constantes reales e y (j) = Aplicando la transformada de Laplace (3.1) a (3.66) se obtiene:

dj y dtj .

sn Y (s) + an−1 sn−1 Y (s) + · · · + a1 sY (s) + a0 Y (s) + P (s) = kU (s) donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones (n−1) iniciales y(0), y(0),...,y ˙ (0) y de los coeficientes de la ecuaci´on diferencial. Entonces puede escribirse: Y (s) =

sn

+ an−1

sn−1

k P (s) U (s)− n n−1 + · · · + a1 s + a0 s + an−1 s + · · · + a1 s + a0

Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces: Y (s) =

k A P (s) − N (s) s N (s)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 Suponga por lo pronto que todas las condiciones iniciales son cero. Esto significa que P (s) = 0 y se puede escribir: Y (s) =

k A N (s) s

Suponga que N (s) s´olo tiene ra´ıces reales, distintas entre s´ı y, adem´as, distintas de s = 0, es decir: N (s) = (s − p1 )(s − p2 ) · · · (s − pn ) donde pi 6= 0, i = 1, . . . , n, con pj 6= pi si i 6= j, representan las ra´ıces de N (s). De acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe escribir: Y (s) =

k A c1 c2 cn f = + + ··· + + N (s) s s − p1 s − p2 s − pn s

(3.67)

donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calculadas. Una manera de calcular ci es la siguiente. Multipl´ıquense ambos miembros de (3.67) por el factor (s − pi ) y eval´ uese toda la expresi´on en s = pi para obtener:

126

3 Base matem´ atica: ecuaciones diferenciales

¯ ¯ k A , ci = (s − pi )¯¯ N (s) s s=pi

i = 1, . . . , n

De manera similar se puede calcular: f=

¯ kA ¯¯ N (s) ¯s=0

Usando la transformaci´on inversa de Laplace, [4], cap.32: ( ) k −1 L = keat s−a se obtiene finalmente: y(t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t + f que representa la soluci´on buscada. N´otese que se puede escribir: y(t) = yn (t) + yf (t) yn (t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t

(3.68)

yf (t) = f

donde la respuesta natural yn (t) s´olo depende de las ra´ıces del polinomio caracter´ıstico N (s) mientras que la respuesta forzada yf (t) s´olo depende de la fracci´on 1s introducida por U (s). Consid´erense las siguientes posibilidades. 1.

2.

Si todas las ra´ıces del polinomio caracter´ıstico N (s) son negativas, es decir si pi < 0 para toda i = 1, . . . , n, entonces l´ımt→∞ yn (t) = 0 y l´ımt→∞ y(t) = yf (t). Si al menos una ra´ız del polinomio caracter´ıstico N (s) es positiva, es decir si pi > 0 para alguna i, entonces, yn (t) → ∞ y y(t) → ∞, conforme t → ∞.

Por u ´ltimo, si las condiciones iniciales no son cero, entonces la soluci´on tiene la forma: y(t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t + f + q(t) donde:

¾ ½ P (s) q(t) = L−1 − N (s)

(3.69)

La transformaci´on inversa de Laplace que define a q(t) puede ser obtenida usando un procedimiento similar al que se acaba de mostrar. M´as a´ un, el lector puede darse cuenta de que q(t) est´a dada por una funci´on de la forma presentada para yn (t) en (3.68) y que sus coeficientes dependen de las condiciones iniciales y(0) . . . , y (n−1) (0). Esto significa que si yn (t) → ∞ en (3.68) entonces q(t) → ∞ tambi´en y si yn (t) → 0 en (3.68) entonces q(t) → 0 tambi´en. De hecho, q(t) forma parte de la respuesta natural cuando las condiciones iniciales no son cero.

3.4 Ra´ıces reales diferentes

127

Ejemplo 3.7 Considere la siguiente ecuaci´ on diferencial de segundo orden dada en (3.40): y¨ + 2ζωn y˙ + ωn2 y = kωn2 u,

y(0) = y0 ,

y(0) ˙ = y˙ 0

(3.70)

Si ζ > 1 entonces las dos ra´ıces, p1 y p2 , del polinomio caracter´ıstico N (s) = s2 + 2ζωn s + ωn2 son reales y diferentes: p p1 = −ζωn + ωn ζ 2 − 1 p p2 = −ζωn − ωn ζ 2 − 1 p1 6= p2 Adem´ as, ambas ra´ıces son negativas: p1 < 0,

p2 < 0

Aunque esto es obvio on: n´ otep poco de observaci´ p p para p2 , para p1 se requiere un 2 = 0, y como −ζω + ω 2 2 se que −ζωn + ωn ζp n n ζ > −ζωn + ωn ζ − 1, entonces −ζωn + ωn ζ 2 − 1 < 0. En la figura 3.13 se muestra la soluci´ on y(t) de la ecuaci´ on diferencial en (3.70) cuando ζ > 1, u = A y las condiciones iniciales son cero. N´ otese que y(t) no presenta oscilaciones en este caso. Recu´erdese que cuando −1 < ζ < 1 la frecuencia de oscilaci´ on es igual a la parte imaginaria de ambas ra´ıces. Por tanto, cuando ζ > 1 no hay oscilaci´ on porque al ser cero la parte imaginaria de ambas ra´ıces, la frecuencia de las oscilaciones tambi´en es cero. Ejemplo 3.8 Consid´erese de nuevo el sistema masa-resorte-amortiguador del ejemplo 3.6. Recu´erdese que (3.64) describe el movimiento del carrito. Suponga que: b ζ= √ >1 2 mK Entonces, de acuerdo al ejemplo anterior, las ra´ıces, p1 y p2 , del polinomio caracter´ıstico s2 + 2ζωn s + ωn2 son reales, distintas y negativas. N´ otese que este caso se presenta cuando el coeficiente de fricci´ on viscosa b > 0 es muy grande o bi´en cuando la constante de rigidez del resorte K > 0 o la masa m del carrito nas. N´ otese tambi´en que una de las ra´ıces (p1 = p son muy peque˜ as −ζωn + ωn ζ 2 − 1 < 0) se aproxima al origen conforme ζ > 1 se hace m´ grande. De acuerdo a lo expuesto en la presente secci´ on, esto significa que el movimiento del carrito es cada vez m´ as lento conforme ζ crece porque la funci´ on ep1 t tarda m´ as tiempo en desaparecer (a on ep2 t p pesar de que la funci´ 2 desaparece m´ as r´ apido porque p2 = −ζωn − ωn ζ − 1 < 0 se aleja cada vez m´ as del origen). Esto explica porqu´e en la figura 3.13 se obtienen respuestas cada vez m´ as lentas conforme ζ > 1 es m´ as grande.

128

3 Base matem´ atica: ecuaciones diferenciales

y(t)

0<ð<1

kA

ð=1

ð>1

tiempo (a) Respuesta en el tiempo Im (s)

p2

ï

à ð! n

p1

Re (s)

(b) Ubicaci´ on de los polos cuando ζ > 1 Figura 3.13. Soluci´ on de una ecuaci´ on diferencial de segundo orden en (3.70), cuando ζ > 1, y en (3.75), cuando ζ = 1, con u = A y las condiciones iniciales son cero.

Ejemplo 3.9 Considere la siguiente ecuaci´ on: y¨ + cy˙ + dy = eu,

y(0) = y0 ,

y(0) ˙ = y˙ 0

con c, d y e constantes reales. Las dos ra´ıces, p1 y p2 , del polinomio caracter´ıstico N (s) = s2 + cs + d est´ an dadas como: √ c c2 − 4d p1 = − + 2 √ 2 c c2 − 4d p2 = − − 2 2

3.5 Ra´ıces reales repetidas

129

Se tienen los siguientes casos: Si d < 0 entonces: p c2 + 4 abs(d) c p1 = − + 2 p 2 2 c + 4 abs(d) c p2 = − − 2 2 las dos ra´ıces son reales y diferentes siendo una positiva y otra negativa, sin importar el valor de c. En el ejemplo 7.3 del cap´ıtulo 7 se muestra que este caso corresponde al de un sistema masa-resorte-amortiguador con coeficiente de rigidez negativo y que esto se obtiene en la pr´ actica cuando un p´endulo simple funciona alrededor de su configuraci´ on invertida (tambi´en llamada inestable). Si c > 0 y d > 0 se recupera el caso estudiado en la secci´ on 3.3 cuando 1 > ζ > 0 y en la presente secci´ on cuando ζ > 1. Si c < 0 y d > 0, con abs(c) peque˜ no y d grande, se recupera el caso estudiado en la secci´ on 3.3 cuando −1 < ζ < 0. La situaci´ on cuando ζ < −1 tambi´en se obtiene en este caso cuando abs(c) es grande y d es peque˜ no, pero las dos ra´ıces son positivas y diferentes: p p1 = −ζωn + ωn ζ 2 − 1 > 0 p p2 = −ζωn − ωn ζ 2 − 1 > 0 p1 6= p2

Los casos ζ = −1 y ζ = 1 se estudian en la siguiente secci´ on.

3.5.

Ra´ıces reales repetidas

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes de orden n: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = ku

(3.71)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en la secci´on 3.4 se obtiene: Y (s) =

P (s) k A − N (s) s N (s)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 Suponga por lo pronto que todas las condiciones iniciales son cero, es decir P (s) = 0, entonces: Y (s) =

k A N (s) s

130

3 Base matem´ atica: ecuaciones diferenciales

Suponga que N (s) s´olo tiene una ra´ız la cual est´a repetida n veces y que es diferente de cero, es decir: N (s) = (s − p)n con p 6= 0. De acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe escribir: k A cn cn−1 cn−2 c2 c1 f = + + + ··· + + + N (s) s (s − p)n (s − p)n−1 (s − p)n−2 (s − p)2 s−p s (3.72) donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calculadas. Una manera de calcular cn es multiplicando ambos miembros de (3.72) por el factor (s − p)n y evaluando en s = p para obtener: cn =

kA p

Por otro lado, las constantes ci , i = 1, . . . , n − 1, se pueden calcular multiplicando ambos miembros de (3.72) por el factor (s − p)n , derivando n − i veces respecto a s y evaluando en s = p para obtener: ¶¯ µ dn−i kA ¯¯ ci = , i = 1, . . . , n − 1 dsn−i s ¯s=p

Finalmente, la constante f se puede calcular multiplicando ambos miembros de (3.72) por el factor s y evaluando en s = 0 para obtener: ¯ kA ¯¯ f= N (s) ¯s=0 Entonces, se puede escribir: Y (s) =

cn−1 cn−2 c2 c1 f cn + + + ··· + + + (s − p)n (s − p)n−1 (s − p)n−2 (s − p)2 s−p s

Usando la transformaci´on inversa de Laplace [4], cap. 32: ( ) 1 tj−1 −1 L = eat , j = 1, 2, 3, . . . , j (s − a) (j − 1)!

0! = 1

se obtiene finalmente: tn−2 tn−3 tn−1 ept + cn−1 ept + cn−2 ept + · · · (n − 1)! (n − 2)! (n − 3)! + c2 t ept + c1 ept + f

y(t) = cn

3.5 Ra´ıces reales repetidas

131

que representa la soluci´on buscada. N´otese que se puede escribir: y(t) = yn (t) + yf (t) tn−1 tn−2 tn−3 ept + cn−1 ept + cn−2 ept + · · · (n − 1)! (n − 2)! (n − 3)! +c2 t ept + c1 ept (3.73)

yn (t) = cn

yf (t) = f Obs´ervese de nuevo que yn (t) s´olo depende de las ra´ıces del polinomio caracter´ıstico N (s) y que yf (t) s´olo depende de la fracci´on 1s introducida por U (s). Finalmente, si las condiciones iniciales son diferentes de cero entonces la soluci´on est´a dada como: tn−2 tn−3 tn−1 ept + cn−1 ept + cn−2 ept + · · · (n − 1)! (n − 2)! (n − 3)! + c2 t ept + c1 ept + f + q(t) ½ ¾ P (s) q(t) = L−1 − N (s)

y(t) = cn

donde q(t) es una funci´on del tiempo cuya “forma” es id´entica a la de yn (t) en (3.73) y cuyos coeficientes dependen de las condiciones iniciales. De hecho, q(t) forma parte de la respuesta natural en el caso en que las condiciones iniciales son diferentes de cero. Consid´erense las siguientes posibilidades: 1.

Si p < 0 es de utilidad calcular el siguiente l´ımite, donde j es cualquier n´ umero entero positivo: l´ım tj ept = l´ım

t→∞

t→∞

tj e−pt

lo cual da una indeterminaci´on porque −pt → +∞. Entonces puede usarse la regla de L’Hopital [13], p´ag. 303: l´ım tj ept = l´ım

t→∞

tj

t→∞ e−pt

dtj dt −pt t→∞ de dt

= l´ım

j tj−1 t→∞ −p e−pt

= l´ım

Como se sigue obteniendo una indeterminaci´on se puede aplicar L’Hopital de nuevo varias veces hasta obtener: l´ım tj ept = l´ım

t→∞

tj

t→∞ e−pt

= l´ım

t→∞

dtj dt −pt t→∞ de dt j−2

= l´ım

j tj−1 t→∞ −p e−pt

= l´ım

j! j(j − 1) t = · · · = l´ım =0 2 −pt t→∞ (−p) e (−p)j e−pt

Aplicando esto a la soluci´on obtenida se concluye que l´ımt→∞ yn (t) = 0, l´ımt→∞ y(t) = yf (t) para cualquier valor p < 0 sin importar que tan cercano a cero est´e dicho valor.

132

2. 3.

3 Base matem´ atica: ecuaciones diferenciales

Si p > 0 es claro que yn (t) → ∞ y y(t) → ∞ conforme t → ∞. Por u ´ltimo, para considerar el caso en el que el polinomio caracter´ıstico tiene n ra´ıces repetidas en p = 0 suponga que U (s) = 0. Por tanto: Y (s) = −

P (s) , N (s)

N (s) = sn

Entonces, de acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap 4, [3], cap. 7, en este caso se debe escribir: P (s) cn cn−1 cn−2 c2 c1 = n + n−1 + n−2 + · · · + 2 + n s s s s s s Usando la transformada de Laplace [4], cap.32: ( ) tj−1 1 −1 = , j = 1, 2, 3, . . . , 0! = 1 L sj (j − 1)! −

se obtiene: tn−1 tn−2 tn−3 + cn−1 + cn−2 + ··· (n − 1)! (n − 2)! (n − 3)! +c2 t + c1 (3.74)

y(t) = yn (t) = cn

yf (t) = 0 Es claro que yn (t) → ∞ y y(t) → ∞ cuando t → ∞ para n ≥ 2 y que yn (t) es una constante si n = 1. N´otese que en el caso en que U (s) = A/s, yn (t) contendr´ıa, adem´as de los t´erminos en (3.74), el t´ermino tn mientras que yf (t) estar´ıa dada como: Z t Z t kA n A dtn . . . dt1 = ··· yf (t) = t | {z } n! | 0 {z 0} n dif erenciales n integrales

Ejemplo 3.10 Considere la siguiente ecuaci´ on diferencial de segundo orden dada en (3.40): y¨ + 2ζωn y˙ + ωn2 y = kωn2 u,

y(0) = y0 ,

y(0) ˙ = y˙ 0

(3.75)

Si ζ = 1 entonces las dos ra´ıces, p1 y p2 , del polinomio caracter´ıstico N (s) = s2 + 2ζωn s + ωn2 son reales, negativas e iguales: p1 = p2 = −ζωn En la figura 3.13 se muestra la soluci´ on y(t) de la ecuaci´ on diferencial en (3.75) cuando ζ = 1, u = A y las condiciones iniciales son cero. N´ otese que y(t) no presenta oscilaciones en este caso porque ambas ra´ıces tienen parte imaginaria igual a cero. Este caso, ζ = 1, representa la frontera entre una soluci´ on oscilatoria ζ < 1 y una soluci´ on que no oscila ζ > 1. De hecho el caso ζ = 1 produce la respuesta m´ as r´ apida sin que haya oscilaciones ya que cuando ζ > 1 la respuesta es cada vez m´ as lenta conforme ζ crece.

3.5 Ra´ıces reales repetidas

133

Ejemplo 3.11 Consid´erese de nuevo el sistema masa-resorte-amortiguador del ejemplo 3.6. Recu´erdese que (3.64) describe el movimiento del carrito. Suponga que: b ζ= √ =1 2 mK Entonces, en este caso el polinomio caracter´ıstico s2 + 2ζωn s + ωn2 s´ olo tiene una ra´ız real y negativa: p = −ζωn la cual est´ a repetida dos veces. La posici´ on x(t) del carrito evoluciona exactamente de la misma forma en que lo hace y(t) en la figura 3.13. Este tipo de respuesta puede ser de mucha utilidad si se desea que el movimiento del carrito sea r´ apido y sin oscilaciones. Ejemplo 3.12 Suponga que en la figura 3.12 no existe ning´ un resorte ni amortiguador, es decir, suponiendo que b = 0 y K = 0 la ecuaci´ on (3.63) se reduce a: m¨ x=f

(3.76)

N´ otese que el polinomio caracter´ıstico es en este caso s2 el cual tiene una ra´ız real p = 0 repetida dos veces. Ahora suponga que todas las condiciones iniciales son cero y que el carrito recibe una peque˜ na perturbaci´ on descrita por: ½ ε0 , 0 ≤ t ≤ t 1 f= (3.77) 0, en otro caso donde ε0 > 0 y t1 > 0 son n´ umeros constantes peque˜ nos. Integrando (3.76) una vez se obtiene: Z 1 t x(t) ˙ = f (τ )dτ + x(0) ˙ m 0 Integrando de nuevo se tiene (suponiendo que x(0) ˙ = 0): ¾ Z t ½Z r 1 f (τ )dτ dr + x(0) x(t) = m 0 0 ¾ Z ½Z r 1 t x(t) = f (τ )dτ dr, x(0) = 0 m 0 0 Sustituyendo (3.77) se obtiene: ½ 1 2 0 ≤ t ≤ t1 2m ε0 t , x(t) = 1 1 2 + ε t ε t (t − t ), t > t1 1 2m 0 1 m 0 1

134

3 Base matem´ atica: ecuaciones diferenciales

N´ otese que x(t) → ∞ conforme t → ∞ (v´ease la figura 3.14) a pesar de que f = 0 para t > t1 , es decir, a pesar de que la respuesta forzada es cero para todo t > t1 . Esto significa que la respuesta natural xn (t) → ∞ cuando t → ∞, lo cual confirma los resultados obtenidos en la presente secci´ on para ra´ıces reales iguales a cero que est´ an repetidas dos veces o m´ as. El lector puede recurrir a su experiencia para verificar que un peque˜ no golpe (f en (3.77)) sobre el carrito es suficiente para que ´este empiece a moverse para nunca detenerse (x(t) → ∞) si no existe fricci´ on entre el carrito y el piso.

x(t) "0 m t1

"0 2 t 2m

t1

t [s]

Figura 3.14. Posici´ on del carrito de la figura 3.12 cuando es perturbado y no existe ning´ un resorte ni amortiguador.

Ejemplo 3.13 Considere la siguiente ecuaci´ on diferencial de segundo orden dada en (3.40): y¨ + 2ζωn y˙ + ωn2 y = kωn2 u,

y(0) = y0 ,

y(0) ˙ = y˙ 0

Si ζ = −1 entonces las dos ra´ıces, p1 y p2 , del polinomio caracter´ıstico N (s) = s2 + 2ζωn s + ωn2 son reales, positivas e iguales: p1 = p2 = −ζωn > 0

3.6.

Ra´ıces complejas conjugadas diferentes

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes de orden n: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = ku

(3.78)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en la secci´on 3.4 se obtiene:

3.6 Ra´ıces complejas conjugadas diferentes

Y (s) =

135

k A P (s) − N (s) s N (s)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 Suponga por lo pronto que todas las condiciones iniciales son cero, es decir P (s) = 0, entonces: Y (s) =

k A N (s) s

Suponga que N (s) tiene n/2 ra´ıces complejas conjugadas diferentes, es decir: i=n/2

N (s) =

Y

i=1

2 [(s − σi )2 + ωdi ]

donde σi 6= σj o ωdi 6= ωdj si i 6= j. Entonces, de acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe escribir: i=n/2 X f Fi s + Ci k A = + 2 + ω2 ] N (s) s [(s − σ ) s i di i=1

donde f es una constante que se puede calcular como en las secciones previas, es decir: ¯ kA ¯¯ f= N (s) ¯s=0

mientras que Fi y Ci son constantes que pueden calcularse del mismo modo en que se calculan B y C en la secci´on 3.3. Por tanto, usando (3.47) se puede escribir: y(t) = yn (t) + yf (t)

(3.79)

i=n/2

yn (t) =

X

βi e−ζi ωni t sin (ωdi t + φi )

i=1

yf (t) = f

donde βi , ωni , ζi y φi , i = 1, . . . , n/2, son constantes reales (v´ease la secci´on 3.3). El comportamiento de la soluci´on en (3.79) satisface uno de los siguientes casos. 1.

Si 0 < ζi < 1 para toda i = 1, . . . , n/2, es decir si la parte real de todas las ra´ıces del polinomio caracter´ıstico N (s) es estrictamente negativa, −ζi ωni < 0 para toda i = 1, . . . , n/2, entonces y(t) oscila de manera que l´ımt→∞ yn (t) = 0 y l´ımt→∞ y(t) = yf (t).

136

2.

3.

3 Base matem´ atica: ecuaciones diferenciales

Si −1 < ζi < 0 para alguna i = 1, . . . , n/2, es decir si la parte real de alguna de las ra´ıces del polinomio caracter´ıstico N (s) es estrictamente positiva, −ζi ωni > 0 para alguna i = 1, . . . , n/2, entonces y(t) oscila de manera que yn (t) y y(t) crecen sin l´ımite conforme el tiempo aumenta. Si ζi = 0 para toda i = 1, . . . , n/2, es decir si la parte real de todas las ra´ıces del polinomio caracter´ıstico N (s) es cero, −ζi ωni = 0 para toda i = 1, . . . , n/2, entonces yn (t) no desaparece al crecer el tiempo pero tampoco crece sin l´ımite. Por tanto, aunque y(t) no crece sin l´ımite, sin embargo no converge a yf (t). N´otese que para que esta situaci´on ocurra es suficiente que ζi = 0 para al menos una i y que para todas las dem´as i se cumpla 0 < ζi < 1.

Finalmente, si las condiciones iniciales son diferentes de cero, entonces: y(t) = yn (t) + yf (t) + q(t) i=n/2

yn (t) =

X

βi e−ζi ωni t sin (ωdi t + φi )

i=1

yf (t) = f donde:

−1

q(t) = L

¾ ½ P (s) − N (s)

Es sencillo verificar que q(t) est´a dado por funciones de la misma “forma” que las funciones que componen a yn (t). De hecho q(t) forma parte de la respuesta natural cuando las condiciones iniciales son diferentes de cero. Es importante se˜ nalar que si ζ ≥ 1 o ζ ≤ −1 entonces se obtienen ra´ıces reales y se recupera uno de los casos de las secciones 3.4 o 3.5. Es conveniente aclarar que se asume que las ra´ıces complejas siempre aparecen con sus parejas conjugadas debido a que esa es la u ´nica manera en que el producto (s − a)(s − a ¯), con a un n´ umero complejo y a ¯ su conjugado, resulte en un polinomio cuyos coeficientes son todos n´ umeros reales. Entonces, cualquier polinomio que contenga ra´ıces complejas y tambi´en sus parejas conjugadas s´olo tendr´a coeficientes reales. Este es un aspecto importante en ingenier´ıa de control donde las ecuaciones diferenciales representan sistemas f´ısicos que, por tanto, s´olo manejan variables y par´ametros reales. Por ejemplo, el polinomio caracter´ıstico del sistema masa-resorte-amortiguador presentado b s+ K en (3.64) est´a dado como s2 + m m donde los coeficientes representan la masa, el coeficiente de fricci´on viscosa y la constante de rigidez del resorte. Es claro que ninguno de estos par´ametros pueden tener parte imaginaria pues representan propiedades cuyos efectos pueden ser apreciados experimentalmente. Ejemplo 3.14 En el ejemplo 2.5 del cap´ıtulo 2 se ha obtenido el modelo matem´ atico del sistema compuesto por dos cuerpos y tres resortes mostrado

3.6 Ra´ıces complejas conjugadas diferentes

137

en la figura 3.15. A partir de ese resultado se puede abordar el caso en el que el resorte de la izquierda no est´ a presente. Esto se consigue considerando que K1 = 0, es decir: b (x˙ 1 − x˙ 2 ) + m1 b x ¨2 − (x˙ 1 − x˙ 2 ) + m2 x ¨1 +

F(t)

x1

K1

K2 1 (x1 − x2 ) = F (t) m1 m1 K3 K2 x2 − (x1 − x2 ) = 0 m2 m2

x2

K2

m1

K3

m2

b Figura 3.15. Sistema con dos cuerpos y tres resortes.

Aplicando la transformada de Laplace (3.1) a cada una de estas ecuaciones diferenciales y considerando todas las condiciones iniciales iguales a cero se obtiene: ³ ´ K2 1 b F (s) + s + m1 m1 m1 X2 (s) X1 (s) = K2 s2 + mb1 s + m 1 ³ ´ K2 b m2 s + m2 X1 (s) X2 (s) = 2 3 s + mb2 s + K2m+K 2 Sustituyendo la segunda ecuaci´ on en la primera y despu´es de realizar algunas manipulaciones algebraicas se obtiene: ³ ´ K2 +K3 b 1 2 s + F (s) s + m1 m2 m2 ´³ ´ ³ ´³ ´ X1 (s) = ³ K2 K2 K2 b b 2 + b s + K2 +K3 − s2 + mb1 s + m s s + s + m2 m2 m1 m1 m2 m2 1

Con el f´ın de simplificar el a ´lgebra correspondiente, supongamos que b = 0, entonces: ³ ´ K2 +K3 1 2 m1 s + m2 ´³ ´ X1 (s) = ³ F (s) 2 K2 2 + K2 +K3 − K2 s2 + m s m2 m1 m2 1

o, equivalentemente:

138

3 Base matem´ atica: ecuaciones diferenciales

X1 (s) =

s4 +

³

1 m1 K2 m1

³

s2 +

+

K2 +K3 m2

K2 +K3 m2

´

´

s2 +

K2 K3 m1 m2

F (s)

(3.80)

Por otro lado, n´ otese que si se multiplican dos polinomios de segundo orden con coeficientes reales a, d, c, e, se obtiene: (s2 + as + c)(s2 + ds + e) = s4 + (a + d)s3 + (c + ad + e)s2 + (cd + ea)s + ce Esto significa que la siguiente simplificaci´ on: (s2 + as + c)(s2 + ds + e) = s4 + (c + ad + e)s2 + ce

(3.81)

es posible si y s´ olo si: a+d=0

y

cd + ea = 0

(3.82)

La primera condici´ on implica que a = −d lo cual, sustituido en la segunda condici´ on, implica que d(c− e) = 0. Por tanto, la igualdad en (3.81) es posible si y s´ olo si ocurre una de las siguientes posibilidades: i) d = a = 0, ii) c = e 6= 0, a = −d, o bien, iii) d = a = e = c = 0. La raz´ on de estudiar la igualdad en (3.81) es el poder determinar c´ omo se puede descomponer en dos factores el polinomio en el denominador de (3.80). En este sentido, n´ otese que la situaci´ on en iii) no es de inter´es porque en tal caso s´ olo aparecer´ıa el t´ermino de s4 en el lado derecho de (3.81). Por otro lado, cuando es aplicado al polinomio en el denominador de (3.80), el caso en ii) implica que: K2 K2 + K3 + m m2 r1 K2 K3 e= m1 m2

2e − a2 =

Combinando ambas expresiones se obtiene: r µ ¶ K2 K3 K3 K2 K2 2 − + − <0 a =2 m1 m2 m1 m2 m2

(3.83)

La raz´ on para la desigualdad al final de esta expresi´ on es que, por definici´ on, el siguiente binomio al cuadrado siempre es positivo o cero: Ãr

K2 − m1

r

K3 m2

!2

r K3 K2 K2 K3 + −2 ≥0 = m1 m2 m1 m 2

Por tanto, de acuerdo a (3.83), el valor de a ser´ıa un n´ umero imaginario. Este caso debe desecharse porque viola la hip´ otesis inicial de que todos los coeficientes a, d, c, e, deben ser reales (v´ease tambi´en el p´ arrafo previo a este

3.6 Ra´ıces complejas conjugadas diferentes

139

ejemplo). Entonces, el u ´nico caso posible es i) d = a = 0, el cual, cuando es aplicado al polinomio en el denominador de (3.80), implica: K2 K2 + K3 + m1 m2 K2 K3 ce = m1 m2

c+e =

(3.84) (3.85)

K2 K3 K2 3 + K2m+K yg= m se tiene, de la segunda expresi´ on, Definiendo f = m 1 2 1 m2 c = g/e y, sustituyendo en la primera expresi´ on, g/e + e = f . Finalmente, multiplicando este resultado por e se obtiene:

e2 − ef + g = 0 Es interesante observar que, siguiendo el mismo procedimiento, se encuentra que la misma ecuaci´ on es v´ alida para c: c2 − cf + g = 0 Resolviendo estas ecuaciones cuadr´ aticas se encuentran las siguientes dos soluciones: r³ ´2 4K 2 K2 K2 +K3 K2 +K3 K2 + m1 m2 2 + + − m1 m2 m1 m2 e1 = c1 = r³ 2 ´ e2 = c2 =

K2 m1

+

K2 +K3 m2



K2 m1



K2 +K3 m2

2

+

4K22 m1 m2

2

N´ otese que el caso e = c no es posible porque entonces (3.84) y (3.85) implicar´ıan que: r K2 + K3 K2 K2 K3 + =2 m1 m2 m1 m 2 lo cual conducir´ıa a: Ãr

K2 − m1

r

K3 m2

!2

=−

K2 m2

que no es posible porque el miembro izquierdo de esta expresi´ on no puede ser negativo. De este modo, s´ olo son posibles los casos: a) e = e1 y c = c2 o, b) e = e2 y c = c1 , los cuales son equivalentes porque, debido a que d = a = 0, (3.80) se puede escribir como: ³ ´ K2 +K3 1 2 m1 s + m2 F (s) (3.86) X1 (s) = (s2 + c)(s2 + e)

140

3 Base matem´ atica: ecuaciones diferenciales

Por otro lado, es claro que

K2 m1

+

K2 +K3 m2

+



K2 m1



K2 +K3 m2

´2

K2 = 2m , lo 1

K2 + cual asegura que e1 = c1 > 0. Obs´ervese, sin embargo, que aunque m 1 r³ ´2 K2 K2 +K3 K2 +K3 3 − > 0 esto no asegura que e2 = c2 > 0 = 2 K2m+K m2 m1 − m2 2 4K 2

por el t´ermino adicional m1 m2 2 dentro del radical. Este problema se resuelve recurriendo a (3.85): los valores de e y c deben tener el mismo signo porque el miembro derecho de (3.85) es positivo. Entonces, ambos e y c deben ser positivos porque de acuerdo a los u ´nicos casos posibles a) y b) se debe usar e = e1 > 0 (lo cual fuerza que c = c2 > 0) o c = c1 > 0 (lo cual fuerza que e = e2 > 0). Finalmente, el razonamiento al principio de este p´ arrafo tambi´en muestra que, a excepci´ on de algunos posibles valores muy especiales 3 . Esto para m1 , m2 , K2 , K3 , ambos e1 = c1 y e2 = c2 , son diferentes de K2m+K 2 asegura que no existen cancelaciones entre los polinomios del numerador y del denominador en (3.86) y el hecho de que e y c sean positivos y diferentes asegura que el polinomio caracter´ıstico de (3.86) tiene dos pares de ra´ıces complejas (imaginarias puras) conjugadas diferentes.

3.7.

Ra´ıces complejas conjugadas repetidas

Considere la siguiente ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes de orden n: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = ku

(3.87)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en la secci´on 3.4 se obtiene: Y (s) =

k A P (s) − N (s) s N (s)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 Suponga por lo pronto que todas las condiciones iniciales son cero, es decir P (s) = 0, entonces: Y (s) =

k A N (s) s

Suponga que el polinomio caracter´ıstico N (s) tiene dos ra´ıces complejas conjugadas repetidas n/2 veces (para tener un total de n ra´ıces): N (s) = (s2 + 2ζωn s + ωn2 )n/2 = [(s − σ)2 + ωd2 ]n/2 Entonces, la expansi´on en fracciones parciales correspondiente a este caso es [2], cap. 4:

3.7 Ra´ıces complejas conjugadas repetidas

141

F2 s + C2 k A F1 s + C1 + + ··· = 2 2 n/2 N (s) s [(s − σ) + ωd ] [(s − σ)2 + ωd2 ]n/2−1 Fn/2−1 s + Cn/2−1 Fn/2 s + Cn/2 f + + + 2 2 2 2 2 [(s − σ) + ωd ] (s − σ) + ωd s En el caso de ra´ıces reales se encontr´o que cuando estas son sencillas introducen t´erminos de la forma ept donde p es la ra´ız en cuesti´on. Cuando dicha ra´ız es repetida j veces, se encontr´o que los t´erminos introducidos se transforman en la forma tj−1 ept . En el caso de ra´ıces complejas conjugadas repetidas ocurre algo similar. En este caso no se har´a una demostraci´on formal de lo que sigue debido a la complejidad del tema. S´olo se presenta la idea intuitiva de la soluci´on para comprender el porqu´e de la forma obtenida. Usando la transformaci´on inversa obtenida en (3.47) se encontr´o que una ra´ız compleja conjugada no repetida (sencilla) introduce en el tiempo un t´ermino de la forma: ) ( Bs + C −1 = βeσt sin(ωd t + φ) L (s − σ)2 + ωd2 para algunas constantes β y φ. Entonces y(t), formada por el efecto de ra´ıces complejas conjugadas repetidas, tiene la forma: y(t) = yn (t) + yf (t) yn (t) = βn/2 t

n/2−1 σt

e

(3.88) sin(ωd t + φn/2 ) + βn/2−1 t

n/2−2 σt

e

sin(ωd t + φn/2−1 )

+ · · · + β2 teσt sin(ωd t + φ2 ) + β1 eσt sin(ωd t + φ1 ) yf (t) = f La soluci´on en (3.88) tiene uno de los siguientes comportamientos. 1.

2.

Si la ra´ız compleja conjugada tiene parte real positiva σ = −ζωn > 0, es decir si −1 < ζ < 0, es f´acil ver que yn (t) → ∞ y y(t) → ∞ conforme t → ∞. Si la ra´ız compleja conjugada tiene parte real negativa σ = −ζωn < 0, es decir si 0 < ζ < 1, se puede proceder como en la secci´on 3.5 para calcular el siguiente l´ımite: l´ım tj eσt sin(ωd t + φ) = 0

t→∞

3.

para cualquier entero j positivo y cualquier n´ umero real estrictamente negativo σ. Entonces, para ra´ıces complejas conjugadas, repetidas, con parte real negativa se tiene que l´ımt→∞ yn (t) = 0 y l´ımt→∞ y(t) = yf (t). Si la ra´ız repetida tiene parte real cero, es decir, σ = 0. Entonces: y(t) = yn (t) + yf (t) yn (t) = βn/2 tn/2−1 sin(ωd t + φn/2 ) + βn/2−1 tn/2−2 sin(ωd t + φn/2−1 ) + · · · +β2 t sin(ωd t + φ2 ) + β1 sin(ωd t + φ1 ) yf (t) = f

142

3 Base matem´ atica: ecuaciones diferenciales

N´otese que en este caso la respuesta natural, yn (t), crece sin l´ımite conforme el tiempo crece en el caso en que la ra´ız se repita al menos dos veces. Pero si la ra´ız es sencilla entonces yn (t) esta formada por una funci´on oscilatoria cuya amplitud no crece ni disminuye, es decir, aunque y(t) nunca alcanzar´a de manera permanente a yf (t) la soluci´on y(t) permanece sin crecer demasiado. Finalmente, es sencillo verificar que si las condiciones iniciales no son cero entonces: y(t) = yn (t) + yf (t) + q(t) yn (t) = βn/2 tn/2−1 eσt sin(ωd t + φn/2 ) + βn/2−1 tn/2−2 eσt sin(ωd t + φn/2−1 ) + · · · + β2 teσt sin(ωd t + φ2 ) + β1 eσt sin(ωd t + φ1 ) yf (t) = f donde: −1

q(t) = L

½ ¾ P (s) − N (s)

La funci´on q(t) est´a dada por las mismas funciones que componen a yn (t) y las tres posibilidades enumeradas previamente tambi´en siguen vigentes en este caso. De hecho q(t) forma parte de la respuesta natural cuando las condiciones iniciales son diferentes de cero. Ejemplo 3.15 (Tomado de [2], cap. 4)Considere el sistema masa-resorte mostrado en la figura 3.12. Suponga que no existe ning´ un amortiguador, es decir que b =q0, y que se aplica una fuerza externa con la forma f = F0 sin(ωt)

K on del carrito x(t) si x(0) = 0 donde ω = m . Se desea describir la posici´ y x(0) ˙ = 0. No es necesario calcular el valor num´erico de las constantes que aparecen en x(t). Soluci´ on. La ecuaci´ on diferencial que describe la situaci´ on en la figura 3.12 cuando b = 0 es: r K (3.89) m¨ x + Kx = f, f = F0 sin(ωt), ω = m

Aplicando la transformada de Laplace a (3.89): s2 X(s) +

K 1 X(s) = F (s) m m

N´ otese que esta expresi´ on tiene la forma: s2 X(s) + ωn2 X(s) = γωn2 F (s) donde ωn =

q

K m

= ω, γ =

1 K.

Se sabe que:

3.7 Ra´ıces complejas conjugadas repetidas

F (s) =

143

F0 ω + ω2

s2

Entonces: X(s) =

γω 3 F0 (s2 + ω 2 )2

Expandiendo en fracciones parciales: Cs + D As + B + 2 (s2 + ω 2 )2 s + ω2

X(s) =

Por tanto, de acuerdo a lo expuesto en la presente secci´ on, se puede escribir: x(t) = β1 t sin(ωt + φ1 ) + β2 sin(ωt + φ2 ) Donde β1 , β2 , φ1 , φ2 son algunas constantes reales. En la figura 3.16 se muesq

tra una gr´ afica de x(t) cuando ω = K m = 10[rad/s], m = 1[Kg] y F0 = 1[N]. A este fen´ omeno se le conoce como “resonancia” y significa que aunque la entrada es acotada la salida puede alcanzar valores muy grandes a pesar de que el polinomio caracter´ıstico no tiene ra´ıces con parte real positiva ni repetidas en s = 0, por lo que este es un fen´ omeno diferente al que se presenta en el ejemplo 3.12. N´ otese que el problema de la resonancia aparece cuando un sistema (ecuaci´ on diferencial) est´ a mal amortiguado (ζ ≈ 0) y se excita con una se˜ nal oscilatoria cuya frecuencia es igual (o muy cercana) a la frecuencia natural del sistema. Debido a que la posici´ on del carrito crece sin l´ımite la resonancia es un fen´ omeno que se considera peligroso. x [m] 0,8

0,6

0,4

0,2

0

-0,2

-0,4

-0,6

-0,8

0

2

4

6

8

10

12

14

16

18

20

t [s] Figura 3.16. Posici´ on de un sistema masa-resorte sometido a condiciones de resonancia.

144

3 Base matem´ atica: ecuaciones diferenciales

3.8.

Una ecuaci´ on diferencial general

Una ecuaci´on diferencial ordinaria, lineal, con coeficientes constantes de orden n siempre puede escribirse como: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = b0 u + b1 u˙ + · · · + bm u(m)

(3.90)

donde n ≥ m. Si n < m la ecuaci´on diferencial no tiene sentido f´ısico, es decir, en la pr´actica no existe ning´ un dispositivo real que est´e representado por dicha ecuaci´on diferencial y, por tanto, no es de inter´es para los ingenieros. N´otese que todas las derivadas que aparecen son con respecto al tiempo. Esta caracter´ıstica permite llamar a estas ecuaciones diferenciales sistemas din´amicos. La funci´on y es la inc´ognita de la ecuaci´on mientras que u es una funci´on del tiempo conocida que tambi´en es llamada excitaci´on. El objetivo de resolver la ecuaci´on diferencial es encontrar la funci´on y(t) que satisfaga la igualdad definida por la ecuaci´on diferencial. Para encontrar y(t) es necesario conocer u(t), las constantes reales ai , i = 0, . . . , n − 1, bj , j = 0, . . . , m, y el conjunto de n constantes y(0), y(0) ˙ ... y (n−1) (0), conocidas como condiciones iniciales del problema, que representan los valores que la funci´on inc´ognita y sus derivadas tienen en t = 0. Aplicando la transformada de Laplace (3.1) a (3.90): sn Y (s) + an−1 sn−1 Y (s) + · · · + a1 sY (s) + a0 Y (s) + P (s) = b0 U (s) + b1 sU (s) + · · · + bm sm U (s) donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones (n−1) (m−1) iniciales y(0), y(0),...,y ˙ (0), u(0), u(0),...,u ˙ (0) y los coeficientes de la ecuaci´on diferencial. Entonces se puede escribir: Y (s) =

sn

b0 + b1 s + · · · + bm sm P (s) U (s)− n + an−1 sn−1 + · · · + a1 s + a0 s + an−1 sn−1 + · · · + a1 s + a0

Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces: Y (s) =

P (s) B(s) A − N (s) s N (s)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 B(s) = b0 + b1 s + · · · + bm sm Suponga por lo pronto que todas las condiciones iniciales son cero. Esto significa que P (s) = 0 y se puede escribir: Y (s) =

B(s) A N (s) s

De acuerdo al m´etodo de expansi´on en fracciones parciales [2], cap. 4, [3], cap. 7, la soluci´on en el tiempo y(t) depende de las ra´ıces del polinomio caracter´ıstico N (s), es decir, de los polos de la siguiente funci´on de transferencia:

3.8 Una ecuaci´ on diferencial general

Y (s) B(s) = G(s) = U (s) N (s)

145

(3.91)

y del factor 1s introducido por U (s) = A/s. La variable y(t) se conoce como la salida y u(t) como la entrada de la funci´on de transferencia G(s). El orden de G(s) se define como el grado del polinomio caracter´ıstico N (s). Como un polinomio de grado n tiene n ra´ıces, entonces una funci´on de transferencia de orden n tiene n polos (v´ease el p´arrafo que sigue a (3.21)). Por otro lado, las ra´ıces del polinomio B(s) se conocen como los ceros de la funci´on de transferencia G(s). Si B(s) es de grado m entonces G(s) tiene m ceros. Recu´erdese la condici´on n ≥ m impuesta al principio de esta secci´on. En las secciones previas se ha visto que siempre se puede escribir y(t) = yn (t) + yf (t) y que el efecto de las condiciones iniciales siempre se pueden considerar como parte de yn (t). Tambi´en se ha visto que yn (t) depende de la naturaleza de las ra´ıces del polinomio caracter´ıstico N (s), es decir, si son reales, sencillas o repetidas, si son complejas conjugadas, sencillas o repetidas y si tienen parte real negativa, positiva o cero. Si yn (t) tiende a cero conforme el tiempo crece se dice que la ecuaci´on diferencial en (3.90) o, equivalentemente, que la funci´on de transferencia G(s) es estable. Resumiendo todos los casos estudiados en las secciones anteriores ahora se puede afirmar lo siguiente: Condiciones para la estabilidad de una funci´ on de transferencia 1. 2.

3.

4.

Si todos los polos de G(s) tienen parte real estrictamente negativa entonces G(s) es estable. Si todos los polos de G(s) tienen parte real estrictamente negativa a excepci´on de algunos polos sencillos (no repetidos) que tienen parte real cero entonces la funci´on de transferencia G(s) es marginalmente estable. Esto significa que aunque yn (t) no desaparece al crecer el tiempo sin embargo tampoco crece sin l´ımite. Si al menos un polo de G(s) tiene parte real estrictamente positiva entonces la funci´on de transferencia G(s) es inestable, es decir, yn (t) crece hasta el infinito conforme el tiempo crece. Si existe al menos un polo de G(s) con parte real cero que esta repetido al menos dos veces entonces G(s) es inestable.

Por otro lado, tambi´en se ha visto que yf (t) depende de la entrada u(t) y que, de hecho, ambas tienen la misma “forma” si el polinomio caracter´ıstico no tiene ra´ıces en s = 0 (si G(s) no tiene polos en s = 0). Esto significa que en un sistema de control la variable u(t) puede ser usada como el valor que se desea que alcance la salida y(t), es decir, u(t) puede ser usada para especificar el valor deseado de y(t). Esto se consigue de la siguiente manera. Si la funci´on de transferencia es estable (es decir, yn (t) → 0) entonces y(t) → yf (t) y, por tanto, s´olo resta asegurar que yf (t) = u. A continuaci´on se establecen las condiciones para cumplir esto en el caso en que u = A es una constante.

146

3 Base matem´ atica: ecuaciones diferenciales

Condiciones que aseguran que l´ımt→∞ y(t) = A. La respuesta total y(t) alcanza a la salida deseada u = A conforme el tiempo crece, es decir yf (t) = A y yn (t) → 0, si G(s) es estable y los coeficientes de los t´erminos independientes de los polinomios B(s) y N (s) son iguales, es decir, si B(0) = N (0). Esto se comprueba usando el teorema del valor final (3.3): l´ım y(t) = l´ım sY (s) = l´ım s

t→∞

s→0

s→0

B(s) A B(0) = A=A N (s) s N (0)

(3.92)

Bajo estas condiciones se dice que G(s) es una funci´on de transferencia de ganancia unitaria en estado estacionario. Cuando u no es una constante y se desea que l´ımt→∞ y(t) = u(t), tambi´en se requiere que G(s) sea estable, yn (t) → 0, pero algunas condiciones adicionales deben ser satisfechas. La determinaci´on de estas condiciones y la manera de satisfacerlas es parte de lo que se estudia en los cap´ıtulos restantes de esta obra (v´ease la secci´on 4.4). Ejemplo 3.16 Considere la situaci´ on presentada en el ejemplo 3.12. A partir de ese ejemplo se puede establecer un experimento que nos permite saber si un sistema, ecuaci´ on diferencial o funci´ on de transferencia es estable o inestable: Si se perturba ligeramente a un sistema que originalmente est´ a en “reposo” puede haber dos comportamientos: Si el sistema es estable entonces se “mueve” y despu´es de cierto tiempo regresa al reposo en el mismo lugar en que originalmente se encontraba Si el sistema es inestable entonces se “mueve” cada vez m´ as de manera que se aleja m´ as y m´ as del lugar en donde inicialmente estaba. Ejemplo 3.17 Considere el tanque que contiene agua estudiado en el ejemplo 3.2 y mostrado en la figura 3.3. Suponga que se utiliza una bomba de agua que produce un flujo qi que es proporcional al voltaje u aplicado en las terminales de la bomba, es decir: qi = k1 u

(3.93)

donde k1 es una constante positiva. Suponga tambi´en que el voltaje aplicado a la bomba se obtiene de acuerdo a la expresi´ on: u = kp (hd − h)

(3.94)

donde hd es un valor constante que representa el nivel de agua deseado, h es el nivel de agua actual en el tanque y kp es una constante positiva. Combinando estas expresiones junto con el modelo en (3.26) se obtiene: dh + ah = kk1 kp (hd − h) dt Agrupando t´erminos:

3.8 Una ecuaci´ on diferencial general

dh + b1 h = b2 h d dt b1 = a + kk1 kp > 0, b2 = kk1 kp > 0,

147

(3.95) b1 > b2

N´ otese que esta expresi´ on tiene la forma de la ecuaci´ on diferencial en (3.4) de manera que b1 , b2 , h y hd juegan los papeles, respectivamente,de a, k, y y u. Entonces la soluci´ on h(t) tiene la misma forma que (3.14), es decir: h(t) = −

b2 hd −b1 t b2 hd e + + h0 e−b1 t , b1 b1

h0 = h(0)

N´ otese que, debido a que b1 > b2 > 0: l´ım h(t) =

t→∞

b2 h d < hd b1

(3.96)

es el valor que alcanza en estado estacionario el nivel de agua en el tanque y es menor (diferente) que el nivel deseado hd . Esto puede explicarse usando (3.92) del siguiente modo. La funci´ on de transferencia de la ecuaci´ on diferencial en (3.95) es: G(s) =

b2 H(s) = Hd (s) s + b1

Entonces: l´ım h(t) = l´ım sH(s) = l´ım s

t→∞

s→0

s→0

b2 b2 h d = h d < hd s + b1 s b1

Ahora bien, este resultado tambi´en puede explicarse usando la experiencia cotidiana del siguiente modo. Sup´ ongase por un momento que l´ımt→∞ h(t) = hd . Entonces, de acuerdo a (3.93) y (3.94): qi = k1 kp (hd − h) = 0 el flujo de agua que entra al tanque es cero porque h = hd . Como el agua contin´ ua fluyendo a trav´es de la v´ alvula de salida, qo 6= 0, lo anterior resultar´ a en h < hd de nuevo. Esto significa que no es posible mantener h = hd de manera permanente, lo que justifica el resultado en (3.96). Ahora suponga que se usa (3.93) junto con: u = kp (hd − h) + ki

Z

0

t

(hd − h(r))dr

(3.97)

donde ki es una constante positiva. Combinando (3.93), (3.97) y (3.26) se obtiene: ¶ µ Z t dh (hd − h(r))dr + ah = kk1 kp (hd − h) + ki dt 0

148

3 Base matem´ atica: ecuaciones diferenciales

Derivando una vez respecto al tiempo a toda la ecuaci´ on se tiene: µ ¶ d d2 h dh +a = kk1 kp (hd − h) + ki (hd − h) dt2 dt dt Agrupando t´erminos: dh dhd d2 h + (a + kk1 kp ) + kk1 ki h = kk1 kp + kk1 ki hd 2 dt dt dt Usando la transformada de Laplace bajo la suposici´ on de condiciones iniciales iguales a cero se obtiene la siguiente funci´ on de transferencia: G(s) =

H(s) kk1 kp s + kk1 ki = 2 Hd (s) s + (a + kk1 kp )s + kk1 ki

Usando (3.92) se obtiene: l´ım h(t) = l´ım sH(s) = l´ım s

t→∞

s→0

s→0

kk1 kp s + kk1 ki hd kk1 ki = hd = hd s2 + (a + kk1 kp )s + kk1 ki s kk1 ki (3.98)

lo cual es completamente cierto si a + kk1 kp > 0 y kk1 ki > 0 (se deja como ejercicio consultar la secci´ on 4.2.1, del cap´ıtulo 4, para verificar que estas condiciones aseguran que las dos ra´ıces del polinomio caracter´ıstico s2 + (a + kk1 kp )s + kk1 ki tienen parte real negativa). De nuevo, este resultado puede ser explicado usando la experiencia cotidiana. Dado que h = hd en estado estacionario, entonces es de esperarse que la se˜ nal de error e = hd −h tenga un comportamiento como el mostrado en la figura 3.17. Recu´erdese que la integral Rt (h −h(r))dr es el area debajo de la curva mostrada en la figura 3.17 la cual d 0 es positiva. Esto significa que cuando h = hd la integral permanece constante (el integrando vale cero) en un valor positivo. Entonces, de acuerdo a (3.93) y (3.97) contin´ ua entrando agua al tanque con un flujo qi que permanece constante en este valor positivo multiplicado por k1 ki > 0. Este flujo resulta ser exactamente igual al flujo del agua que sale qo de manera que el nivel de agua h = hd permanece igual al nivel deseado, tal como lo predice (3.98). Ejemplo 3.18 Considere el sistema masa-resorte-amortiguador estudiado en el ejemplo 3.6 pero ahora suponga que no hay ning´ un resorte. Haciendo K = 0 en (3.63) se obtiene: m¨ x + bx˙ = f Suponga que se utiliza alg´ un dispositivo (un motor tan r´ apido que su ecuaci´ on diferencial puede no ser considerada, por ejemplo) que genera una fuerza de acuerdo a la siguiente expresi´ on: f = kp (xd − x)

(3.99)

3.8 Una ecuaci´ on diferencial general

149

e [m]

t [s] Rt Figura 3.17. La integral 0 (hd − h(r))dr es el ´ area sombreada debajo de la curva definida por e = hd − h. Se supone que hd > h(0).

donde kp es una constante positiva, xd es una constante que representa la posici´ on deseada y x es la posici´ on medida del carrito. Combinando estas expresiones se obtiene: m¨ x + bx˙ = kp (xd − x) y agrupando: x ¨+

b kp kp x˙ + x = xd m m m

Usando la transformada de Laplace bajo la suposici´ on de condiciones iniciales iguales a cero se encuentra la siguiente funci´ on de transferencia: G(s) =

X(s) = Xd (s) s2 +

kp m b ms

+

kp m

Se deja como ejercicio encontrar las ra´ıces del polinomio caracter´ıstico s2 + kp kp b b m s + m y comprobar que ambas tienen parte real negativa si m > 0 y m > 0. Entonces, usando (3.92) se encuentra que la posici´ on alcanzada en estado estacionario: l´ım x(t) = l´ım sX(s) = l´ım s

t→∞

s→0

s→0

s2 +

kp m b ms

+

kp m

xd = s

kp m kp m

xd = xd

es igual a la posici´ on deseada xd . La raz´ on de este resultado puede explicarse usando, de nuevo, la experiencia: cuando x = xd la fuerza producida de acuerdo a (3.99) es f = 0 por lo que el carrito puede detenerse y permanecer en dicha posici´ on. M´ as a´ un, si x < xd entonces f > 0 y el carrito incrementa su posici´ on x acerc´ andose a xd (v´ease la figura 3.12 para recordar la direcci´ on en se aumenta x y en la que f es positiva). Si x > xd entonces f < 0 y el carrito decrementa su posici´ on x acerc´ andose, de nuevo, a xd .

150

3 Base matem´ atica: ecuaciones diferenciales

Se deja como ejercicio que el lector haga el an´ alisis correspondiente para verificar que en el caso que exista un resorte, es decir cuando K > 0, entonces l´ımt→∞ x(t) 6= xd si xd 6= 0. N´ otese sin embargo que, de nuevo, esto puede explicarse de manera sencilla usando la experiencia: Si x = xd entonces, de acuerdo a (3.99), la fuerza externa aplicada sobre el carrito es cero f = 0 y la fuerza de fricci´ on tambi´en es cero −bx˙ = 0 si se supone que el carrito ya est´ a en reposo. Sin embargo, si x = xd 6= 0 entonces la fuerza del resorte sobre el carrito −Kx es diferente de cero por lo que el carrito abandonar´ a la posici´ on x = xd 6= 0. El carrito alcanzar´ a el reposo en una posici´ on x tal que la fuerza del resorte y la fuerza f en (3.99) se cancelen exactamente, es decir, donde kp (xd − x) = Kx.

3.9.

Polos y ceros en sistemas de orden superior

En los sistemas de orden 3 o mayor no es posible hacer un estudio gr´afico detallado de la respuesta y(t) como se ha hecho en el caso de sistemas de primer y segundo orden. La principal raz´on es la complejidad de las expresiones obtenidas cuando una funci´on de transferencia tiene tres polos o m´as. Por esta raz´on, cuando se tiene un sistema de orden alto es importante poder aproximarlo usando un sistema de orden menor. Hay dos maneras de conseguir esto: i) cancelando algunos polos con algunos ceros de la funci´on de transferencia correspondiente e ii) despreciando el efecto de los polos “r´apidos”. A continuaci´on se presentan algunos ejemplos de como se puede hacer esto. 3.9.1.

Cancelaci´ on polo-cero y modelos reducidos

Considere el siguiente sistema de segundo orden: Y (s) =

k(s − d) U (s) (s − p1 )(s − p2 )

(3.100)

Suponga que U (s) = A/s, p1 6= p2 , p1 < 0, p2 < 0, d < 0, y que p1 p2 ≈ −kd con el fin de que la funci´on de transferencia en (3.100) sea de ganancia aproximadamente unitaria en estado estacionario. Usando expansi´on en fracciones parciales: Y (s) =

A k(s − d) B C D = + + (s − p1 )(s − p2 ) s s − p1 s − p2 s

(3.101)

Multiplicando ambos miembros por el factor (s − p1 ) y evaluando en s = p1 se obtiene: ¯ k(p1 − d)A k(s − d)A ¯¯ = B= (s − p2 )s ¯s=p1 (p1 − p2 )p1

3.9 Polos y ceros en sistemas de orden superior

151

Multiplicando ambos miembros de (3.101) por el factor (s − p2 ) y evaluando en s = p2 se obtiene: ¯ k(s − d)A ¯¯ k(p2 − d)A C= = (s − p1 )s ¯ (p2 − p1 )p2 s=p2

Multiplicando ambos miembros de (3.101) por el factor s y evaluando en s = 0 se obtiene: ¯ kdA k(s − d)A ¯¯ =− D= (s − p1 )(s − p2 ) ¯s=0 p1 p2

Si p1 ≈ d < 0 entonces, de acuerdo a la condici´on p1 p2 ≈ −kd, se tiene que k ≈ −p2 y, por tanto: B≈0 k(p2 − d)A kA C≈ = (p2 − d)p2 p2 kA D≈− p2

(3.102) (3.103) (3.104)

para obtener finalmente: y(t) ≈

kA p2 t kA e − p2 p2

(3.105)

kA p2 t kA e − p2 p2

(3.106)

k U (s) s − p2

(3.107)

El lector puede verificar que: y(t) = es la soluci´on de: Y (s) =

con U (s) = A/s y k = −p2 . Por tanto, se concluye. Si un polo y un cero de una funci´on de transferencia est´an muy cercanos, entonces se pueden cancelar para obtener una funci´on de transferencia de orden reducido. Es decir, se puede usar (3.107) en lugar de (3.100) para obtener resultados muy similares. Las ventajas de usar el modelo (3.107) son: i) se trata un modelo de orden menor que (3.100) e ii) no tiene ning´ un cero. La ventaja de disponer de un modelo de orden reducido que describe aproximadamente a un modelo de orden superior es que con mucha frecuencia el modelo reducido es de orden suficientemente peque˜ no de modo que su respuesta puede especificarse gr´aficamente como el de un sistema de primer o segundo orden. Por otro lado, un cero en la funci´on de transferencia modifica su respuesta de una manera que no es f´acil de cuantificar por lo que es muy conveniente que la funci´on de transferencia no tenga ceros. Es importante mencionar que la cancelaci´on de un polo y un cero s´olo es permitida si ambos tienen parte real negativa, pues de otro modo su efecto se har´a presente, tarde o temprano, conforme el tiempo crece.

152

3 Base matem´ atica: ecuaciones diferenciales

3.9.2.

Polos dominantes y modelos reducidos

Considere la siguiente funci´on de transferencia: Y (s) =

k d 1 s + a U (s) s + RC

(3.108)

donde U (s) = A/s. Usando expansi´on en fracciones parciales: Y (s) =

C d A B D k 1 s+a s = 1 + s+a + s s + RC s + RC

(3.109)

1 1 y evaluando en s = − RC : Multiplicando ambos miembros por el factor s+ RC ¯ d A ¯¯ A d ¡ 1 ¢ B=k (3.110) =k 1 s + a s ¯s=− 1 a − RC − RC RC

Multiplicando ambos miembros de (3.109) por el factor s + a y evaluando en s = −a: ¯ d A ¯¯ A d (3.111) C=k =k 1 s¯ 1 (−a) s + RC −a + RC s=−a Multiplicando ambos miembros de (3.109) por el factor s y evaluando en s = 0: ¯ d A A ¯¯ d =k 1 D=k (3.112) 1 (s + a) ¯ a s + RC RC s=0

Si a ≫

1 RC

> 0 entonces:

d A 1 a RC dA C ≈k 2 ≪D a

B ≈ −k

(3.113) (3.114)

Por tanto, usando (3.109) y despreciando C se obtiene: y(t) ≈ −k

d A − 1 t d A RC + k 1 e 1 a a RC RC

(3.115)

d A d A − 1 t RC + k 1 e 1 a a RC RC

(3.116)

El lector puede verificar que: y(t) = −k es la soluci´on de: Y (s) =

kd 1 U (s) a(s + RC )

(3.117)

3.9 Polos y ceros en sistemas de orden superior

153

con U (s) = A/s. Por tanto, se puede utilizar (3.117) en lugar de (3.108). La 1 condici´on a ≫ RC se interpreta diciendo que “el polo en s = −a es muy 1 1 ”. Al polo en s = − RC se le conoce r´apido comparado con el polo en s = − RC como el polo dominante porque su efecto es el que sobresale en la respuesta del sistema. Por tanto, se concluye. Si un polo es mucho m´as r´apido que los otros, entonces se puede obtener una funci´on de transferencia de orden reducido si se desprecia el polo r´apido y se conservan los polos dominantes (lentos). Un criterio aceptado es que los polos r´apidos (los que se pueden despreciar) tienen una parte real de al menos 5 veces la parte real de los polos dominantes (los que se conservan). N´otese, sin embargo, que no es cuesti´on de simplemente hacer desaparecer el factor s + a en el denominador de la funci´on de transferencia: la constante a a´ un aparece dividiendo en (3.117) porque es necesaria para conservar la ganancia en estado estacionario de la funci´on de transferencia en (3.108). Una manera sencilla de obtener (3.117) a partir de (3.108) es la siguiente: Y (s) =

k k d d U (s) 1 s + a U (s) = 1 s + RC s + RC a( a1 s + 1)

Si a es muy grande se puede suponer que Y (s) ≈

1 as

(3.118)

≪ 1 y, por tanto:

kd 1 U (s) a(s + RC )

(3.119)

que es la expresi´on en (3.117). Finalmente, es importante mencionar que una reducci´on de orden como la presentada es v´alida s´olo si el polo que se desprecia tiene parte real negativa. Si el polo que se desprecia tiene parte real positiva entonces, por peque˜ na que sea C la contribuci´on de este polo crecer´a con el tiempo hasta el infinito y no podr´a ser despreciada de ninguna manera. Ejemplo 3.19 De acuerdo al ejercicio 9 y el ejemplo 2.12 del cap´ıtulo 2, el modelo de un motor de CD est´ a dado como: dia = υ − Ra ia − ke ω, dt dω = km ia − Bω J dt

La

(3.120)

donde ω es la velocidad del motor (v´eanse tambi´en (9.9) y (9.10) del cap´ıtulo 9). Suponga que este motor acciona un sistema hidr´ aulico que por efecto centr´ıfugo produce un flujo de agua, qi , que es proporcional a la velocidad del motor, es decir, qi = γω, donde γ es una constante positiva. Finalmente, este flujo de agua es utilizado para llenar el tanque del ejemplo 3.2 en el presente cap´ıtulo, cuyo modelo est´ a dado en (3.26) y que por facilidad de referencia se reescribe a continuaci´ on:

154

3 Base matem´ atica: ecuaciones diferenciales

dh + ah = kqi dt 1 1 a= , k= RC C Usando la transformada de Laplace (3.1) y considerando todas las condiciones iniciales iguales a cero, no es dif´ıcil comprobar que las ecuaciones correspondientes adquieren la forma: 1/La (V (s) − ke ω(s)) a s+ R La

I(s) =

(3.121)

km /J I(s) s+ B J 1/C H(s) = 1 Qi (s) s + RC ω(s) =

(3.122) (3.123)

Combinando (3.121) y (3.122) se obtiene: ω(s) =

km /J 1/La (V (s) − ke ω(s)) Ra s+ B J s + La

De acuerdo a (3.118) se puede escribir: ω(s) =

B J

k /J ¡ Jm ¢ Bs + 1

Ra La

1/La ´ (V (s) − ke ω(s)) ³ La s + 1 Ra

En motores de CD peque˜ nos, la inductancia La y la constante de fricci´ on La J ≪ . Por tanto, se puede considerar viscosa B son peque˜ nas por lo que R B a La que R s ≪ 1 s´ olamente y que entonces se puede aproximar: a ω(s) =

1 km (V (s) − ke ω(s)) JR s+ B a J

Para continuar, se pueden reagrupar los t´erminos que contienen ω(s) para reescribir esta expresi´ on del siguiente modo: ω(s) = s+

³

km JR ´V km ke B + J JRa

(s)

Sustituyendo esto y Qi (s) = γω(s) en (3.123) se encuentra: H(s) =

1 C

s+

1 RC

γ s+

³

km JR ´V km ke B + J JRa

(s)

Procediendo de nuevo como en (3.118) se puede escribir:

3.10 El principio de superposici´ on

H(s) =

γ C 1 RC

(RCs + 1)

155

km JR

³

B J

+

km ke JRa

´µ

¶ V (s) s+1 B + km ke 1

J

JRa

Si el tanque tiene una secci´ on suficientemente amplia, el motor alcanzar´ a su velocidad nominal mucho tiempo antes de que el nivel de agua en el tanque se incremente apreciablemente. Esto se cuantifica de manera m´ as precisa estableciendo que la constante de tiempo del tanque es muy grande comparada con la constante de tiempo del motor, es decir, que RC ≫ B + k1m ke . EntonJ

ces, se puede decir que aproximar:

1

km ke B J + JRa

H(s) =

γ C 1 RC

(RCs + 1)

o bi´en: H(s) =

JRa

s ≪ 1 s´ olamente y que, por tanto, se puede

1 C

s+

1 RC

Por lo que definiendo: k1 =

³

³

km JR ´V km ke B J + JRa

km JR γ ´V km ke B J + JRa

(s)

(s)

km JR γ km ke B J + JRa

y comparando con (3.123) se justifica la expresi´ on presentada en (3.93), es decir, que se puede considerar que el flujo de agua es proporcional al voltaje aplicado al motor a trav´es de una constante k1 . Esto es posible si: 1) la constante de tiempo de la din´ amica el´ectrica del motor es m´ as peque˜ na que la constante de tiempo de la din´ amica mec´ anica del motor, es decir si La J Ra ≪ B , y 2) si la constante de tiempo del tanque es muy grande comparada con la constante de tiempo del motor completo, es decir si RC ≫ B + k1m ke . J

JRa

Finalmente, es importante mencionar que este procedimiento es v´ alido porque km ke Ra B + > 0 y > 0, es decir, los polos despreciados son negativos. J JRa La

3.10.

El principio de superposici´ on

Toda ecuaci´on diferencial lineal satisface el principio de superposici´on. M´as a´ un, el hecho de que una ecuaci´on diferencial satisfaga el principio de superposici´on se acepta como una prueba de que la ecuaci´on diferencial es lineal. Con el fin de simplificar la exposici´on, a continuaci´on se presenta el principio de superposici´on para el caso en el que todas las condiciones iniciales son cero.

156

3 Base matem´ atica: ecuaciones diferenciales

Principio de superposici´ on. Considere la siguiente ecuaci´on diferencial ordinaria, lineal con coeficientes constantes de orden n: y (n) + an−1 y (n−1) + · · · + a1 y˙ + a0 y = b0 u + b1 u˙ + · · · + bm u(m)

(3.124)

donde n ≥ m. Suponga que todas las condiciones iniciales son cero. Suponga tambi´en que y1 (t) es la soluci´on de (3.124) cuando u1 (t) se usa como entrada y que y2 (t) es la soluci´on de (3.124) cuando u2 (t) se usa como entrada. Entonces, α1 y1 (t) + α2 y2 (t), donde α1 y α2 son constantes arbitrarias, es la soluci´on de (3.124) cuando α1 u1 (t) + α2 u2 (t) se usa como entrada. A continuaci´on se presenta una manera de comprobar este resultado. Como la ecuaci´on diferencial en (3.124) es lineal y todas las condiciones iniciales son cero entonces se puede expresar en t´erminos de su funci´on de transferencia: Y (s) = G(s)U (s)

(3.125)

Esto significa que se puede escribir: Y1 (s) = G(s)U1 (s) Y2 (s) = G(s)U2 (s) Sumando estas expresiones se obtiene: α1 Y1 (s) + α2 Y2 (s) = α1 G(s)U1 (s) + α2 G(s)U2 (s) = G(s)(α1 U1 (s) + α2 U2 (s)) Esto es posible gracias a que α1 y α2 son constantes. Esta expresi´on comprueba que α1 y1 (t) + α2 y2 (t) es la soluci´on de (3.125) y, por tanto, de (3.124) cuando α1 u1 (t) + α2 u2 (t) se usa como entrada. Ejemplo 3.20 En el circuito mostrado en la figura 3.18(a) se desea conocer el voltaje en la impedancia Z4 (s), seg´ un la polaridad mostrada. Con el fin de simplificar el circuito y conseguir el objetivo planteado, se har´ a uso de un resultado importante en el an´ alisis de circuitos: el teorema de intercambio de fuentes. Teorema 3.1 Teorema de intercambio de fuentes [5], p´ ag. 214, [11], p´ ag. 61. Cuando se tiene en serie una impedancia, Z(s), y una fuente de voltaje, Vf v (s), entre dos terminales a y b, se le puede sustituir por una fuente de corriente, If c (s), conectada en paralelo a la misma impedancia del circuito serie. La magnitud de la fuente de corriente es igual a If c (s) = Vf v (s)/Z(s). Cuando se tiene en paralelo una impedancia, Z(s), y una fuente de corriente, If c (s), entre dos terminales a y b, se le puede sustituir por una fuente de voltaje, Vf v (s), conectada en serie a la misma impedancia del circuito paralelo. La magnitud de la fuente de voltaje es igual a Vf v (s) = Z(s)If c (s).

3.10 El principio de superposici´ on Z 1(s)

157

Z 5(s)

Z 3(s) V 1(s)

+ à

Z 2(s)

+ V (s) 2 à

+

Z 4(s) à

(a)

Z 3(s) I 1(s)

Z 1(s)

Z 2(s)

Z 5(s)

+

I 2(s)

Z 4(s) à

(b) I 3(s)

I a (s)

Z 3(s)

I 1(s) + I 2(s)

Z a (s)

+

Z 4(s) à

(c) Figura 3.18. Circuito el´ectrico estudiado en el ejemplo 3.20.

Aplicando la primera parte de este resultado a las fuentes V1 (s) y V2 (s), se obtiene el circuito de la figura 3.18(b) donde: I1 (s) =

V1 (s) , Z1 (s)

I2 (s) =

V2 (s) Z5 (s)

(3.126)

Es claro que Z1 (s), Z2 (s) y Z5 (s) est´ an conectadas en paralelo y su equivalente es (v´ease (2.139)): Za (s) =

1 1 Z1 (s)

+

1 Z2 (s)

+

1 Z5 (s)

158

3 Base matem´ atica: ecuaciones diferenciales

Usando esto y la combinaci´ on de las fuentes de corriente se obtiene el circuito de la figura 3.18(c). A continuaci´ on se har´ a uso de otro resultado importante en el an´ alsis de circuitos el´ecticos: el divisor de corriente. Resultado 3.1 Divisor de corriente [5], p´ ag. 176, [11], p´ ag. 38. Cuando se tienen dos impedancias en paralelo que est´ an a su vez conectadas en paralelo a una fuente de corriente, la corriente que circula por cualquier impedancia es igual a el valor de la fuente de corriente multiplicada por la impedancia contraria a la que se desea calcular la corriente y dividida ente la suma de las dos impedancias. Por tanto, aplicando la regla de divisor de corriente y la Ley de Ohm al circuito en la figura 3.18(c) se obtienen las siguientes relaciones: Za (s) (I1 (s) + I2 (s)) Za (s) + Z3 (s) + Z4 (s) Vz4 (s) = Z4 (s)I3 (s) I3 (s) =

donde Vz4 (s) es el voltaje en la impedancia Z4 (s). Combinando estas expresiones se obtiene: Vz4 (s) =

Za (s)Z4 (s) (I1 (s) + I2 (s)) Za (s) + Z3 (s) + Z4 (s)

Finalmente, utilizando (3.126) se encuentra: Vz4 (s) =

Za (s)Z4 (s) Za (s) + Z3 (s) + Z4 (s)

µ

V1 (s) V2 (s) + Z1 (s) Z5 (s)



Se concluye que el voltaje en la impedancia Z4 (s) se puede obtener como la suma de los voltajes en Z4 (s) debidos a cada una de las fuentes, V1 (s) y V2 (s), cuando la otra fuente es puesta en corto circuito (igual a cero) y sumando ambos resultados. Esto es precisamente lo que establece el principio de superposici´ on. Es interesante subrayar que el principio de superposici´ on ha sido establecido m´ as arriba en la presente secci´ on, suponiendo que las diferentes entradas se suman directamente y luego se aplican al sistema. Sin embargo, este ejemplo muestra que el principio de superposici´ on es v´ alido en sistemas lineales a´ un y cuando las fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar inmediatamente (v´ease la figura 3.18(a)). Ejemplo 3.21 En el circuito mostrado en la figura 3.19(a) se desea conocer el voltaje en la impedancia Z3 (s), seg´ un la polaridad mostrada. Con el fin de simplificar el problema y conseguir el objetivo planteado, primero se obtiene el circuito equivalente mostrado en la figura 3.19(b). Entonces se puede hacer uso del teorema de intercambio de fuentes (v´ease el ejemplo previo) para obtener el circuito de la figura 3.19(c), donde: I1 (s) =

V1 (s) Z1 (s)

(3.127)

3.10 El principio de superposici´ on Z 1(s) +

Z 3(s) V 1(s)

+ à

à

Z 2(s)

Z 4(s)

+ V (s) 2 à

(a) Z 1(s)

Z 3(s) à

+

V 1(s)

+ à

Z 2(s)

+ V (s) 2 à

Z 4(s)

(b) Z 3(s) +

I 1(s)

Z 1(s)

Z 2(s)

à

+ V (s) 2 à

Z 4(s)

(c) Z a (s)

I(s)

Z 3(s) +

à

+ à

V 3(s) + à

V 2(s)

(d) Figura 3.19. Circuito el´ectrico estudiado en el ejemplo 3.21.

159

160

3 Base matem´ atica: ecuaciones diferenciales

Como las impedancias Z1 (s), Z2 (s) y Z4 (s) est´ an conectadas en paralelo, se encuentra que su equivalente est´ a dado como (v´ease (2.139)): Za (s) =

1 1 Z1 (s)

+

1 Z2 (s)

+

1 Z4 (s)

Como la impedancia equivalente Za (s) queda conectada en paralelo con la fuente de corriente I1 (s), se puede usar la segunda parte del teorema de intercambio de fuentes, listado en el ejemplo previo, para obtener el circuito de la figura 3.19(d), donde: V3 (s) = Za (s)I1 (s) V3 (s) − V2 (s) I(s) = Za (s) + Z3 (s) Vz3 (s) = Z3 (s)I(s) donde Vz3 (s) es el voltaje en la impedancia Z3 (s). Combinando estas expresiones y usando (3.127) se obtiene: Z3 (s) (V3 (s) − V2 (s)) Za (s) + Z3 (s) Z3 (s) = (Za (s)I1 (s) − V2 (s)) Za (s) + Z3 (s) µ ¶ Za (s) Z3 (s) V1 (s) − V2 (s) = Za (s) + Z3 (s) Z1 (s)

Vz3 (s) =

Se concluye, de nuevo, que el voltaje en la impedancia Z3 (s) se puede obtener como la suma de los voltajes en Z3 (s) debidos a cada una de las fuentes, V1 (s) y V2 (s), cuando la otra fuente es puesta en corto circuito (igual a cero) y sumando ambos resultados. Adem´ as, este ejemplo tambi´en muestra que el principio de superposici´ on es v´ alido en sistemas lineales a´ un y cuando las fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar inmediatamente (v´ease la figura 3.19(a)).

3.11. Caso de estudio. Un convertidor electr´ onico de potencia de CD a CD tipo resonante serie de alta frecuencia En la secci´on 2.7 del cap´ıtulo 2 se obtuvo el modelo matem´atico de un convertidor electr´onico de potencia de CD a CD tipo resonante serie de alta frecuencia. Este modelo es presentado en (2.186)-(2.188) y a continuaci´on se reescribe para facilitar la referencia:

3.11 Caso de estudio

di = −v − v0 sign(i) + E(t) dt dv =i C dt dv0 v0 C0 = abs(i) − dt R L

161

(3.128) (3.129) (3.130)

donde: sign(i) =

½

+1, i > 0 −1, i < 0

(3.131)

mientras que abs(i) representa el valor absoluto de i. En la presente secci´on se estudiar´a el funcionamiento de este circuito mediante la soluci´on del modelo en (3.128)-(3.130). Para esto, es de mucha utilidad realizar un cambio de coordenadas para las variables involucradas en el modelo. Por esta raz´on se definen las siguientes variables (v´ease la secci´on 2.7 del cap´ıtulo 2 para una explicaci´on del significado de los par´ametros involucrados): r L v v0 t i (3.132) , z2 = , z3 = , τ = √ z1 = E C E E LC Sustituyendo esto en (3.128), (3.129), (3.130) se tiene: ´ ³ q z d E C L 1 L ³ √ ´ = −Ez2 − Ez3 sign(z1 ) + E(t) d τ LC r C d (Ez2 ) C ³ √ ´ = z1 E L d τ LC Ã r ! C Ez3 d(Ez3 ) C0 ³ √ ´ = abs E z1 − L R d τ LC Simplificando se encuentra:

z˙1 = −z2 − z3 sign(z1 ) + u

z˙2 = z1

z3 αz˙3 = abs(z1 ) − Q

(3.133) (3.134) (3.135)

donde el punto “·” representa lapderivada respecto al tiempo normalizado τ mientras que α = C0 /C, Q = R C/L y u es una variable que s´olo toma los valores de +1 (cuando E(t) = +E) y −1 (cuando E(t) = −E). Normalmente, el valor del capacitor de salida C0 se selecciona muy grande comparado con el valor del capacitor resonante C porque esto asegura que z3 , es decir v0 , se mantendr´a aproximadamente constante durante varios ciclos de la corriente

162

3 Base matem´ atica: ecuaciones diferenciales

resonante z1 , es decir i. Por tanto, bajo esta suposici´on (z3 constante), se puede despreciar (3.135) y el uso de (3.133) y (3.134) es suficiente para representar la evoluci´on de las variables resonantes z1 y z2 , al menos durante varias oscilaciones. Por otro lado, para conseguir que el circuito opere en resonancia, los transistores Q1 , Q3 se activan (conducen) cuando z1 > 0 (es decir i > 0) con lo que u = +1 (porque E(t) = +E en este caso), de acuerdo a las figuras 2.44(a), 2.45 y 2.46, mientras que los transistores Q2 , Q4 se activan (conducen) cuando z1 < 0 (es decir i < 0) con lo que u = −1 (porque E(t) = −E en este caso). Una manera abreviada de indicar esto es especificando que u = sign(z1 ), donde sign(z1 ) = +1 si z1 > 0 y sign(z1 ) = −1 si z1 < 0. Lo anterior significa que, de acuerdo a (3.133) y (3.134), la evoluci´on de las variables resonantes puede ser descrita como: z˙1 = −z2 + ve

z˙2 = z1 ½ 1 − z3 , Q1 , Q3 conducen ve = −(1 − z3 ), Q2 , Q4 conducen

(3.136) (3.137)

donde z3 se considera constante. Aplicando el cambio de variable z4 = z2 − ve a las ecuaciones anteriores se obtiene z˙4 = z˙2 = z1 , porque v˙ e = 0 al ser ve constante, y z¨4 = z˙1 = −z2 + ve = −z4 , es decir: z¨4 + z4 = 0

(3.138)

N´otese que se trata de una ecuaci´on diferencial ordinaria, de segundo orden, lineal y de coeficientes constantes, como la definida en (3.40) con ζ = 0 y ωn = 1. Como adem´as la excitaci´on, o entrada, de esta ecuaci´on diferencial es igual a cero entonces A = 0 y la soluci´on completa est´a dada por la respuesta natural u ´nicamente. Por tanto, de acuerdo a la secci´on 3.3 y, en particular, a (3.49) y (3.50), la soluci´on de (3.138) est´a dada como: ½ ¾ ½ ¾ z40 (s + 2ζωn ) + z˙40 z40 s + z˙40 −1 −1 z4 (τ ) = p(τ ) = L =L s2 + 2ζωn s + ωn2 s2 + 1 ½ ¾ z40 s z˙40 = L−1 = z40 cos(τ ) + z˙40 sin(τ ) (3.139) + 2 2 s +1 s +1 donde se han usado los pares transformados [4], cap. 32: ) ( s −1 = cos(aτ ) L s2 + a2 ( ) a −1 L = sin(aτ ) s2 + a2 mientras que z40 = z4 (0) = z2 (0) − ve y z˙40 = z˙4 (0) = z1 (0). Derivando (3.139) una vez respecto a τ se obtiene:

3.11 Caso de estudio

z˙4 (τ ) = −z40 sin(τ ) + z˙40 cos(τ )

163

(3.140)

Entonces, usando (3.139) y (3.140) es sencillo verificar que: 2 2 z42 (τ ) + z˙42 (τ ) = z40 + z˙40

(3.141)

Esto significa que si la soluci´on de (3.138) se dibuja sobre un plano donde el eje horizontal es z4 y el eje vertical es z˙4 , entonces se obtiene un c´ırculo centrado en el origen, (z4 , z˙4 ) = (0, 0), que tiene p un radio (constante) determinado 2 + z˙ 2 . M´ por las condiciones iniciales, es decir z40 as a´ un, de acuerdo a los 40 cambios de variable z4 = z2 − ve y z˙4 = z1 , se concluye que si la soluci´on de (3.136), (3.137), se dibuja sobre un plano donde el eje horizontal es z2 y el eje vertical es z1 , entonces se obtiene un c´ırculo centrado en el punto p 2 (z2 , z1 ) = (ve , 0), que tiene un radio (constante) igual a (z20 − ve )2 + z10 donde z20 = z2 (0) y z10 = z1 (0). Es importante mencionar que, de acuerdo a (3.136) y (3.137), los valores de z1 y z2 no pueden presentar discontinuidades porque para eso se necesitar´ıan valores infinitos de z˙1 y z˙2 , respectivamente, lo cual no es posible dado que los miembros derechos de (3.136) y (3.137) no toman valores infinitos. Esto significa que, al combinar las soluciones en ambas regiones (cuando z1 > 0 y cuando z1 < 0), las condiciones iniciales en cada regi´on deben ser iguales a los valores finales de la soluci´on alcanzados en la regi´on previa. Todo lo anterior se muestra gr´aficamente en la figura 3.20. La trayectoria cerrada mostrada en esta figura indica que las variables resonantes z2 , z1 (es decir v e i) oscilan de manera permanente. Se debe subrayar que esta trayectoria cerrada se recorre en sentido horario porque, de acuerdo a (3.137), z2 crece cuando z1 > 0 (si z˙2 > 0 entonces z2 crece) y z2 disminuye cuando z1 < 0. N´otese que debido a que ve puede tomar dos valores diferentes, 1 − z3 (cuando z1 > 0) y −(1 − z3 ) (cuando z1 < 0), la u ´nica manera de conseguir la situaci´on mostrada en la figura 3.20 es que z3 = 1, es decir, que ve = 0 en ambas regiones. Esto significa que el voltaje entregado a la salida es igual al voltaje de suministro v0 = E. A continuaci´on se muestra como puede ser utilizado un convertidor resonante serie de CD a CD para entregar voltajes de salida menores que la unidad z3 < 1 (es decir v0 < E), lo cual es una aplicaci´on importante de este tipo de convertidores. Sea la funci´on s = z1 − γz2 , con γ una constante positiva, y as´ıgnese u = sign(s). Esto define las regiones mostradas en la figura 3.21. N´otese que los transistores Q1 , Q3 est´an encendidos cuando u = +1 (por encima de la l´ınea recta definida por z1 = γz2 ), pero s´olo conducen cuando z1 > 0 pues, aunque Q1 , Q3 est´en encendidos, cuando z1 < 0 la corriente el´ectrica fluye a trav´es de los diodos D1 , D3 (cualquiera de los transistores Q1 , Q2 , Q3 , Q4 s´olo conducen en una direcci´on). Por otro lado, los transistores Q2 , Q4 est´an encendidos cuando u = −1 (por debajo de la l´ınea recta definida por z1 = γz2 ), pero s´olo conducen cuando z1 < 0 pues, aunque Q2 , Q4 est´en encendidos, cuando z1 > 0 la corriente el´ectrica fluye a trav´es de los diodos D2 , D4 .

164

3 Base matem´ atica: ecuaciones diferenciales

Z1

(à 1 + Z3; 0)

(1 à Z3; 0)

Z2

Figura 3.20. Evoluci´ on de las variables resonantes z2 y z1 cuando u = sign(z1 ).

Las variables resonantes siguen evolucionando de acuerdo a (3.136) y (3.137) pero ahora ve toma los siguientes los valores constantes:  1 − z3 , Q1 , Q3 conducen, (z1 > γz2 , z1 > 0)    −(1 − z3 ), Q2 , Q4 conducen, (z1 < γz2 , z1 < 0) ve = 1 + z3 , D1 , D3 conducen, (z1 > γz2 , z1 < 0)    −(1 + z3 ), D2 , D4 conducen, (z1 < γz2 , z1 > 0)

Esto significa que, de nuevo y de acuerdo a los argumentos establecidos entre (3.136) y el p´arrafo que sigue de (3.141), las variables resonantes describen c´ırculos sobre el plano z2 − z1 . El radio de estos c´ırculos est´a determinado por las condiciones iniciales en cada regi´on (iguales a los valores finales en la regi´on previa). El centro de estos c´ırculos est´a ubicado en los siguientes puntos, dependiendo de la regi´on en que se est´a trabajando: (z2 , z1 ) = (1 − z3 , 0),

z1 > γz2 , z1 > 0,

3.11 Caso de estudio

z1

165

s=0 z 1 = íz 2

z 1 > íz 2 z1 > 0

z 1 < íz 2 z1 > 0

Q1; Q3

D2; D4

à 1 à z3

à 1 + z3

D1; D3

z 1 > íz 2 z1 < 0

1 à z3

1 + z3

z2

Q2; Q4

z 1 < íz 2 z1 < 0

Figura 3.21. Evoluci´ on de las variables resonantes z2 y z1 cuando u = sign(s) con s = z1 − γz2 .

(z2 , z1 ) = (−1 + z3 , 0), z1 < γz2 , z1 < 0, (z2 , z1 ) = (1 + z3 , 0), z1 > γz2 , z1 < 0, (z2 , z1 ) = (−1 − z3 , 0),

z1 < γz2 , z1 > 0

En la figura 3.21 se muestra la situaci´on correspondiente cuando γ = 3 que, como antes, implica que las variables resonantes z2 , z1 (es decir v e i) oscilan de manera permanente. El lector puede proceder del siguiente modo para obtener la trayectoria cerrada mostrada en la figura 3.21. Proponga cualquier valor tal que z3 < 1 y utilice cualquier punto sobre el plano z2 − z1 como valor inicial. Usando un comp´as dibuje c´ırculos con centro en los puntos arriba listados seg´ un la regi´on en cuesti´on. Recuerde que, seg´ un se explic´o previamente y de acuerdo a (3.137), estos c´ırculos deben ser recorridos en sentido horario.

166

3 Base matem´ atica: ecuaciones diferenciales

Notar´a que se empezar´a a obtener una trayectoria con forma de espiral, como la l´ınea punteada mostrada en la figura 3.21, que finalmente terminar´a en una trayectoria cerrada. El hecho de que dicha trayectoria cerrada sea alcanzada a partir de cualquier punto inicial sobre el plano z2 − z1 es una muestra de que tal trayectoria cerrada es estable (o atractiva). El lector puede proceder de la misma manera usando un valor z3 > 1 para verificar que en este caso no se consigue alcanzar ninguna trayectoria cerrada. Esto es un indicativo de que en un convertidor resonante serie no es posible obtener un voltaje de salida v0 que sea mayor que el voltaje de suministro E, es decir no es posible obtener un valor de z3 mayor que la unidad (recu´erdese que v0 = Ez3 ). Si se desea un voltaje de salida tal que v0 > E se puede utilizar el convertidor resonante paralelo mostrado en la figura 2.44(b). Por otro lado, en la figura 3.21, los arcos de c´ırculo con centro en (z2 , z1 ) = (1 − z3 , 0) y (z2 , z1 ) = (−1 − z3 , 0) se dibujan de manera consecutiva. Entonces, si ambos estuvieran centrados en el origen (z2 , z1 ) = (0, 0), juntos completar´ıan un ´angulo de 180 grados. Sin embargo, los centros de estos arcos de c´ırculo est´an colocados en el cuadrante donde z2 tiene signo contrario al cuadrante donde est´a ubicado dicho arco de c´ırculo. Esta observaci´on junto con el uso de geometr´ıa b´asica permite concluir que los arcos de c´ırculo con centro en (z2 , z1 ) = (1 − z3 , 0) y (z2 , z1 ) = (−1 − z3 , 0) describen juntos un ´angulo menor que 180 grados a pesar de que juntos completan un semiciclo completo en ambas variables resonantes z2 , z1 . Por tanto, los cuatro arcos de c´ırculo que componen a la trayectoria cerrada completa en la figura 3.21 describen juntos un ´angulo menor que 360 grados a pesar de que describen un ciclo completo en ambas variables resonantes. N´otese que la frecuencia con la que se recorren los arcos de c´ırculo mencionados sigue siendo ωn = 1 pero, de acuerdo a lo reci´en explicado, ahora se requiere menos tiempo para realizar una oscilaci´on completa porque los cuatro arcos de c´ırculo describen un ´angulo menor a la misma velocidad angular. Por tanto, la frecuencia de operaci´on ωo de las variables resonantes es mayor que ωn = 1, es decir ωo > ωn . Usando (3.132) se puede comprobar que: ωn 1 ωnt = √ =√ , LC LC

ωo > ωnt ωot = √ LC

donde ωnt y ωot representan, respectivamente, la frecuencia de resonancia del circuito y la frecuencia de operaci´on del circuito, expresadas respecto a la base de tiempo real t. Por tanto, se concluye que el circuito debe operar a frecuencias mayores que la frecuencia de resonancia para entregar voltajes de salida menores que el voltaje de suministro v0 < E (es decir z3 < 1). Por esta raz´on, cuando los transistores se activan de acuerdo a la regla u = sign(s), el circuito en las figuras 2.44(a) y 2.45 se denomina convertidor electr´onico de potencia de CD a CD tipo resonante serie de alta frecuencia. Para mayor informaci´on sobre convertidores de potencia de CD a CD tipo resonantes se recomienda consultar [8], donde se dise˜ nan, construyen, controlan y se prueban experimentalmente (ambos tipos: serie y paralelo), y [7], donde se

3.12 Resumen del cap´ıtulo

167

abunda sobre el m´etodo aqu´ı presentado para obtener la respuesta de un convertidor resonante serie usando arcos de c´ırculo. Por otro lado, en [9] y [10] se introdujo por primera vez el uso del plano de fase (z2 − z1 ) para estudiar el funcionamiento de convertidores electr´onicos de potencia tipo resonantes.

3.12.

Resumen del cap´ıtulo

Los sistemas que interesa controlar en ingenier´ıa, as´ı como cada uno de los componentes de un sistema de control en lazo cerrado, est´an descritos por ecuaciones diferenciales ordinarias, lineales, de coeficientes constantes. As´ı que, para el ingeniero de control, el estudio de las ecuaciones diferenciales debe estar dirigido hacia la comprensi´on de las caracter´ısticas de una ecuaci´on diferencial que determinan la forma gr´afica de la soluci´on. La soluci´on de una ecuaci´on diferencial lineal y de coeficientes constantes est´a dada como la suma de la respuesta natural y la respuesta forzada. La respuesta natural depende exclusivamente del polinomio caracter´ıstico de la ecuaci´on diferencial y siempre est´a presente, aunque la excitaci´on o entrada sea igual a cero. En cambio, la respuesta forzada depende de la entrada aplicada y si ´esta es cero entonces la respuesta forzada tambi´en es cero. Cuando el polinomio caracter´ıstico no tiene ra´ıces con parte real igual a cero y la entrada es un polinomio del tiempo, entonces la respuesta forzada tambi´en es un polinomio del tiempo del mismo grado que la entrada. La importancia de este hecho es que, si la respuesta natural tiende a cero (si la ecuaci´on diferencial es estable), entonces la respuesta total converger´a a la respuesta forzada. Por tanto, la entrada de una ecuaci´on diferencial puede ser seleccionada de modo tal que represente la manera en que se desea se comporte la soluci´on de la ecuaci´on diferencial. De este modo, el dise˜ no de sistemas de control se reduce a lo siguiente: dado un sistema a controlar (ecuaci´on diferencial), seleccionar un controlador (otra ecuaci´on diferencial, en general) para que al ser conectado en realimentaci´on con el sistema a controlar se obtenga una nueva ecuaci´on diferencial que 1) sea estable, 2) la respuesta forzada sea igual a la entrada aplicada al sistema realimentado (o valor deseado a la salida) y 3) que la respuesta natural desaparezca suficientemente r´apido y sin producir demasiadas oscilaciones. Las caracter´ısticas listadas en el p´arrafo anterior se consiguen del siguiente modo: 1.

2.

Estabilidad. Esta propiedad est´a determinada exclusivamente por las ra´ıces del polinomio caracter´ıstico de la ecuaci´on diferencial o, equivalentemente, de los polos de la funci´on de transferencia que representa al sistema de control (v´ease la secci´on 3.8). Respuesta en estado estacionario. Este aspecto tiene que ver con el conseguir que la respuesta forzada sea igual a la entrada aplicada al sistema realimentado. En la secci´on 3.8 se indica que, en el caso de que la entrada

168

3.

3 Base matem´ atica: ecuaciones diferenciales

sea una constante, esto est´a determinado por los t´erminos independientes de los polinomios de la funci´on de transferencia. Respuesta transitoria. Este aspecto se refiere a darle la forma adecuada a la respuesta natural y depende de la selecci´on adecuada de los polos de la funci´on de transferencia en lazo cerrado.

En los cap´ıtulos 5, 6, 7 se estudia la manera de dise˜ nar controladores para plantas arbitrarias usando los m´etodos del lugar de las ra´ıces, la respuesta en frecuencia y la variable de estado. La idea es conseguir que el sistema en lazo cerrado sea estable, que la respuesta en estado estacionario sea igual a la entrada del sistema en lazo cerrado (para cualquier entrada) y que la respuesta transitoria tenga la “forma” m´as adecuada.

3.13. 1. 2.

3.

4. 5. 6. 7.

8. 9.

Preguntas de Repaso

¿Por qu´e una funci´on de transferencia es inestable si tiene un polo con parte real cero que est´a repetido dos o m´as veces? Se ha dicho que la respuesta forzada tiene la misma forma que la entrada ¿Por qu´e esto puede no ser cierto si la funci´on de transferencia tiene polos con parte real cero? D´e un ejemplo de una entrada y una funci´on de transferencia para las cuales esto pueda suceder. Cuando una l´ampara incandescente (foco) se enciende, se calienta. Sin embargo, la temperatura del foco no crece de manera indefinida sino que se detiene en un cierto valor. De todas las ecuaciones diferenciales estudiadas, ¿Cu´al cree usted que mejor describe la evoluci´on de la temperatura del foco? ¿Por qu´e? ¿Qu´e relaci´on existe entre una funci´on de transferencia y una ecuaci´on diferencial? ¿Cu´ales son las cuatro reglas que determinan la estabilidad de una funci´on de transferencia? ¿Bajo qu´e condiciones un motor de CD con escobillas podr´ıa comportarse como un integrador? ¿Y como un doble integrador? ¿C´omo cree que ser´ıa la gr´afica de la soluci´on completa (respuesta natural m´as respuesta forzada) de una ecuaci´on diferencial que tiene dos pares de polos complejos conjugados poco amortiguados: un par con parte imaginaria mucho mas grande que la parte imaginaria del otro par? ¿C´omo cree que ser´ıa la gr´afica de la respuesta natural de una ecuaci´on diferencial de segundo orden con dos ra´ıces reales, repetidas y negativas? Se ha visto que las funciones del tiempo que forman parte de la respuesta natural est´an determinadas por los polos de la funci´on de transferencia (ra´ıces del polinomio caracter´ıstico) pero, ¿Cu´al es el efecto que tienen los ceros de la funci´on de transferencia? ¿De qu´e cree que dependen los coeficientes de las fracciones parciales obtenidas antes de aplicar la transformada inversa de Laplace? (vea las secciones 3.1 y 3.9).

3.14 Ejercicios propuestos

10.

Dibuje el plano complejo s y sobre ´el ubique la zona donde deben colocarse i) los polos reales que corresponden a respuestas r´apidas, ii) los polos complejos conjugados que corresponden a respuestas poco oscilatorias, iii) los polos complejos conjugados que corresponden a respuestas r´apidas, iv) los polos complejos conjugados que corresponden a respuestas que oscilan de manera permanente y v) los polos inestables.

3.14. 1.

169

Ejercicios propuestos

Considere el tanque con agua descrito en el ejemplo 3.2. La gr´afica mostrada en la figura 3.22 se obtiene cuando se aplica un flujo qi constante y el tanque tiene una secci´on de 0.5[m2 ]. Encuentre los valores de R y qi .

h [m]

t [s] Figura 3.22. Nivel en un tanque cuando se aplica un flujo de entrada constante.

2.

3.

Considere el control proporcional de nivel presentado en el ejemplo 3.17 (cuando se usa u = kp (hd − h), es decir, la expresi´on en (3.94)). Utilice las expresiones obtenidas en este caso para el nivel de agua para determinar lo que sucede con la diferencia hd − h(t), cuando t → ∞, conforme se utilizan valores cada vez mayores de kp > 0. Use su experiencia cotidiana para explicar por qu´e sucede esto. Considere el control proporcional-integral de nivel presentado en el ejemplo 3.17 (cuando se usa la expresi´on en (3.97)). Demuestre que existir´an

170

4.

3 Base matem´ atica: ecuaciones diferenciales

oscilaciones en el nivel de agua si se utiliza un valor suficientemente grande de ki > 0. ¿C´omo puede explicar este fen´omeno de acuerdo a su experiencia cotidiana? Dada la siguiente ecuaci´on diferencial: y¨ + 127y˙ + 570y = 3990u,

5.

y(0) = 0,

y(0) ˙ = 0,

u=1

encuentre los valores de ζ, ωn y el par´ametro k introducido en la ecuaci´on (3.40). Usando estos datos diga c´omo est´a expresada y(t). Considere el sistema masa-resorte-amortiguador descrito en el ejemplo 3.6. La gr´afica mostrada en la figura 3.23 se obtiene cuando se aplica una fuerza f =0.5[Nm] constante. Encuentre los valores de b, K y m.

x [m]

t [s] Figura 3.23. Posici´ on de la masa en un sistema masa-resorte-amortiguador cuando se aplica una fuerza de entrada constante. La l´ınea punteada representa el valor final de la posici´ on de la masa.

6.

Considere las siguientes funciones de transferencia: Y1 (s) = G1 (s)U (s), Y2 (s) = G2 (s)U (s) ab b G1 (s) = , G2 (s) = , (s + a)(s + b) s+b

a > 0, b > 0

donde U (s) = A/s, con A una constante. Realice simulaciones en las que use valores de a que aumentan desde valores peque˜ nos hasta valores muy

3.14 Ejercicios propuestos

7.

171

grandes (respecto a b) y compare gr´aficamente a y1 (t) e y2 (t). Explique lo que observa. De acuerdo a la secci´on 3.1, se sabe que para cualquier condici´on inicial la siguiente ecuaci´on diferencial y˙ + 7y = 2 tiene una soluci´on de la forma y(t) = Ee−7t + D donde E y D son algunas constantes que no interesa calcular en este ejercicio. Encuentre del mismo modo la soluci´on para cada una de las siguientes ecuaciones diferenciales. y¨ + 4y˙ + y = 2 −¨ y + y˙ + 10y = 3t y¨ + 7y˙ = 2 sin(t) y¨ + 3y˙ + 2y = 2e−t y¨ + 2y˙ + 2y = 2 cos(2t) − 4 sin(2t) y¨ − 4y = 8t2 − 4

y (4) + 11y (3) + 28¨ y = 10 8.

Para las siguientes ecuaciones diferenciales diga cuanto vale l´ımt→∞ y(t). N´otese que el mismo resultado se obtiene sin importar el valor de las condiciones iniciales. y (3) + y¨ − 2y˙ + y = 8

y¨ + y˙ − 10y = cos(5t) y¨ + ay˙ + by = kA, a > 0, b > 0, a, b, A, k son constantes

9.

Diga cu´al de las soluciones de las siguientes ecuaciones diferenciales presenta menor sobre paso y cu´al tiene un tiempo de subida m´as corto. 3¨ y + 3y˙ + y6 = 2A y¨ + 4y˙ + 10y = 9A

10.

A es una constante. Considere la soluci´on de una ecuaci´on diferencial de segundo orden ante una entrada constante o tipo escal´on, considerando condiciones iniciales cero, presentada en (3.44). Obtenga los m´aximos de dicha respuesta y resolviendo para el primero de dichos m´aximos demuestre que el sobre paso se puede calcular como: −√

Mp ( %) = 100 × e

ζ 1−ζ 2

π

Encuentre los instantes de tiempo en los cuales la respuesta natural es cero y resolviendo para el primero de esos instantes demuestre que: !# " Ãp 1 1 − ζ2 tr = π − arctan ωd ζ

172

11.

3 Base matem´ atica: ecuaciones diferenciales

Considere las siguientes expresiones: Y (s) =

12.

13.

14.

as + b U (s), s2 + c

Z(s) =

s2

d U (s) +c

donde U (s) = A/s con A, a, b, c, d constantes positivas. Exprese y(t) en funci´on de z(t). Considere la siguiente funci´on de transferencia: c G(s) = 2 s + bs + c ¿Qu´e debe hacer con b y/o c para que el sistema responda m´as r´apido?, ¿Qu´e debe hacer con b y/o c para que el sistema responda con menos oscilaciones? Considere la soluci´on y(t) de una ecuaci´on diferencial lineal de coeficientes constantes de orden n arbitrario. Si la excitaci´on o entrada es acotada, ¿Cu´ales son las condiciones para que y(t) sea acotada para todo tiempo? Es decir, para que y(t) no se haga infinita. ¿Cu´ales son las condiciones para que, cuando el tiempo tiende a infinito, la u ´nica parte de y(t) que permanezca sea la llamada respuesta forzada? Suponga que la excitaci´on o entrada es cero. Diga cu´ales son las diferentes posibilidades para el comportamiento de y(t) cuando el tiempo crece y bajo qu´e condiciones se presenta cada una de ellas. Suponga que la excitaci´on o entrada es un polinomio del tiempo. Demuestre que la soluci´on no puede tener un polinomio del tiempo de grado mayor que el contenido en la excitaci´on o entrada si todas las ra´ıces del polinomio caracter´ıstico de la ecuaci´on diferencial tienen parte real negativa. Suponga que la entrada o excitaci´on est´a dada como la suma de muchas funciones seno y coseno del tiempo, de diferentes frecuencias. Recordando como es la respuesta ante una excitaci´on tipo seno o coseno del tiempo y el principio de superposici´on ¿Puede explicar el resultado fundamental de la respuesta de las ecuaciones diferenciales lineales que dice ([6], p´ag. 389) “si la excitaci´on es una funci´on peri´odica cualquiera de periodo T y si todas las ra´ıces del polinomio caracter´ıstico tienen parte real negativa, entonces cuando t → ∞ la soluci´on y(t) tambi´en es una funci´on peri´odica de periodo T aunque con una forma de onda posiblemente diferente a la de la excitaci´on”? (recuerde el concepto de series de Fourier). Verifique las siguientes igualdades: −5/3 5/3 5 = + s2 + s − 2 s+2 s−1 1/3 2/3 −1 2 = + + ii) s(s + 2)(s − 1) s+2 s−1 s i)

3.14 Ejercicios propuestos

iii) iv) v) vi) vii) viii) ix) x) xi) xii) 15.

173

1 1/2 −1/4 1/4 = + + 2 − −s+1 (s − 1) s−1 s+1 1 1/2 −3/4 −1/4 1 = + + + s4 − s3 − s2 + s s (s − 1)2 s−1 s+1 2 1 −s = + 2 s3 + 2s s s +2 −1 −1/3 −1/9 1/9 3 = 3 + 2 + + 4 3 s − 3s s s s s−3 −1/2 1/4 1/4 8 = + + s(s + 4)(s − 4) s s+4 s−4 1 −1 8 = + 2 s − 16 s−4 s+4 4 2 −1 s−1 = 2+ + 2 s4 + s3 + 2s2 s s s +s+2 4 2 2 1 −s − 1 = + + + 2 s5 + 3s4 + 4s3 + 4s2 + 3s (s + 1)3 (s + 1)2 s+1 s +1 2 3s + 3s − 2 −1 2 1 = 2 + + s3 + 2s2 s s s+2 2 −3 3 1 s+2 = 2+ + + s2 (s + 1)2 s s (s + 1)2 s+1 s3

s2

Un horno de inducci´on consiste b´asicamente de un inductor (L) dentro del cual se coloca un recipiente de material refractario que contiene una cantidad de metal (conductor de la electricidad) a fundir. En serie al inductor se conecta un capacitor (C) para corregir el factor de potencia. Al circuito se le aplica un voltaje alterno de alta frecuencia (audiofrecuencia) con lo cual se inducen corrientes de remolino (o de eddy) en el metal contenido dentro del recipiente refractario, por lo que se produce calor y el metal se funde. El dispositivo constituye un circuito RLC en serie donde la resistencia (R) es el equivalente de la resistencia el´ectrica del metal a fundir. El voltaje alterno de alta frecuencia que se aplica al circuito est´a dado como una onda cuadrada de valor u = E sign(i) donde i es la corriente el´ectrica a trav´es del circuito, E es una constante positiva y sign(i) = +1 si i ≥ 0 o sign(i) = −1 si i < 0. Considere que el valor inicial de la corriente el´ectrica en el circuito es cero. Demuestre que si el coeficiente de amortiguamiento del circuito es menor que la unidad (0 < ζ < 1) la corriente en el inductor pes cero de manera peri´odica cada π/ωd segundos, donde ωd = ωn 1 − ζ 2 , 1 R . ωn = √LC y ζ = 2Lω n De acuerdo a u = E sign(i), el voltaje aplicado, u, cambia de valor cada que i = 0. Considerando esto y un valor inicial vc (0) para el voltaje en el capacitor, encuentre una expresi´on para el voltaje en el capacitor que sea v´alida en el pr´oximo instante en el que i = 0.

174

16.

3 Base matem´ atica: ecuaciones diferenciales

Proponga los valores num´ericos que desee para R, L y C (tales que 0 < ζ < 1). Sabiendo que el voltaje en el capacitor y la corriente en el inductor no son discontinuos cuando el valor de u cambia (¿Por qu´e?), use de manera iterativa (utilizando un programa de computadora) la f´ormula obtenida en el inciso anterior para calcular de manera num´erica el voltaje en el capacitor despu´es de varios cambios en el valor de u. Verifique que al crecer el tiempo el voltaje en el capacitor converge a un valor constante cada que i = 0. Simule el comportamiento del circuito RLC en serie cuando u = E sign(i), para comprobar los resultados del inciso anterior. De acuerdo al ejemplo 3.19, cuando la inductancia de armadura se considera despreciable, el modelo de un motor de CD est´a dado como: ω(s) = s+

³

km JR ´V km ke B + J JRa

(s)

donde ω(s) y V (s) son las transformadas de Laplace de la velocidad del motor y del voltaje aplicado en las terminales de armadura. Suponga que el voltaje aplicado es cero y que la velocidad inicial es diferente de cero. N´otese que aplicar un voltaje igual a cero en las terminales del motor equivale a poner en corto las terminales de armadura y el voltaje inducido es diferente de cero si la velocidad es diferente de cero. Dibuje la respuesta natural bajo estas condiciones. ¿C´omo puede hacer que la respuesta natural desaparezca m´as r´apido? ¿Qu´e pasa con la corriente el´ectrica? ¿Puede explicar por qu´e la respuesta natural disminuye m´as r´apidamente si la resistencia de armadura tiende a cero? ¿Conoce lo que significa el t´ermino “frenado din´amico”? ¿Por qu´e la constante de tiempo depende directamente de la inercia?¿Qu´e significa esto desde el punto de vista de las Leyes de la Mec´anica (Leyes de Newton)? ¿Por qu´e la constante de tiempo depende inversamente de la constante de fuerza contraelectromotriz? Suponga que se aplica un voltaje diferente de cero a partir de una velocidad inicial igual a cero. Dibuje la respuesta total del sistema. ¿Por qu´e la velocidad final no depende de la inercia J? D´e una interpretaci´on desde el punto de vista de la f´ısica.

Referencias

1. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 2. E. Kreyszig, Matem´ aticas avanzadas para ingenier´ıa, Vol. 1, Limusa, M´exico, 1980. 3. C. Ray Wylie, Matem´ aticas superiores para ingenier´ıa, McGraw-Hill, 4a. Edici´ on, M´exico, 1994. 4. M. R. Spiegel, Manual de f´ ormulas y tablas matem´ aticas., McGraw-Hill, Serie Schaum, M´exico, 2002. 5. I. Benitez Serrano, Analisis de redes el´ectricas: Circuitos 1, Instituto Polit´ecnico Nacional, ESIME, M´exico, D.F., 1983. 6. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New York, 1984. 7. V. Hern´ andez Guzm´ an, A new stability analysis method for DC to DC series resonant converters, Computaci´ on y Sistemas, vol. 11, no. 1, pp. 14-25, 2007. 8. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud diferencial: dise˜ no y construcci´ on, Tesis Maestr´ıa en Ciencias, CINVESTAV-IPN (Zacatenco), Febrero (2002). 9. R. Oruganti y F.C. Lee, Resonant power processors, Part I-State plane analysis, IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1453-1460, 1985. 10. R. Oruganti y F.C. Lee, Resonant power processors, Part II-Methods of control, IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1461-1471, 1985. 11. W. H. Hayt y J. E. Kemmerly, An´ alisis de circuitos en ingenier´ıa, McGraw-Hill, M´exico, D.F., 1985. 12. V. Valkenburg, An´ alisis de redes, Limusa, M´exico, D.F., 1994. 13. J. Stewart, C´ alculo. Diferencial e integral, International Thomson Editores, M´exico, D.F., 2003.

4 Criterios de estabilidad y error en estado estacionario

!d

üã

+

PI à

1=Ð M

I ãq +

PI

à

PI

I ãd = 0

vq vd

!

(dq) à1

PMSM

Id +

à

dq Iq

Los sistemas de control en lazo cerrado pueden ser complejos. En ellos, los componentes del sistema de control se conectan entre s´ı dando origen a los diagramas de bloques. La manera de trabajar estos problemas es simplificando los diagramas de bloques para obtener una u ´nica funci´on de transferencia de lazo cerrado que representa al sistema completo. Una vez conseguido esto, se puede determinar la estabilidad del sistema completo estudiando la ubicaci´on de los polos de la funci´on de transferencia de lazo cerrado. Este problema puede ser complejo incluso para sistemas de segundo orden. Por esta raz´on, se propone un m´etodo que determina la estabilidad simplemente analizando los signos de los coeficientes del polinomio caracter´ıstico. Para sistemas de orden superior se utiliza el criterio de Routh. Por otro lado, el estudio del error en estado estacionario permite determinar qu´e tipo de controlador se debe utilizar para conseguir que la respuesta forzada sea igual o muy parecida a la entrada del sistema en lazo cerrado (o valor deseado a la salida).

178

4 Criterios de estabilidad y error

Objetivos del cap´ıtulo Dado un sistema en lazo cerrado, aprender a manipular el diagrama de bloques correspondiente para obtener una funci´ on de transferencia equivalente. Identificar la regla de los signos para determinar la ubicaci´ on de las ra´ıces de un polinomio, como un m´etodo sencillo que permite establecer la estabilidad de sistemas de primero y segundo orden. Identificar el criterio de estabilidad de Routh como el m´etodo que da condiciones necesarias y suficientes para determinar cu´ ando un sistema de orden arbitrario es estable. Dado un sistema en lazo cerrado y a partir del estudio del error en estado estacionario, conseguir que la respuesta forzada sea igual o muy parecida a la entrada. Un sistema de control general esta formado por varios componentes que interact´ uan entre s´ı: planta a controlar, controlador, sistemas de medici´on, actuadores, etc. Por esta raz´on un sistema de control puede ser muy complejo. A pesar de esto, cualquier sistema de control en lazo cerrado puede ser reducido para ser representado por una sola funci´on de transferencia la cual relaciona a la salida controlada con la referencia o salida deseada. Esta funci´on de transferencia de lazo cerrado puede ser estudiada como se hace en el cap´ıtulo 3. En el presente cap´ıtulo se presenta el concepto de diagramas de bloques para indicar como est´a constituido un sistema de control en lazo cerrado y se presenta la manera de manipularlos para obtener la funci´on de transferencia de lazo cerrado. Por otro lado, un sistema de control siempre se dise˜ na de modo que cumpla tres requisitos: a) que sea estable, b) que tenga las caracter´ısticas deseadas de respuesta transitoria y c) que tenga las caracter´ısticas deseadas de respuesta en estado estacionario. De acuerdo a lo estudiado en el cap´ıtulo 3, una funci´on de transferencia es estable si todos sus polos tienen parte real negativa. Sin embargo, verificar este requisito de manera anal´ıtica puede presentar algunas dificultades y por ello surge la necesidad de encontrar m´etodos sencillos para conseguirlo. En este cap´ıtulo se presentan dos alternativas: 1) la regla de los signos para determinar la ubicaci´on de las ra´ıces de un polinomio y, 2) el Criterio de estabilidad de Routh. Las caracter´ısticas de respuesta transitoria de un sistema de control dependen de la ubicaci´on de los polos y de los ceros de la funci´on de transferencia en lazo cerrado. Hay dos m´etodos para el dise˜ no de un controlador que asigne los polos y los ceros de la funci´on de transferencia de lazo cerrado en los lugares requeridos para que se consigan las caracter´ısticas deseadas de respuesta transitoria: el lugar de las ra´ıces (cap´ıtulo 5) y la respuesta en frecuencia (cap´ıtulo 6). Finalmente, las caracter´ısticas deseadas de respuesta en estado estacionario se refieren al dise˜ no de un controlador que consiga que, una vez que la

4.1 Diagramas de bloques

179

respuesta natural es cero1 , la respuesta del sistema en lazo cerrado alcance la referencia o salida deseada de manera exacta o, al menos, dentro de ciertos m´argenes de tolerancia. Esto se consigue si la respuesta forzada del sistema en lazo cerrado es igual o muy cercana a la referencia o salida deseada. Este tema tambi´en es estudiado en el presente cap´ıtulo.

4.1.

Diagramas de bloques

A continuaci´on se muestra, a base de ejemplos, como se puede manipular un diagrama de bloques formado por la interconexi´on de varias funciones de transferencia para ser simplificado y ser representado por una sola funci´on de transferencia. Tambi´en se muestra como se pueden simplificar los diagramas de bloques correspondientes a sistemas que tienen dos (o m´as) entradas. Ejemplo 4.1 Suponga que se tienen dos sistemas tales que la entrada de uno es la salida del otro (conectados en cascada), como se muestra en la figura 4.1. Entonces se puede escribir: Y1 (s) = G1 (s)U1 (s),

Y2 (s) = G2 (s)U2 (s),

U1 (s) = Y2 (s)

para obtener: Y1 (s) = G1 (s)G2 (s)U2 (s), Y1 (s) = G(s)U2 (s)

U 2(s)

G 2(s)

G 1(s)

Y 1(s)

G(s) = G1 (s)G2 (s)

)

U 2(s)

G(s)

Y 1(s)

Figura 4.1. Sistemas conectados en cascada.

Esto significa que los sistemas conectados en cascada, como en la figura 4.1, pueden ser representados por una sola funci´ on de transferencia G(s) que se calcula como el producto de las funciones de transferencia de los sistemas en cascada. El lector puede verificar que esto es cierto sin importar el n´ umero de sistemas conectados en cascada. Ejemplo 4.2 Suponga que se tienen dos sistemas conectados en paralelo como se muestra en la figura 4.2. Entonces se puede escribir: Y1 (s) = G1 (s)U (s), 1

Y2 (s) = G2 (s)U (s)

Cuando el tiempo es suficientemente grande, o en estado estacionario

180

4 Criterios de estabilidad y error

para obtener: Y1 (s) + Y2 (s) = (G1 (s) + G2 (s))U (s)

G(s) = G1 (s) + G2 (s)

Y1 (s) + Y2 (s) = G(s)U (s)

Y 1(s)

G 1(s)

+

U(s)

Y 1(s) + Y 2(s)

+

G 2(s)

)

U(s)

Y 2(s)

G(s)

Y 1(s) + Y 2(s)

Figura 4.2. Sistemas conectados en paralelo.

Esto significa que los sistemas conectados en paralelo, como en la figura 4.2, pueden ser representados por una sola funci´ on de transferencia G(s) que se calcula como la suma de las funciones de transferencia de los sistemas conectados en paralelo. El lector puede verificar que esto es cierto sin importar el n´ umero de sistemas conectados en paralelo. Ejemplo 4.3 Considere el sistema de control en lazo cerrado mostrado en la figura 4.3. Los bloques G(s) y H(s) representan las funciones de transferencia de los diferentes componentes de un sistema de control. De hecho, G(s) y H(s) pueden ser el resultado de combinar las funciones de transferencia de varios componentes del sistema de control como se indica en los dos ejemplos previos. De acuerdo a la definici´ on de funci´ on de transferencia, a partir de la figura 4.3 se encuentra que: C(s) = G(s)E(s),

E(s) = R(s) − Y (s),

Y (s) = H(s)C(s)

Sustituyendo sucesivamente estas expresiones se encuentra que: C(s) = G(s)[R(s) − Y (s)] = G(s)[R(s) − H(s)C(s)]

= G(s)R(s) − G(s)H(s)C(s) C(s)[1 + G(s)H(s)] = G(s)R(s) G(s) R(s) C(s) = 1 + G(s)H(s)

4.1 Diagramas de bloques

181

donde: C(s) G(s) = R(s) 1 + G(s)H(s)

M (s) =

(4.1)

se conoce como la funci´ on de transferencia de lazo cerrado.

C(s)

E(s)

R(s) +

G(s) à

Y(s)

H(s) Figura 4.3. Sistema en lazo cerrado.

Ejemplo 4.4 Considere el diagrama de bloques de la figura 4.4(a). Para reducir este diagrama de bloques es conveniente recorrer el punto de resta colocado a la derecha de U (s) hasta donde se encuentra I ∗ (s). Para conseguirlo es indispensable que la variable I(s) en 4.4(a) permanezca sin alterarse. Es decir, de acuerdo a la figura 4.4(a): I(s) =

1 [KAp (I ∗ (s) − I(s)) − nke sθ(s)] Ls + R

N´ otese que esta expresi´ on tambi´en es v´ alida en el diagrama de bloques de la figura 4.4(b) y, por tanto, este diagrama de bloques es equivalente al de la figura 4.4(a). A continuaci´ on, es claro que el lazo existente entre el segundo punto de resta en 4.4(b) e I(s) es id´entico al sistema en lazo cerrado mostrado en la figura 4.3 con: G(s) =

KAp , Ls + R

H(s) = 1

donde se ha usado el resultado del ejemplo 4.1 para calcular la funci´ on de transferencia de dos sistemas en cascada como el producto de las funciones de transferencia de los sistemas en cascada. Por tanto, usando (4.1) se encuentra que la siguiente funci´ on de transferencia debe ser colocada antes de I(s): KAp Ls + R + KAp Esto se muestra en la figura 4.4(c). El diagrama de bloques en la figura 4.4(c) tiene dos entradas. Para encontrar la salida θ(s) como funci´ on de las dos entradas se usa el principio de superposici´ on (v´ease la secci´ on 3.10), es decir: θ(s) = G1 (s)I ∗ (s) + G2 (s)Tp (s)

(4.2)

182

4 Criterios de estabilidad y error U i ( s)

I ã(s) +

Ap

K

U ( s)

à

+

I(s)

1 Ls+R

nkm

+

T p ( s) à

ò ( s)

1 Js 2 +bs

à

nke s

(a) I ã(s) + à

+

I(s)

1 Ls+R

KAp à

nke KA p

nkm

+

T p ( s) à

ò(s)

1 Js 2 +bs

s

(b) I ã(s) +

KA p Ls+R+KA p

I(s)

+

nkm

T p ( s) à

à

nke KA p

ò(s)

1 Js 2 +bs

s

(c) Figura 4.4. Simplificaci´ on de un diagrama de bloques que contiene un lazo interno.

donde G1 (s) es la funci´ on de transferencia obtenida con I ∗ (s) como entrada y θ(s) como salida cuando se considera que Tp (s) = 0 en el diagrama de bloques en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene la forma mostrada en la figura 4.5(a). Por tanto, usando (4.1) se define:

M (s) =

G(s) θ(s) = ∗ = G1 (s) 1 + G(s)H(s) I (s)

con: G(s) =

KAp nkm , (Ls + R + KAp )(Js2 + bs)

H(s) =

nke s KAp

para obtener: G1 (s) = h³

sL+R KAp

nkm ´ + 1 (sJ + b) +

n2 km ke KAp

i

(4.3) s

4.1 Diagramas de bloques

Iã(s) +

KA p Ls+R+KA p

à

1 Js 2+bs

nkm

183

ò(s)

nk e s KA p (a) Diagrama de bloques cuando Tp (s) = 0.

T p(s) à

ò(s)

1 Js 2+bs

à nk mKA p Ls+R+KA p

nk e s KA p

(b) Diagrama de bloques cuando I ∗ (s) = 0.

Iã(s)

G1(s) +

ò(s) +

T p(s)

G2(s)

(c) Diagrama de bloques equivalente a cualquiera de los diagramas mostrados en la figura 4.4. Figura 4.5. Simplificaci´ on del diagrama de bloques en la figura 4.4(c).

Por otro lado, G2 (s) es la funci´ on de transferencia obtenida con Tp (s) como entrada y θ(s) como salida cuando se considera que I ∗ (s) = 0 en el diagrama de bloques en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene la forma mostrada en la figura 4.5(b). Por tanto, usando (4.1) se define: M (s) =

−G(s) θ(s) = = G2 (s) 1 + G(s)H(s) Tp (s)

con: G(s) = para obtener:

1 , 2 Js + bs

H(s) =

n2 km ke s Ls + R + KAp

184

4 Criterios de estabilidad y error

G2 (s) = h³



sL+R KAp

³

sL+R KAp

´ +1

´ + 1 (sJ + b) +

n2 km ke KAp

i

(4.4) s

Por tanto, cualquiera de los diagramas de bloques de las figuras 4.4(a), 4.4(b) o 4.4(c) se puede representar como el diagrama de bloques de la figura 4.5(c) con G1 (s) y G2 (s) dadas en (4.3) y (4.4). Ejemplo 4.5 Considere el sistema en lazo cerrado mostrado en la figura 4.6(a). Este ejemplo representa un esquema de control conocido como controlador con dos grados de libertad. Este es un sistema con dos entradas y una salida. Por tanto, se puede proceder como en el ejemplo previo para, usando el principio de superposici´ on, escribir: C(s) = G1 (s)R(s) + G2 (s)D(s) donde G1 (s) es la funci´ on de transferencia obtenida usando R(s) como entrada y C(s) como salida cuando D(s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 4.6(b). Por otro lado, G2 (s) es la funci´ on de transferencia obtenida usando D(s) como entrada y C(s) como salida cuando R(s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 4.6(c). Primero se procede a obtener G1 (s). Para simplificar el diagrama de bloques de la figura 4.6(b) n´ otese que: V (s) = Gc1 (s)(R(s) − C(s)) − Gc2 (s)C(s)

= Gc1 (s)(R(s) − C(s)) + Gc2 (s)(R(s) − C(s)) − Gc2 (s)R(s) = (Gc1 (s) + Gc2 (s))(R(s) − C(s)) − Gc2 (s)R(s)

Por lo que se obtienen, sucesivamente, los diagramas de bloques de las figuras 4.7(a), 4.7(b) y 4.7(c). N´ otese que, de acuerdo al ejemplo 4.2, se puede escribir: ¸ · Gc2 (s) R(s) F (s) = 1 − Gc1 (s) + Gc2 (s) Gc1 (s) + Gc2 (s) − Gc2 (s) = R(s) Gc1 (s) + Gc2 (s) Gc1 (s) = R(s) (4.5) Gc1 (s) + Gc2 (s) Por otro lado, se puede hacer uso de (4.1) junto con: G(s) = (Gc1 (s) + Gc2 (s))Gp (s),

H(s) = 1

para obtener: C(s) =

(Gc1 (s) + Gc2 (s))Gp (s) F (s) 1 + (Gc1 (s) + Gc2 (s))Gp (s)

(4.6)

4.1 Diagramas de bloques

185

D(s)

R(s) +

à

+

G c1 ( s)

+

+

C(s) G p ( s)

à

G c2 ( s)

(a) Sistema en lazo cerrado.

R(s) +

V(s)

+

G c1 ( s)

C(s) G p ( s)

à

à

G c2 ( s)

(b) Caso cuando D(s) = 0

D(s)

+

G p ( s)

C(s)

à +

+

G c1 ( s)

G c2 ( s) (c) Caso cuando R(s) = 0 Figura 4.6. Sistema de control con dos grados de libertad.

Sustituyendo (4.5) en (4.6) se obtiene: C(s) =

Gc1 (s)Gp (s) R(s) 1 + (Gc1 (s) + Gc2 (s))Gp (s)

por lo que se concluye que: G1 (s) =

Gc1 (s)Gp (s) 1 + (Gc1 (s) + Gc2 (s))Gp (s)

(4.7)

Por otro lado, del diagrama de bloques de la figura 4.6(c) y de acuerdo al ejemplo 4.2 se obtiene el diagrama de bloques de la figura 4.8. Usando (4.1) junto con: G(s) = Gp (s),

H(s) = Gc1 (s) + Gc2 (s)

186

4 Criterios de estabilidad y error G c2(s) R(s)

+

à

G c1(s) + G c2(s)

V(s)

+

à

C(s)

G p ( s)

(a) G c2(s) G c1(s)+G c2(s)

R(s)

+

G c1(s) + G c2(s)

à

G c1(s) + G c2(s)

G p ( s)

+

à

C(s)

V(s)

(b) G c2(s) G c1(s)+G c2(s)

R(s)

à

V(s)

F(s)

+ 1

+

G c1(s) + G c2(s)

C(s)

G p ( s)

à (c)

Figura 4.7. Simplificaci´ on del diagrama de bloques mostrado en la figura 4.6(b).

se obtiene: C(s) =

Gp (s) D(s) 1 + (Gc1 (s) + Gc2 (s))Gp (s)

es decir: G2 (s) =

Gp (s) 1 + (Gc1 (s) + Gc2 (s))Gp (s)

(4.8)

Por tanto, el diagrama de bloques de la figura 4.6(a) se puede representar como el diagrama de bloques de la figura 4.9 con G1 (s) y G2 (s) dadas en (4.7) y (4.8).

4.2 Regla de los signos

D(s)

+

187

C(s)

G p ( s)

à G c1(s) + G c2(s) Figura 4.8. Simplificaci´ on del diagrama de bloques en la figura 4.6(c).

R(s)

G 1(s)

+ + D(s)

C(s)

G 2(s)

Figura 4.9. Diagrama de bloques equivalente al de la figura 4.6(a).

4.2. Regla de los signos para determinar la ubicaci´ on de las ra´ıces de un polinomio De acuerdo a la secci´on 3.8, la estabilidad de una funci´on de transferencia est´a asegurada si la parte real de todos sus polos es negativa, es decir si todas las ra´ıces de su polinomio caracter´ıstico tienen parte real negativa. Sin embargo, en ocasiones es dif´ıcil calcular el valor exacto de los polos, sobre todo si el polinomio es de grado tres o mayor. La raz´on de esto es que el procedimiento para calcular las ra´ıces de polinomios de orden 3 y 4 es un poco complicado. M´as a´ un, para polinomios de grado 5 o mayor ni siquiera existen procedimientos anal´ıticos para esto. Incluso para polinomios de segundo grado en ocasiones es un poco tedioso tener que hacer el c´alculo correspondiente a´ un cuando la f´ormula existente para tal caso es bien conocida. As´ı que es muy conveniente contar con un medio sencillo que permita determinar si los polos de un polinomio tienen parte real negativa o si existe alguno con parte real positiva. En esta secci´on se introducen criterios sencillos que resuelven este problema y que est´an basados en el estudio de los signos de los coeficientes de un polinomio. 4.2.1.

Polinomios de segundo grado

Criterio 4.1 Si un polinomio de segundo grado tiene todos sus coeficientes con el mismo signo, entonces todas sus ra´ıces tienen parte real negativa. Prueba. Considere el siguiente polinomio: p(s) = s2 + cs + d

188

4 Criterios de estabilidad y error

donde c > 0, d > 0. Si todos los coeficientes de un polinomio tuvieran signo negativo, entonces se puede factorizar dicho signo y proceder como se muestra a continuaci´on. Las dos ra´ıces de p(s) se obtienen usando la f´ormula general: √ −c ± c2 − 4d s1,2 = (4.9) 2 Caso i): c2 − 4d < 0. En este caso ambas ra´ıces son complejas conjugadas con parte real negativa porque c > 0: √ −c 4d − c2 s1,2 = ± j 2 2 Caso ii): c2 − 4d > 0. En este caso c2 > c2 − 4d > 0 porque d > 0. Aplicando la ra´ız cuadrada en ambos lados de la desigualdad se obtiene: p c > c2 − 4d

porque la ra´ız cuadrada es una funci´on estrictamente creciente. Entonces: p c − c2 − 4d > 0

De acuerdo a (4.9), esto significa que ambas ra´ıces son reales, distintas y negativas en este caso: √ c + c2 − 4d <0 s1 = − √2 c − c2 − 4d s2 = − <0 2 Caso iii): c2 − 4d = 0. En este caso ambas ra´ıces son reales, iguales y negativas: s1,2 =

−c 2

(4.10)

Ejemplo 4.6 N´ otese que el polinomio s2 + s + 1 satisface el caso i) por lo que sus ra´ıces son complejas conjugadas con parte real negativa. De hecho, no es dif´ıcil verificar que estas ra´ıces son −0.5 + j0.866 y −0.5 − j0.866. Por otro lado, el polinomio s2 + 2.5s + 1 satisface el caso ii) por lo que sus dos ra´ıces son reales, distintas y negativas. No es dif´ıcil verificar que dichas ra´ıces son −2 y −0.5. Finalmente, el polinomio s2 + 2s + 1 satisface el caso iii) por lo que sus dos ra´ıces son reales, iguales y negativas. No es dif´ıcil verificar que dichas ra´ıces son −1 y −1.

4.2 Regla de los signos

189

Criterio 4.2 Si un polinomio de segundo grado tiene algunos de sus coeficientes con signo contrario al de los otros coeficientes, entonces al menos una de sus ra´ıces tiene parte real positiva. Prueba. Considere el siguiente polinomio: p(s) = s2 + cs + d donde hay tres posibilidades: 1) c < 0, d > 0. 2) c > 0, d < 0. 3) c < 0, d < 0. Las dos ra´ıces correspondientes se obtienen usando la f´ormula general: √ −c ± c2 − 4d s1,2 = (4.11) 2 Caso i): c2 − 4d < 0. En este caso ambas ra´ıces son complejas conjugadas con parte real positiva si se cumple 1). Los casos 2) y 3) no son posibles porque d < 0 implica que c2 − 4d > 0. Caso ii): c2 − 4d > 0. Este caso es posible para d < 0, con c < 0 o c > 0 y algunos valores peque˜ nos de d > 0 con c < 0. Para valores mayores de d > 0 se recupera el caso i). Si d < 0 entonces: c2 < c2 − 4d Aplicando la ra´ız cuadrada en ambos lados de la desigualdad se obtiene: p abs(c) < c2 − 4d

porque la ra´ız cuadrada es una funci´on estrictamente creciente. Entonces: p abs(c) − c2 − 4d < 0

Esto significa que ambas ra´ıces son reales y distintas con una de ellas positiva: √ c + c2 − 4d <0 s1 = − √2 c − c2 − 4d >0 s2 = − 2 Si d > 0 con c < 0 entonces: c2 > c2 − 4d

190

4 Criterios de estabilidad y error

Aplicando la ra´ız cuadrada en ambos lados de la desigualdad se obtiene: p abs(c) > c2 − 4d p abs(c) − c2 − 4d > 0

Como c < 0, ya que d > 0, entonces hay dos ra´ıces reales positivas: √ c + c2 − 4d >0 s1 = − √2 c − c2 − 4d s2 = − >0 2

Caso iii): c2 − 4d = 0. En este caso d = c2 /4 > 0, por lo que c < 0 (v´ease 1)). Esto implica que ambas ra´ıces son reales, iguales y positivas: s1,2 =

−c >0 2

(4.12)

Ejemplo 4.7 A continuaci´ on se presentan varios polinomios de segundo orden y sus correspondientes ra´ıces. Se deja como ejercicio para el lector que verifique estos resultados, que identifique a que caso de los anteriores corresponde cada uno y que compruebe que se cumplen las predicciones hechas en el an´ alisis arriba presentado. s2 + 2s − 1, ra´ıces: −2.4142 y 0.4142. s2 − 2.5s + 1, ra´ıces: 2 y 0.5. s2 − s − 1, ra´ıces: 1.618 y −0.618. s2 − s + 1, ra´ıces: 0.5 + j0.866 y 0.5 − j0.866. s2 − 2s + 1, ra´ıces: 1 y 1. 4.2.2.

Polinomios de primer grado

En este caso es muy f´acil demostrar que se cumple algo similar a los polinomios de segundo grado: Criterio 4.3 Si los dos coeficientes tienen el mismo signo entonces la u ´nica ra´ız es real y negativa. Si un coeficiente tiene signo contrario al otro coeficiente entonces la u ´nica ra´ız es real y positiva. 4.2.3.

Polinomios de grado 3 o mayor

Criterio 4.4 Si al menos un coeficiente tiene signo contrario a los otros coeficientes entonces es seguro que existe al menos una ra´ız con parte real positiva.

4.3 Criterio de estabilidad de Routh

191

Prueba. Considere el siguiente polinomio donde n ≥ 3:

p(s) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − p1 )(s − p2 ) · · · (s − pn ()4.13)

Del estudio de polinomios de segundo grado se sabe que el producto (s − pi )(s − pj ) = s2 + cs + d ser´a tal que c < 0 y/o d < 0 si una de las ra´ıces pi o pj o ambas tienen parte real positiva. Por otro lado, el polinomio de primer orden (s − pk ) tiene un coeficiente negativo si su ra´ız pk es positiva. N´otese tambi´en que los coeficientes aj , j = 0, . . . , n − 1 que se encuentran en el lado izquierdo de (4.13) se obtienen como la suma de los productos de los coeficientes de los polinomios de la forma s2 + cs + d y (s − pk ) que existen en el miembro de la derecha de (4.13). Entonces, la u ´nica manera de que exista un coeficiente aj < 0 en el lado izquierdo de (4.13) es que exista una ra´ız con parte real positiva en el miembro derecho de (4.13), es decir que alguno de los polinomios s2 + cs + d o (s − pk ) tenga un coeficiente negativo. Criterio 4.5 A´ un cuando todos los coeficientes tengan el mismo signo, no puede asegurarse que todas las ra´ıces tienen parte real negativa. Esto puede explicarse usando los mismos argumentos del p´arrafo anterior, recordando que el producto de dos coeficientes negativos da un resultado positivo. Entonces, a´ un cuando todos los coeficientes del polinomio en el lado izquierdo de (4.13) sean positivos, existe la posibilidad de que dos coeficientes negativos (ra´ıces con parte real positiva) del lado derecho de (4.13) se multipliquen para dar un coeficiente positivo del lado izquierdo de (4.13). Ejemplo 4.8 Para ilustrar lo que sucede cuando un polinomio es de orden mayor a 2, a continuaci´ on se presentan algunos polinomios y sus ra´ıces. El lector puede comprobar estos resultados verificando que s3 + a2 s2 + a1 s + a0 = (s−p1 )(s−p2 )(s−p3 ) donde p1 , p2 , p3 son las ra´ıces del polinomio en cuesti´ on. s3 + s2 + s + 1.5, ra´ıces: −1.2041, 0.102 + j1.1115 y 0.102 − j1.1115. Dos ra´ıces con parte real positiva, a pesar de que todos los coeficientes del polinomio tienen el mismo signo. s3 − s2 + s + 1, ra´ıces: 0.7718 + j1.1151, 0.7718 − j1.1151 y −0.5437. Dos ra´ıces con parte real positiva porque un coeficiente del polinomio tiene signo contrario a los otros coeficientes. s3 + s2 + 1, ra´ıces: −1.4656, 0.2328 + j0.7926, 0.2328 − j0.7926. Dos ra´ıces con parte real positiva porque un coeficiente tiene valor cero, aunque los dem´ as coeficientes tienen el mismo signo. s3 + s2 + 3s + 1, ra´ıces: −0.3194 + j1.6332, −0.3194 − j1.6332 y −0.3611. Todas las ra´ıces tienen parte real negativa y todos los coeficientes del polinomio tienen el mismo signo.

4.3.

Criterio de estabilidad de Routh

Como se ve en la secci´on anterior, la regla de los signos para determinar la ubicaci´on de las ra´ıces de un polinomio, aunque muy c´omoda, tiene su

192

4 Criterios de estabilidad y error

principal desventaja cuando se trata de aplicar a polinomios de grado mayor o igual a 3: si todos los coeficientes de dicho polinomio tienen el mismo signo nada se puede asegurar a cerca del signo de la parte real de sus ra´ıces. La soluci´on a este problema la da el criterio de estabilidad de Routh el cual, dado un polinomio de grado arbitrario, establece condiciones necesarias y suficientes para asegurar que todas las ra´ıces tienen parte real negativa. Tabla 4.1. Tabla que se debe construir para aplicar el criterio de Routh. sn n−1

s sn−2 sn−3 sn−4 .. . s2 s1 s0

an an−1 b1 c1 d1 .. . p1 q1 p2

an−2 an−4 an−6 an−3 an−5 an−7 b2 b3 b4 c2 c3 c4 d2 d3 d4 .. .. .. . . . p2 0 0

... ... ... ... ...

0 0 0 0 0

... 0

Dado un polinomio arbitrario, ord´enelo en orden descendente de potencias: an sn + an−1 sn−1 + · · · + a1 s + a0

(4.14)

El criterio de estabilidad de Routh consiste en realizar los siguientes dos pasos: 1.

Construya la tabla 4.1. N´otese que los primeros dos renglones de la tabla anterior se construyen usando directamente los coeficientes del polinomio bajo estudio. Observe tambi´en que los u ´ltimos elementos de los dos primeros renglones terminan en ceros, pues ese es el valor de los coeficientes de las potencias que no aparecen en el polinomio en (4.14). Los elementos de los otros renglones se calculan de acuerdo a las siguientes reglas: b1 =

an−1 an−2 − an an−3 an−1 an−4 − an an−5 , b2 = , an−1 an−1 an−1 an−6 − an an−7 b3 = an−1

.. . c1 =

b1 an−5 − an−1 b3 , b1

b1 an−3 − an−1 b2 , b1

c2 =

c1 b2 − b1 c2 , c1

c1 b3 − b1 c3 , c1

c3 =

b1 an−7 − an−1 b4 b1

.. . d1 = .. .

d2 =

d3 =

c1 b4 − b1 c4 c1

4.3 Criterio de estabilidad de Routh

2.

193

N´otese que, de acuerdo a estas reglas, el u ´ltimo elemento de cada rengl´on es cero y que la tabla tiene una forma triangular. Analice u ´nicamente la primera columna de la tabla construida. El n´ umero de cambios de signos al recorrer de arriba hacia abajo los elementos de la primera columna es igual al n´ umero de ra´ıces con parte real positiva.

A continuaci´on se presentan varios ejemplos. Ejemplo 4.9 Sea el siguiente polinomio de segundo orden: s2 + as + b con a y b dos constantes reales. Dado que este polinomio es de segundo grado (tiene dos ra´ıces) entonces se puede usar la regla de los signos vista en la secci´ on 4.2 para concluir que las dos ra´ıces tiene parte real negativa si a > 0,

b>0

ya que el coeficiente de s2 es positivo e igual a uno. Ahora se har´ a uso del criterio de Routh para verificar este resultado. De acuerdo a las reglas del criterio de Routh se construye la tabla 4.2. El criterio de Routh establece que el n´ umero de cambios de signo al recorrer los elementos de la primera columna es igual al n´ umero de ra´ıces con parte real positiva. Por tanto, si no hay cambios de signo entonces las dos ra´ıces tendr´ an parte real negativa. Como el primer elemento de la primera columna es igual a 1, el cual es un n´ umero positivo, entonces las condiciones: a > 0,

b>0

deben cumplirse simult´ aneamente para asegurar que ambas ra´ıces tienen parte real negativa. De este modo, el criterio de Routh y la regla de los signos de la secci´ on 4.2 dan el mismo resultado, como se esperaba. Tabla 4.2. Aplicaci´ on del criterio de Routh al polinomio s2 + as + b. s2 1 b 0 s1 a 0 s0 b

Ejemplo 4.10 Sea el siguiente polinomio: s3 + 5s2 + 2s − 8 Dado que existe un coeficiente de signo contrario al de los otros (−8) se puede usar la regla de los signos vista en la secci´ on 4.2 para concluir que existe al menos una ra´ız con parte real positiva. Ahora se har´ a uso del criterio de Routh

194

4 Criterios de estabilidad y error

para verificar este resultado. De acuerdo a las reglas del criterio de Routh se construye la tabla 4.3. El criterio de Routh establece que el n´ umero de cambios de signo al recorrer los elementos de la primera columna es igual al n´ umero de ra´ıces con parte real positiva. Por tanto, se concluye que el polinomio s3 + 5s2 + 2s − 8 tiene una ra´ız con parte real positiva. De hecho, usando software especializado se pueden usar m´etodos num´ericos para encontrar que: s = −2,

s = 1,

s = −4

son las ra´ıces del polinomio en cuesti´ on. Tabla 4.3. Aplicaci´ on del criterio de Routh al polinomio s3 + 5s2 + 2s − 8. s3 s2 s1 s0

1 5 5×2−1×(−8) 5

2 0 -8 0 = 3.6 0

−8

Ejemplo 4.11 Sea el siguiente polinomio: s3 + 1.8s2 + 0.61s + 2.02 N´ otese que todos los coeficientes del polinomio tienen el mismo signo (todos son positivos). En este caso la regla de los signos vista en la secci´ on 4.2 no es de utilidad porque el polinomio es de tercer grado. En este tipo de situaciones el criterio de Routh es de gran utilidad. De acuerdo a las reglas del criterio de Routh se construye la tabla 4.4. El criterio de Routh establece que el n´ umero de cambios de signo al recorrer los elementos de la primera columna es igual al n´ umero de ra´ıces con parte real positiva. Por tanto, se concluye que el polinomio s3 + 1.8s2 + 0.61s + 2.02 tiene dos ra´ıces con parte real positiva. De hecho, usando software especializado se pueden usar m´etodos num´ericos para encontrar que: s = −2,

s = 0.1 + j,

s = 0.1 − j

son las ra´ıces del polinomio en cuesti´ on. Tabla 4.4. Aplicaci´ on del criterio de Routh al polinomio s3 + 1.8s2 + 0.61s + 2.02. s3 s2 s1 s0

1 1.8 1.8×0.61−1×2.02 1.8

2.02

0.61 0 2.02 0 = −0.512 0

4.3 Criterio de estabilidad de Routh

195

Ejemplo 4.12 Sea el siguiente polinomio: s3 + as2 + bs + c donde a, b y c son constantes reales desconocidas. Este tipo de situaciones es muy com´ un en sistemas de control donde los coeficientes del polinomio caracter´ıstico dependen de las ganancias del controlador, las cuales no se conocen de antemano y deben ser determinadas de modo que se asegure la estabilidad en lazo cerrado. Esto se consigue asegurando que todas las ra´ıces del polinomio caracter´ıstico de lazo cerrado tengan parte real negativa. Sin embargo, el c´ alculo de las ra´ıces de un polinomio de tercer orden usando f´ ormulas anal´ıticas es un proceso tedioso y, por tanto, esa no es una soluci´ on pr´ actica. Este es otro tipo de problema en el que el criterio de Routh es de gran utilidad. De acuerdo a las reglas del criterio de Routh se construye la tabla 4.5. El criterio de Routh establece que el n´ umero de cambios de signo al recorrer los elementos de la primera columna es igual al n´ umero de ra´ıces con parte real positiva. Por tanto, como el primer elemento de la columna es igual a 1, es decir es positivo, entonces si: a > 0,

ab − c >0 a

c>0

(4.15)

se asegura que las tres ra´ıces tiene parte real negativa. N´ otese que las condiciones en (4.15) son equivalentes a: a > 0,

b>

c >0 a

c>0

Esto indica que aunque a los coeficientes a y c s´ olo se les exige que deben ser positivos, en el caso del coeficiente b esto no es suficiente y se le exige un poco m´ as: b > ac > 0. Tabla 4.5. Aplicaci´ on del criterio de Routh al polinomio s3 + as2 + bs + c. s3 s2 s1 s0

1 a ab−1×c a

b0 c0 0

c

Ejemplo 4.13 (Caso especial. S´ olo el elemento de la primera columna de un rengl´ on es igual a cero) Sea el siguiente polinomio: s5 + 2s4 + 3s3 + 6s2 + 5s + 3 De acuerdo a las reglas del criterio de Routh se construye la tabla 4.6. Sin embargo, la construcci´ on de la tabla se detiene en el rengl´ on correspondiente a

196

4 Criterios de estabilidad y error

s3 porque el elemento de la primera columna de ese rengl´ on es cero. Esto trae como consecuencia algunas divisiones entre cero al continuar construyendo los siguientes renglones. Se recomienda sustituir el cero de la primera columna por un valor ε > 0 peque˜ no pero positivo y continuar construyendo la tabla como se muestra en la tabla 4.7. Tabla 4.6. Aplicaci´ on del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3. s5 s4 s3 s2 s1 s0

1 2 2×3−1×6 2

3 6 =0

2×5−1×3 2

5 3 = 3.5 0

Tabla 4.7. Aplicaci´ on del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3 (continuaci´ on). s5 s4 s3 s2 s1 s0

1 2 ε

3 6 3.5

ε×6−2×3.5 ε×3−2×0 ε ε 42ε−49−6ε2 0 12ε−14

5 3 0 =30

3

Ahora determ´ınese el n´ umero de cambios de signo en la primera columna conforme ε > 0 tiende a cero. N´ otese que en el caso de este ejemplo hay dos cambios de signo. Esto significa que el polinomio bajo estudio tiene dos ra´ıces con parte real positiva. De hecho, se puede usar software especializado para encontrar, usando m´etodos num´ericos, que las ra´ıces del polinomio s5 + 2s4 + 3s3 + 6s2 + 5s + 3 son: s = 0.3429 + j1.5083, s = 0.3429 − j1.5083, s = −1.6681, s = −0.5088 + j0.7020, s = −0.5088 − j0.7020 Si al considerar ε > 0 no hubiera cambios de signo al recorrer la primera columna entonces el sistema es marginalmente estable, es decir, hay ra´ıces sobre el eje imaginario. Ejemplo 4.14 (Caso especial. Un rengl´ on est´ a formado por ceros exclusivamente o un rengl´ on est´ a formado por un s´ olo elemento el cual, adem´ as, es cero) Sea el siguiente polinomio:

4.3 Criterio de estabilidad de Routh

197

s3 + 3s2 + s + 3 De acuerdo a las reglas del criterio de Routh se construye la tabla 4.8. Sin embargo, la construcci´ on de la tabla se detiene en el rengl´ on correspondiente a s1 porque todo ese rengl´ on est´ a formado exclusivamente por ceros. Este es un caso especial que indica la existencia de ra´ıces: 1) sim´etricas y reales, 2) sim´etricas e imaginarias, o 3) 4 ra´ıces colocadas sobre los v´ertices de un rect´ angulo centrado en el origen. Para continuar con el m´etodo se debe formar un polinomio con los elementos del rengl´ on inmediato superior al rengl´ on formado exclusivamente por ceros: P (s) = 3s2 + 3, se obtiene su derivada: dP (s) = 6s ds y se sustituyen estos coeficientes en el rengl´ on formado exclusivamente por ceros, como se muestra en la tabla 4.9, para continuar construyendo la tabla. Tabla 4.8. Aplicaci´ on del criterio de Routh al polinomio s3 + 3s2 + s + 3. s3 s2 s1 s0

1 3 3×1−1×3 3

10 30 =00

Tabla 4.9. Aplicaci´ on del criterio de Routh al polinomio s3 + 3s2 + s + 3 (continuaci´ on). s3 s2 s1 s0

110 330 60 3

Como no hay cambios de signo al recorrer los elementos de la primera columna se concluye que no hay ra´ıces con parte real positiva y se concluye, por tanto, que de los tres casos mencionados anteriormente s´ olo es posible el caso 2): hay ra´ıces sim´etricas e imaginarias. Es m´ as, un aspecto importante en este caso especial es el siguiente: “Con los elementos del rengl´ on inmediato superior al rengl´ on formado exclusivamente por ceros forme un polinomio. Las ra´ıces de dicho polinomio tambi´en son ra´ıces del polinomio original”.

198

4 Criterios de estabilidad y error

Esto significa que las ra´ıces del polinomio 3s2 + 3 tambi´en son ra´ıces del polinomio s3 + 3s2 + s + 3. Estas ra´ıces se pueden obtener como: 3s2 + 3 = 0,

⇒ s = ±j

Por tanto, el polinomio s3 + 3s2 + s + 3 tiene una ra´ız en s = j y otra en s = −j. De hecho, se puede usar software especializado para encontrar, usando m´etodos num´ericos, que las ra´ıces del polinomio s3 + 3s2 + s + 3 son: s = −3,

s = j,

s = −j

Ejemplo 4.15 (Caso especial. Un rengl´ on est´ a formado por ceros exclusivamente o un rengl´ on est´ a formado por un s´ olo elemento el cual, adem´ as, es cero) Sea el siguiente polinomio: s4 + s2 + 1 De acuerdo a las reglas del criterio de Routh se construye la tabla 4.10. Como hay un rengl´ on formado exclusivamente por ceros se procede como en el ejemplo anterior. El polinomio formado con los elementos del rengl´ on inmediato superior (igual al polinomio original en este caso) es derivado respecto a s: P (s) = s4 + s2 + 1,

dP (s) = 4s3 + 2s ds

Tabla 4.10. Aplicaci´ on del criterio de Routh al polinomio s4 + s2 + 1. s4 1 1 1 0 s3 0 0 0 s2 s1 s0

Tabla 4.11. Aplicaci´ on del criterio de Routh al polinomio s4 +s2 +1 (continuaci´ on). s4 s3 s2 s1 s0

1 4 4×1−1×2 4 0.5×2−4×1 0.5

1 2 = 0.5 = −1.5

4×1−1×0 4

10 0 =1

0

1

Los coeficientes del polinomio resultante se sustituyen en el rengl´ on formado exclusivamente por ceros y se contin´ ua con la construcci´ on de la tabla

4.3 Criterio de estabilidad de Routh

199

como se muestra en la tabla 4.11. Como hay dos cambios de signo al recorrer la primera columna de la tabla 4.11 se concluye que existen dos ra´ıces con parte real positiva. Esto significa que es posible uno de los siguientes casos: hay ra´ıces sim´etricas y reales, o hay 4 ra´ıces colocadas sobre los v´ertices de un rect´ angulo centrado en el origen. De hecho, se puede hacer uso de software especializado para encontrar, usando m´etodos num´ericos que las ra´ıces del polinomio s4 + s2 + 1 son: s = −0.5 ± j0.8660,

s = 0.5 ± j0.8660

es decir, hay 4 ra´ıces colocadas sobre los v´ertices de un rect´ angulo centrado en el origen. Ejemplo 4.16 (Ra´ıces repetidas sobre el eje imaginario) Cuando el polinomio caracter´ıstico tiene ra´ıces repetidas sobre el eje imaginario la funci´ on de transferencia es inestable. Sin embargo, este tipo de inestabilidad no es detectado por el m´etodo del criterio de Routh. Por ejemplo, suponga que el siguiente es el polinomio caracter´ıstico de una funci´ on de transferencia: s4 + 2s2 + 1 = [(s + j)(s − j)]2 N´ otese que hay dos ra´ıces repetidas sobre el eje imaginario. De acuerdo a las reglas del criterio de Routh se construye la tabla 4.12. Como hay un rengl´ on formado exclusivamente por ceros se obtiene la derivada del siguiente polinomio: P (s) = s4 + 2s2 + 1,

dP (s) = 4s3 + 4s ds

y se contin´ ua con el m´etodo como se muestra en la tabla 4.13. Tabla 4.12. Aplicaci´ on del criterio de Routh al polinomio s4 + 2s2 + 1. s4 1 2 1 0 s3 0 0 0 s2 s1 s0

Como hay otro rengl´ on formado exclusivamente por ceros se obtiene la derivada del siguiente polinomio: P1 (s) = s2 + 1,

dP1 (s) = 2s ds

y se contin´ ua con el m´etodo como se muestra en la tabla 4.14. N´ otese que no hay cambios de signo en la primera columna de la tabla 4.14 por lo que

200

4 Criterios de estabilidad y error

Tabla 4.13. Aplicaci´ on del criterio de Routh al polinomio s4 +2s2 +1 (continuaci´ on). s4 s3 s2 s1 s0

1 4 4×2−4×1 4

2 4 =1

4×1−1×0 4

0

10 0 =10

0

Tabla 4.14. Aplicaci´ on del criterio de Routh al polinomio s4 +2s2 +1 (continuaci´ on). s4 s3 s2 s1 s0

1 4 1 2 1

210 40 10 0

el m´etodo indica, correctamente, que no hay ra´ıces con parte real positiva. Adem´ as, las ra´ıces del polinomio P1 (s) = s2 + 1 son s = ±j, por lo que se concluye estabilidad marginal. N´ otese que esto es incorrecto porque el polinomio s4 + 2s2 + 1 tiene dos ra´ıces imaginarias repetidas dos veces, lo cual implica inestabilidad. As´ı que debe tenerse cuidado con estos casos.

4.4.

Error en estado estacionario

Se ha visto que la soluci´on de una ecuaci´on diferencial siempre est´a dada como la suma de la respuesta natural y la respuesta forzada. Si la ecuaci´on diferencial es estable o, equivalentemente, si la funci´on de transferencia es estable entonces la respuesta natural desaparece al crecer el tiempo y la soluci´on alcanza la respuesta forzada. Recu´erdese que la respuesta forzada depende de (o es similar a) la entrada aplicada a la ecuaci´on diferencial. De acuerdo a este razonamiento, en un sistema de control en lazo cerrado se procede del siguiente modo. 1) La entrada del sistema en lazo cerrado es una se˜ nal que representa el valor que se desea alcance la salida del sistema en lazo cerrado. Por esto, a dicha se˜ nal de entrada se le conoce como la referencia o la salida deseada. 2) El controlador se dise˜ na de manera que el sistema en lazo cerrado sea estable y que la respuesta forzada del sistema en lazo cerrado sea igual o muy cercana a la referencia o salida deseada. En esta secci´on se estudian las propiedades que debe tener un sistema de control en lazo cerrado para que la respuesta forzada del sistema realimentado sea igual o muy cercana a la entrada del sistema en lazo cerrado, es decir a la referencia o salida deseada. N´otese que esto equivale a conseguir que la se˜ nal de error, definida como la diferencia entre la salida del sistema y la referencia o salida deseada, sea cero o muy cercana a cero en estado estacionario, es

4.4 Error en estado estacionario

201

decir, cuando el tiempo es muy grande. Por esta raz´on, en lo que sigue se estudia el comportamiento del error en estado estacionario. Considere el sistema en lazo cerrado con realimentaci´on unitaria mostrado en la figura 4.10. Como se muestra en esta secci´on, un concepto fundamental para la determinaci´on del error en estado estacionario es el tipo del sistema, el cual se define a continuaci´on. Una funci´on de transferencia de lazo abierto de orden n siempre se puede escribir del siguiente modo: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) sN (s − p1 )(s − p2 ) · · · (s − pn−N )

donde n es el n´ umero de polos de lazo abierto y m es el n´ umero de ceros de lazo abierto con n > m, zj 6= 0, j = 1, . . . , m y pi 6= 0, i = 1, . . . , n − N . De este modo, N es el n´ umero de polos que la funci´on de transferencia de lazo abierto tiene en el origen (una vez cancelados los ceros que la funci´on de transferencia de lazo abierto pueda tener en el origen). Por definici´on, el tipo del sistema es igual a N , es decir, es el n´ umero de integradores que el sistema tiene en lazo abierto. Por otro lado, la se˜ nal de error est´a dada como la diferencia entre la salida del sistema realimentado y la referencia o salida deseada: E(s) = R(s) − C(s)

⇒ C(s) = R(s) − E(s)

y por otro lado: C(s) = G(s)E(s) = R(s) − E(s) de donde se encuentra que:

C(s)

E(s)

R(s) +

G(s) à

Figura 4.10. Sistema en lazo cerrado con realimentaci´ on unitaria.

E(s)[1 + G(s)] = R(s) 1 E(s) = R(s) 1 + G(s)

(4.16)

El error en estado estacionario ess se obtiene usando (4.16) y el teorema del valor final presentado en (3.3), es decir: ess = l´ım e(t) = l´ım sE(s) = l´ım t→∞

s→0

s→0

s R(s) 1 + G(s)

(4.17)

202

4 Criterios de estabilidad y error

Como el error en estado estacionario es la diferencia entre la salida del sistema c(t) y la referencia o salida deseada r(t), en estado estacionario, es l´ogico que en la expresi´on anterior ess dependa de la referencia R(s). Por tanto, para continuar con el estudio es necesario conocer el valor de R(s) lo cual motiva la definici´on de se˜ nales de prueba. Una se˜ nal de prueba debe ser una funci´on del tiempo con dos caracter´ısticas: 1) que tenga un significado f´ısico de importancia en aplicaciones reales y 2) que sea sencilla de manejar matem´aticamente. A continuaci´on se definen algunas de las se˜ nales (o entradas) de prueba m´as com´ unes en control cl´asico. Considere el problema del control de la posici´on de un ca˜ n´on antia´ereo. En este problema se desea que el ca˜ n´on apunte todo el tiempo hacia un avi´on que se mueve a gran velocidad. Algunas situaciones que pueden presentarse son las siguientes. Entrada de prueba escal´ on. Suponga que el avi´on se dirige directamente hacia el ca˜ n´on sobre una direcci´on de valor constante A. Si el ca˜ n´on inicialmente apunta hacia una direcci´on diferente (cero) a donde se encuentra el avi´on, entonces la referencia o la direcci´on en la que se desea apunte el ca˜ n´on tiene la forma mostrada en la figura 4.11. Esta se˜ nal se conoce como escal´on y representa un cambio muy r´apido (discontinuo) en la direcci´on en que se desea apunte el ca˜ n´on. Entonces el ca˜ n´on debe moverse r´apidamente para que la direcci´on en que realmente apunta alcance la direcci´on deseada, mostrada en la figura 4.11. M´as a´ un, se desea que en estado estacionario la diferencia entre estas se˜ nales sea cero o al menos, en el peor de los casos, muy cercana a cero. Si r(t) es un escal´on: ½ 0, t < 0 r(t) = A, t ≥ 0 donde A es una constante, entonces R(s) = L{r(t)} = As es una funci´on suficientemente sencilla para ser manejada matem´aticamente.

r(t) A 0

t

Figura 4.11. Entrada de prueba escal´ on.

Entrada de prueba rampa. Suponga que el avi´on pasa enfrente del ca˜ n´on con velocidad constante A, dirigi´endose hacia otro punto, y que

4.4 Error en estado estacionario

203

inicialmente el ca˜ n´on est´a apuntando hacia el avi´on (en cero). Entonces la referencia o la direcci´on en la que se desea apunte el ca˜ n´on tiene la forma mostrada en la figura 4.12. Esta se˜ nal se conoce como rampa e indica que se desea que la direcci´on en la que apunta el ca˜ n´on cambie con una velocidad constante A (la velocidad del avi´on). Si r(t) es una rampa: ½ 0, t < 0 r(t) = At, t ≥ 0 donde A = dr(t) es una constante que representa la velocidad con que dt r(t) cambia, entonces R(s) = L{r(t)} = sA2 es una funci´on suficientemente sencilla para ser manejada matem´aticamente.

r(t) A 0

t

Figura 4.12. Entrada de prueba rampa.

Entrada de prueba par´ abola. Suponga que ahora el avi´on pasa enfrente del ca˜ n´on con aceleraci´on constante A (tratando de escapar), dirigi´endose hacia otro punto, y que inicialmente el ca˜ n´on est´a apuntando hacia el avi´on (en cero). Entonces la referencia o la direcci´on en la que se desea apunte el ca˜ n´on tiene la forma mostrada en la figura 4.13. Esta se˜ nal se conoce como par´abola e indica que se desea que la direcci´on en la que apunta el ca˜ n´on cambie con una aceleraci´on constante A (la aceleraci´on del avi´on). Si r(t) es una parabola: ½ 0, t<0 r(t) = 1 2 At , t≥0 2 2

es una constante que representa la aceleraci´on con que donde A = d dtr(t) 2 r(t) cambia, entonces R(s) = L{r(t)} = sA3 es una funci´on suficientemente sencilla para ser manejada matem´aticamente. Como cualquiera de las tres situaciones anteriores puede aparecer durante el funcionamiento del sistema de control de posici´on del ca˜ n´on antia´ereo, el dise˜ no del controlador debe ser tal que el error de estado estacionario sea cero o muy peque˜ no ante cualquiera de las tres se˜ nales de prueba. A continuaci´on se determinan las condiciones que permiten conseguir estas especificaciones para cada se˜ nal de prueba.

204

4 Criterios de estabilidad y error

r(t) 1 At2 2

0

t

Figura 4.13. Entrada de prueba par´ abola.

4.4.1.

Referencia tipo escal´ on

Suponga que R(s) = A/s es un escal´on de altura A. Usando la expresi´on en (4.17) se obtiene: ess = l´ım

s→0

=

s A 1 + G(s) s

A , 1 + kp

kp = l´ım G(s) s→0

donde kp se conoce como la constante de error est´atica de posici´on y su valor est´a directamente relacionado con el tipo del sistema. Por esta raz´on se consideran los siguientes casos: Sistemas tipo 0 (N = 0). En este caso la funci´on de transferencia de lazo abierto tiene la forma: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) (s − p1 )(s − p2 ) · · · (s − pn )

por lo que: kp = l´ım G(s) = s→0

k(−z1 )(−z2 ) · · · (−zm ) (−p1 )(−p2 ) · · · (−pn )

kp es finito. Esto significa que el error en estado estacionario es diferente de cero: ess =

A 6= 0 1 + kp

Sistemas tipo mayor o igual a 1 (N ≥ 1). En este caso la funci´on de transferencia de lazo abierto tiene la forma: G(s) = por lo que:

k(s − z1 )(s − z2 ) · · · (s − zm ) sN (s − p1 )(s − p2 ) · · · (s − pn−N )

4.4 Error en estado estacionario

kp = l´ım G(s) = s→0

205

k(−z1 )(−z2 ) · · · (−zm ) →∞ 1 )(−p2 ) · · · (−pn−N )

sN (−p

Esto significa que el error en estado estacionario es igual a cero: ess = 4.4.2.

A =0 1 + kp

Referencia tipo rampa

Suponga que R(s) = A/s2 es una rampa de pendiente A. Usando la expresi´on en (4.17) se obtiene: ess = l´ım

s→0

=

A s 1 + G(s) s2

A , kv

kv = l´ım sG(s) s→0

donde kv se conoce como la constante de error est´atica de velocidad y su valor est´a directamente relacionado con el tipo del sistema. Por esta raz´on se consideran los siguientes casos: Sistemas tipo 0 (N = 0). En este caso la funci´on de transferencia de lazo abierto tiene la forma: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) (s − p1 )(s − p2 ) · · · (s − pn )

por lo que: kv = l´ım sG(s) = (0) s→0

k(−z1 )(−z2 ) · · · (−zm ) =0 (−p1 )(−p2 ) · · · (−pn )

Esto significa que el error en estado estacionario crece sin l´ımite (tiende a infinito): ess =

A →∞ kv

Sistemas tipo igual a 1 (N = 1). En este caso la funci´on de transferencia de lazo abierto tiene la forma: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) s(s − p1 )(s − p2 ) · · · (s − pn−1 )

por lo que: kv = l´ım sG(s) = s→0

k(−z1 )(−z2 ) · · · (−zm ) (−p1 )(−p2 ) · · · (−pn−1 )

206

4 Criterios de estabilidad y error

kv es un n´ umero diferente de cero y finito. Esto significa que el error en estado estacionario es diferente de cero: ess =

A 6= 0 kv

Sistemas tipo mayor o igual a 2 (N ≥ 2). En este caso la funci´on de transferencia de lazo abierto tiene la forma: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) sN (s − p1 )(s − p2 ) · · · (s − pn−N )

por lo que: kv = l´ım sG(s) = s→0

k(−z1 )(−z2 ) · · · (−zm ) N −1 s (−p1 )(−p2 ) · · · (−pn−N )

→∞

porque N − 1 ≥ 1. Esto significa que el error en estado estacionario es igual a cero: ess = 4.4.3.

A =0 kv

Referencia tipo par´ abola

Suponga que R(s) = A/s3 es una par´abola con segunda derivada igual a A. Usando la expresi´on en (4.17) se obtiene: ess = l´ım

s→0

=

A , ka

s A 1 + G(s) s3 ka = l´ım s2 G(s) s→0

donde ka se conoce como la constante de error est´atica de aceleraci´on y su valor est´a directamente relacionado con el tipo del sistema. La funci´on de transferencia de lazo abierto tiene la forma: G(s) =

k(s − z1 )(s − z2 ) · · · (s − zm ) − p1 )(s − p2 ) · · · (s − pn−N )

sN (s

por lo que: ka = l´ım s2 G(s) = s→0

k(−z1 )(−z2 ) · · · (−zm ) sN −2 (−p1 )(−p2 ) · · · (−pn−N )

Esto significa que: El error en estado estacionario crece sin l´ımite (tiende a infinito) para sistemas tipo menor o igual a 1: ess =

A → ∞, kv

N ≤1

4.4 Error en estado estacionario

207

El error en estado estacionario es diferente de cero para sistemas tipo igual a 2: ess =

A 6= 0, kv

N =2

El error en estado estacionario es igual a cero para sistemas tipo mayor o igual a 3: ess =

A = 0, kv

N ≥3

N´otese que, para las tres referencias o se˜ nales de prueba consideradas, el error en estado estacionario se hace cero si se incrementa convenientemente el n´ umero de integradores que tiene la funci´on de transferencia de lazo abierto (tipo del sistema). Esto explica porqu´e algunos controladores incluyen un integrador (v´ease la secci´on 5.2.4 donde se estudia el controlador PI). Por otro lado, es muy importante subrayar que los resultados que se acaban de presentar s´olo se cumplen si se asegura que el sistema en lazo cerrado es estable ya que los resultados anteriores se han obtenido suponiendo que la respuesta natural tiende a cero conforme el tiempo crece. M´as adelante, en los cap´ıtulos 5 y 6, se explica que el adicionar polos de lazo abierto (integradores, cuando dichos polos est´an en s = 0) tiende a hacer inestable al sistema en lazo cerrado. As´ı que no siempre ser´a posible, o conveniente, dise˜ nar un sistema de control con error en estado estacionario igual a cero y se deber´a conformar con un error en estado estacionario peque˜ no. Finalmente, y por razones did´acticas, en la figura 4.14 se muestra gr´aficamente el comportamiento de la salida c(t) con respecto a la referencia r(t), cuando ´esta es una rampa, para los distintos tipos de sistema. r(t)

e ss = 0

e ss6=0

c(t)

e ss ! 1

0

t

Figura 4.14. Comportamiento de la salida c(t) cuando la referencia r(t) es una rampa. N´ otese que ess = 0 cuando el tipo es mayor o igual a 2, ess 6= 0 cuando el tipo es igual a 1 y ess → ∞ cuando el tipo es igual a 0.

Ejemplo 4.17 En la figura 4.15 se muestra un sistema de control de velocidad de un motor de CD (v´ease el cap´ıtulo 9). El modelo del motor est´ a dado

208

4 Criterios de estabilidad y error

k por la funci´ on de transferencia Gm (s) = s+a , con k > 0 y a > 0, mientras que la constante positiva kp representa la funci´ on de transferencia de un controlador proporcional. Esto significa que la corriente usada como se˜ nal de control se calcula como:

i∗ = kp (ωd − ω) donde ω es la velocidad medida, ωd es la velocidad deseada e I ∗ (s) es la transformada de Laplace de i∗ . La funci´ on de transferencia de lazo abierto es: G(s)H(s) =

kp k s+a

N´ otese que al ser a > 0 este sistema es tipo 0 porque la funci´ on de transferencia de lazo abierto no tiene ning´ un polo en el origen (en s = 0). Por tanto, de acuerdo a la secci´ on 4.4.1, si la velocidad deseada es constante (es decir, un escal´ on) entonces el error en estado estacionario ess = ωd − l´ımt→∞ ω(t) es constante y diferente de cero, es decir, un controlador proporcional de velocidad no es u ´til para conseguir que el motor alcance la velocidad deseada. N´ otese que, de acuerdo a las secciones 4.4.2 y 4.4.3, el problema es m´ as grave (es decir, el error en estado estacionario es mayor) si la velocidad deseada tuviera la forma de una rampa o de una par´ abola. ! d(s)

+

kp

I ã(s)

k s+a

!(s)

à Figura 4.15. Sistema de control proporcional de velocidad.

La manera de resolver este problema, cuando la velocidad deseada es una constante, es usando un controlador proporcional-integral (PI). El controlador PI realiza la siguiente operaci´ on sobre el error de velocidad: Z t e(r)dr, e = ωd − ω i∗ = kp e + ki 0

donde kp y ki son constantes positivas.Usando la transformada de Laplace se obtiene: E(s) I ∗ (s) = kp E(s) + ki µ ¶ s ki = kp + E(s) s

4.4 Error en estado estacionario

209

µ

¶ kp s + ki E(s) s ! Ã s + kkpi E(s) = kp s =

donde E(s) es la transformada de Laplace del error de velocidad. Con esto es posible construir el diagrama de bloques de lazo cerrado que se muestra en la figura 4.16. N´ otese que ahora el sistema es tipo 1 porque la funci´ on de transferencia de lazo abierto: ! Ã s + kkpi k G(s)H(s) = kp s s+a tiene un polo en s = 0 y, por tanto, de acuerdo a la secci´ on 4.4.1 el error en estado estacionario es cero, es decir, la velocidad del motor alcanza la velocidad deseada cuando el tiempo sea suficientemente grande y si ωd es constante (un escal´ on). As´ı, el t´ermino integral en un controlador PI es introducido con el fin de llevar a cero el error en estado estacionario. Finalmente, debe aclararse que este resultado ser´ a totalmente cierto s´ olo hasta que se asegure que el sistema en lazo cerrado sea estable, es decir, hasta que todos los polos de lazo cerrado tengan parte real negativa. Por otro lado, n´ otese que, de acuerdo a las secciones 4.4.2 y 4.4.3 el controlador PI de velocidad s´ olo es u ´til para referencias tipo escal´ on, pues el error en estado estacionario sigue siendo diferente de cero si la referencia de velocidad tiene forma de una rampa o de una par´ abola.

! d(s)

+

à

k

kp

s+k pi s

I ã(s)

k s+a

!(s)

Figura 4.16. Sistema de control proporcional-integral de velocidad.

Ejemplo 4.18 Considere el sistema de control proporcional de posici´ on de un motor de CD mostrado en la figura 4.17. N´ otese que la funci´ on de transferencia del motor tiene un polo en s = 0 cuando la posici´ on es la salida a controlar, por lo que el sistema es de tipo 1 y el error en estado estacionario es cero si la posici´ on deseada es una constante (un escal´ on) (v´ease la secci´ on 4.4.1). Es interesante darse cuenta que este resultado se mantiene (la posici´ on del motor alcanzar´ a a la posici´ on deseada) si se usa cualquiera de los siguientes controladores (v´eanse los cap´ıtulos 5 y 10): a) un controlador PD (figura

210

4 Criterios de estabilidad y error

4.18), b) un controlador proporcional de posici´ on con realimentaci´ on de velocidad (figura 4.19), o c) o un compensador de adelanto (figura 4.20). Aunque con cualquiera de estos controladores, el requisito de un error cero en estado estacionario es satisfecho autom´ aticamente por las propiedades matem´ aticas del modelo del motor (el polo en el origen con el que cuenta), sin embargo el prop´ osito de todos estos controladores es introducir el amortiguamiento y la rapidez de respuesta deseados as´ı como asegurar la estabilidad del sistema en lazo cerrado. Es importante aclarar que si la estabilidad en lazo cerrado no es asegurada, entonces tampoco se asegura que el error en estado estacionario sea cero, a pesar de que el sistema sea de tipo 1.

òd ( s) +

kp

I ã(s)

ò(s)

k s ( s+a)

à

Figura 4.17. Control proporcional de posici´ on.

òd(s) +

à

ð ñ Iã(s) kp kd s + k d

k s(s+a)

ò(s)

Figura 4.18. Sistema de control proporcional-derivativo de posici´ on.

òd ( s)

+

kp à

I ã(s)

+

k s ( s+a)

ò(s)

à kv s

Figura 4.19. Control proporcional de posici´ on con realimentaci´ on de velocidad.

4.4 Error en estado estacionario

òd ( s)

+

I ã(s)

í s+d s+c

k s ( s+a)

211

ò(s)

à

Figura 4.20. Control de posici´ on con un compensador de adelanto.

Ejemplo 4.19 ¿Qu´e sucede en un motor de CD que pueda explicar el porqu´e, cuando la referencia es un escal´ on, un controlador proporcional de velocidad no puede conseguir un error cero en estado estacionario y, en cambio, s´ı lo puede conseguir un controlador proporcional de posici´ on? La respuesta a esta pregunta es la siguiente. Cuando en un sistema de control proporcional de posici´ on el error es igual a cero (cuando la posici´ on del motor es igual a la posici´ on deseada) entonces la corriente i∗ = kp (θd − θ) ordenada al motor es cero, el motor se detiene y, por tanto, la condici´ on θd = θ puede mantenerse para siempre. En cambio, en un sistema de control proporcional de velocidad, si la velocidad del motor es igual a la velocidad deseada entonces la corriente ordenada al motor i∗ = kp (ωd − ω) es cero y el motor se detendr´ıa. Esto significa que la condici´ on ωd = ω no puede mantenerse para siempre y como resultado, en un sistema de control proporcional de velocidad ´esta variable alcanza, en estado estacionario, un valor constante tal que la diferencia entre ω y ωd sea suficiente para generar una corriente i∗ = kp (ωd − ω) que mantenga girando al motor en esa velocidad. Cuando se utiliza un controlador PI de velocidad Rt entonces la integral del error 0 (ωd − ω(r))dr es constante cuando ωd = ω y ese valor constante, multiplicado por la ganancia integral ki es suficiente para producir una corriente que mantiene girando al motor a la velocidad deseada. Ejemplo 4.20 Considere un sistema de control de posici´ on de un motor de CD que cuenta con un controlador PID, es decir, la consigna de corriente est´ a dada como: Z t de e(r)dr, e = θd − θ i∗ = kp e + kd + ki dt 0 Usando la transformada de Laplace se obtiene:

E(s) I ∗ (s) = kp E(s) + kd sE(s) + ki s µ ¶ ki = kp + kd s + E(s) s = kd

s2 +

kp kd s

+

ki kd

E(s) s De este modo se obtiene el diagrama de bloques mostrado en la figura 4.21. N´ otese que el motor tiene un polo en s = 0 y el controlador tiene otro polo en

212

4 Criterios de estabilidad y error

s = 0, es decir el sistema es tipo 2 porque la funci´ on de transferencia de lazo abierto tiene dos polos en el origen (en s = 0). Esto significa, de acuerdo a las secciones 4.4.1 y 4.4.2 que la posici´ on alcanzar´ a a la posici´ on deseada θd si ´esta tiene la forma de un escal´ on o de una rampa. En cambio, el error en estado estacionario ser´ a diferente de cero y constante si la posici´ on deseada tiene la forma de una par´ abola (v´ease la secci´ on 4.4.3).

ò d(s)

+

kp

kd

à

I ã(s)

k

s 2+k s+k i d

ò(s)

k s(s+a)

d

s

Figura 4.21. Sistema de control PID de posici´ on.

Xd (s) +

Ax à

s+ b í s+ c

ï 1

+

ë à

+

k s ( s+ a )

ï 2

à

ký s

ú s2

X(s)





Figura 4.22. Control de un sistema ball and beam.

Por otro lado, considere el sistema mostrado en la figura 4.22. Se trata del sistema de control de posici´ on de un sistema ball and beam (v´ease el cap´ıtulo 12). N´ otese que la funci´ on de transferencia de lazo abierto cuenta con dos polos en s = 0. En este caso, estos dos polos de lazo abierto en el origen son parte del modelo del sistema ball and beam a controlar, es decir, la planta posee de manera natural dichos polos y no es necesario introducir un controlador de tipo integral para generarlos. Por tanto, el error en estado estacionario ser´ a igual a cero si la posici´ on deseada xd es un escal´ on o una rampa, pero si la referencia es una par´ abola entonces el error en estado estacionario ser´ a una constante diferente de cero. Ejemplo 4.21 Suponga que tiene un motor de CD con funci´ on de transferenθ(s) k cia Gm (s) = I ∗ (s) = s(s+a) y que se desea que el error en estado estacionario sea igual a cero cuando la referencia de posici´ on θd sea una par´ abola. En este caso se necesita que el sistema sea de tipo 3 y como la planta tiene un polo

4.5 Resumen del cap´ıtulo

213

en s = 0 es necesario introducir un controlador que tenga dos polos en s = 0. Por tanto, se propone un controlador de la forma: Z tZ r Z t de i∗ = kp e + kd + ki e(τ )dτ dr, e = θd − θ e(r)dr + kii dt 0 0 0 el cual se puede escribir como: I ∗ (s) =

kd s3 + kp s2 + ki s + kii E(s) s2

(4.18)

donde E(s) es la transformada de Laplace del error de posici´ on, lo cual muestra que tiene dos polos en s = 0 y que, por tanto, es u ´til para resolver el problema en cuesti´ on. N´ otese que adem´ as de introducir el t´ermino de la integral doble, con ganancia kii , tambi´en se ha incluido el t´ermino de una integral sencilla con ganancia ki . Esto se hace para mejorar la estabilidad en lazo cerrado. Si no se introduce el t´ermino de la integral sencilla entonces se obtendr´ an pobres desempe˜ nos en la respuesta transitoria o incluso se puede producir inestabilidad. Como regla general, si el controlador ha de introducir una integral iterada de orden k entonces se deber´ an incluir tambi´en t´erminos que incluyan todas las integrales iteradas de orden 1 hasta k−1. Esto con el fin de mejorar la respuesta transitoria y asegurar la estabilidad en lazo cerrado.

4.5.

Resumen del cap´ıtulo

En este cap´ıtulo se han presentado las herramientas preliminares b´asicas para el an´alisis y dise˜ no de sistemas de control de orden arbitrario. Primero se debe entender que la respuesta de cualquier sistema de control en lazo cerrado, por complejo que sea, est´a determinada por la funci´on de transferencia equivalente en lazo cerrado. La representaci´on de un sistema de control mediante diagramas de bloques y su correspondiente simplificaci´on son fundamentales para obtener la funci´on de transferencia de lazo cerrado. A partir de esta funci´on de transferencia se puede determinar i) la estabilidad en lazo cerrado y la respuesta transitoria (polos de la funci´on de transferencia de lazo cerrado), y ii) la respuesta en estado estacionario (o valor final). En el cap´ıtulo 3 se explica que para que una funci´on de transferencia sea estable es necesario y suficiente que todos sus polos tengan parte real negativa. Sin embargo, el verificar esta condici´on mediante el c´alculo exacto de dichos polos es un problema complejo. Esto es particularmente cierto cuando el valor de los coeficientes del polinomio no se conocen num´ericamente. Esta situaci´on es frecuente en el dise˜ no de sistemas de control ya que los coeficientes del polinomio caracter´ıstico dependen de las ganancias del controlador las cuales a´ un no se conocen. M´as a´ un, es deseable que las ganancias del controlador puedan seleccionarse dentro de un rango de valores con el fin de hacer flexible el dise˜ no del sistema de control. Estas caracter´ısticas requieren el uso de t´ecnicas

214

4 Criterios de estabilidad y error

anal´ıticas (y no num´ericas) para determinar cu´ando el sistema de control en lazo cerrado es estable. Este hecho representa un grave problema porque las f´ormulas anal´ıticas para determinar las ra´ıces de polinomios de grado superior son complejas. M´as a´ un, no existe soluci´on anal´ıtica para polinomios de grado quinto o mayor. Esta problem´atica es resuelta, finalmente, usando el criterio de estabilidad de Routh el cual, debe recordarse, simplemente representa una herramienta para verificar si todas las ra´ıces del polinomio caracter´ıstico tienen sus partes reales negativas. Por otro lado, la regla de los signos para determinar la ubicaci´on de las ra´ıces de un polinomio, vista en la secci´on 4.2, es un m´etodo que tiene sus limitaciones. Sin embargo, al ser mucho m´as simple que el criterio de Routh puede tener algunas ventajas en ciertas aplicaciones y por eso tambi´en se ha presentado en este cap´ıtulo. El estudio del error en estado estacionario que se ha presentado en este cap´ıtulo, establece criterios para seleccionar el controlador m´as conveniente a fin de conseguir que la respuesta en estado estacionario alcance al valor deseado. Dicho de otro modo, para que la respuesta forzada sea igual, o muy cercana, a la entrada del sistema en lazo cerrado o valor deseado a la salida. Finalmente, la selecci´on del controlador tambi´en debe hacerse de modo que se consiga la respuesta transitoria deseada, a partir de una adecuada ubicaci´on de los polos de lazo cerrado. La soluci´on de este problema se presenta en el cap´ıtulo siguiente.

4.6. 1. 2. 3.

4. 5.

6.

7.

Preguntas de repaso

¿Qu´e es el tipo de un sistema en lazo cerrado? ¿C´omo se puede aumentar el tipo de un sistema de control? ¿Cu´al es la relaci´on entre el criterio de estabilidad de Routh y el requerimiento de que todas las ra´ıces del polinomio caracter´ıstico tengan parte real negativa? ¿Para qu´e sirve y cu´al es la principal desventaja de la regla de los signos vista en la secci´on 4.2? Suponga que de acuerdo al estudio del error en estado estacionario se concluye que el valor final de la salida alcanzar´a el valor deseado ¿Por qu´e es necesario que el sistema sea estable para que esto sea completamente cierto? Suponga que para conseguir un error en estado estacionario igual a cero necesita usar un controlador que incluya una integral qu´ıntuple (5 integrales anidadas) ¿Por qu´e debe incluir tambi´en las integrales cu´adruple (4 integrales anidadas), triple y doble? ¿Tambi´en debe incluir la integral sencilla? ¿Por qu´e? Justifique su respuesta usando un motor de CD como planta y usando el criterio de Routh. ¿Qu´e relaci´on existe entre el estudio del error en estado estacionario, presentado en este cap´ıtulo, y el objetivo de conseguir que la respuesta for-

4.7 Ejercicios propuestos

8.

9. 10.

zada alcance a la entrada del sistema en lazo cerrado (o valor deseado a la salida)? Considere el tanque que contiene agua estudiado en el ejemplo 3.2 del cap´ıtulo 3. ¿Por qu´e un controlador proporcional de nivel no consigue un error en estado estacionario igual a cero, pero un controlador proporcionalintegral s´ı puede conseguirlo? Justifique su respuesta tambi´en desde el punto de vista de la f´ısica del sistema: ¿Qu´e pasa con el flujo de entrada cuando el nivel es igual al nivel deseado? ¿Qu´e cuidado debe tener al aplicar el criterio de Routh a polinomios con ra´ıces repetidas con parte real cero? El estudio del error en estado estacionario que se ha presentado s´olo considera valores deseados a la salida tipo escal´on, rampa y par´abola ¿Qu´e sucede en aplicaciones como la del ca˜ n´on antia´ereo (cap´ıtulo 1) donde no se conoce de manera exacta cu´al es la salida deseada?

4.7. 1.

2.

215

Ejercicios propuestos

En base al conocimiento del tipo que debe tener un sistema para asegurar un error en estado estacionario igual a cero para referencias escal´on, rampa y par´abola, demuestre que la funci´on de transferencia de lazo cerrado correspondiente (v´ease la figura 4.10) debe tener las siguientes caracter´ısticas: Los t´erminos independientes de s, en el numerador y en el denominador, deben ser iguales para conseguir un error cero en estado estacionario ante una referencia tipo escal´on. Los t´erminos independientes de s as´ı como los de primer orden en s, tanto en el numerador como en el denominador, deben ser iguales para conseguir un error cero en estado estacionario ante una referencia tipo rampa. Los t´erminos independientes de s as´ı como los de primer orden y los de segundo orden en s, en el numerador y en el denominador, deben ser iguales para conseguir un error cero en estado estacionario ante una referencia tipo par´abola. N´otese que esto significa que el controlador tambi´en debe asignar convenientemente los ceros de la funci´on de transferencia, lo cual respalda los argumentos presentados en el ejemplo 4.21 (v´ease (4.18)). En los ejemplos 3.17 y 3.18 del cap´ıtulo 3 se presentan explicaciones basadas en la experiencia cotidiana para entender porqu´e el control proporcional-integral (expresi´on en (3.97)) de nivel de agua y el control proporcional de un sistema masa-amortiguador consiguen que h → hd y x → xd cuando t → ∞ y hd y xd son constantes. Ahora revise esos ejemplos y explique esos resultados a partir del conocimiento del tipo de dichos sistemas de control.

216

3.

4.

4 Criterios de estabilidad y error

Considere el sistema masa-resorte-amortiguador presentado en el ejemplo 3.6 del cap´ıtulo 3. Si se aplica una fuerza constante de valor A y la masa alcanza el reposo, es decir x˙ = 0 y x ¨ = 0, entonces sustituyendo esto directamente en la ecuaci´on diferencial correspondiente se obtiene que la A posici´on que alcanza la masa es x = K . Ahora utilice el teorema del valor final para calcular el valor final de x cuando f = A. ¿Qu´e relaci´on existe entre las condiciones x˙ = 0 y x ¨ = 0 y el requisito s → 0 del teorema del valor final? Considere el sistema masa-resorte-amortiguador rotativo: J θ¨ + f θ˙ + Kθ = T donde J es la inercia, f es el coeficiente de fricci´on viscosa, K es la constante de rigidez del resorte, θ es la posici´on angular del cuerpo y T es el par aplicado el cual est´a dado como el siguiente controlador PID: Z t de e(r)dr, e = θd − θ T = kp e + kd + ki dt 0 Use el criterio de Routh para demostrar que las siguientes condiciones: J > 0 ki > 0,

5.

K + kp > 0,

aseguran la estabilidad en lazo cerrado. N´otese que una ganancia integral ki grande tiende a producir inestabilidad y que este efecto puede ser compensado usando valores grandes de kp y de kd . Tambi´en puede observarse que una inercia J peque˜ na permite el uso de ganancias integrales m´as grandes antes de que aparezca la inestabilidad y que lo mismo ocurre si la constante de rigidez K es grande. ¿Puede encontrar una explicaci´on desde el punto de vista de la mec´anica (f´ısica) para este fen´omeno? Procediendo como en el ejemplo 4.3 de este cap´ıtulo, demuestre que la funci´on de transferencia del sistema de lazo cerrado mostrado en la figura 4.3 es: M (s) =

6.

f + kd ki >0 > J K + kp

G(s) C(s) = R(s) 1 − G(s)H(s)

cuando el sistema tiene realimentaci´on positiva, es decir, cuando el trayecto de realimentaci´on se suma (en lugar de restarse) en la figura 4.3. Considere el sistema mec´anico mostrado en la figura 4.23. En el ejemplo 2.4 del cap´ıtulo 2 se encontr´o que el modelo matem´atico correspondiente est´a dado como: b1 dxm1 K 1 d2 xm1 + + (xm1 − xm2 ) = F (t) dt2 m1 dt m1 m1 d2 xm2 b2 dxm2 K + − (xm1 − xm2 ) = 0 2 dt m2 dt m2

4.7 Ejercicios propuestos

217

donde xm1 es la posici´on de m1 y xm2 es la posici´on de m2 . Aplique la transformada de Laplace a cada una de las expresiones anteriores para expresar Xm1 (s) y Xm2 (s) como las salidas de dos funciones de transferencia. Obtenga el diagrama de bloques correspondiente conectando convenientemente estas dos funciones de transferencia de acuerdo a las entradas que cada una de ellas tiene. Usando el resultado del ejercicio previo, reduzca este diagrama de bloques para comprobar que: Xm2 (s) =

G1 (s)G2 (s)/m1 F (s) 1 − G1 (s)G2 (s)K/m1

donde F (s) es la transformada de Laplace de F (t) y: G1 (s) = G2 (s) =

1 s2 + s2 +

b1 m1 s K m2 b2 m2 s

+

K m1

+

K m2

Usando este resultado compruebe que la funci´on de transferencia Xm2 (s) e significa esto? Para ello suponga F (s) tiene un polo en s = 0 ¿Qu´ que se aplica una fuerza constante F (t) en el tiempo ¿Qu´e pasa con la posici´on de la masa m2 bajo el efecto de esta fuerza? ¿Y que pasar´a con la posici´on de la masa m1 ? Para esto encuentre la funci´on de transferencia existente entre Xm1 (s) y Xm2 (s). Use el criterio de Routh para encontrar las condiciones bajo las cuales la funci´on de transferencia XFm2(s)(s) no es inestable. N´otese que se puede proceder del mismo modo con los otros ejemplos del cap´ıtulo 2 que tambi´en incluyen resortes.

F (t)

m1 b1

K m2 b2

Figura 4.23. Dos cuerpos unidos por un resorte.

Al final del cap´ıtulo 5 se proponen otros ejercicios cuya soluci´on involucra el uso de los conceptos estudiados en el presente cap´ıtulo.

Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Magazine, pp. 17-25, June 1996. 2. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 3. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 4. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edici´ on, Pearson Prentice-Hall, Madrid, 2008. 5. B.C. Kuo, Sistemas de control autom´ atico, 7a. edici´ on, Prentice-Hall Hispanoamericana, M´exico, 1995. 6. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edici´ on en espa˜ nol, McGraw-Hill, M´exico, 1992.

5 Dise˜ no usando la respuesta en el tiempo

La herramienta m´as importante para dise˜ nar sistemas de control usando la respuesta en el tiempo es el m´etodo del lugar de las ra´ıces propuesto por W.R. Evans entre 1948 y 1950. El propio Evans dijo que la motivaci´on espec´ıfica que recibi´o para desarrollar el m´etodo del lugar de las ra´ıces vino de una pregunta que le plante´o un alumno durante un curso que impart´ıa en North American Aviation. De hecho, los primeros en usar el m´etodo fueron los dise˜ nadores de North American Aviation.

222

5 Dise˜ no usando la respuesta en el tiempo

Objetivos del cap´ıtulo Entender que significa “lugar de las ra´ıces”. Aprender a dibujar el lugar de las ra´ıces. Analizar y dise˜ nar sistemas de control usando el m´etodo del lugar de las ra´ıces. Considere el sistema en lazo cerrado mostrado en la figura 5.1. En el ejemplo 4.3 de la secci´on 4.1 se muestra que la funci´on de transferencia del sistema en lazo cerrado est´a dada como: M (s) =

G(s) C(s) = R(s) 1 + G(s)H(s)

(5.1)

En el cap´ıtulo 3 se explica que la respuesta en el tiempo c(t) = L−1 {C(s)} =

R(s) +

G(s)

C(s)

à H(s) Figura 5.1. Sistema en lazo cerrado.

L−1 {M (s)R(s)} est´a dada como la suma de la respuesta natural y de la respuesta forzada: c(t) = cn (t) + cf (t). Los objetivos del sistema de control en la figura 5.1 son: Que el sistema de control en lazo cerrado sea estable, es decir que l´ımt→∞ cn (t) = 0, lo cual se asegura si todos los polos de la funci´on de transferencia de lazo cerrado M (s) tienen parte real menor que cero. Esto es importante porque consigue que conforme el tiempo crece la respuesta del sistema c(t) converge a la respuesta forzada cf (t). Que la convergencia cn (t) → 0 sea conseguida r´apidamente. Que la respuesta forzada sea igual a la salida deseada cf (t) = r(t) = L−1 {R(s)}. El u ´ltimo punto constituye las caracter´ısticas de respuesta en estado estacionario y la manera de asegurar que el sistema en lazo cerrado responde con las caracter´ısticas deseadas se estudia en la secci´on 4.4. El segundo punto constituye las caracter´ısticas de respuesta transitoria deseadas y en este cap´ıtulo se estudia la manera de dise˜ nar un controlador que asegure que el sistema en lazo cerrado responda con las caracter´ısticas deseadas. Debe subrayarse que al asegurar que se obtienen las caracter´ısticas deseadas de respuesta transitoria tambi´en se debe asegurar la estabilidad del sistema en lazo cerrado.

5.1 Dise˜ no con el lugar de las ra´ıces

223

El problema de dise˜ nar un controlador consiste en asignar convenientemente los polos 1 + G(s)H(s) = 0 y los ceros G(s) = 0 de la funci´on de transferencia de lazo cerrado M (s). En control cl´asico los polos y los ceros de la planta siempre se consideran conocidos y la estructura del controlador se propone como algo conocido (para satisfacer las caracter´ısticas de respuesta en estado estacionario, por ejemplo). Sin embargo la ubicaci´on exacta de los polos y los ceros del controlador debe ser seleccionada de modo que se asegure que los polos de lazo cerrado 1 + G(s)H(s) = 0 est´en colocados en los valores deseados y que los ceros de lazo cerrado G(s) = 0 est´en colocados convenientemente. En este cap´ıtulo se presenta una de las herramientas principales de control cl´asico para resolver este problema: el m´etodo del lugar de las ra´ıces. Este m´etodo determina la ubicaci´on de los polos de la funci´on de transferencia de lazo cerrado M (s) a partir del estudio de la funci´on de transferencia de lazo abierto G(s)H(s). Adem´as, es posible ubicar los ceros de la funci´on de transferencia de lazo cerrado M (s) de modo que su efecto sobre la respuesta del sistema en lazo cerrado sea peque˜ no.

5.1. Dise˜ no con el lugar de las ra´ıces. Caracter´ısticas deseadas de la respuesta transitoria Suponiendo que los polos y los ceros de la planta se conocen, el m´etodo del lugar de las ra´ıces es una herramienta gr´afica que es u ´til para determinar cuales ser´an los polos de lazo cerrado si se usa un controlador que contiene ciertos polos y ceros que se proponen o que se deben calcular. Por otro lado, tambi´en es posible utilizar el lugar de las ra´ıces para conseguir que uno o varios ceros de lazo cerrado se cancelen con uno o varios polos de lazo cerrado. De acuerdo a la secci´on 3.9.1 esto permite reducir el orden del sistema y eliminar la presencia de ceros de manera que la respuesta transitoria del sistema en lazo cerrado puede ser aproximada por uno de los casos sencillos estudiados en las secciones 3.1 y 3.3. Estas caracter´ısticas facilitan la tarea de dise˜ nar el controlador de manera que la funci´on de transferencia de lazo cerrado M (s) tenga los polos y los ceros que aseguren las caracter´ısticas deseadas de respuesta transitoria. El lugar de las ra´ıces est´a representado por varias curvas cuyos puntos constituyen los polos del sistema de lazo cerrado obtenidos conforme un par´ametro, k, es variado desde k = 0 hasta k = +∞. De acuerdo a (5.1), todo punto s que sea un polo de lazo cerrado (y que, por tanto, pertenezca al lugar de las ra´ıces) debe cumplir 1 + G(s)H(s) = 0. El lugar de las ra´ıces se construye proponiendo puntos s en el plano complejo s, los cuales deben ser verificados si satisfacen la condici´on para ser polos de lazo cerrado: 1 + G(s)H(s) = 0. Para verificar esta condici´on de una manera sencilla se propone un conjunto de reglas que se listan a continuaci´on. Estas reglas dan lugar a la construcci´on gr´afica del lugar de las ra´ıces el cual se dibuja a partir de los polos y los ceros de la funci´on de transferencia de lazo abierto G(s)H(s). Esto significa que los

224

5 Dise˜ no usando la respuesta en el tiempo

polos de lazo cerrado ser´an determinados a partir de los polos y los ceros de lazo abierto. La funci´on de transferencia de lazo abierto se puede escribir como: Qm j=1 (s − zj ) G(s)H(s) = k Qn , n>m (5.2) i=1 (s − pi )

donde zj , j = 1, . . . , m, son los ceros de lazo abierto y pi , i = 1, . . . , n, son los polos de lazo abierto. Siendo zj , pi y s n´ umeros complejos, en general, ubicados en el plano s se puede escribir: s − zj = lj ∠θj s − pi = li ∠θi como se ilustra en la figura 5.2. Entonces: Im (s)



li

pi

lj



zj

s

òi

òj

zj

pi

Re (s)

Figura 5.2. Representaci´ on gr´ afica de los factores s − zj y s − pi .

  Qm n m X X l ∠θ l j j j j=1 j=1 θi  θj − G(s)H(s) = k Qn = k Qn ∠ i=1 li ∠θi i=1 li i=1 j=1 Qm

(5.3)

Por otro lado, los valores de s que satisfacen lo siguiente son los polos de lazo cerrado: 1 + G(s)H(s) = 0

(5.4)

Esto significa que los polos de lazo cerrado son los valores de s que satisfacen: G(s)H(s) = −1 = 1∠ ± (2q + 1)180◦ ,

q = 0, 1, 2, . . .

(5.5)

Usando (5.3) y (5.5) se obtiene la condici´on de magnitud (5.6) y la condici´on de ´angulo (5.7) que debe satisfacer todo s que sea polo de lazo cerrado y que, por tanto, pertenezca al lugar de las ra´ıces:

5.1 Dise˜ no con el lugar de las ra´ıces

Qm

j=1 lj

m X j=1

k Qn

θj −

i=1 li n X i=1

=1

225

(5.6)

θi = ±(2q + 1)180◦ ,

q = 0, 1, 2, . . .

(5.7)

A partir de estas condiciones se obtienen las siguientes reglas. 5.1.1. 1.

Reglas para construir el lugar de las ra´ıces.

El lugar de las ra´ıces empieza (k = 0) en los polos de lazo abierto. Usando (5.2) y (5.4): Qm j=1 (s − zj ) =0 1 + G(s)H(s) = 1 + k Qn i=1 (s − pi ) Qm Qn j=1 (s − zj ) i=1 (s − pi ) + k Qn =0 = (s − p i) i=1 m n Y Y (s − zj ) = 0 (5.8) (s − pi ) + k = =

i=1 n Y

i=1

2.

j=1

(s − pi ) = 0

si k = 0. Lo que significa que los polos de lazo cerrado (los que satisfacen 1 + G(s)H(s) = 0) son id´enticos a los polos de lazo abierto (s = pi , i = 1, . . . , n). El lugar de las ra´ıces termina (k → ∞) en los ceros de lazo abierto. Partiendo de (5.8): 1 + G(s)H(s) =

n Y

(s − pi ) + k

i=1 m Y

≈k

3.

j=1

m Y

j=1

(s − zj ) = 0

(s − zj ) = 0

Qn Qm porque i=1 (s − pi ) ≪ k j=1 (s − zj ) si k → ∞. Lo que significa que los polos de lazo cerrado (los que satisfacen 1 + G(s)H(s) = 0) son id´enticos a los ceros de lazo abierto (s = zj , j = 1, . . . , m). Cuando k → ∞ hay n−m ramas del lugar de las ra´ıces que tienden hacia alg´ un punto en el infinito del plano s. Esto significa que la funci´ on de transferencia de lazo abierto G(s)H(s) tiene n − m ceros en el infinito. Estas ramas pueden ser identificadas mediante la inclinaci´on de la linea

226

5 Dise˜ no usando la respuesta en el tiempo

recta a la que cada una de dichas ramas tiende asint´oticamente conforme k → ∞. El ´angulo que cada as´ıntota forma con el eje real positivo se puede calcular como: ´angulo de la as´ıntota =

±180◦ (2q + 1) , n−m

q = 0, 1, 2, . . .

(5.9)

Esta f´ormula se puede obtener del siguiente modo. Cuando se considera un

asíntota

s

Im (s)

ò Re (s)

polos y ceros de lazo abierto

Figura 5.3. Polos y ceros de lazo abierto para determinar las as´ıntotas de la regla 3.

punto s que se encuentra muy lejos del origen sobre una as´ıntota, todos los polos y todos los ceros de G(s)H(s), o de lazo abierto, se observan todos reunidos en un punto del plano s, como se muestra en la figura 5.3. Por tanto, el ´angulo con que contribuye cada polo y cada cero de lazo abierto a la condici´on en (5.7) (v´ease la figura 5.3) es id´entico al de los dem´as, es decir, representando dicho ´angulo por θ la condici´on de ´angulo (5.7) se puede escribir como: m X j=1

θj −

n X i=1

θi = (m − n)θ = ±(2q + 1)180◦ ,

q = 0, 1, 2, . . .

Despejando θ de esta expresi´on se obtiene: θ=

4.

±(2q + 1)180◦ , n−m

q = 0, 1, 2, . . .

lo cual se convierte en (5.9) al hacer θ =´angulo de la as´ıntota (v´ease la figura 5.3). El punto σa donde las as´ıntotas intersectan el eje real se calcula como [5], Cap. 6: P P i pi − j zj σa = n−m

5.1 Dise˜ no con el lugar de las ra´ıces

5.

227

Considere un punto sobre el eje real del plano s. Suponga que a la derecha de dicho punto existe un n´ umero de polos (No. polosD) y de ceros (No. cerosD) reales que al ser sumados (N =No. polosD+No. cerosD) dan un n´ umero impar N . Entonces dicho punto sobre el eje real forma parte del lugar de las ra´ıces. En caso contrario tal punto no pertenece al lugar de las ra´ıces. Observe la figura 5.4 y considere la condici´on de ´angulo (5.7). N´otese que dos polos o dos ceros complejos conjugados producen ´angulos que al sumarse son iguales a 0 o a 360◦ por lo que no tienen contribuci´on en la condici´on de ´angulo (5.7). Esto significa que, en este caso, en la expresi´on (5.7) s´olo se deben considerar los polos y ceros reales. Por otro lado, n´otese que todo polo y cero real que se encuentre colocado a la izquierda del punto de prueba s contribuye con un ´angulo cero. Esto significa que en la expresi´on (5.7) s´olo se deben considerar los polos y ceros reales que se encuentren a la derecha del punto de prueba s. N´otese que cada cero real a la derecha del punto s contribuye con un ´angulo de +180◦ y cada polo a la derecha del mismo punto contribuye con un ´angulo de −180◦ . Por tanto, en ´angulo total con el que contribuyen todos los polos y ceros que est´an a la derecha del punto de prueba es: m X j=1

θj −

n X i=1

θi = No.cerosD × (+180◦ ) + No.polosD × (−180◦ )

Por otro lado, si la resta de dos n´ umeros es un n´ umero impar entonces Im (s)

òj

òi 0

î

0

î

180 î

180 î

s Re (s)

ò 0i

ò 0j

Figura 5.4. Polos y ceros de lazo abierto para estudiar la regla 5.

la suma de los mismos n´ umeros es un n´ umero impar. Por tanto, si: m X j=1

θj −

n X i=1

θi = (No.cerosD − No.polosD) × (+180◦ ) = ±(2q + 1)180◦

228

5 Dise˜ no usando la respuesta en el tiempo

para alg´ un q = 0, 1, 2, . . ., es decir (No. cerosD−No. polosD) es impar, entonces tambi´en se cumple: m X j=1

6.

7.

θj −

n X i=1

θj = N × (+180◦ ) = ±(2q + 1)180◦

para alg´ un q = 0, 1, 2, . . ., es decir con N =(No. PolosD+No. cerosD) impar. N´otese que ´esta u ´ltima expresi´on constituye la condici´on de ´angulo (5.7) por lo que el punto de prueba s en la figura 5.4 es un polo de lazo cerrado y forma parte del lugar de las ra´ıces. El lugar de las ra´ıces es sim´ etrico respecto al eje horizontal. Esto se entiende f´acilmente si se recuerda que todo polo complejo aparece siempre simult´aneamente con su pareja conjugada (v´ease el u ´ltimo p´arrafo de la secci´on 3.6). El ´ angulo de salida de un polo complejo se calcula como: ´angulo de salida de P un polo complejo= ±(2q + 1)180◦ + [´angulos de vectores desde los ceros hacia el polo en cuesti´ P on] − [´angulos de vectores desde los otros polos hacia el polo en cuesti´on] (5.10)

La explicaci´on de esta f´ormula es como sigue. Considere la figura 5.5. El s

pv

ò pv

òj

òi zj

pi

Im (s)

Re (s)

Figura 5.5. Polos y ceros de lazo abierto para estudiar la regla 7.

punto s es un punto que pertenece al lugar de las ra´ıces y que est´a infinitesimalmente cercano al polo en el punto pv . El ´angulo θpv medido como el ´angulo formado con respecto al eje horizontal positivo por el vector trazado desde el polo en pv hacia el punto s es igual al ´angulo de salida del polo complejo en pv . La condici´on de ´angulo (5.7) establece que: m X j=1

θj −

n X i=1

θi =

5.1 Dise˜ no con el lugar de las ra´ıces

229

= (θz1 + θz2 + · · · + θzm ) − (θp1 + θp2 + · · · + θpv + · · · + θpn ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . . donde θzj y θpi representan los ´angulos debidos a los ceros y a los polos de lazo abierto, respectivamente (puede considerarse que s = pv ). Despejando θpv : θpv = ±(2q + 1)180◦ + (θz1 + θz2 + · · · + θzm ) − (θp1 + θp2 + · · · + θpn ) 8.

para q = 0, 1, 2, . . ., que equivale a la f´ormula (5.10). El ´ angulo de llegada a un cero complejo se calcula como: ´angulo de llegadaPa un cero complejo= ±(2q + 1)180◦ − [´angulos de vectores desde los otros ceros hacia el cero enP cuesti´on] + [´angulos de vectores desde los polos hacia el cero en cuesti´on]

(5.11)

La explicaci´on de esta f´ormula es como sigue. Considere la figura 5.6. El s

zv

ò zv

òj

òi zj

pi

Im (s)

Re (s)

Figura 5.6. Polos y ceros de lazo abierto para estudiar la regla 8.

punto s es un punto que pertenece al lugar de las ra´ıces y que est´a infinitesimalmente cercano al cero en el punto zv . El ´angulo θzv medido como el ´angulo formado con respecto al eje horizontal positivo por el vector trazado desde el cero en zv hacia el punto s es igual al ´angulo de llegada al cero en zv . La condici´on de ´angulo (5.7) establece que: m X j=1

θj −

n X

θi =

i=1

= (θz1 + θz2 + · · · + θzv + · · · + θzm ) − (θp1 + θp2 + · · · + θpn ) = ±(2q + 1)180◦ donde q = 0, 1, 2, . . ., mientras que θzj y θpi representan los ´angulos debidos a los ceros y a los polos de lazo abierto, respectivamente (puede considerarse que s = zv ). Despejando θzv :

230

5 Dise˜ no usando la respuesta en el tiempo

θzv = ±(2q + 1)180◦ − (θz1 + θz2 + · · · + θzm ) + (θp1 + θp2 + · · · + θpn ) 9.

10.

11.

para q = 0, 1, 2, . . ., que equivale a la f´ormula (5.11). La ganancia de lazo abierto, k, requerida para que un punto s, perteneciente al lugar de las ra´ıces, verdaderamente sea seleccionado como un polo de lazo cerrado se calcula de manera que se satisfaga la condici´ on de magnitud (5.6): Qn i=1 li k = Qm j=1 lj

Los puntos de cruce con el eje imaginario se pueden obtener usando el criterio de Routh (v´ease la secci´on 4.3).

Finalmente dos reglas pr´acticas: Un polo de lazo abierto (en el semiplano izquierdo) agregado al lugar de las ra´ıces tiende a inestabilizar al sistema en lazo cerrado. Este efecto inestabilizante es mayor conforme el polo se coloque cada vez m´ as cerca del origen. Considere la figura 5.7, donde s representa un punto que pertenece al lugar de las ra´ıces y se est´a considerando un sistema que en lazo abierto no tiene ceros y s´olo tiene los dos polos mostrados. De acuerdo a la condici´on de ´angulo (5.7): −(θp1 + θp2 ) = −180◦ En la figura 5.8 se conservan los polos en p1 y en p2 pero se agrega un

s

Im (s)

ò p1

ò p2 p2

p1

Re (s)

Figura 5.7. Un punto perteneciente al lugar de las ra´ıces de un sistema con dos polos en lazo abierto.

tercer polo en p3 . Ahora la condici´on de ´angulo (5.7) se escribe como:

5.1 Dise˜ no con el lugar de las ra´ıces

Im (s)

ò p2 p2

s

ò p1

ò p3 p3

231

p1

Re (s)

Figura 5.8. El lugar de las ra´ıces es empujado hacia la derecha al introducir un polo adicional de lazo abierto.

−(θp1 + θp2 + θp3 ) = −180◦

12.

Esto significa que la suma θp1 + θp2 debe ser menor en la figura 5.8 que en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre hacia la derecha como en la figura 5.8, es decir, si el lugar de las ra´ıces es doblado hacia la derecha en la figura 5.8. Es f´acil ver que esta desviaci´on es mayor (el lugar de las ra´ıces es empujado cada vez m´as hacia la zona de inestabilidad) conforme θp3 es mayor, es decir, conforme p3 es m´as cercano al origen. Esto es una muestra de que un controlador integral tiende a inestabilizar a un sistema en lazo cerrado. Un cero de lazo abierto (en el semiplano izquierdo) agregado al lugar de las ra´ıces tiende a aumentar la estabilidad del sistema en lazo cerrado. Este efecto estabilizante es mayor conforme el cero se coloque cada vez m´ as cerca del origen. Considere de nuevo la figura 5.7. De acuerdo a la condici´on de ´angulo (5.7): −(θp1 + θp2 ) = −180◦ En la figura 5.9 se conservan los polos en p1 y en p2 pero se agrega un cero en z1 . Ahora la condici´on de ´angulo (5.7) se escribe como: θz1 − (θp1 + θp2 ) = −180◦ Esto significa que la suma θp1 + θp2 debe ser mayor en la figura 5.9 que en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre hacia la izquierda como en la figura 5.9, es decir, si el lugar de las ra´ıces es doblado hacia la izquierda en la figura 5.9. Es f´acil ver que esta desviaci´on es mayor (el sistema es halado cada vez m´as hacia la zona de mayor estabilidad) conforme θz1 es mayor, es decir, conforme z1 es m´as cercano

232

5 Dise˜ no usando la respuesta en el tiempo

Im (s)

s

ò p2

ò p1

ò z1

p2

p1

z1

Re (s)

Figura 5.9. El lugar de las ra´ıces es halado hacia la izquierda al introducir un cero adicional de lazo abierto.

al origen. Esto es una muestra de que el controlador derivativo tiende a estabilizar a un sistema.

5.2. 5.2.1.

Ejemplos Control proporcional de posici´ on

De acuerdo al cap´ıtulo 10, el siguiente es el modelo de un motor de CD cuando no existen perturbaciones externas: k I ∗ (s) s(s + a) nkm b >0 a = > 0, k = J J

θ(s) =

(5.12)

donde θ(s) e I ∗ (s) representan la posici´on (salida) y la consigna de corriente (entrada), respectivamente. Suponga que se usa el siguiente control proporcional de posici´on: I ∗ (s) = kp (θd (s) − θ(s)) donde θd (s) es la posici´on deseada y kp es una constante conocida como la ganancia proporcional. El sistema en lazo cerrado se puede representar como en la figura 5.10, de donde se concluye que la funci´on de transferencia en lazo abierto est´a dada como: G(s)H(s) =

kp k s(s + a)

(5.13)

5.2 Ejemplos

233

N´otese que el sistema es tipo 1 por lo que el error en estado estacionario es cero cuando la posici´on deseada es un escal´on. Por tanto, el u ´nico problema de dise˜ no que resta es seleccionar el valor de kp de manera que los polos de lazo cerrado est´en ubicados en los lugares deseados. A continuaci´on se estudia este problema usando el m´etodo del lugar de las ra´ıces. La ganancia kp es

òd(s) +

à

kp

Iã(s)

k s(s+a)

ò(s)

Figura 5.10. Sistema de control proporcional de posici´ on.

variada por el m´etodo para que tome valores desde 0 hasta +∞. Primero se reescribe G(s)H(s) en la siguiente forma: G(s)H(s) =

kp k ∠ − (θ1 + θ2 ) l1 l2

donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 (v´ease la figura 5.11). Las dos condiciones fundamentales que definen el lugar de las ra´ıces son las condiciones de ´angulo (5.7) y de magnitud (5.6) las cuales se expresan, respectivamente, como: −(θ1 + θ2 ) = ±(2q + 1)180◦ , kp k =1 l 1 l2

q = 0, 1, 2, . . .

La regla 5 indica que sobre el eje real s´olo existe lugar de las ra´ıces entre los puntos s = 0 y s = −a. Adem´as, de acuerdo a la regla 1, el lugar de las ra´ıces inicia (kp = 0) en s = 0 y s = −a. Por otro lado, de acuerdo a las reglas 2 y 3, cuando kp tiende a +∞ las ramas que inician en los puntos s = 0 y s = −a deben terminar en alg´ un cero de lazo abierto (no existe ninguno en este caso) o en alg´ un punto en el infinito del plano s. Por tanto, el lugar de las ra´ıces debe alejarse de los puntos s = 0 y s = −a, sobre el eje real, conforme kp crece de manera que debe existir un punto de separaci´on en alg´ un lugar entre dichos puntos para luego dirigirse hacia el infinito sobre el plano s. Por otro lado, de acuerdo a la condici´on de ´angulo, −(θ1 + θ2 ) = −180◦ = −(α + θ1 ) en la figura 5.11, se concluye que α = θ2 y, por lo que los tri´angulos t1 y t2 deben ser id´enticos para cualquier polo de lazo cerrado s. Entonces, las dos ramas mencionadas anteriormente y que son mostradas en la figura 5.11 deben ser paralelas al eje imaginario. Esto significa que el punto donde las dos ramas se separan del eje real est´a ubicado en el punto medio entre los polos ubicados en s = 0, s = −a, es decir en (0 − a)/2 = −a/2. Esto tambi´en

234

5 Dise˜ no usando la respuesta en el tiempo

Im (s)

s

ì

ì

l2

l1 t1

t2

ò1

ë

ò2 àa

à a2

0

Figura 5.11. Lugar de las ra´ıces para G(s)H(s) =

Re (s)

kp k . s(s+a)

puede verificarse usando las reglas 3 y 4. Finalmente, de acuerdo a la regla 6 ambas ramas son sim´etricas respecto al eje horizontal. La condici´on de magnitud se usa cuando se necesita conocer el valor exacto de kp que permita conseguir un punto espec´ıfico sobre el lugar de las ra´ıces. N´otese, por ejemplo, que al crecer kp hacia +∞ las longitudes l1 y l2 deben crecer para satisfacer la condici´on de magnitud kp k =1 l1 l2

(5.14)

lo cual significa que los polos de lazo cerrado correspondientes a valores grandes de kp tienden a alg´ un punto en el infinito del plano s. Por tanto, se concluye: i) los dos polos de lazo cerrado son reales, negativos y diferentes cuando kp > 0 es peque˜ na y ambos se aproximan al punto s = −a/2; esto significa que la rapidez del sistema aumenta porque el polo m´as lento se aleja del origen, ii) de acuerdo a la condici´on de magnitud, cuando: kp =

a2 l1 l2 = , k 4k

con l1 = l2 =

a , 2

los dos polos de lazo cerrado son reales, repetidos, negativos y ubicados en s = − a2 ; por lo que se alcanza la mayor rapidez sin que haya oscilaciones, iii) a2 conforme kp > 4k se incrementa los dos polos se alejan del eje real (uno hacia arriba y el otro hacia abajo) sobre la linea vertical que pasa por s = − a2 ; esto significa que el sistema es m´as r´apido (porque ωn , la distancia de los polos al origen, aumenta; v´ease la secci´on 3.3) y la respuesta del sistema

5.2 Ejemplos

235

en lazo cerrado (de segundo orden) es cada vez m´as oscilatoria (porque el ´angulo 90◦ − α disminuye y el amortiguamiento, dado como ζ = sin(90◦ − α), disminuye; v´ease la secci´on 3.3). Todo lo anterior significa que no es posible conseguir simult´aneamente una respuesta tan r´apida y tan amortiguada como se desee. Esto es una consecuencia directa de que los polos de lazo cerrado no pueden ser ubicados en cualquier lugar del plano s y s´olo pueden ser colocados sobre la linea gruesa mostrada en la figura 5.11. En el siguiente ejemplo se muestra que la introducci´on de un cero en la funci´on de transferencia de lazo abierto permite colocar los dos polos de lazo cerrado en cualquier punto del plano s. 5.2.2.

Control proporcional-derivativo (PD) de posici´ on

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero ahora junto con el siguiente controlador proporcional-derivativo: i∗ = kp e + kd

de , dt

e = θd − θ

donde kp es, como antes, la ganancia proporcional y kd es una constante conocida como la ganancia derivativa. Usando la transformada de Laplace se obtiene: I ∗ (s) = kp E(s) + kd sE(s) = (kp + kd s)E(s) µ ¶ kp E(s) = kd s + kd por lo que se obtiene el diagrama de bloques mostrado en la figura 5.12. Entonces, la funci´on de transferencia de lazo abierto est´a dada como: G(s)H(s) =

kd k(s + c) , s(s + a)

c=

kp >0 kd

(5.15)

N´otese que ahora es kd la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para

òd(s) +

à

ð ñ Iã(s) kd s + kk pd

k s(s+a)

ò(s)

Figura 5.12. Sistema de control proporcional-derivativo de posici´ on.

dibujar el lugar de las ra´ıces. Primero se reescribe G(s)H(s) en la siguiente forma:

236

5 Dise˜ no usando la respuesta en el tiempo

G(s)H(s) =

kd k l3 ∠θ3 − (θ1 + θ2 ) l1 l2

(5.16)

donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 , s − (−c) = l3 ∠θ3 . Las condiciones de ´angulo y de magnitud se expresan, respectivamente, como: θ3 − (θ1 + θ2 ) = ±(2q + 1)180◦ , kd k l3 =1 l1 l2

q = 0, 1, 2, . . .

El lugar de las ra´ıces correspondiente a este caso se puede obtener a partir del obtenido para la funci´on de transferencia en (5.13) considerando que simplemente se ha adicionado un cero en s = −c. De acuerdo a la regla 12 el cero ser´a la causa para que las dos ramas del lugar de las ra´ıces mostrado en la figura 5.11 se “doblen” hacia la izquierda. Esto puede comprobarse usando la regla 3 para encontrar que ahora existe una sola rama del lugar de las ra´ıces que tiende hacia una as´ıntota que forma un ´angulo de ±1800 con el eje real positivo. Como se muestra en la figura 5.13 el Im(s)

àc

Re(s)

àa

(a) c > a Im(s)

àa

àc

Re(s)

(b) c < a Figura 5.13. Lugar de las ra´ıces para G(s)H(s) =

kd k(s+c) . s(s+a)

lugar de las ra´ıces puede tener dos formas diferentes dependiendo de en d´onde

5.2 Ejemplos

237

se coloque el cero en s = −c. Si se coloca a la izquierda del polo en s = −a (como en la figura 5.13(a)) entonces, de acuerdo a la regla 5, existir´a lugar de las ra´ıces sobre dos segmentos del eje real negativo: entre los puntos s = 0 y s = −a y a la izquierda del cero en s = −c. Adem´as, de acuerdo a las reglas 2 y 3 una de las dos ramas del lugar de las ra´ıces que inician (kd = 0) en los polos de lazo abierto colocados en s = 0 y s = −a debe tender al cero en s = −c mientras que la otra rama debe tender hacia el infinito del plano s siguiendo la as´ıntota que forma un ´angulo de ±1800 con el eje real positivo. Por tanto, debe existir un punto de separaci´on entre los puntos s = 0 y s = −a. Adem´as, como el lugar de las ra´ıces es sim´etrico respecto al eje real (regla 6) entonces despu´es de separarse estas ramas deben formar dos semic´ırculos hacia la izquierda del punto de separaci´on para volverse a unir sobre el eje real negativo en un punto a la izquierda del cero en s = −c para que, luego, una de las ramas se aproxime al cero en s = −c y la otra se vaya hacia el infinito sobre el eje real negativo. Por otro lado, si el cero en s = −c se coloca entre los polos de lazo abierto en s = 0 y s = −a entonces, de acuerdo a la regla 5, existir´a lugar de las sobre los segmentos del eje real negativo colocados entre los puntos s = −c y s = 0 as´ı como a la izquierda del polo en s = −a. N´otese que ahora la rama que inicia (kd = 0) en s = 0 tiende al cero en s = −c mientras que la rama que inicia (kd = 0) en s = −a tiende al infinito sobre el eje real negativo. N´otese tambi´en que ´esto es posible sin necesidad de que existan ramas fuera del eje real, como se muestra en la figura 5.13(b). A partir de este estudio del lugar de las ra´ıces, se puede ver que el sistema en lazo cerrado es estable para cualquier kp > 0 y kd > 0 porque las dos posibilidades para el lugar de las ra´ıces que han sido presentadas en la figura 5.13 muestran que los polos de lazo cerrado siempre est´an sobre el semiplano complejo izquierdo s (polos con parte real negativa). A continuaci´on se muestra que siempre existen ganancias kp y kd que permiten colocar los polos de lazo cerrado en cualquier punto sobre el semi plano complejo izquierdo s que se desee. De acuerdo a (5.1), la funci´on de transferencia de lazo cerrado est´a dada como: kd k(s + c) θ(s) = 2 (5.17) θd (s) s + (a + kd k)s + ckd k es decir, existen dos polos de lazo cerrado, dados por el lugar de las ra´ıces, y un cero en s = −c que es precisamente el cero de lazo abierto que aparece en los lugares de las ra´ıces mostrados en la figura 5.13. N´otese que el polinomio caracter´ıstico en (5.17) tiene la forma est´andar: s2 + 2ζωn s + ωn2

(5.18)

Por esta raz´on se pueden igualar ambos polinomios para concluir que, igualando coeficientes: a + kd k ωn2 = ckd k = kp k, ζ = p (5.19) 2 kp k

238

5 Dise˜ no usando la respuesta en el tiempo

polos deseados en lazo cerrado: s = −ζωn ± ωn

p

ζ2 − 1

Esto significa que usando kp y kd se pueden colocar los polos de lazo cerrado en cualquier punto del semiplano complejo izquierdo s porque se puede asignar cualquier valor a ζ y a ωn . Por a otro lado, es com´ un ubicar los polos de lazo cerrado (complejos conjugados) de manera que se consiga el tiempo de subida tr y el sobre paso Mp ( %) deseados. Para esto, normalmente se usan las expresiones en (3.59) para encontrar: abs(ln(Mp ( %)/100)) ζ= q π 2 + ln2 (Mp ( %)/100) !! Ã Ãp 1 − ζ2 1 π − atan ωd = tr ζ ωd ωn = p 1 − ζ2

(5.20)

(5.21)

Sin embargo, en el caso del control PD de posici´on que se est´a estudiando, la ubicaci´on de los polos de lazo cerrado en los puntos deseados no asegura que se obtendr´a la respuesta transitoria deseada debido a la presencia del cero colocado en s = −c en la funci´on de transferencia de lazo cerrado presentada en (5.17). Este problema motiva el ejemplo mostrado a continuaci´on en el cual se usa un compensador de adelanto para controlar la posici´on. Sin embargo, antes de continuar, es conveniente aclarar que a pesar del inconveniente que se acaba de mencionar para el control PD de posici´on su uso es muy com´ un en las aplicaciones. Esto se debe a que la sinton´ıa del control PD en este tipo de aplicaciones no necesita del c´alculo exacto de las ganancias, pues ´estas se pueden seleccionar a prueba y error usando la siguiente regla (recuerde que la funci´on de transferencia en (5.17) es estable si kp > 0 y kd > 0): Fije kd > 0 en un valor e incremente kp > 0 hasta obtener una respuesta suficientemente r´apida. Esto trae como consecuencia una respuesta muy oscilatoria porque el amortiguamiento disminuye al incrementar kp (v´ease (5.19)). En ese momento contin´ ue con el siguiente paso. Mantenga kp > 0 en el u ´ltimo valor obtenido en el paso anterior y empiece a incrementar kd > 0 hasta obtener una respuesta suficientemente amortiguada. Esto, sin embargo, reduce la rapidez de la respuesta porque el amortiguamiento aumenta. As´ı que mantenga el u ´ltimo valor de kd , regrese al punto anterior y repita el procedimiento hasta tener la rapidez y el sobre paso (amortiguamiento) deseados. 5.2.3.

Control de posici´ on usando un compensador de adelanto

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero ahora junto con el siguiente controlador:

5.2 Ejemplos

I ∗ (s) = γ

s+d , s+c

c > d > 0,

239

γ>0

el cual se conoce como compensador de adelanto porque c > d. Esta condici´on (c > d) se introduce cuando se quiere aumentar el amortiguamiento del sistema, es decir, cuando los polos de lazo cerrado deben ser recorridos hacia la izquierda del semi plano complejo izquierdo (v´eanse las reglas 11 y 12). El diagrama de bloques en lazo cerrado se muestra en la figura 5.14. La funci´on de transferencia de lazo abierto est´a dada como:

òd ( s)

+

I ã(s)

s+d í s+c

k s ( s+a)

ò(s)

à

Figura 5.14. Control de posici´ on con una red de adelanto.

G(s)H(s) = γ

k(s + d) s(s + a)(s + c)

(5.22)

Si el valor de d se propone tal que: d=a

(5.23)

entonces la funci´on de transferencia en lazo cerrado es: γk ωn2 θ(s) = 2 = 2 θd (s) s + cs + γk s + 2ζωn s + ωn2 lo que significa que: c = 2ζωn ,

γ=

ωn2 k

(5.24)

As´ı que si se usan las expresiones en (5.20) y (5.21) para calcular ζ y ωn de manera que se consiga el tiempo de subida y el sobre paso deseados, entonces (5.23) y (5.24) representan una regla de sinton´ıa muy simple. En la figura 5.15 se muestra que cuando d = a el lugar de las ra´ıces es muy similar al obtenido en la secci´on 5.2.1 porque, al cancelarse el polo en s = −a y el cero en s = −d, la funci´on de transferencia de lazo abierto se reduce a: G(s)H(s) =

γk s(s + c)

240

5 Dise˜ no usando la respuesta en el tiempo Im(s)

àd

à c2

àc

Re(s)

àa

Figura 5.15. Lugar de las ra´ıces para G(s)H(s) en (5.22) cuando d = a.

que es id´entica a la funci´on de transferencia en (5.13) intercambiando kp por γ y a por c. La diferencia radica en que, en el presente caso, al seleccionar c de acuerdo a (5.24) se asegura que el lugar de las ra´ıces pasar´a por los puntos deseados del semiplano izquierdo complejo s: p p s1 = −ζωn + jωn 1 − ζ 2 , s2 = −ζωn − jωn 1 − ζ 2

cuando, de acuerdo a la condici´on de magnitud (v´ease (5.14) y la figura 5.11 con c en lugar de a y γ en lugar de kp ): γk = 1, l1 l2

l1 = l2 = |s1 | = |s2 | = ωn



γ=

ωn2 k

Por tanto, si d = a no es necesario dibujar el lugar de las ra´ıces. A continuaci´on se obtiene el lugar de las ra´ıces para el caso en que d 6= a, con el fin de entender que suceder´ıa en tal caso. Por tanto, consid´erese la funci´on de transferencia de lazo abierto presentada en (5.22). La constante γ es la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para dibujar el lugar de las ra´ıces. N´otese que, de acuerdo a (5.1) y la figura 5.14, la funci´on de transferencia de lazo cerrado tiene la forma: γ k(s + d) θ(s) = θd (s) (s − e)(s − g)(s − h)

(5.25)

donde e, g y h representan las ubicaciones de los tres polos de lazo cerrado. Primero se reescribe G(s)H(s) en la siguiente forma: G(s)H(s) =

γ k l3 ∠[θ3 − (θ1 + θ2 + θ4 )] l1 l2 l4

(5.26)

donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 , s − (−d) = l3 ∠θ3 , s − (−c) = l4 ∠θ4 . Las condiciones de ´angulo (5.7) y de magnitud (5.6) se expresan, respectivamente, como:

5.2 Ejemplos

θ3 − (θ1 + θ2 + θ4 ) = ±(2q + 1)180◦ , γ k l3 =1 l1 l2 l4

q = 0, 1, 2, . . .

241

(5.27) (5.28)

N´otese que ahora se tiene n = 3, m = 1, p1 = 0, p2 = −a, p3 = −c, z1 = −d. De acuerdo a las reglas 1, 2 y 3, una de las tres ramas que inician (γ = 0) en los puntos s = 0, s = −a, s = −c (polos de lazo abierto) debe terminar (γ = +∞) en el cero de lazo abierto colocado en s = −d. Por tanto, existir´an dos ramas del lugar de las ra´ıces que tienden a alg´ un punto del infinito sobre el plano s. De acuerdo a la regla 3, los ´angulos de las as´ıntotas a las que tienden estas ramas son: ±180◦ (2 × 0 + 1) ±180◦ (2 × 0 + 1) = = ±90◦ n−m 3−1 Adem´as, de acuerdo a la regla 4 la intersecci´on de estas as´ıntotas con el eje real puede ser ajustada usando el cero en s = −d y el polo en s = −c:

p1 + p2 + p3 − (−d) 0−a−c+d = (5.29) n−m 2 Como c y d deben ser positivas por motivos de estabilidad entonces las as´ıntotas se mueven hacia la izquierda (mayor estabilidad) conforme el cero es ubicado m´as cerca del origen (d → 0) y/o el polo en −c es movido hacia la izquierda. Esto significa que los polos de lazo cerrado se pueden ubicar del siguiente modo: e y g complejos conjugados, mientras que h se selecciona como real y cercano al cero colocado en s = −d. De este modo, el polo y el cero tienden a disminuir sus efectos sobre la respuesta transitoria del sistema en lazo cerrado, la cual tiende a ser parecida a la de una funci´on de transferencia con la forma: θ(s) eg = (5.30) θd (s) (s − e)(s − g) σa =

es decir, la forma est´andar de segundo orden (5.18) para que el tiempo de subida y el sobre paso puedan ser calculados a partir de los valores e y g usando (3.59) o (5.20) y (5.21). N´otese, sin embargo, que esto s´olo ser´a completamente cierto si d = a. De acuerdo a la regla 5 existe lugar de las ra´ıces sobre dos segmentos del eje real porque se tienen cuatro polos y ceros reales de lazo abierto. La ubicaci´on de dichos segmentos sobre el eje real dependen del valor de d usado, como se muestra en las figuras 5.16(a) y 5.16(b). Sin embargo, n´otese que en cualquiera de estos casos existe un polo de lazo cerrado que se aproxima al cero en s = −d conforme γ crece, lo cual es una caracter´ıstica deseable para conseguir (5.30) y que ocurre cuando d = a. 5.2.4.

Control proporcional-integral (PI) de velocidad

De acuerdo al cap´ıtulo 9, el siguiente es el modelo de un motor de CD cuando la salida a controlar es la velocidad ω(s):

242

5 Dise˜ no usando la respuesta en el tiempo

Im(s)

àc

àa

Re(s)

àd

(a) a > d

Im(s)

àc

àd

àa

Re(s)

(b) a < d Figura 5.16. Lugares de las ra´ıces para G(s)H(s) en (5.22).

1 1 [kI ∗ (s) − Tp (s)] s+a J nkm b >0 a = > 0, k = J J

ω(s) =

donde la consigna de corriente I ∗ (s) es la entrada y Tp (s) es una perturbaci´on externa de par. Se propone dise˜ nar un controlador PI de velocidad, es decir, se escoge: Z t i∗ = kp e + ki e(r)dr, e = ωd − ω 0

5.2 Ejemplos

243

donde ωd es la velocidad deseada, kp es la ganancia proporcional y la constante ki es conocida como la ganancia integral. Usando la transformada de Laplace: E(s) I ∗ (s) = kp E(s) + ki µ ¶ s ki = kp + E(s) s µ ¶ kp s + ki E(s) = s ! Ã s + kkpi E(s) = kp s Por tanto, en lazo cerrado se obtiene el diagrama de bloques mostrado en la figura 5.17(a). Como este sistema tiene dos entradas, se puede hacer uso del principio de superposici´on (v´ease la secci´on 3.10) para escribir: ω(s) = G1 (s)ωd (s) + G2 (s)Tp (s) donde G1 (s) es la funci´on de transferencia usando ωd (s) como la entrada y ω(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 5.17(b), mientras que G2 (s) es la funci´on de transferencia usando Tp (s) como la entrada y ω(s) como la salida cuando ωd (s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 5.17(c). Es importante subrayar que cuando Tp (s) es la entrada entonces ω(s) representa la desviaci´on de la velocidad (respecto de ωd (s)) producida por la perturbaci´on. A continuaci´on se estudia el problema de seleccionar las ganancias del controlador PI de manera que la respuesta en lazo cerrado tenga las caracter´ısticas deseadas de respuesta transitoria ante la referencia de velocidad ωd . Para esto se usa el diagrama de bloques de la figura 5.17(b), de donde se observa que la funci´on de transferencia de lazo abierto es: G(s)H(s) =

kp k(s + c) , s(s + a)

c=

ki kp

(5.31)

N´otese que el sistema es tipo 1, lo cual asegura que ω(t) = ωd en estado estacionario si ωd es una constante. Esta es una de las razones de haber elegido usar un controlador PI en este ejemplo. Por tanto, como las caracter´ısticas deseadas de la respuesta en estado estacionario est´an aseguradas (la velocidad alcanza la velocidad deseada) s´olo resta seleccionar las ganancias kp y ki de manera que sean satisfechas las caracter´ısticas de respuesta transitoria. Para esto, n´otese que la funci´on de transferencia en lazo abierto mostrada en (5.31) es id´entica a la funci´on de transferencia mostrada en (5.15) correspondiente al control PD de posici´on ya que s´olo hay que reemplazar kd por kp . Por tanto, el lugar de las ra´ıces correspondiente al control PI de velocidad es id´entico a los dos casos mostrados en la figura 5.13 y se obtienen las mismas conclusiones: i)

244

5 Dise˜ no usando la respuesta en el tiempo

T p(s)

1 J

! d(s)

+

kp

à

k s+k pi

I ã(s) k

s

à

+

!(s)

1 s+a

(a) Sistema de control completo.

! d(s)

+

!(s)

k

kp

à

s+k pi

k s+a

s

(b) Caso cuando Tp (s) = 0.

T p(s)

1 J

à

à

!(s)

1 s+a

k

k pk

s+k pi s

(c) Caso cuando ωd (s) = 0. Figura 5.17. Sistema de control proporcional-integral de velocidad

siempre existen ganancias kp y ki que permiten colocar los dos polos de lazo cerrado en cualquier punto sobre el semi plano complejo izquierdo; por tanto, es posible sintonizar el controlador PI usando un procedimiento de prueba y error id´entico al presentado al final de la secci´on 5.2.2: s´olo se debe usar la ganancia ki (control PI) en lugar de kp (control PD) y usar la ganancia kp (control PI) en lugar de kd (control PD), ii) el cero colocado en s = −c tambi´en es un cero de la funci´on de transferencia en lazo cerrado G1 (s) lo que afecta a las caracter´ısticas de respuesta transitoria ante la referencia de velocidad. Es decir, que la respuesta transitoria no tendr´a las caracter´ısticas

5.2 Ejemplos

245

dise˜ nadas usando (5.20) y (5.21) para seleccionar los polos de lazo cerrado. Esto plantea las siguientes dos posibilidades para el dise˜ no. 1.

El problema indicado en el inciso ii) puede ser eliminado si se elige: c=a=

ki kp

(5.32)

porque en tal caso, de acuerdo a la figura 5.17(b) y a (5.1), la funci´on de transferencia de lazo cerrado es: ω(s) kp k = ωd (s) s + kp k Esto significa que la repuesta en lazo cerrado, ante la referencia de velocidad, es como la de un sistema de primer orden con ganancia unitaria en estado estacionario y una constante de tiempo igual a kp1k . Entonces, si se especifica una constante de tiempo deseada igual a τ se debe establecer: kp k =

1 τ

(5.33)

As´ı que las condiciones en (5.33) y (5.32) representan una sencilla regla Im(s)

àc

àa

Re(s)

Figura 5.18. Lugar de las ra´ıces para c = a, G(s)H(s) =

kp k . s

de sinton´ıa. Finalmente, el lugar de las ra´ıces correspondientes al caso que k k se acaba de estudiar (c = a, G(s)H(s) = ps ) se muestra en la figura 5.18. Esto puede deducirse f´acilmente usando las reglas 3 y 5, ya que al s´olo existir un polo de lazo abierto, s´olo existe un polo de lazo cerrado, el cual debe ser real y debe tender a un cero en el infinito (sobre el eje real, sobre una as´ıntota que forma −180◦ con el eje real positivo) porque no hay ning´ un cero de lazo abierto. Adem´as, la condici´on de magnitud: kp k =1 l1

246

5 Dise˜ no usando la respuesta en el tiempo

donde l1 es la distancia del polo de lazo cerrado deseado al origen, establece que el polo deseado en lazo cerrado ubicado en s = − τ1 es alcanzado cuando: kp k = l1 ,

l1 =

1 1 ⇒ kp k = τ τ

lo cual coincide con (5.33). Sin embargo, a continuaci´on se muestra que esta regla de sinton´ıa trae un problema en cuanto a la respuesta del sistema en lazo cerrado ante la perturbaci´on externa Tp (s). Para esto, consid´erese el diagrama de bloques de la figura 5.17(c). Si se selecciona c = a entonces la funci´on de transferencia de lazo cerrado es: − Jk s ω(s) = Tp (s) (s + kp k)(s + a)

(5.34)

Usando el teorema del valor final se encuentra que: l´ım ω(t) = l´ım sω(s)

t→∞

s→0

= l´ım s s→0

2.

− Jk s td =0 (s + kp k)(s + a) s

la desviaci´on producida por una perturbaci´on externa de par de valor constante igual a td es reducida a cero en estado estacionario. Esta es la otra raz´on por la cual se ha elegido usar un controlador PI de velocidad. Sin embargo, existe un problema. La rapidez con la que tal desviaci´on es llevada a cero depende de los polos de la funci´on de transferencia mostrada en (5.34), los cuales est´an ubicados en s = −kp k y s = −a. Aunque uno de estos polos puede ser hacerse tan r´apido como se desee usando un valor grande de kp , la rapidez del otro polo (s = −a) no puede ser modificada y depende de la rapidez que el motor de CD tiene en lazo abierto. Esto trae como consecuencia que la desviaci´on debida a la perturbaci´on puede ser llevada a cero muy lentamente, lo cual representa un serio inconveniente. Tratando de resolver el problema que se acaba de indicar se puede optar por abandonar la regla de sinton´ıa representada por (5.33) y (5.32). Como ahora c 6= a, la funci´on de transferencia de lazo cerrado correspondiente al diagrama de bloques de la figura 5.17(c) es: − Jk s ω(s) = 2 Tp (s) s + (a + kp k)s + kp kc

(5.35)

Usando de nuevo el teorema del valor final se puede verificar f´acilmente que si la perturbaci´on externa es constante Tp (s) = tsd entonces la desviaci´on producida en estado estacionario es cero de nuevo: l´ımt→∞ ω(t) = 0, debido a que la funci´on de trasferencia en (5.35) tiene un cero en s = 0. Por otro lado, los polos de la funci´on de transferencia en (5.35), que son los

5.2 Ejemplos

247

que determinan la rapidez con la que la desviaci´on de velocidad desaparece, son id´enticos a los polos de la funci´on de transferencia ωω(s) = G1 (s), d (s) por lo que pueden ser determinados usando el m´etodo del lugar de las ra´ıces a partir de (5.31). Tal como ya se ha explicado, el lugar de las ra´ıces correspondiente es id´entico a los dos casos mostrados en la figura 5.13 sustituyendo el uso de kd por el de kp . Es muy importante subrayar que la funci´on de transferencia en (5.35) no tiene el cero en s = −c que se muestra en el lugar de las ra´ıces de la figura 5.13. Esto significa que ninguno de los dos polos de lazo cerrado obtenidos con el m´etodo del lugar de las ra´ıces podr´a cancelarse con el cero en s = −c y el polo m´as lento tendr´a el efecto m´as importante sobre la rapidez con la que la desviaci´on debida a la perturbaci´on es llevada a cero. Con esto en mente se concluye lo siguiente. Con el fin de que el cero en s = −c tenga poco efecto sobre la respuesta transitoria ante la referencia de velocidad, uno de los polos de lazo cerrado debe seleccionarse cerca del cero en s = −c. El otro polo de lazo cerrado (el m´as r´apido) se aleja hacia la izquierda y tiende al infinito conforme el polo lento se acerca a s = −c. Esto significa que el polo r´apido determina las caracter´ısticas de respuesta transitoria (constante de tiempo) ante la referencia de velocidad. Entonces, si se desea establecer cierto valor para la constante de tiempo (de manera que el polo r´apido ocupe un punto finito sobre el eje real negativo), el polo lento siempre estar´a relativamente lejos del cero en s = −c (a donde converger´ıa cuando el polo r´apido llegue al infinito). Esto significa que la respuesta transitoria estar´a afectada por los dos polos y el cero en s = −c. Por tanto, si c 6= a, no se puede determinar una regla de sinton´ıa que de manera exacta fije las caracter´ısticas de respuesta transitoria ante la referencia de velocidad. Es m´as conveniente seleccionar c > a porque el polo de lazo cerrado m´as lento (el que se aproxima a s = −c) queda colocado m´as a la izquierda (es m´as r´apido) que si selecciona c < a. Por esta misma raz´on, si se quiere aumentar la rapidez con la que el efecto de la perturbaci´on desaparece, se debe seleccionar c 6= a con c > 0 cada vez m´as grande. De acuerdo a c = ki /kp , esto significa que se necesita una ganancia integral mayor. Por tanto, aunque es posible aumentar la rapidez con la que desaparece la desviaci´on producida por la perturbaci´on, se concluye que no se pueden calcular de manera exacta las ganancias kp y ki que aseguren que se consiguen, simult´aneamente, las caracter´ısticas deseadas de respuesta transitoria ante la referencia deseada y un rechazo r´apido de los efectos de la perturbaci´on. Esta afirmaci´on es verificada experimentalmente en el cap´ıtulo 9 y, por ello, en ese cap´ıtulo se presenta un controlador PI modificado de velocidad que resuelve este problema.

248

5 Dise˜ no usando la respuesta en el tiempo

Previendo su uso experimental en el cap´ıtulo 9, a continuaci´on se propone una regla de sinton´ıa para el caso cuando c 6= a. De acuerdo a (5.31) la condici´on de magnitud es: kp kl1 =1 l3 l2 donde s − (0) = l2 ∠θ2 , s − (−a) = l3 ∠θ3 , s − (−c) = l1 ∠θ1 . El criterio de sinton´ıa seleccionado es proponer que el polo m´as lento est´e ubicado en un valor conocido s = −p1 , para fijar un l´ımite inferior en la rapidez con la que se rechaza el efecto de la perturbaci´on. Por otro lado, de acuerdo a los puntos listados previamente, se propone c cercano a p1 de manera que p1 > c. Entonces, usando la condici´on de magnitud previa se obtiene la regla de sinton´ıa: l 2 l3 ki = c, c < p1 , kp = kp l1 k l1 = abs(−p1 + c), l2 = abs(−p1 ),

(5.36) l3 = abs(−p1 + a)

De acuerdo a lo expuesto previamente, la respuesta ante la referencia de velocidad ser´a mucho m´as r´apida que la dictada por el polo en s = −p1 . Para prop´ositos de comparaci´on, esto es muy importante pues en el cap´ıtulo 9 se dise˜ nan algunos controladores de velocidad que consiguen simultaneamente respuestas transitorias ante una referencia de velocidad y una perturbaci´on externa que son determinadas por un polo en s = −p1 . En cambio con el control PI de velocidad aqu´ı estudiado, si se desea aumentar la rapidez de respuesta ante una perturbaci´on externa (con un polo en s = −p1 ), la respuesta ante la referencia de velocidad debe ser mucho m´as r´apida. 5.2.5.

Control proporcional-integral-derivativo (PID) de posici´ on

Considere de nuevo el modelo de un motor de CD pero ahora considerando la presencia de una perturbaci´on externa: θ(s) =

1 1 [kI ∗ (s) − Tp (s)] s(s + a) J

junto con el siguiente controlador proporcional-integral-derivativo: Z t de e(r)dr, e = θd − θ i∗ = kp e + kd + ki dt 0 donde θd es la posici´on deseada y las constantes kp , kd y ki se conocen como las ganancias proporcional, derivativa e integral, respectivamente. Usando la transformada de Laplace se obtiene:

5.2 Ejemplos

249

E(s) I ∗ (s) = kp E(s) + kd sE(s) + ki s ¶ µ ki E(s) = kp + kd s + s = kd

s2 +

kp kd s

s

+

ki kd

E(s)

por lo que se obtiene el diagrama de bloques mostrado en la figura 5.19(a). Como este sistema tiene dos entradas entonces se puede usar el principio de superposici´on (v´ease la secci´on 3.10) para escribir: θ(s) = G1 (s)θd (s) + G2 (s)Tp (s) donde G1 (s) es la funci´on de transferencia usando θd (s) como la entrada y θ(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 5.19(b) para encontrar: ´ ³ kp ki 2 s + k k s + d kd kd θ(s) = G1 (s) = 3 , Tp (s) = 0 (5.37) θd (s) s + (a + kd k)s2 + kp ks + ki k Por otro lado, G2 (s) es la funci´on de transferencia usando Tp (s) como la entrada y θ(s) como la salida cuando θd (s) = 0, es decir, cuando se usa el diagrama de bloques de la figura 5.19(c) para encontrar: − Jk s θ(s) = G2 (s) = 3 , Tp (s) s + (a + kd k)s2 + kp ks + ki k

θd (s) = 0

(5.38)

Es importante subrayar que cuando Tp (s) es la entrada entonces θ(s) representa la desviaci´on de la posici´on (respecto de θd (s)) producida por la perturbaci´on. Usando el teorema del valor final se encuentra que: l´ım θ(t) = l´ım sθ(s)

t→∞

s→0

= l´ım s s→0

− Jk s td =0 s3 + (a + kd k)s2 + kp ks + ki k s

la desviaci´on de posici´on en estado estacionario producida por una perturbaci´on externa de par constante Tp (s) = tsd es cero. Utilizando de nuevo el teorema del valor final, no es dif´ıcil comprobar que, usando (5.37), el valor final de posici´on θ es igual al valor deseado θd cuando ´este es constante. Estas son las principales razones para usar un controlador PID de posici´on. A continuaci´on se estudia el problema de seleccionar las ganancias del controlador PID de manera que la respuesta en lazo cerrado tenga las caracter´ısticas deseadas de respuesta transitoria ante la referencia de posici´on θd . Con este prop´osito, los tres polos de la funci´on de transferencia en (5.37) deben ser asignados en los puntos deseados sobre el semiplano complejo izquierdo. Esto se consigue igualando el polinomio caracter´ıstico de la funci´on

250

5 Dise˜ no usando la respuesta en el tiempo

T p(s)

1 J

ò d(s)

+ kd

à

s

2

k kp +k s+k i d d

I ã(s) k

s

+

à

1 s(s+a)

ò(s)

(a) El sistema de control completo.

ò d(s)

+

kp

kd

à

k

s 2+k s+k i d

k s(s+a)

d

s

ò(s)

(b) Caso cuando Tp (s) = 0.

T p(s)

1 J

ò(s)

à à

1 s(s+a)

kp

k dk

k

s 2+k s+k i d

d

s

(c) Caso cuando θd (s) = 0. Figura 5.19. Sistema de control PID de posici´ on

de transferencia en (5.37) con un polinomio que tiene sus tres ra´ıces en los puntos deseados s = p1 , s = p2 , s = p3 : s3 + (a + kd k)s2 + kp ks + ki k = (s − p1 )(s − p2 )(s − p3 ) Es claro que a los tres coeficientes del polinomio caracter´ıstico se les puede asignar cualquier valor con combinaciones adecuadas de las ganancias kp , kd y ki . Esto significa que los tres polos del sistema en lazo cerrado pueden ser asignados en cualquier lugar que se desee del semiplano complejo izquierdo. Una manera de seleccionar los polos deseados es: dos complejos conjugados con parte real negativa y el otro real y negativo (para asegurar estabilidad), es decir:

5.2 Ejemplos

p1 = σ1 + jω1 ,

p2 = σ1 − jω1 ,

p3 < 0,

σ1 < 0,

251

ω1 > 0

Si se desea que la respuesta sea dominada por los dos polos complejos conjugados entonces se puede proponer: |p3 | > 6|σ1 | Con estos datos se obtiene: s3 + (a + kd k)s2 + kp ks + ki k = (s − p1 )(s − p2 )(s − p3 )

(5.39)

= s3 − (2σ1 + p3 )s2 + (σ12 + ω12 + 2σ1 p3 )s − p3 (σ12 + ω12 )

de donde, igualando coeficientes, se obtiene la siguiente regla de sinton´ıa: −(2σ1 + p3 ) − a k σ12 + ω12 + 2σ1 p3 kp = k 2 −p3 (σ1 + ω12 ) ki = k

kd =

(5.40)

N´otese que las tres ganancias del controlador son positivas. Aunque la parte real e imaginaria de los polos en p1 y p2 pueden ser calculadas usando (5.20) y (5.21) de manera que se obtenga el tiempo de subida tr y el sobre paso Mp ( %) deseados, sin embargo la respuesta obtenida tendr´a diferencias importantes respecto de estos valores deseados debido a los dos ceros que tiene la funci´on de transferencia en (5.37). Aunque esta es una desventaja importante de la regla de sinton´ıa en (5.40), estos valores pueden ser usados como una simple aproximaci´on de las ganancias requeridas del controlador para posteriormente hacer ajustes finos, a prueba y error, hasta obtener las caracter´ısticas deseadas de respuesta transitoria. Para esto, dado que el sistema en lazo cerrado es de tercer orden, es muy importante tener presente la regla de estabilidad obtenida en el ejemplo 4.12 de la secci´on 4.3. La posibilidad de ajustar a prueba y error las ganancias de un controlador PID (v´ease la secci´on 5.3) es una de las principales razones por las que este tipo de controlador tiene tanto uso en la industria. Con el fin de buscar una regla de sinton´ıa que permita calcular de manera exacta las ganancias de un controlador PID, a continuaci´on se procede a estudiar el lugar de las ra´ıces para el control PID de posici´on. Para esto se usa el diagrama de bloques de la figura 5.19(b), de donde se observa que la funci´on de transferencia de lazo abierto es: G(s)H(s) =

kd k(s + α)(s + β) , s2 (s + a)

(s + α)(s + β) = s2 +

kp ki s + (5.41) kd kd

para algunas constantes α y β diferentes de cero cuyos valores se proponen como parte del proceso del dise˜ no para despu´es, a partir de estos valores,

252

5 Dise˜ no usando la respuesta en el tiempo

calcular kp y ki . N´otese que kd es la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para dibujar el lugar de las ra´ıces. Es claro que el sistema es tipo 2 (el motor tiene un integrador por naturaleza y el otro integrador es debido al controlador PID) y, por tanto, el error en estado estacionario ante una referencia de posici´on constante es cero. En la figura 5.20 se presentan tres posibilidades para el lugar de las ra´ıces correspondiente, las cuales dependen de los valores propuestos para α y β. Se invita al lector a usar las reglas presentadas en la secci´on 5.1.1 para comprobar estos resultados. De acuerdo a la figura 5.20(a), se puede dise˜ nar el sistema de control de manera que dos polos de lazo cerrado sean muy pr´oximos a los dos ceros colocados en s = −α y s = −β para que el sistema en lazo cerrado responda como un sistema de primer orden con un polo real y negativo. Tambi´en se puede elegir que un polo de lazo cerrado sea muy pr´oximo al cero en s = −α de modo que el sistema en lazo cerrado responda como un sistema de segundo orden, con polos complejos conjugados, que contiene un cero. Aunque la presencia de este cero modifica la forma de la respuesta transitoria, es una manera de conseguir una respuesta con especificaciones aproximadas de tiempo de subida y sobre paso deseados. Este es el criterio de dise˜ no que se usa a continuaci´on. En casos como este, los m´etodos tradicionales del lugar de las ra´ıces proponen seguir los siguientes tres pasos: Dise˜ ne un controlador PD de posici´on con funci´on de transferencia: kd (s + β) de manera que se obtengan el tiempo de subida y el sobre paso deseados. A la funci´on de transferencia de lazo abierto dise˜ nada en el paso anterior, agregue el factor: s+α s con α un valor positivo muy cercano a cero. Calcule las ganancias PID usando (5.41), es decir: kp = (α + β)kd ,

ki = αβkd

(5.42)

A continuaci´on se dise˜ na un controlador PD de la forma kd (s + β) para k , es decir, cuando el sistema en lazo cerrado tiene la forma la planta s(s+a) presentada en la figura 5.21 y la funci´on de transferencia de lazo abierto es: G(s)H(s) =

kd k(s + β) s(s + a)

La funci´on de transferencia de lazo cerrado es, en este caso: kd k(s + β) θ(s) = 2 θd (s) s + (a + kd k)s + kd kβ

(5.43)

5.2 Ejemplos

253

Im(s)

àì

àë

àa

+

Re(s)

(a)

Im(s)

àì

àa

àë

+

Re(s)

(b)

Im(s)

àë

+

àa

àì

Re(s)

(c)

Figura 5.20. Diferentes posibilidades para el lugar de las ra´ıces del control PID de posici´ on.

254

5 Dise˜ no usando la respuesta en el tiempo

Igualando a un polinomio de segundo grado est´andar: s2 + (a + kd k)s + kd kβ = s2 + 2ζωn s + ωn2 se obtiene: kd =

2ζωn − a , k

β=

ωn2 kd k

(5.44)

Los valores de ζ y ωn se pueden calcular usando (5.20) y (5.21) a partir de

ò d(s)

+

k d(s + ì)

à

k s(s+a)

ò(s)

Figura 5.21. Control PD de posici´ on.

los valores deseados de tiempo de subida y sobre paso. El lugar de las ra´ıces correspondiente a este caso se muestra en la figura 5.22 y es id´entico al caso c > a mostrado en la figura 5.13, porque s´olo en este caso el control PD de posici´on puede producir polos complejos conjugados de lazo cerrado. A partir de (5.43) se encuentra que las condiciones de ´angulo y de magnitud establecen: θ3 − (θ1 + θ2 ) = ±180◦ (2q + 1),

q = 1, 2, . . .

kd kl3 =1 l1 l2

(5.45)

donde l1 , l2 , l3 , θ1 , θ2 y θ3 est´an definidas en la figura 5.22. Cuando se agrega el factor s+α on de transferencia de lazo abierto en (5.43) se encuentra s a la funci´ que la funci´on de transferencia de lazo abierto ahora es: G(s)H(s) =

kd k(s + β)(s + α) s2 (s + a)

(5.46)

Como α > 0 es peque˜ na, el lugar de las ra´ıces correspondiente tiene la forma mostrada en la figura 5.23 (se invita al lector a usar las reglas presentadas en la secci´on 5.1.1 para comprobar este resultado). Las condiciones de ´angulo y de magnitud correspondientes a este caso se establecen a partir de (5.46) como: θ3 + θ5 − (2θ1 + θ2 ) = ±180◦ (2q + 1),

q = 1, 2, . . .

kd kl3 l5 = 1 (5.47) l12 l2

donde l1 , l2 , l3 , θ1 , θ2 y θ3 son id´enticas a las definidas en la figura 5.22, mientras que l5 y θ5 se definen en la figura 5.23. La raz´on de seleccionar

5.2 Ejemplos POLO DESEADO

l3

ò1

ò2

ò3

àì

Im(s)

l1

l2

255

Re(s)

àa

Figura 5.22. Lugar de las ra´ıces para el sistema en la figura 5.21.

Im(s) ò5

l1 l3

l2

àì

àa

ò1

l5 ò2

ò3

ï

à "à ë+

Re(s)

Figura 5.23. Lugar de las ra´ıces para la funci´ on de transferencia de lazo abierto mostrada en (5.46).

α > 0 cercana a cero es para conseguir que l1 y l5 sean casi iguales de manera que l5 /l1 ≈ 1. Esto tambi´en asegura que θ1 y θ5 son casi iguales por lo que θ5 − θ1 ≈ 0. Entonces, las condiciones de ´angulo y de magnitud en (5.45) y (5.47) son casi id´enticas. Esto asegura que los polos de lazo cerrado que se obtienen cuando la funci´on de transferencia de lazo abierto es la presentada en (5.43) son casi id´enticos a los polos de lazo cerrado obtenidos cuando la funci´on de transferencia de lazo abierto es la presentada en (5.46). As´ı se asegura que las caracter´ısticas de respuesta transitoria (tiempo de subida y sobre paso) dese˜ nadas con el controlador PD en (5.44) tambi´en se consiguen con el controlador PID:

256

5 Dise˜ no usando la respuesta en el tiempo k

kd

s2 + kdp s + (s + α)(s + β) = kd s s

ki kd

es decir, cuando las ganancias se seleccionan de acuerdo a (5.42). Sin embargo, es importante resaltar una gran desventaja de este m´etodo de dise˜ no: de acuerdo a (5.42) un valor peque˜ no de α resulta en un valor peque˜ no de la ganancia integral ki . La principal consecuencia de esto es que la desviaci´on de posici´on debida a la perturbaci´on externa es llevada a cero muy lentamente y esto puede ser inaceptable en la pr´actica. Esto tambi´en se puede explicar a partir del lugar de las ra´ıces de la figura 5.23. N´otese que un polo de lazo cerrado (colocado digamos en s = −ε, ε > 0) se aproxima al cero colocado en s = −α, por lo que ambos se cancelan en la funci´on de transferencia presentada en (5.37) y no se aprecia el efecto de ninguno de ellos en la respuesta transitoria ante la referencia de posici´on. Sin embargo, el cero en s = −α no aparece en la funci´on de transferencia mostrada en (5.38). Pero el polo en s = −ε a´ un esta presente en esta funci´on de transferencia y afecta considerablemente a la respuesta transitoria: este polo lento (cercano al origen) es el responsable de una respuesta transitoria muy lenta cuando aparece una perturbaci´on externa. A pesar de estos inconvenientes, el m´etodo del lugar de las ra´ıces recomienda dise˜ nar los controladores PID de esta manera. M´as a´ un, es interesante mencionar que estos inconvenientes en los m´etodos cl´asicos de dise˜ no siguen sin soluci´on a pesar de que ya han sido puntualizados previamente en algunos trabajos internacionales como el de la referencia [10]. Por otro lado, de acuerdo a (5.42), se puede obtener una ganancia integral m´as grande (para obtener un rechazo m´as r´apido de la perturbaci´on) seleccionando un valor m´as grande de α. Sin embargo, de acuerdo a lo expuesto previamente, esto resultar´a en una respuesta transitoria ante la referencia de posici´on que no tiene las caracter´ısticas deseadas. Estos razonamientos permiten afirmar que no existe una regla de sinton´ıa que permita calcular de manera exacta las ganancias de un controlador PID de posici´on de modo que se consigan simult´aneamente las caracter´ısticas deseadas de respuesta transitoria ante una referencia de posici´on y un rechazo satisfactorio de los efectos de una perturbaci´on externa de par. Estas observaciones se verifican experimentalmente en el cap´ıtulo 10 donde, dada la problem´atica que se acaba de describir, se presentan y se prueban experimentalmente nuevos controladores que eliminan estas desventajas. Finalmente, a pesar de las desventajas arriba mencionadas, es importante recordar lo que se indic´o justo despu´es de (5.40): el controlador PID es uno de los controladores m´as utilizados a nivel industrial debido a que puede ser sintonizado a prueba y error (v´ease la secci´on 5.3) de manera que se respete la regla de estabilidad obtenida en el ejemplo 4.12 de la secci´on 4.3.

5.2 Ejemplos

5.2.6.

257

Asignaci´ on de los polos de lazo cerrado deseados

En esta parte se presenta un ejemplo para mostrar c´omo se usa el lugar de las ra´ıces para dise˜ nar un controlador de modo que se asignen los polos de lazo cerrado deseados. Considere la siguiente funci´on de transferencia: G(s)H(s) =

k (s − 35.7377)(s + 36.5040)

(5.48)

La ganancia k es variada por el m´etodo para que tome valores desde 0 hasta +∞. Primero se reescribe G(s)H(s) en la siguiente forma: G(s)H(s) =

k ∠ − (θ1 + θ2 ) l1 l 2

donde se han definido los vectores s − 35.7377 = l1 ∠θ1 , s − (−36.5040) = l2 ∠θ2 . Las dos condiciones fundamentales que definen el lugar de las ra´ıces son las condiciones de ´angulo (5.7) y de magnitud (5.6) las cuales se expresan, respectivamente, como: −(θ1 + θ2 ) = ±(2q + 1)180◦ , k =1 l1 l2

q = 0, 1, 2, . . .

La regla 5 indica que sobre el eje real s´olo existe lugar de las ra´ıces entre los puntos s = 35.7377 y s = −36.5040. Adem´as, de acuerdo a la regla 1, el lugar de las ra´ıces inicia (k = 0) en s = 35.7377 y s = −36.5040. Por otro lado, de acuerdo a las reglas 2 y 3, cuando k tiende a +∞ las ramas que inician en los puntos s = 35.7377 y s = −36.5040 deben terminar en alg´ un cero de lazo abierto (no existe ninguno en este caso) o en alg´ un punto en el infinito del plano s. Por tanto, el lugar de las ra´ıces debe alejarse de los puntos s = 35.7377 y s = −36.5040, sobre el eje real, conforme k crece de manera que debe existir un punto de separaci´on en alg´ un lugar entre dichos puntos para luego dirigirse hacia el infinito sobre el plano s. Por otro lado, de acuerdo a la condici´on de ´angulo, −(θ1 + θ2 ) = −180◦ = −(α + θ1 ), y la figura 5.24 se puede observar que α = θ2 y, por tanto, que los tri´angulos t1 y t2 deben ser id´enticos para cualquier polo de lazo cerrado s. Entonces, las dos ramas mencionadas anteriormente y que son mostradas en la figura 5.24 deben ser paralelas al eje imaginario. Esto significa que el punto donde las dos ramas se separan del eje real est´a ubicado en el punto medio entre los polos ubicados en s = 35.7377, s = −36.5040, es decir en (35.7377 − 36.5040)/2 = −0.7663. Esto tambi´en puede verificarse usando las reglas 3 y 4. Finalmente, de acuerdo a la regla 6 ambas ramas son sim´etricas respecto al eje horizontal. La condici´on de magnitud se usa cuando se necesita conocer el valor exacto de k que permita conseguir un punto espec´ıfico sobre el lugar de las ra´ıces.

258

5 Dise˜ no usando la respuesta en el tiempo

Im (s)

s

ì

ì l1

l2

t1

t2

ò2 à 36:50

ë à 0:7663

ò1

35:73

Re (s)

Figura 5.24. Lugar de las ra´ıces para G(s)H(s) en (5.48).

N´otese, por ejemplo, que al crecer k hacia +∞ las longitudes l1 y l2 deben crecer para satisfacer la condici´on de magnitud k =1 l1 l2 lo cual significa que los polos de lazo cerrado correspondientes a valores grandes de k tienden a alg´ un punto en el infinito del plano s. Suponga ahora que se incluye un polo adicional a la funci´on de transferencia en (5.48) para tener: 116137 k = s3 + 72.54s2 − 1250s − 9.363 × 104 116137 k = (s − 35.7377)(s + 36.5040)(s + 71.7721)

G(s)H(s) =

(5.49)

De nuevo, la constante k es la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para dibujar el lugar de las ra´ıces. Primero se reescribe G(s)H(s) en la siguiente forma: G(s)H(s) =

116137 k ∠ − (θ1 + θ2 + θ3 ) l 1 l 2 l3

donde se han definido los vectores s−35.7377 = l1 ∠θ1 , s−(−36.5040) = l2 ∠θ2 , s − (−71.7721) = l3 ∠θ3 . Las condiciones de ´angulo (5.7) y de magnitud (5.6) se expresan, respectivamente, como: −(θ1 + θ2 + θ3 ) = ±(2q + 1)180◦ , 116137 k =1 l1 l2 l3

q = 0, 1, 2, . . .

5.2 Ejemplos

259

El lugar de las ra´ıces correspondiente a este caso se puede obtener a partir del obtenido para la funci´on de transferencia en (5.48) considerando que simplemente se ha adicionado un polo en s = −71.7721. De acuerdo a la regla 11 el nuevo polo ser´a causa para que las dos ramas del lugar de las ra´ıces mostrado en la figura 5.24 se “doblen” hacia la derecha como se alcanza a apreciar ligeramente en la figura 5.25. Esto puede comprobarse usando la regla 3 para encontrar que ahora existen tres ramas del lugar de las ra´ıces que tienden hacia as´ıntotas que forman ´angulos de ±180◦ y ±60◦ con el eje real positivo. Root Locus

15

10

Imaginary Axis

5

0

−5

−10

−15

−80

−60

−40

−20 Real Axis

0

20

40

Figura 5.25. Lugar de las ra´ıces para G(s)H(s) en (5.49).

Por otro lado, el punto de separaci´on entre los puntos s = 35.7377 y s = −36.5040 que en la figura 5.24 estaba colocado en el punto (35.7377 − 36.5040)/2 = −0.7663 ahora en la figura 5.25 se encuentra colocado m´as hacia la derecha que −0.7663. La raz´on de esto se explica en la figura 5.26 donde s′ y s representan dos puntos sobre el lugar de las ra´ıces que est´an muy cerca del punto de separaci´on para el caso de las figuras 5.24 y 5.25, respectivamente. Como en la figura 5.25 se debe cumplir que −(θ1 + θ2 + θ3 ) = −180◦ mientras que en la figura 5.24 se debe cumplir −(θ1′ + θ2′ ) = −180◦ , entonces ambos θ1 y θ2 deben ser menores que θ1′ y θ2′ . Esto significa que el punto s debe estar desplazado hacia la derecha del punto s′ . N´otese que este desplazamiento del punto de separaci´on hacia la derecha del punto −0.7663 es mayor conforme el ´angulo θ3 introducido por el polo en s = −71.7721 sea mayor, es decir,

260

5 Dise˜ no usando la respuesta en el tiempo

conforme este polo se encuentre colocado m´as hacia la derecha. De hecho, en la figura 5.25 se observa que el punto de separaci´on est´a colocado en el semiplano derecho. Im (s ) s;

;

ò1

ò3

s

ò2 ; ò2

ò1

Re (s )

à 0:7663

Figura 5.26. Un polo adicional recorre el punto de separaci´ on hacia la derecha.

Esta descripci´on del lugar de las ra´ıces de la figura 5.25 permite concluir que siempre existir´a al menos un polo de lazo cerrado que tiene parte real positiva, es decir, habr´a inestabilidad en lazo cerrado para cualquier valor positivo de k. Debido a que k se puede interpretar como la ganancia de un controlador proporcional, se concluye que no es posible estabilizar el sistema usando ning´ un controlador proporcional y debe intentarse otro controlador. De acuerdo a la regla 12 se requiere usar un controlador que introduzca un cero de lazo abierto ya que esto consigue “doblar” el lugar de las ra´ıces hacia la izquierda para conseguir estabilidad de lazo cerrado. Considere la siguiente funci´on de transferencia de lazo abierto: 116137(s + b) = + 72.54s2 − 1250s − 9.363 × 104 116137(s + b) =k (s − 35.7377)(s + 36.5040)(s + 71.7721)

G(s)H(s) = k

s3

(5.50)

con b una constante positiva. De nuevo, la constante k es la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para dibujar el lugar de las ra´ıces. Primero se reescribe G(s)H(s) en la siguiente forma: G(s)H(s) =

116137 k l4 ∠[θ4 − (θ1 + θ2 + θ3 )] l1 l2 l3

(5.51)

donde se han definido los vectores s−35.7377 = l1 ∠θ1 , s−(−36.5040) = l2 ∠θ2 , s − (−71.7721) = l3 ∠θ3 , s − (−b) = l4 ∠θ4 . Las condiciones de ´angulo (5.7) y de magnitud (5.6) se expresan, respectivamente, como: θ4 − (θ1 + θ2 + θ3 ) = ±(2q + 1)180◦ , 116137 k l4 =1 l1 l2 l3

q = 0, 1, 2, . . .

(5.52) (5.53)

5.2 Ejemplos

261

N´otese que ahora se tiene n = 3, m = 1, p1 = 35.7377, p2 = −36.5040, p3 = −71.7721, z1 = −b. De acuerdo a las reglas 1, 2 y 3, una de las tres ramas que inician (k = 0) en los puntos s = 35.7377, s = −36.5040, s = −71.7721 (polos de lazo abierto) debe terminar (k = +∞) en el cero de lazo abierto colocado en s = −b. Por tanto, existir´an dos ramas del lugar de las ra´ıces que tienden a alg´ un punto del infinito sobre el plano s. De acuerdo a la regla 3, los ´angulos de las as´ıntotas a las que tienden estas ramas son: ±180◦ (2 × 0 + 1) ±180◦ (2 × 0 + 1) = = ±90◦ n−m 3−1 Adem´as, de acuerdo a la regla 4 la ubicaci´on de estas as´ıntotas sobre el eje real puede ser ajustada usando el cero en s = −b: σa =

35.7377 − 36.5040 − 71.7721 + b p1 + p2 + p3 − (−b) = n−m 2

(5.54)

N´otese que b debe ser positivo pues de otra manera una rama del lugar de las ra´ıces ser´ıa halado hacia el semiplano derecho generando polos de lazo cerrado inestables. N´otese tambi´en que las as´ıntotas se mueven hacia la izquierda (mayor estabilidad) conforme el cero es ubicado m´as cerca del origen, es decir conforme b tiende a cero. Todo esto significa que existe un l´ımite en cuanto a que tan a la izquierda se pueden colocar los polos complejos conjugados de lazo cerrado. De acuerdo a la regla 5 ahora existir´a lugar de las ra´ıces sobre dos segmentos del eje real porque ahora se tienen cuatro polos y ceros reales de lazo abierto. La ubicaci´on de dichos segmentos sobre el eje real depende del valor de b usado, como se muestra en las figuras 5.27(a) y 5.27(b). M´as a´ un, en la figura 5.27(c) se muestra que si se selecciona b = 36.5040 entonces se cancela el cero de lazo abierto en s = −b con el polo de lazo abierto ubicado s = −36.5040. Esto significa que, en tal caso, s´olo existir´a lugar de las ra´ıces en un segmento del eje real. En la figura 5.27(c) se aprecia que s´olo existen dos polos de lazo cerrado. En las figuras 5.27(a) y 5.27(b) se puede apreciar que existen tres polos de lazo cerrado y que uno de esos polos estar´a en el semiplano complejo derecho (inestabilidad en lazo cerrado) si la ganancia k es demasiado peque˜ na. Por otro lado, si k es demasiado grande se tendr´an dos polos complejos conjugados con parte imaginaria demasiado grande, por lo que la respuesta oscilar´a r´apidamente. Aunque en teor´ıa esto puede funcionar porque los tres polos tienen parte real negativa, sin embargo un valor grande de k hace que se sature el amplificador de potencia por lo que el sistema de control no podr´a funcionar satisfactoriamente en la pr´actica. As´ı que un buen dise˜ no ser´a aquel que permita obtener los polos de lazo cerrado deseados usando una ganancia k que no sea ni muy grande ni muy peque˜ na. Suponga que se desean los siguientes polos complejos conjugados de lazo cerrado s = −25 ± j40. A continuaci´on se presenta la manera de calcular los

262

5 Dise˜ no usando la respuesta en el tiempo

àb

(a) b = 31.24 < 36.50 Root Locus

150

100

Imaginary Axis

50

0

àb -50

-100

-150 -80

-60

-40

-20 Real Axis

0

20

40

0

20

40

(b) b > 36.50 Root Locus

2

1.5

1

Imaginary Axis

0.5

0

àb -0.5

-1

-1.5

-2 -80

-60

-40

-20 Real Axis

(c) b = 36.50 Figura 5.27. Lugares de las ra´ıces para G(s)H(s) definida en (5.50) obtenidos al cambiar el valor de b.

5.2 Ejemplos

263

Im (s )

à 25 + j40 ï l3

ò2

ò3 à 71:7

l2

à 36:5

l4

l1

ò4

àb

ò1 35:7

Re (s )

Figura 5.28. Polos y ceros de lazo abierto para ubicar los polos deseados de lazo cerrado en s = −25 ± j40.

valores exactos de b y de k que permiten conseguir estos polos de lazo cerrado. De acuerdo a la figura 5.28 se calculan los siguientes ´angulos: µ ¶ 40 θ3 = arctan 71.7721 − 25 µ ¶ 40 θ2 = arctan 36.5040 − 25 µ ¶ 40 θ1 = 1800 − arctan 35.7377 + 25 Usando la condici´on de ´angulo (5.52) se calcula θ4 y con esto el valor de b: θ4 = −1800 + (θ1 + θ2 + θ3 ) 40 b= + 25 = 31.2463 tan(θ4 ) Por otro lado, de acuerdo a la figura 5.28 se calculan las siguientes longitudes: p l4 = 402 + (b − 25)2 p l3 = 402 + (71.7721 − 25)2 p l2 = 402 + (36.5040 − 25)2 p l1 = 402 + (35.7377 + 25)2 con las que finalmente se usa la condici´on de magnitud (5.53) para calcular k: k=

l1 l2 l3 = 0.0396 116137 l4

La ubicaci´on del tercer polo de lazo cerrado se puede encontrar de la condici´on 1 + G(s)H(s) = 0 usando G(s)H(s) dada en (5.50) as´ı como b = 31.2463 y k = 0.0396 es decir:

264

5 Dise˜ no usando la respuesta en el tiempo

1 + 0.0396 de donde:

s3

116137(s + 31.2463) =0 + 72.54s2 − 1250s − 9.363 × 104

(5.55)

s3 + 72.54s2 + (0.0396 × 116137 − 1250)s +(0.0396 × 116137 × 31.2463 − 9.363 × 104 ) = 0 Las ra´ıces de este polinomio son los polos de lazo cerrado conseguidos con b = 31.2463 y k = 0.0396. Usando un programa de computadora se encuentra que estas ra´ıces son −25.0037 + j39.9630, −25.0037 − j39.9630 y −22.5326. Estos polos tambi´en son mostrados en la figura 5.27(a) usando signos “+”. N´otese que se han conseguido los polos complejos conjugados deseados y el tercer polo, el cual es real, tambi´en esta colocado en el semiplano complejo izquierdo, es decir, se ha conseguido estabilidad en lazo cerrado. Recu´erdese que el factor k(s + b) representa un controlador proporcional-derivativo. Es importante mencionar que este sistema de control es utilizado para regular la salida en un valor deseado igual a cero. Esto implica que independientemente del tipo del sistema la salida deseada ser´a alcanzada . As´ı que no es necesaria ninguna consideraci´on respecto a la respuesta en estado estacionario. En la figura 5.29 se muestra la respuesta en lazo cerrado (l´ınea continua) ante una entrada cero, r = 0 (v´ease la figura 5.1). Se usa (5.50), b = 31.2463 y k = 0.0396. Tambi´en se muestra, con l´ınea interrumpida, la respuesta de ω2 un sistema cuya funci´on de transferencia es s2 +2ζωnn s+ω2 cuyos polos est´an n ubicados en s = −25 ± j40. Por tanto, este sistema representa el modelo de referencia pues su respuesta posee las caracter´ısticas deseadas de la respuesta transitoria. Ambas respuestas inician a partir de un valor de salida igual a 2.85. N´otese que ambas respuestas son parecidas. Sin embargo, las diferencias existentes entre ellas se deben al cero en s = −31.2463 y al polo de lazo cerrado en s = −22.5326, los cuales no est´an suficientemente cerca como para que sus efectos sean cancelados completamente. 5.2.7. Control proporcional-integral-derivativo (PID) de un sistema de levitaci´ on magn´ etica En esta secci´on se presenta la manera de usar el lugar de las ra´ıces para seleccionar las ganancias de un controlador PID para el sistema de levitaci´on magn´etica que se construye y se prueba experimentalmente en el cap´ıtulo 11. La funci´on de transferencia de lazo abierto es la siguiente: ! Ã k s2 + kdp s + kkdi 11613700 kd (5.56) G(s)H(s) = 3 s + 2739s2 − 1250s − 3.536 × 106 s donde kd es el par´ametro que var´ıa el m´etodo desde 0 hasta +∞ para dibujar k el lugar de las ra´ıces, mientras que los valores de kdp y kkdi deben ser propuestos.

5.2 Ejemplos

265

3

2.5

2

1.5

1

0.5

0

−0.5

0

0.05

0.1

0.15

0.2

0.25

Figura 5.29. Respuesta en lazo cerrado del sistema (5.50) a partir de una condici´ on inicial diferente de cero. L´ınea continua: respuesta dise˜ nada. L´ınea interrumpida: respuesta deseada. Eje vertical: y[m]. Eje horizontal: tiempo en segundos.

En el cap´ıtulo 11 se explica que se utiliza un controlador PID para asegurar que se alcanza la posici´on deseada (constante) a´ un cuando exista incertidumbre en el peso de la bola a levitar. N´otese que el controlador PID introduce dos ceros de lazo abierto. Usando software especializado se encuentra que los cuatro polos de lazo abierto est´an colocados en: s1 = 35.9,

s2 = −2739.4,

s3 = −35.9,

s4 = 0

Usando la regla 3 se encuentra que existen n − m = 4 − 2 = 2 ramas del lugar de las ra´ıces que tienden al infinito en el plano s siguiendo as´ıntotas cuyos ´angulos est´an dados como: ±180◦ = ±90◦ 2 Adem´as, de acuerdo a la regla 4, el punto sobre el eje real donde estas as´ıntotas se intersectan es: σa =

35.9 − 2739.4 − 35.9 + σz1 + σz2 2

donde −σz1 < 0 y −σz2 < 0 son las partes reales de los dos ceros de lazo abierto introducidos por el controlador PID (estos valores deben ser propuestos). Es claro que σa se mueve hacia la izquierda (lo que implica que el sistema de

266

5 Dise˜ no usando la respuesta en el tiempo

lazo cerrado se hace m´as estable) si −σz1 < 0 y −σz2 < 0 se eligen cercanos a cero. N´otese que esto est´a de acuerdo con la regla 12. A partir de esto se concluye que σa < −1100 est´a colocado muy a la izquierda del origen. Usando estas observaciones, as´ı como las reglas 1, 2, 5 y 6 se encuentra que existen las tres posibilidades mostradas en la figura 5.30 para el lugar de las ra´ıces de este problema. Si se conociera la ubicaci´on de los polos de lazo cerrado que resultan en un buen desempe˜ no experimental del sistema en lazo cerrado, se podr´ıa proceder como en la secci´on 5.2.6 para determinar la ubicaci´on adecuada de los ceros de lazo abierto (introducidos por el controlador PID). Sin embargo, este no es el caso de este problema y por ello el principal objetivo del dise˜ no es simplemente conseguir que el sistema en lazo cerrado sea estable. Como ya se mencion´o, es preferible que los dos ceros de lazo abierto est´en colocados cerca del origen. Esto significa que es preferible que el lugar de las ra´ıces tenga la forma mostrada en la figura 5.30(a). Por otro lado, dos ceros complejos forzar´ıan la existencia de polos complejos conjugados de lazo cerrado, lo cual resulta en un sistema menos amortiguado (m´as dif´ıcil de estabilizar). Por esta raz´on, tambi´en se desecha el lugar de las ra´ıces de figura 5.30(c). Por tanto, buscando obtener el lugar de las ra´ıces de la figura 5.30(a) se proponen los siguientes valores: kp ki 31.24 = 31.24, = kd kd 0.8 pues esto coloca los dos ceros de lazo abierto en: s5 = −29.9355,

(5.57)

s6 = −1.3045

es decir, est´an colocados entre los polos de lazo abierto ubicados en: s3 = −35.9,

s4 = 0

N´otese que el hecho de que σa < −1100 est´a colocado muy a la izquierda del origen y que las as´ıntotas forman ´angulos de ±90◦ asegura que existe un valor m´ınimo de kd a partir del cual todos los polos de lazo cerrado est´an colocados en el semi plano complejo izquierdo. Usando los valores num´ericos en (5.57) se utiliza el criterio de Routh para encontrar que: kd > 0.01

(5.58)

asegura que todos los polos de lazo cerrado est´an colocados en el semi plano complejo izquierdo y que el sistema en lazo cerrado es estable. Esto se hace del siguiente modo. De la condici´on 1 + G(s)H(s) = 0 (es decir, usando (5.56) y (5.57)) se obtiene el polinomio caracter´ıstico: s4 + a3 s3 + a2 s2 + a1 s + a0 = 0 a3 = 2739, a2 = 11613700 kd − 1250, a1 = 11613700 × 31.24 kd − 3.536 × 106 , 31.28 kd a0 = 11613700 × 8

(5.59)

5.2 Ejemplos

267

Im(s)

ûa

Re(s)

(a)

Im(s)

ûa

Re(s)

(b)

Im(s)

ûa

Re(s)

(c) Figura 5.30. Diferentes posibilidades para el lugar de las ra´ıces del control PID de un sistema de levitaci´ on magn´etica.

268

5 Dise˜ no usando la respuesta en el tiempo

Para aplicar el criterio de Routh se construye la tabla 5.1. Para que haya Tabla 5.1. Aplicaci´ on del criterio de Routh al polinomio en (5.59). s4 s3 s2 s1 s0

1 a3

a 2 a0 a1 0 a3 a2 −a1 = e a0 0 a3 ea1 −a3 a0 0 e a0

estabilidad en lazo cerrado se requiere que no haya cambios de signo en la primera columna de la tabla 5.1, es decir que: a3 a2 − a1 > 0, a3

ea1 − a3 a0 > 0, e

a3 > 0,

a0 > 0

(5.60)

N´otese que la tercera condici´on en (5.60) se satisface de manera natural mientras que de la primera y la u ´ltima condiciones se encuentra que: kd > −3.5695 × 10−6 ,

kd > 0

De la segunda condici´on en (5.60) se obtiene: µ ¶ b1 b3 b1 b3 2 2 b5 kd + − − 2739 kd − >0 b2 b4 b2 b4 b2 b4 b1 = 112250,

(5.61)

(5.62)

b2 = 3.1447 × 1010 ,

b4 = 11613700 × 31.24,

b3 = 3.536 × 106 , 31.28 b5 = 11613700 8

Dado que se trata de un polinomio de segundo grado, no es dif´ıcil encontrar que las ra´ıces del polinomio en (5.62) son kd = 0.01 y kd = −3.5 × 10−6 . M´as a´ un, se puede evaluar num´ericamente para encontrar que: (kd − 0.01)(kd + 3.5 × 10−6 ) > 0, si kd < −3.5 × 10−6

(kd − 0.01)(kd + 3.5 × 10−6 ) < 0, si − 3.5 × 10−6 < kd < 0.01 (kd − 0.01)(kd + 3.5 × 10−6 ) > 0, si kd > 0.01

Por tanto, para satisfacer simult´aneamente (5.61) y (5.62) y asegurar estabilidad en lazo cerrado, se debe seleccionar (5.58). En el cap´ıtulo 11 se usan estos resultados para proponer varios conjuntos de ganancias para el controlador PID que son probados experimentalmente. 5.2.8.

Control de un sistema ball and beam

En esta secci´on se dise˜ na un controlador para el sistema ball and beam que se construye y prueba experimentalmente en el cap´ıtulo 12, secci´on 12.7.

5.2 Ejemplos

269

Inicialmente suponga que se usar´a un controlador proporcional de ganancia γ. Lo primero que se procede a hacer es estudiar la posibilidad de que el sistema en lazo cerrado pueda ser estable para alg´ un valor positivo de la ganancia γ (los otros par´ametros tambi´en son positivos pero no se pueden cambiar). El diagrama de bloques en lazo cerrado correspondiente se muestra en la figura 5.31. La funci´on de transferencia de lazo cerrado es:

Xd (s) +

Ax

í

k s ( s+ a )

ú s2

X(s)

à

Figura 5.31. Sistema en lazo cerrado. Control proporcional de ganancia γ.

γAx kρ X(s) = 4 Xd (s) s + as3 + γAx kρ Ax = 5.3750, k = 16.6035,

a = 3.3132,

ρ=5

La estabilidad del sistema en lazo cerrado se estudia usando el criterio de Routh. Para ello se construye la tabla 5.2 usando el polinomio caracter´ıstico de lazo cerrado s4 + as3 + γAx kρ. N´otese que un elemento de la primera Tabla 5.2. Aplicaci´ on del criterio de Routh al polinomio s4 + as3 + γAx kρ. s4 1 0 γAx kρ s3 a 0 0 s2 0 ≈ ε γAx kρ x kρ s1 −aγA 0 ε 0 s γAx kρ

columna es igual a cero por lo que, de acuerdo al m´etodo, debe ser sustituido por un valor ε > 0 peque˜ no. N´otese que bajo esta condici´on, existen dos cambios de signo en la primera columna de la tabla 5.2 y que esto no puede ser modificado ajustando el valor de γ (positivo). Entonces, se concluye que no existe ning´ un controlador proporcional que pueda hacer que el sistema en lazo cerrado sea estable y debe intentarse con otro controlador. De acuerdo a la regla 12 de la secci´on 5.1.1 un controlador PD hace m´as estable aquello que no lo es, porque un controlador PD introduce un cero de lazo abierto. Sin embargo, un controlador PD amplifica el ruido debido a su parte derivativa. Esto se ve claramente en el cap´ıtulo 6 porque un controlador PD es un filtro pasa altas y el ruido es una se˜ nal de alta frecuencia.

270

5 Dise˜ no usando la respuesta en el tiempo

Una manera de conseguir las propiedades estabilizantes de un controlador PD pero disminuyendo un poco el efecto del ruido es usando un compensador de on, a continuaci´on se adelanto de la forma γ s+δ s+c con c > δ > 0. Por esta raz´ estudia la posibilidad de estabilizar el sistema en cuestion usando el diagrama de bloques mostrado en la figura 5.32. La funci´on de transferencia de lazo

Xd (s) +

Ax

k s ( s+ a )

î í s+ s+ c

ú s2

X(s)

à

Figura 5.32. Sistema en lazo cerrado. Uso de un compensador de adelanto.

cerrado es: X(s) γAx kρ(s + δ) = 5 Xd (s) s + (a + c)s4 + acs3 + γAx kρs + γAx kρδ La estabilidad del sistema en lazo cerrado se estudia usando el criterio de Routh. Para ello se construye la tabla 5.3 usando el polinomio caracter´ıstico de lazo cerrado s5 + (a + c)s4 + acs3 + γAx kρs + γAx kρδ. N´otese que, dado que Tabla 5.3. Aplicaci´ on del criterio de Routh al polinomio s5 + (a + c)s4 + acs3 + γAx kρs + γAx kρδ. s5 s4 s3 s2 s1 s0

1 a+c ac −(a+c)e =f ac

f e−acγAx kρδ f

ac 0 (a+c)γAx kρ−γAx kρδ a+c

γAx kρ γAx kρδ =e

γAx kρδ 0

γAx kρδ

todos los par´ametros son positivos, hay al menos dos cambios de signo en la primera columna de la tabla 5.3. Entonces, se concluye que no existe ning´ un compensador de adelanto que pueda hacer que el sistema en lazo cerrado sea estable y debe intentarse otra estrategia de control. Analizando cuidadosamente la tabla 5.3 se encuentra que el problema es originado por el primer , el cual es negativo. elemento correspondiente al rengl´on s2 , es decir −(a+c)e ac N´otese que esto es una consecuencia de que el segundo elemento correspondiente al rengl´on s4 es igual a cero. Esto es debido a que la potencia s2 tiene un coeficiente cero en el polinomio s5 + (a + c)s4 + acs3 + γAx kρs + γAx kρδ.

5.2 Ejemplos

271

Por tanto, se concluye que el sistema en lazo cerrado puede ser estable si el polinomio caracter´ıstio de la funci´on de transferencia de lazo abierto tiene la potencia s2 con un coeficiente positivo. A continuaci´on se muestra que esto es posible si se usan dos lazos internos como se muestra en la figura 5.33. N´otese que se sigue manteniendo el uso del compensador de adelanto. En este caso, Xd (s) +

Ax

s+ b í s+ c

à

ï 1

+

ë à

+

k s ( s+ a )

ï 2

à

ký s

ú s2

X(s)





Figura 5.33. Sistema en lazo cerrado. Uso de lazos internos y un compensador de adelanto.

la funci´on de transferencia de lazo abierto est´a dada como: G(s)H(s) = c > b > 0,

Ax ρ γ s + b αkAθ 1 Aθ s + c s2 + (a + kv kAθ )s + αkAθ s2 γ > 0, Aθ = 0.9167

N´otese que el sistema es tipo 2, por lo que el error en estado estacionario es cero si la referencia deseada es una constante o una rampa. El lector puede obtener la funci´on de transferencia de lazo cerrado XX(s) para verificar d (s) que el polinomio caracter´ıstico correspondiente es de grado 5 y con todos los coeficientes de sus potencias positivos (incluido el coeficiente de s2 ), como se esperaba. De acuerdo a la discusi´on previa, esto significa que existe la posibilidad de encontrar valores positivos para γ, c, b (con c > b), kv y α que consigan que el sistema en lazo cerrado sea estable. A continuaci´on se encuentran estos valores usando el m´etodo del lugar de las ra´ıces. Suponga que las ra´ıces del polinomio s2 + (a + kv kAθ )s + αkAθ son complejas conjugadas, es decir, que se puede escribir: s2 + (a + kv kAθ )s + αkAθ = (s + σ + jω)(s + σ − jω),

σ > 0,

ω>0

De acuerdo a la regla 3 existen n − m = 4 ramas del lugar de las ra´ıces que tienden hacia el infinito del plano s sobre cuatro as´ıntotas cuyos ´angulos est´an dados como: ±180◦ = ±45◦ 4 ±180◦ (3) = ±3(45◦ ) = ±135◦ 4 Por tanto, usando estos resultados as´ı como las reglas 1,2 y 5, se concluye que

272

5 Dise˜ no usando la respuesta en el tiempo

Im(s)

x x

àû

+ x

àb

àc

Re(s)

x (a)

Im(s)

x àû + x àb

x

àc

Re(s)

x

(b)

Im(s)

x x àc

+ x à ûà b

Re(s)

x (c) Figura 5.34. Diferentes posibilidades para el lugar de las ra´ıces de un sistema ball and beam.

5.2 Ejemplos

273

existen las posibilidades mostradas en la figura 5.34. De acuerdo a la regla 4, el punto donde se intersectan las as´ıntotas mencionadas anteriormente con el eje real est´a dado como: σa =

−2σ + (b − c) 4

Esto significa que las 4 ramas son haladas hacia la izquierda (por lo que el sistema en lazo cerrado tiende a ser m´as estable) si: Se elige un valor mayor de σ > 0, es decir, si el sistema: s2

αkAθ + (a + kv kAθ )s + αkAθ

(5.63)

est´a suficientemente amortiguado, lo cual se consigue usando un valor suficientemente grande de la ganancia kv > 0. b > 0 se aproxima a cero y c > 0 es grande, es decir si c > b. N´otese que esto est´a en completo acuerdo con las reglas 11 y 12. Siguiendo la segunda opci´on se obtiene el diagrama del lugar de las ra´ıces mostrado en la figura 5.34(b). N´otese que las dos ramas que inician en los dos polos colocados en s = 0 siempre permanecen sobre el semiplano complejo derecho, lo cual implica que el sistema en lazo cerrado es inestable. La principal raz´on para este comportamiento es que las ramas que inician en los polos de la funci´on de transferencia en (5.63) son halados hacia el segmento sobre el eje real entre s = −c y s = −b. Esto, a su vez, se debe a que los dos polos complejos de lazo abierto est´an muy cerca del segmento entre s = −c y s = −b. Si dichos polos complejos se alejan de dicho segmento entonces se abre la posibilidad de que las dos ramas que inician en los polos colocados en s = 0 sean haladas hacia el segmento entre s = −c y s = −b para obtener el diagrama mostrado en la figura 5.34(c). Esto implica que hay estabilidad en lazo cerrado para algunos valores peque˜ nos de la ganancia de lazo. Para conseguir esto, es necesario usar valores grandes del coeficiente αkAθ (esto incrementa la distancia al origen de los polos complejos de lazo abierto arriba mencionados), es decir, usando un valor grande de α. La discusi´on anterior indica que se deben usar valores grandes de kv y α. Sin embargo, en la pr´actica estos valores est´an limitados por el contenido de ruido del sistema, por lo que kv y α deben ser obtenidos usando pruebas experimentales. De hecho, el ruido tambi´en es una raz´on importante para no seleccionar reales los polos de la funci´on de transferencia en (5.63): obtener polos reales implica un sistema muy amortiguado lo cual requiere un valor de kv a´ un mayor. De acuerdo a las pruebas experimentales reportadas en el cap´ıtulo 12 se seleccionaron los siguientes valores: α = 12,

kv = 0.2

Por tanto, los u ´nicos valores que falta determinar son γ, c y b. Aunque estos par´ametros se pueden determinar de manera que los polos de lazo cerrado

274

5 Dise˜ no usando la respuesta en el tiempo

sean asignados en los valores deseados (usando la metodolog´ıa presentada en la secci´on 5.2.6), sin embargo en este problema no se conoce cual es la ubicaci´on de los polos de lazo cerrado que resultan en un buen desempe˜ no. Por esta raz´on, el objetivo de dise˜ no es simplemente que el sistema en lazo cerrado sea estable. Para conseguir esto se procede del siguiente modo. Se proponen valores para b y c de modo que c > b > 0. Se hace uso de software especializado para dibujar el lugar de las ra´ıces. Se elige un valor de γ > 0 para el cual todos los polos de lazo cerrado est´en ubicados en el semi plano complejo izquierdo. Esto significa que γ es el par´ametro usado por el m´etodo para dibujar el lugar de las ra´ıces. Si no existe tal valor de γ > 0 se regresa al primer paso. De este modo se obtiene el lugar de las ra´ıces de la figura 5.35 donde se observa que todos los polos de lazo cerrado (marcados con el s´ımbolo “+”) tienen parte real negativa si se usa: γ = 1.2,

c = 20,

b = 2.5

Finalmente, es conveniente decir que se debe incluir un paso adicional para el procedimiento arriba listado: Una vez seleccionados los valores de γ, c y b se deben realizar pruebas experimentales para verificar que se obtiene un buen desempe˜ no con el sistema de control dise˜ nado. Si no es as´ı, entonces regrese de nuevo al primer paso del procedimiento arriba listado.

Root Locus 15

10

Imaginary Axis

5

0

−5

−10

−15

−20

−15

−10 Real Axis

−5

0

Figura 5.35. Lugar de las ra´ıces del sistema ball and beam dise˜ nado.

5.3 Caso de estudio

275

5.3. Caso de estudio. Notas adicionales sobre el control PID de posici´ on de un motor de CD En la secci´on 5.2.5 se estudia el uso de un controlador PID para regular la posici´on de un motor de CD. Ah´ı se encontr´o que la posici´on del motor se relaciona con la posici´on deseada y la perturbaci´on externa de par, a trav´es de dos funciones de transferencia que, sin embargo, tienen el mismo polinomio caracter´ıstico: s3 + (a + kd k)s2 + kp ks + ki k

(5.64)

Tambi´en se encontr´o que si se desean asignar los siguientes polos de lazo cerrado p1 , p2 , p3 : p1 = σ1 + jω1 ,

p2 = σ1 − jω1 ,

p3 < 0,

σ1 < 0,

ω1 > 0

entonces las ganancias del controlador se deben seleccionar de acuerdo a (5.40), es decir: −(2σ1 + p3 ) − a >0 k σ 2 + ω12 + 2σ1 p3 kp = 1 >0 k −p3 (σ12 + ω12 ) >0 ki = k

kd =

(5.65) (5.66) (5.67)

Por otro lado, en el ejemplo 4.12, del cap´ıtulo 4, se encontr´o que todas las ra´ıces del siguiente polinomio: s3 + as2 + bs + c tienen parte real negativa si y s´olo si: a > 0,

b>

c >0 c>0 a

Aplicando estas condiciones al polinomio caracter´ıstico dado en (5.64) se obtiene: a + kd k > 0,

kp k >

ki k , a + kd k

ki k > 0

(5.68)

Usando las expresiones en (5.65), (5.66), (5.67) y (5.68) se puede concluir que las ganancias de un controlador PID de posici´on para un motor de CD tienen los siguientes efectos sobre la respuesta del sistema en lazo cerrado: Valores mayores y positivos de la ganancia integral, ki , resultan en una respuesta m´as r´apida y que oscila cada vez m´as. La primera parte de esta observaci´on se justifica a partir de (5.67), donde ωn2 = σ12 + ω12 , recordando

276

5 Dise˜ no usando la respuesta en el tiempo

que dos polos complejos conjugados producen una respuesta m´as r´apida si ωn es mayor y que un polo real y negativo, p3 < 0, produce una respuesta m´as r´apida si su valor absoluto, −p3 , es mayor. La segunda parte de la observaci´on se justifica a partir de la segunda desigualdad en (5.68), es ki k decir kp k > a+k . Si ki es mayor, entonces esta condici´on tiende a no ser dk v´alida, es decir, el sistema en lazo cerrado se acerca a la inestabilidad y por eso oscila cada vez m´as. Valores mayores y positivos de la ganancia proporcional, kp , resultan en una respuesta m´as r´apida cuyas oscilaciones, al menos, no se incrementan de manera importante. La primera parte de esta observaci´on se justifica a partir de (5.66) usando argumentos similares a los de la ganancia integral en el p´arrafo anterior: recordando que ωn2 = σ12 + ω12 , σ1 p3 > 0, que dos polos complejos conjugados producen una respuesta m´as r´apida si ωn es mayor y que un polo real y negativo, p3 , produce una respuesta m´as r´apida si su valor absoluto es mayor. La segunda parte de la observaci´on se justifica, de nuevo, a partir de la segunda desigualdad en (5.68), es decir ki k kp k > a+k . Si kp es mayor, entonces esta condici´on es cada vez m´as v´alidk da, es decir, el sistema en lazo cerrado se hace cada vez m´as estable. Sin embargo, esto, unido al incremento en la rapidez (que en general tiende a aumentar las oscilaciones de la respuesta), puede resultar en un comportamiento transitorio donde, al menos, las oscilaciones no aumentan de manera importante. Valores mayores y positivos de la ganancia derivativa, kd , producen una respuesta que oscila menos. Esta observaci´on se justifica a partir de la ki k . N´otese que si kd > 0 segunda desigualdad en (5.68), es decir kp k > a+k dk es mayor, entonces esta condici´on es m´as v´alida y, por tanto, el sistema en lazo cerrado es m´as estable. As´ı, un valor mayor de kd > 0 puede reducir las oscilaciones debidas a un valor grande de ki > 0. Por otro lado, a partir de (5.65) se concluye que valores mayores de kd > 0 producen valores mayores de −σ1 > 0 y/o de −p3 > 0. Usando este hecho, junto con (5.66), (5.67), y si kp y ki se mantienen constantes, se concluye que si ωn2 = σ12 +ω12 aumenta (o disminuye), al variar σ1 , entonces −p3 disminuye (o aumenta) por lo que la rapidez de respuesta no se ve claramente afectada. Sin embargo, en la pr´atica es com´ un encontrar que al aumentar kd > 0 la rapidez de respuesta del sistema en lazo cerrado disminuye un poco. Es conveniente advertir que la funci´on de transferencia entre la posici´on y su valor deseado (G1 (s) en (5.37)) tiene dos ceros cuyo efecto sobre la respuesta transitoria no es del todo clara. As´ı que es posible que en algunas ocasiones existan algunas variaciones respecto de los efectos que se acaban de mencionar para las ganancias de un controlador PID. Adem´as, estas variantes pueden ser favorecidas por el hecho de que en algunos mecanismos la perturbaci´on externa est´a presente desde que se ordena un nuevo valor deseado de posici´on. Para ilustrar mejor estas ideas, a continuaci´on se presentan los resultados obtenidos de manera experimental al controlar la posici´on de un motor de

5.3 Caso de estudio

277

CD. El prototipo experimental es el mismo que se describe en el cap´ıtulo 10 con una variante adicional (no presente en dicho cap´ıtulo): la flecha del motor se une firmemente a un p´endulo como el mostrado en la figura 5.36. De este modo, y por efecto de la gravedad g, se introduce una perturbaci´on de par que trata de desviar la posici´on del motor respecto de su valor deseado. En la figura 5.36, T (t) representa el par generado por el motor y θ es la variable que se controla. Los par´ametros del p´endulo l y m no se miden para mostrar que se puede sintonizar un controlador PID sin necesidad de conocer los par´ametros de la planta, si se entienden cuales son los efectos de las ganancias de un controlador PID (listados m´as arriba). T(t)

l

ò

g

m

d Figura 5.36. P´endulo simple que se conecta a la flecha de un motor de CD.

En las figuras 5.37 y 5.38 se muestran los resultados experimentales correspondientes. Se usa el valor deseado de posici´on θd = π/2[rad] pues es ah´ı donde la perturbaci´on de par debida a la gravedad tiene su mayor efecto. Adem´as se muestra una l´ınea vertical ubicada en t = 0.13[s] y una l´ınea horizontal ubicada en θ = 1.8[rad] para indicar el tiempo de subida y el sobre paso deseados. La intenci´on es variar un par´ametro a la vez con el fin de apreciar claramente su efecto. De este modo, las curvas dibujadas en la figura 5.37 corresponden a los siguientes par´ametros de controlador PID: 1.

2.

Gr´afica superior: L´ınea cont´ınua: kp = 0.5, ki = 0, kd = 0. L´ınea-punto: kp = 1, ki = 0, kd = 0. L´ınea punteada: kp = 1, ki = 0, kd = 0.05. Gr´afica inferior: L´ınea cont´ınua: kp = 1, ki = 2, kd = 0.05. L´ınea-punto: kp = 1, ki = 5, kd = 0.05. L´ınea punteada: kp = 2, ki = 5, kd = 0.05. L´ınea interrumpida: kp = 2, ki = 5, kd = 0.1.

Como el sistema en lazo cerrado es de tercer orden cuando se usa un controlador PID y, adem´as, no se conocen los par´ametros del motor a controlar,

278

5 Dise˜ no usando la respuesta en el tiempo

es dif´ıcil saber que ganancias del controlador hay que utilizar para evitar la inestabilidad. As´ı que lo mejor es iniciar con un controlador PD (asignando ki = 0), que produce un sistema en lazo cerrado de segundo orden el cual es estable para cualquier valor positivo de kp con kd = 0 (pues todo mecanismo real posee un poco de fricci´on). Posteriormente, de acuerdo a la respuesta transitoria que se vaya obteniendo y a las reglas de sinton´ıa arriba listadas, se podr´a empezar a ajustar las ganancias ki y kd de manera que se consigan respuestas estables. Por esta raz´on, en la parte superior de la figura 5.37 se utiliza un controlador PD. N´otese que se obtiene un error en estado estacionario diferente de cero debido a la perturbaci´on de par que introduce la gravedad (porque ki = 0). En esta parte del experimento, la idea es acercar la rapidez del sistema a la rapidez deseada asegurando un comportamiento suficientemente estable. Por esta raz´on, primero se incrementa la ganancia proporcional hasta kp = 1 y luego se incrementa la ganancia derivativa hasta kd = 0.05. De este modo, en la parte inferior de la figura 5.37, se puede introducir el t´ermino integral que aunque lleva a cero el error en estado estacionario produce respuestas m´as oscilatorias. De nuevo, la idea es tratar de aproximarse a la rapidez de respuesta deseada. Esto se consigue incrementando primero la ganancia integral hasta ki = 5. Como esto tambi´en incrementa las oscilaciones, posteriormente se usa kp = 2 consiguiendo mayor rapidez pero sin aumentar notablemente las oscilaciones. Finalmente, se usa kd = 0.1 para obtener una respuesta suficientemente amortiguada. N´otese que el incremento de kd reduce un poco la rapidez de la repuesta (tiempo de subida mayor). Las curvas dibujadas en la figura 5.38 corresponden a los siguientes par´ametros de controlador PID: 1.

2.

Gr´afica superior: L´ınea cont´ınua: kp = 2, ki = 5, kd = 0.1. L´ınea-punto: kp = 2, ki = 5, kd = 0.2. L´ınea punteada: kp = 2, ki = 8, kd = 0.2. Gr´afica inferior: L´ınea cont´ınua: kp = 2, ki = 8, kd = 0.2. L´ınea-punto: kp = 2.5, ki = 8, kd = 0.2. L´ınea punteada: kp = 3, ki = 8, kd = 0.2. L´ınea interrumpida: kp = 3.5, ki = 8, kd = 0.2.

En la gr´afica superior de la figura 5.38 se observa que la respuesta es a´ un m´as amortiguada y m´as lenta al incrementar la ganancia derivativa de kd = 0.1 a kd = 0.2. Como en este momento la respuesta es muy lenta y el sobre paso es muy peque˜ no, se usa ki = 8 para producir un sistema m´as r´apido y con un sobre paso mayor que coincide con el sobre paso deseado. Con el fin de incrementar la rapidez, sin afectar notablemente el sobre paso, en la parte inferior de la figura 5.38 se incrementa la ganancia proporcional hasta kp = 3.5. De este modo se consigue la rapidez y el sobre paso deseados. Es conveniente aclarar lo siguiente. Al conectar un p´endulo a la flecha de un motor de CD, el sistema de control es no lineal. Esto significa que en ciertas

5.3 Caso de estudio

279

ò [rad]

tiempo[s]

ò [rad]

tiempo[s] Figura 5.37. Control PID de posici´ on de un motor de CD con una carga pendular. Resultados experimentales.

regiones el comportamiento del sistema de control no es predicho adecuadamente por el an´alisis matem´atico presentado m´as arriba. Por ejemplo, si el valor deseado de posici´on es cercano a θd = ±π, un simple control PD puede ser inestable si la ganancia proporcional (positiva) no es mayor que un cierto umbral inferior. Este resultado se obtiene usando un controlador PD en el caso x∗1 = ±π, x∗2 = 0 del ejemplo 7.3 estudiado en el cap´ıtulo 7 y obteniendo los polos de dicha aproximaci´on lineal. Tambi´en pueden consultarse los trabajos reportados en [4], [2], cap. 8, [3], cap. 7. Esta situaci´on es m´as grave cuando se trata de un controlador PID pero el problema no aparece si el valor deseado de posici´on se mantiene alejado de θd = ±π, situaci´on que corresponde a los experimentos aqu´ı presentados. Finalmente, n´otese que se ha conseguido seleccionar las ganancias de un controlador PID de posici´on para un motor de CD sin necesidad de conocer el valor num´erico de ning´ un par´ametro del motor ni del p´endulo. Sin embargo, el conocimiento m´ınimo con el que se debe contar para resolver este problema, desde el punto de vista de construcci´on del mecanismo, es verificar previamente que el motor puede producir par suficiente. Esto debe incluir el par necesario para compensar el efecto de la gravedad m´as una parte adicional de par que permita alcanzar la rapidez de respuesta deseada.

280

5 Dise˜ no usando la respuesta en el tiempo

ò [rad]

tiempo[s]

ò [rad]

tiempo[s] Figura 5.38. Control PID de posici´ on de un motor de CD con una carga pendular. Resultados experimentales.

5.4.

Resumen del cap´ıtulo

El m´etodo m´as poderoso para el dise˜ no de sistemas de control usando la respuesta en el tiempo es el lugar de las ra´ıces. Esto significa que las plantas a controlar pueden ser sistemas de orden arbitrario con cualquier n´ umero de ceros. Este m´etodo provee las herramientas necesarias para determinar, de manera gr´afica, la ubicaci´on de los polos de lazo cerrado a partir de los polos y ceros de lazo abierto. Algunos de los polos y ceros de lazo abierto son introducidos por el controlador y la idea del m´etodo es ajustar la ubicaci´on de los polos y ceros del controlador (mediante la selecci´on adecuada de sus ganancias) de manera que se consigan los polos de lazo cerrado deseados. Los polos de lazo cerrado deseados se determinan a partir del conocimiento de c´omo afectan los polos de una funci´on de transferencia a la respuesta transitoria correspondiente. Para esto es muy importante el estudio previo del cap´ıtulo 3. Por otro lado, la estructura del controlador se selecciona a partir del conocimiento de c´omo influyen los polos (de lazo abierto) del controlador sobre la respuesta en estado estacionario del sistema en lazo cerrado. Para esto es muy importante el estudio previo del error en estado estacionario presentado en el cap´ıtulo 4.

5.5 Preguntas de repaso

281

Aunque el lugar de las ra´ıces ha sido usado como un m´etodo de dise˜ no de controladores, tambi´en es una herramienta poderosa para el an´alisis de sistemas de control. Esto significa que se puede utilizar para determinar: i) que tan estable es un sistema de control, ii) c´omo afecta el cambio de un par´ametro a la respuesta del sistema de control, iii) qu´e debe hacerse para modificar las propiedades del sistema de control, etc. El uso del m´etodo del lugar de las ra´ıces en estas aplicaciones depende en gran medida de un buen entendimiento del m´etodo y del conocimiento del material presentado en los cap´ıtulos 3 y 4.

5.5. 1.

2.

3. 4.

5.

6.

7. 8.

9. 10.

Preguntas de repaso

¿Cu´ando y para qu´e utilizar´ıa cada uno de los siguientes controladores? Proporcional. Proporcional-derivativo. Proporcional-integral. Proporcional-integra-derivativo. ¿Por qu´e cree que no es recomendable el uso de controladores: i) derivativos, ii) integrales y iii) derivativos-integrales, sin la presencia de la parte proporcional? Explique. ¿De qu´e manera el error en estado estacionario determina los polos y/o ceros (la estructura) del controlador? ¿Cu´al es el componente principal que debe tener un controlador si se desea mejorar la estabilidad del sistema en lazo cerrado? ¿Cu´al es el efecto de esto sobre el lugar de las ra´ıces? ¿Cu´al es el componente principal que debe tener un controlador si se desea mejorar el error en estado estacionario? ¿Cu´al es el efecto de esto sobre el lugar de las ra´ıces? ¿Por qu´e el lugar de las ra´ıces inicia en los polos de lazo abierto y termina en los ceros de lazo abierto? ¿Qu´e significan las palabras “inicia” y “termina”? Si la funci´on de transferencia de lazo abierto no tiene ceros ¿En d´onde termina el lugar de las ra´ıces? Con frecuencia se dice que al aumentar la ganancia de lazo el sistema en lazo cerrado tiende a hacerse inestable. Sin embargo, esto no siempre es cierto pues depende de las caracter´ısticas de la planta que se est´a controlando. Revise los ejemplos presentados en este cap´ıtulo y d´e un ejemplo de una planta a controlar que requiera que la ganancia de lazo sea suficientemente grande para que el sistema en lazo cerrado sea estable. ¿Qu´e es un compensador de adelanto, cu´al es su principal caracter´ıstica y para qu´e se usa? Consulte la secci´on 9.8 del cap´ıtulo 9, las secciones 10.2.2 y 10.5 del cap´ıtulo 10 y la secci´on 8.2 del cap´ıtulo 8 para explicar c´omo construir´ıa un con-

282

5 Dise˜ no usando la respuesta en el tiempo

trolador PID y un compensador de adelanto usando software y electr´onica anal´ogica.

5.6. 1.

Ejercicios propuestos

Considere el sistema de control de la figura 5.39 donde: k = 35.2671,

a = 3.5201,

c = 10.3672,

γ = 2.0465,

d = 3.8935

Verifique que cuando ki = 0 y kp = 1 hay dos polos complejos conjugados de lazo cerrado en s = −4.8935 ± j6.6766. Con la ayuda de alg´ un software especializado, obtenga el lugar de las ra´ıces para los siguientes valores de ki : ki = 0.001, 0.01, 0.1, 1, 10 Use el valor de kp como la ganancia que el m´etodo var´ıa desde 0 hasta +∞ para dibujar el gr´afico. Seleccione el valor de kp = 1 y observe que pasa con los polos de lazo cerrado correspondientes con respecto a los puntos s = −4.8935±j6.6766. Utilice software especializado para realizar simulaciones en cada caso cuando la referencia es un escal´on unitario. Compare la respuesta obtenida conforme ki crece con la respuesta obtenida cuando kp = 1 y ki = 0. Elabore los lugares de las ra´ıces correspondientes usando el m´etodo propuesto en este cap´ıtulo y explique lo que sucede. òd ( s)

+

k

ò(s)

k s(s+a)

í s+d s+c

kp + si à

Figura 5.39. Controlador PI en cascada con una red de adelanto.

2.

Considere la siguiente planta: Y (s) = H1 (s)U (s), a)

H1 (s) =

k , s(s + a)

k = 35.2671,

a = 3.5201

Utilice las expresiones en (3.59) del cap´ıtulo 3 para obtener los valores de kp y kv que consigan las siguientes caracter´ısticas de respuesta transitoria: tr = 0.33[s],

Mp ( %) = 10

cuando yd es un escal´on unitario (constante igual a uno) y se utiliza la siguiente entrada: u(t) = kp (yd − y) − kv y, ˙ control proporcional con realimentaci´on de velocidad.

5.6 Ejercicios propuestos

b)

283

Considere que la entrada est´a dada como: u(t) = kp (yd − y) + kd

d(yd − y) , dt

control proporcional-derivativo

Obtenga la funci´on de transferencia de lazo cerrado y use las expresiones en (3.59) del cap´ıtulo 3 para determinar kp y kd de manera que los polos de lazo cerrado se ubiquen en lugares tales que determinen las siguientes carcter´ısticas de lazo cerrado: tr = 0.33[s],

3.

4.

Mp ( %) = 10

Haga simulaciones para cada uno de los incisos anteriores y compare las respuestas obtenidas. ¿A qu´e se debe la diferencia existente entre estas respuestas? ¿Los ceros de una funci´on de transferencia pueden afectar la forma exacta de la respuesta? ¿Puede usar el lugar de las ra´ıces para explicar esta diferencia? Considere un sistema en lazo cerrado como el de la figura 5.1 con H(s) = 1 y G(s) = s3 +s21+s+1 . Usando las reglas presentadas en la secci´on 5.1.1 construya el lugar de las ra´ıces correspondiente a un controlador proporcional. Compruebe que el sistema en lazo cerrado es inestable para cualquier valor positivo de la ganancia del controlador proporcional. Use el criterio de Routh como alternativa para encontrar este resultado. Con el fin de estabilizar el sistema en lazo cerrado y para conseguir un error cero en estado estacionario ante una referencia tipo escal´on dise˜ ne un controlador PID del siguiente modo. i) Proponga kd s2 + kp s + ki = kd (s − z1 )(s − z2 ), con z1 = −0.5 + 1.3j, z2 = −0.5 − 1.3j. Usando las reglas presentadas en la secci´on 5.1.1 dibuje el lugar de las ra´ıces correspondiente para verificar que no existe ning´ un valor positivo de la ganancia derivativa que produzca un sistema en lazo cerrado estable. ii) Proponga kd s2 +kp s+ki = kd (s−z1 )(s−z2 ), con z1 = −0.25+1.3j, z2 = −0.25 − 1.3j. Usando las reglas presentadas en la secci´on 5.1.1 dibuje el lugar de las ra´ıces correspondiente para verificar que existe un rango de valores positivos de la ganancia derivativa kd que producen un sistema en lazo cerrado estable. Utilice el criterio de Routh para encontrar el rango de valores de kd que consiguen estabilidad en lazo cerrado. De acuerdo a lo anterior ¿C´omo debe seleccionar los ceros de un controlador PID para mejorar la estabilidad del sistema en lazo cerrado? Verifique que la funci´on de transferencia del circuito mostrado en la figura 5.40 es: Vo (s) s+a = , Vi (s) s+b

a=

1 , R1 C

b=

1 1 + R1 C R2 C

N´otese que como b > a esta red el´ectrica puede usarse como un compensador de adelanto.

284

5 Dise˜ no usando la respuesta en el tiempo

C

+

vi

+ à

R1

vo

R2

à

Figura 5.40. Compensador de adelanto.

5.

Considere la siguiente planta: G(s) =

6.

7.

8.

4(s + 0.2) (s + 0.5)(s2 − 0.2s + 0.3)

Use la t´ecnica del lugar de las ra´ıces para dise˜ nar un controlador que asegure estabilidad en lazo cerrado y un error cero en estado estacionario cuando la referencia deseada es un escal´on. Se sugiere proponer la ubicaci´on de los polos y ceros del controlador y luego seleccionar la ganancia de lazo abierto de manera que todos los polos de lazo cerrado pertenezcan al semiplano complejo izquierdo. Considere el control PD de posici´on estudiado en la secci´on 5.2.2. Demuestre que el valor de la ganancia derivativa kd no afecta al error en estado estacionario cuando la referencia deseada es una constante. Considere el control PID de posici´on estudiado en la secci´on 5.2.5. Demuestre que los valores de las ganancias proporcional kp y derivativa kd no afectan al error en estado estacionario a pesar de la presencia de una perturbaci´on constante cuando la referencia deseada tambi´en es constante. En este mismo problema suponga que no existe la parte integral del controlador, es decir que ki = 0. Demuestre que el valor de la ganancia derivativa kd no afecta al error en estado estacionario a pesar de la presencia de la perturbaci´on. Considere el sistema masa-resorte-amortiguador mostrado en la figura 5.41 y modelado en el ejemplo 2.2 del cap´ıtulo 2. En el ejemplo 3.18 del cap´ıtulo 3 se explica porqu´e hay un error en estado estacionario diferente de cero cuando se usa un controlador proporcional de posici´on y la posici´on deseada xd es una constante diferente de cero. Recuerde que la fuerza F (t) aplicada sobre la masa es la se˜ nal entregada por el controlador. Ahora suponga que se usa un controlador PID de posici´on. Encuentre el error en estado estacionario cuando la posici´on deseada xd es un valor

5.6 Ejercicios propuestos

285

constante diferente de cero. Use su experiencia cotidiana para explicar el porqu´e de su respuesta, es decir, trate de explicar pensando en qu´e pasa con la fuerza F (t) aplicada sobre la masa y qu´e efecto tiene el resorte sobre la masa.

K

F (t)

b m

Figura 5.41. Sistema masa-resorte-amortiguador.

9.

Considere el p´endulo simple estudiado en el ejemplo 2.13 del cap´ıtulo 2 y mostrado en la figura 5.42. N´otese que la gravedad ejerce un par diferente de cero sobre el p´endulo si la posici´on angular θ no es igual a cero. Suponga que se desea llevar la posici´on θ del p´endulo a un valor constante θd igual a 90◦ . N´otese que el par T (t) es la entrada del p´endulo. Usando la experiencia del ejercicio previo, diga qu´e tipo de controlador utilizar´ıa para calcular T (t) de manera que θ consiga alcanzar a θd . Explique por qu´e. Este problema est´a hecho para que razone y no necesita utilizar el modelo matem´atico del p´endulo. De hecho, dicho modelo matem´atico es no lineal y por eso no puede ser analizado usando las t´ecnicas estudiadas hasta aqu´ı.

T(t)

l

ò

g

m

d Figura 5.42. P´endulo simple.

286

10.

5 Dise˜ no usando la respuesta en el tiempo

Considere una planta cualquiera G(s) y los siguientes controladores colocados en cascada con G(s): s+a , s+b s+c , Gd (s) = s+d Gc (s) =

11.

0d>0

Gc (s) se conoce como un compensador de adelanto mientras que Gd (s) se conoce como un compensador de atraso. ¿Cu´al es el efecto de cada uno de estos compensadores sobre el error en estado estacionario ante una referencia escal´on? ¿Cu´al es el efecto de cada uno de estos compensadores sobre la estabilidad relativa del sistema en lazo cerrado? ¿Con cu´al de estos compensadores se relaciona un controlador PI y con cu´al un controlador PD? Explique por qu´e. ¿C´omo construir´ıa con estos dos compensadores un controlador que tenga caracter´ısticas similares a las de un PID? Explique. En un barco es com´ un contar con un u ´nico girocomp´as que indica el rumbo actual de barco. Sin embargo, se debe contar con esta informaci´on en diferentes puntos del barco por lo que es necesario transmitir esta informaci´on electr´onicamente para exhibirla en cada punto del barco donde se necesita usando un instrumento de aguja. La posici´on angular de la aguja es ajustada con un motor de CD usando la informaci´on suministrada por el girocomp´as como la posici´on deseada. Dise˜ ne un sistema de control en lazo cerrado de manera que la posici´on de la aguja del instrumento siga fielmente a la orientaci´on suministrada por el girocomp´as de acuerdo a las siguientes especificaciones: Que ante un cambio tipo escal´on de 8◦ en la orientaci´on del girocomp´as, el error en estado estacionario se reduzca y se mantenga en menos de 1◦ en 0.3 segundos o menos y que el sobre paso sea menor o igual al 25 %. Cuando la orientaci´on del girocomp´as cambie de acuerdo a una rampa de 5◦ por segundo, que el error en estado estacionario sea de 0.3◦ o menos. No existen perturbaciones externas. ¿Bajo que condiciones de operaci´on del barco pueden ocurrir estas situaciones? La funci´on de transferencia entre el voltaje aplicado al motor y la posici´on de la aguja en grados es: G(s) =

s(4.4 ×

10−9 s2

45.84 × 10−5 + 308.5 × 10−9 s + 3.3 × 10−6 )

Sugerencia. i) En base las especificaciones suministradas decida qu´e controlador deber´a usar. ii) Usando la primera especificaci´on determine una zona, en el

5.6 Ejercicios propuestos

287

dominio del tiempo, dentro de la cual debe estar la respuesta del sistema en lazo cerrado. iii) Recuerde que, de acuerdo a la figura 3.10 en el cap´ıtulo 3, la respuesta de un sistema de segundo orden esta contenida dentro de dos envolventes exponenciales que dependen de ζ y de ωn . Con esta informaci´on, usando el amortiguamiento deseado y usando el punto ii) anterior, determine la zona del plano complejo s dentro de la cual deben caer los polos dominantes (complejos conjugados) del sistema en lazo cerrado. iv) Determine un punto conveniente sobre la frontera de dicha zona del plano s y use las reglas vistas para construir el lugar de las ra´ıces para determinar las ganancias de un controlador que consiga que dicho punto sea un polo de lazo cerrado. v) Una vez conseguido esto, seleccione una ganancia de lazo abierto que asegure que todos los polos de lazo cerrado est´en dentro de la zona deseada. vi) Verifique que se cumple la segunda especificaci´on y, si no es as´ı, redise˜ ne el controlador. vii) Mediante simulaciones verifique que se satisfacen todas las especificaciones.

Referencias

1. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004. 2. R. Kelly, V. Santib´ an ˜ez and A. Lor´ıa, Control of robot manipulators in joint space, Springer, London, 2005. 3. R. Kelly y V. Santib´ an ˜ez, Control de movimiento de robots manipuladores, Pearson Prentice Hall, Madrid, 2003. 4. R. Kelly, PD control with desired gravity compensation of robotic manipulators: a review, The International Journal of Robotcs Research, vo. 16, No. 5, pp. 660672, 1997. 5. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 6. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edici´ on, Pearson Prentice-Hall, Madrid, 2008. 8. B.C. Kuo, Sistemas de control autom´ atico, 7a. edici´ on, Prentice-Hall Hispanoamericana, M´exico, 1995. 9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edici´ on en espa˜ nol, McGraw-Hill, M´exico, 1992. 10. W. Ali and J.H. Burghart, Effects of lag controllers on the transient response, IEE Proceedings-D, Control theory and applications, vol. 138, no. 2, pp. 119-122, March 1991.

6 Dise˜ no usando la respuesta en frecuencia

Uno de los problemas m´as importantes y urgentes por resolver durante la Segunda Guerra Mundial fue el direccionamiento de ca˜ nones antia´ereos. La soluci´on de este problema motiv´o en buena medida el desarrollo del conjunto de herramientas que hoy conocemos como las t´ecnicas de respuesta en frecuencia. Aunque las ideas de Nyquist fueron formuladas un poco antes de este per´ıodo, las ideas de Bode sobre los m´argenes de fase y de ganancia, as´ı como el ancho de banda, fueron establecidas durante este per´ıodo. El uso de estas herramientas, en conjunto con el desarrollo de otras ideas como los diagramas de bloques, fue fundamental para resolver el problema de controlar ca˜ nones antia´ereos.

292

6 Dise˜ no usando la respuesta en frecuencia

Objetivos del cap´ıtulo Entender qu´e significa respuesta en frecuencia y conocer los conceptos fundamentales de este enfoque. Conocer la relaci´ on entre las caracter´ısticas de respuesta en frecuencia y las caracter´ısticas de respuesta en el tiempo. Usar los conceptos de respuesta en frecuencia para el an´ alisis y dise˜ no de sistemas de control. En el cap´ıtulo 5 se presenta un m´etodo para dise˜ nar sistemas de control que se conoce como el m´etodo de la respuesta en el tiempo. La caracter´ıstica principal de ese m´etodo es que trata de ubicar convenientemente los polos de lazo cerrado de manera que la respuesta transitoria tenga las caracter´ısticas deseadas. Para ese m´etodo es fundamental saber c´omo es la respuesta transitoria en el tiempo que introducen los polos de lazo cerrado: reales, complejos conjugados, sencillos, repetidos, etc. En el presente cap´ıtulo se introduce un nuevo m´etodo para el dise˜ no de sistemas de control que se conoce como el m´etodo de la respuesta en frecuencia. Fundamental para este estudio es entender que si una ecuaci´on diferencial lineal se excita con una entrada que es una funci´on sinusoidal del tiempo, entonces la salida tambi´en ser´a, en estado estacionario, una funci´on sinusoidal del tiempo de la misma frecuencia que la entrada pero con una amplitud y una fase diferentes. La base de este m´etodo radica en estudiar como var´ıan la amplitud y la fase de la se˜ nal de salida al cambiar la frecuencia de la se˜ nal sinusoidal aplicada a la entrada. Esto es lo que se conoce como respuesta en frecuencia. Como se muestra en este cap´ıtulo, la manera en que cambian la amplitud y la fase de la se˜ nal de salida depende de c´omo son y en d´onde est´an ubicados los polos y los ceros de la funci´on de transferencia correspondiente a la ecuaci´on diferencial bajo estudio. La estrategia de dise˜ no en este m´etodo es modificar convenientemente las caracter´ısticas de respuesta en frecuencia del sistema en lazo abierto de manera que se obtengan las caracter´ısticas deseadas de la respuesta en el tiempo del sistema en lazo cerrado. Puede afirmarse que cualquier problema de dise˜ no en control cl´asico puede ser resuelto usando cualquiera de los m´etodos: el m´etodo de la respuesta en el tiempo o el m´etodo de la respuesta en frecuencia. Esto significa que ambos m´etodos suministran las herramientas necesarias para cualquier problema de control cl´asico. Sin embargo, dado que cada m´etodo analiza el mismo problema desde puntos de vista diferentes, cada uno suministra informaci´on que puede ser complementaria a la suministrada por el otro m´etodo. As´ı que es muy importante que se dominen ambos m´etodos.

6.1.

Un circuito RC de corriente alterna

A continuaci´on se presentan algunos resultados experimentales obtenidos con el circuito el´ectrico de la figura 6.1(a). Se utiliza un generador de se˜ nales

6.1 Un circuito RC de corriente alterna

293

para aplicar el siguiente voltaje de entrada: vi (t) = A sin(ωt)

(6.1)

En el osciloscopio se observa una situaci´on como la que se muestra en la figura 6.1(b), es decir el voltaje de salida (en el capacitor) tiene la forma: v0 (t) = B sin(ωt + φ) 360 tφ φ= [grados] T Esto significa que ambas se˜ nales vi (t) y v0 (t) son funciones sinusoidales de la

R +

ýi (t)

i (t)

C

ý0 (t) à

(a)

A B

t

tþ ý 0 (t) ý i (t)

T

(b) Figura 6.1. Relaciones entre los voltajes de entrada y de salida en un circuito RC.

misma frecuencia. Es importante aclarar que, bajo la situaci´on mostrada en la figura 6.1(b), el valor de φ es considerado negativo, es decir que el voltaje de salida, v0 (t), est´a atrasado respecto de la entrada, vi (t). Utilizando diferentes valores de frecuencia, ω, se obtienen las mediciones mostradas en la tabla 6.1 las cuales se muestran graficadas en la figura 6.2 (l´ınea continua). La primera de estas figuras muestra c´omo var´ıa el cociente B/A al cambiar la frecuencia ω y la otra como var´ıa la fase φ al cambiar la frecuencia ω.

294

6 Dise˜ no usando la respuesta en frecuencia

Tabla 6.1. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a). f [Hz] ω = 2πf [×105 rad/s] 50 0.0031 60 0.0038 70 0.0044 80 0.0050 90 0.0057 100 0.0063 200 0.0126 300 0.0188 400 0.0251 500 0.0314 600 0.0377 700 0.0440 800 0.0503 900 0.0565 1000 0.0628 2000 0.1257 3000 0.1885 4000 0.2513 5000 0.3142 6000 0.3770 7000 0.4398 8000 0.5027 9000 0.5655 10000 0.6283 20000 1.2566 30000 1.8850 40000 2.5133 50000 3.1416

A [V] 1.04 1.04 1.04 1.08 1 0.7 0.7 0.98 1.02 1.2 1.2 1.22 1.24 1.22 1.04 1.22 1.22 1.22 1.2 1.12 1.02 0.83 1.08 1.08 1.2 1.2 1.2 1.18

B [V] φ [grados] 1.04 0 1.04 0 1.04 0 1.08 0 1 0 0.7 0 0.68 0 0.94 -11.92 0.9 -13.06 1.1 -18 1.1 -23.85 1.1 -25.71 1.1 -29.03 1.08 -29.45 0.88 -29.38 0.8 -52.89 0.62 -65.8 0.5 -79.28 0.4 -79.2 0.28 -81.42 0.252 -88.73 0.22 -85.71 0.212 -94 0.28 -86.4 0.112 -83.22 0.08 -86.74 0.057 -83.52 0.047 -86.4

Se dice que el comportamiento mostrado en la figura 6.2 es el de un filtro pasa bajas. Esto significa que las se˜ nales de baja frecuencia (cercanas a ω = 0) son poco atenuadas, B/A ≈ 1, mientras que las se˜ nales de alta frecuencia (ω muy grande) son fuertemente atenuadas, B/A ≈ 0. Por “atenuar” se debe entender que el voltaje de salida v0 (t) tiene un amplitud menor que la amplitud del voltaje de entrada vi (t), es decir, B es menor que A. 6.1.1.

Representaciones gr´ aficas comunes

Gr´ aficas de Bode Suponga que se tiene un n´ umero k. El valor correspondiente en decibeles (dB) se obtiene mediante la operaci´on:

6.1 Un circuito RC de corriente alterna

295

B A p1

2

1 RC

þ [grados] à 45

1 RC

! [rad=s]

Figura 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a) (v´ease la tabla 6.1).

kdB = 20 log(k) donde log(k) representa el logaritmo base 10 de k. El logaritmo base 10 de k se define del siguiente modo. Si: 10z = k entonces z = log(k). A continuaci´on se presentan algunas propiedades importantes y algunos valores que toman los logaritmos: log(xy) = log(x) + log(y),

log(x/y) = log(x) − log(y),

(6.2)

log(xm ) = m log(x), log(1) = 0, Si x → 0 entonces log(x) → −∞

Las gr´aficas de Bode se dibujan sobre papel semilogar´ıtmico: el eje horizontal (ω) tiene escala logar´ıtmica mientras que el eje vertical tiene escala lineal. Utilizando los valores de la tabla 6.1 se obtienen los datos mostrados en la tabla 6.2. En la figura 6.3 se muestran las gr´aficas de Bode correspondientes (l´ınea continua). N´otese lo siguiente: Cuando ω → 0. En la figura 6.3 se tiene que 20log(B/A) → 0 [dB] lo cual corresponde, en la figura 6.2, a B/A → 1. Esto est´a de acuerdo con log(1) = 0. En ambas figuras 6.3 y 6.2 se tiene que φ → 0[grados].

296

6 Dise˜ no usando la respuesta en frecuencia

Tabla 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a). ω = 2πf [×105 rad/s] 20log(B/A) [dB] φ [grados] 0.0031 0 0 0.0038 0 0 0.0044 0 0 0.0050 0 0 0.0057 0 0 0.0063 0 0 0.0126 -0.2518 0 0.0188 -0.3620 -11.92 0.0251 -1.0872 -13.06 0.0314 -0.7558 -18 0.0377 -0.7558 -23.85 0.0440 -0.8993 -25.71 0.0503 -1.0406 -29.03 0.0565 -1.0587 -29.45 0.0628 -1.4510 -29.38 0.1257 -3.6654 -52.89 0.1885 -5.8794 -65.8 0.2513 -7.7478 -79.28 0.3142 -9.5424 -79.2 0.3770 -12.0412 -81.42 0.4398 -12.1440 -88.73 0.5027 -11.5331 -85.71 0.5655 -14.1418 -94 0.6283 -11.7253 -86.4 1.2566 -20.5993 -83.22 1.8850 -23.5218 -86.74 2.5133 -26.4661 -83.52 3.1416 -27.9957 -86.4

Cuando ω → +∞. En la figura 6.3 se tiene que 20log(B/A) → −∞ [dB] lo cual corresponde, en la figura 6.2, a B/A → 0. Esto est´a de acuerdo con log(x) → −∞ si x → 0. En ambas figuras 6.3 y 6.2 se tiene que φ → −90[grados]. Cuando ω = 1/RC =10 000[rad/s]. En la figura 6.3 se tiene que √ 20log(B/A) = −3 [dB] lo cual corresponde, en la figura 6.2, a B/A = 1/ 2. En ambas figuras 6.3 y 6.2 se tiene que φ = −45[grados]. Es posible observar que en las gr´aficas de Bode es m´as f´acil identificar la frecuencia a partir de la cual el circuito RC aten´ ua las se˜ nales de salida. Esta es una de las razones por las que se introducen las gr´aficas de Bode.

6.1 Un circuito RC de corriente alterna

ð ñ 20log B A [dB]

297

à3

1 RC

þ [grados] à 45

1 RC

! [rad=s] Figura 6.3. Gr´ aficas de Bode para el circuito en la figura 6.1(a).

Gr´ aficas polares En la figura 6.4 se define el n´ umero complejo G de la siguiente manera: B ∠φ = Re(G) + jIm(G) A B B |G| = , Re(G) = cos(φ), A A G=

Im(G) =

B sin(φ) A

G

Im (G) jG j

þ Re (G)

Figura 6.4. N´ umero complejo.

Usando estas definiciones, los valores mostrados en la tabla 6.1 se pueden graficar como en la figura 6.5 (l´ınea continua). Esta gr´afica se conoce como

298

6 Dise˜ no usando la respuesta en frecuencia

gr´afica polar. En esta gr´afica la frecuencia crece desde ω = 0 hasta ω = +∞ de acuerdo a la direcci´on indicada por la flecha. De acuerdo a la definici´on de G, el cociente B/A esta determinado por la distancia hacia el origen medida desde el punto correspondiente y φ es el ´angulo medido respecto del eje real positivo. Con estas observaciones es posible identificar los puntos a los cuales ω = 0, ω = +∞ y ω = 1/RC (aquel en el cual el ´angulo formado con el eje real positivo es −45[grados]). La raz´on principal por la que se introduce la gr´afica polar tiene que ver con el criterio de estabilidad que se presentar´a m´as adelante.

Im(G)

! =+1

!=0

ï

ï

à 45

ï

! = R1C

Re(G) Figura 6.5. Gr´ afica polar para el circuito de la figura 6.1(a).

6.1.2.

Modelo matem´ atico

Aplicando la ley de voltajes de Kirchhoff al circuito de la figura 6.1(a) se encuentra: Z Z 1 t 1 t i(τ )dτ, v0 (t) = i(τ )dτ vi (t) = iR + C 0 C 0 Aplicando la transformada de Laplace (3.2): Vi (s) = I(s)R +

1 I(s), sC

V0 (s) =

1 I(s) sC

6.1 Un circuito RC de corriente alterna

299

Combinando estas expresiones se tiene: V0 (s) =

a Vi (s), s+a

a=

1 RC

(6.3)

Sea vi (t) la se˜ nal presentada en (6.1), entonces su transformada de Laplace est´a dada como: Vi (s) =

ωA s2 + ω 2

(6.4)

Por tanto, expandiendo en fracciones parciales: V0 (s) =

ωA F Cs + D a = + 2 s + a s2 + ω 2 s+a s + ω2

(6.5)

Las constantes C y de D se calculan del siguiente modo. Multiplicando ambos miembros de (6.5) por el factor s2 + ω 2 y evaluando en s = jω: aωA = jωC + D jω + a Multiplicando el miembro izquierdo por el factor (−jω + a)/(−jω + a) e igualando partes reales e imaginarias se tiene: D=

a2 ωA , ω 2 + a2

C=

−aωA ω 2 + a2

Entonces: s ω −aωA a2 A Cs + D = + 2 2 2 2 2 2 2 2 2 s +ω ω +a s +ω ω + a s + ω2 Usando los pares transformados: L{cos(ωt)} =

s2

s , + ω2

L{sin(ωt)} =

s2

ω + ω2

se encuentra: L−1

½

Cs + D s2 + ω 2

¾

=

aA [−ω cos(ωt) + a sin(ωt)] + a2

ω2

De acuerdo a la figura 6.6 se puede escribir: √ ¾ ½ aA ω 2 + a2 Cs + D −1 = [sin(φ) cos(ωt) + cos(φ) sin(ωt)] L s2 + ω 2 ω 2 + a2 µ ¶ −ω a sin(ωt + φ), φ = atan (6.6) = A√ a ω 2 + a2 Por tanto, aplicando la transformada inversa de Laplace a (6.5) se obtiene:

300

6 Dise˜ no usando la respuesta en frecuencia a

þ

p a2

+

à!

!2

Figura 6.6. Tri´ angulo definido por la fase φ.

v0 (t) = F e−at + A √ Como a =

1 RC

a sin(ωt + φ) + a2

ω2

> 0 entonces: v0 (t) → B sin(ωt + φ),

a B = A√ ω 2 + a2

(6.7)

conforme t → ∞. Esto significa que si el voltaje de entrada vi (t) es una funci´on seno del tiempo entonces, en estado estacionario, el voltaje de salida v0 (t) tambi´en es una funci´on seno del tiempo con la misma frecuencia ω pero con amplitudes y fases diferentes. A continuaci´on se muestra que los valores de B/A y φ obtenidos en (6.6) y (6.7) tambi´en se pueden calcular a partir de la funci´on de transferencia en (6.3) usando el cambio de variable s = jω. Defina: G(s) =

a s+a

y considere el cambio de variable s = jω, entonces: ¯ ¯ ¯ ¯ ¯ a ¯ ¯ a a − jω ¯ ¯=¯ ¯= |G(jω)| = ¯¯ jω + a ¯ ¯ jω + a a − jω ¯ ¯ ¯ ¯ a(a − jω) ¯ B ¯= √ a = ¯¯ 2 = ω + a2 ¯ A ω 2 + a2 ¶ µ ¶ µ −ω Im(G(jω)) = atan φ = ∠G(jω) = atan Re(G(jω)) a

(6.8) (6.9)

En este punto es conveniente recordar que una funci´on de transferencia se a = define como el cociente de la salida sobre la entrada, es decir G(s) = s+a V0 (s) Vi (s) .

As´ı que no es extra˜ no que |G(jω)| est´e dado como el cociente de las amplitudes de la salida y de la entrada. Por otro lado, si de manera intuitiva se asume que G(jω), V0 (jω), Vi (jω) son n´ umeros complejos, entonces el ´angulo

6.1 Un circuito RC de corriente alterna

301

de V0 (jω) debe obtenerse como la suma de los ´angulos de G(jω) y de Vi (jω) porque V0 (jω) = G(jω)Vi (jω). Esto significa que la diferencia de ´angulo entre Vi (jω) y V0 (jω) es igual al ´angulo de G(jω). En las figuras 6.2, 6.3 y 6.5 se muestran las gr´aficas correspondientes (l´ınea interrumpida) obtenidas utilizando |G(jω)| y φ definidas en (6.8) y (6.9). La semejanza que se aprecia en estas figuras entre las l´ıneas continuas y las interrumpidas son una muestra de que las relaciones obtenidas anal´ıticamente representan satisfactoriamente la situaci´on experimental. De acuerdo a (6.7), (6.8), (6.9) si vi (t) est´a dada como en (6.1) entonces: µ ¶ Im(G(jω)) v0 (t) = A|G(jω)| sin(ωt + φ), φ = atan (6.10) Re(G(jω)) Por otro lado, puede repetirse el procedimiento anterior para encontrar que si vi (t) = A cos(ωt) entonces: µ ¶ Im(G(jω)) v0 (t) = A|G(jω)| cos(ωt + φ), φ = atan (6.11) Re(G(jω)) 6.1.3.

Componentes de frecuencia

De acuerdo a las Series de Fourier, cualquier se˜ nal peri´odica puede ser representada como la suma de muchas se˜ nales seno y coseno de frecuencias diferentes. Por ejemplo, sea la funci´on f (t) presentada en la figura 6.7. Su expansi´on en series de Fourier est´a dada como [1], p´ag. 457: µ ¶ 1 4k 1 sin(t) + sin(3t) + sin(5t) + · · · f (t) = (6.12) π 3 5 El espectro de frecuencias |F (ω)| es una funci´on de la frecuencia ω que indica las frecuencias contenidas en la funci´on f (t) y cual es la contribuci´on de cada una de esas frecuencias a la se˜ nal total f (t). El espectro |F (ω)| puede ser interpretado como la amplitud que tiene la se˜ nal seno o coseno de frecuencia 4k 1 4k 1 , , ,. . ., en (6.12). El espectro de frecuencias obtenido con ω, es decir 4k π π 3 π 5 las series de Fourier es discreto, es decir, s´olo existe contribuci´on de frecuencias que son m´ ultiplos enteros de una frecuencia fundamental. En el caso de (6.12) la frecuencia fundamental es 1, mientras que 3, 5,. . . son sus m´ ultiplos enteros a los que se hace referencia. El uso de la transformada de Fourier permite representar cualquier funci´on no peri´odica como la suma de se˜ nales seno y coseno de muchas frecuencias. En este caso, el espectro de frecuencias es continuo, es decir, |F (ω)| est´a definido para frecuencias que no necesitan ser m´ ultiplos enteros de ninguna frecuencia fundamental. A las frecuencias que contribuyen al espectro |F (ω)| se les conoce como componentes de frecuencia. El razonamiento que se presenta a continuaci´on es intuitivo pues un an´alisis exacto est´a fuera del alcance de este libro. Considere el sistema:

302

6 Dise˜ no usando la respuesta en frecuencia f (t)

k

àù

à 2ù

ù



t

àk

Figura 6.7. Funci´ on del tiempo peri´ odica.

V0 (s) =

a Vi (s) s+a

(6.13)

Suponga que vi (t) es la se˜ nal escal´on que se muestra en la la figura 6.8. A ýi (t)

t

Figura 6.8. Entrada tipo escal´ on.

continuaci´on se muestra que el uso de la transformada de Fourier permite expresar a vi (t) como la suma de se˜ nales seno y coseno de muchas frecuencias. En an´alisis de Fourier es com´ un encontrar la transformada de Fourier a partir de las series de Fourier al suponer que la frecuencia fundamental ω0 = ∆ω → 0 tiende a cero y que el “arm´onico” nω0 = n∆ω → ω tiende a la frecuencia continua ω. Esto significa que se puede escribir (v´ease, por ejemplo [2], p´ag.

6.1 Un circuito RC de corriente alterna

303

72): vi (t) =

n=+∞ X

An [cos(n∆ωt) + j sin(n∆ωt)]∆ω

(6.14)

n=−∞

√ donde, j = −1, el factor ∆ω colocado en el extremo derecho se introduce para asegurar la convergencia de la sumatoria, que en el l´ımite ω0 = ∆ω → 0 se convierte en una integral y ∆ω se convierte en una diferencial, y An es en general un n´ umero complejo que representa la amplitud del “arm´onico” de frecuencia n∆ω → ω. De acuerdo a lo expuesto en la secci´on 3.10 el sistema en (6.13) es lineal y, por tanto, satisface el principio de superposici´on, es decir si v01 (t) es la soluci´on cuando vi1 (t) es la entrada y v02 (t) es la soluci´on cuando vi2 (t) es la entrada entonces α1 v01 (t) + α2 v02 (t) es la soluci´on cuando α1 vi1 (t) + α2 vi2 (t) es la entrada, donde α1 y α2 son constantes arbitrarias. Por tanto, se puede usar el principio de superposici´on, (6.10), (6.11), (6.14) para obtener: v0 (t) =

n=+∞ X

n=−∞

φn = atan

An |G(jn∆ω)| [cos(n∆ωt + φn ) + j sin(n∆ωt + φn )]∆ω

µ

Im(G(jn∆ω)) Re(G(jn∆ω))



(6.15)

Es decir, la contribuci´on de cada una de las se˜ nales seno y coseno a la funci´on del tiempo v0 (t) est´a determinada por las componentes de frecuencia ω = n∆ω de la se˜ nal de entrada y por la amplificaci´on o atenuaci´on que el sistema efect´ ua sobre cada una de esas componentes de frecuencia. Esto significa que la salida, v0 (t), contiene b´asicamente las mismas componentes de frecuencia que, vi (t), pero amplificadas o atenuadas seg´ un lo determine el sistema, G(s). Tambi´en se dice que la salida se obtiene como el filtraje de la entrada bajo el efecto del sistema. Componentes de frecuencias grandes En la figura 6.9 se muestran dos se˜ nales con forma de onda seno de diferente frecuencia. N´otese que una se˜ nal de frecuencia mayor muestra variaciones m´as r´apidas en el tiempo. Esto significa que si f (t) tiene componentes de frecuencia mayores entonces f (t) contiene variaciones m´as r´apidas. Por ejemplo, sea la funci´on f (t) presentada en la figura 6.7. Su expansi´on en series de Fourier est´a dada como: µ ¶ 1 1 4k sin(t) + sin(3t) + sin(5t) + · · · f (t) = π 3 5 En la figura 6.10 se muestran varias aproximaciones de esta funci´on que incluyen diferentes componentes de frecuencia [1], p´ag. 458. N´otese que mientras exista mayor contenido de frecuencias grandes la funci´on obtenida tiene

304

6 Dise˜ no usando la respuesta en frecuencia

sen (! 1t) 1

sen (! 2t)

t

!1 > !2

Figura 6.9. Comparaci´ on entre dos funciones seno de diferente frecuencia.

variaciones m´as r´apidas en el tiempo y se aproxima, poco a poco, a las discontinuidades abruptas que la funci´on f (t) tiene en puntos espec´ıficos.

k

àk

t [s]

Figura 6.10. Diferentes aproximaciones de la funci´ on f (t) presentada en la 4k figura 6.7. L´ ınea continua f (t) = sin(t). L´ ınea interrumpida f2¢(t) = 1 π ¢ ¡ ¡ 4k sin(t) + 13 sin(3t) . Linea-punto f3 (t) = 4k sin(t) + 31 sin(3t) + 15 sin(5t) . π π

6.1 Un circuito RC de corriente alterna

305

Ruido El ruido es una se˜ nal indeseable que var´ıa r´apidamente. Esto significa que el ruido tiene componentes de frecuencia muy grandes. Componentes de frecuencia cero Una se˜ nal de frecuencia cero es una se˜ nal constante. Esto se puede concluir partir de lo siguiente: Au cos(ωt) = Au = constante,

si ω = 0

Entonces, usando t´erminos propios de las ingenier´as el´ectrica y electr´onica, una se˜ nal f (t) que contiene una componente de frecuencia cero es una se˜ nal que tiene una componente de CD. Esto significa que si f (t) presenta variaciones entonces estas se realizan alrededor de un valor constante diferente de cero. 6.1.4. Relaci´ on entre la respuesta en la frecuencia y en la respuesta en el tiempo De acuerdo a lo expuesto en la secci´on previa se concluye lo siguiente: Considere el sistema en (6.13). Si vi (t) = A es una se˜ nal constante, es decir de frecuencia cero ω = 0, entonces la salida correspondiente, en estado estacionario, es v0 (t) = A|G(j0)| = A (v´eanse (6.14) y (6.15)), porque |G(j0)| = |G(jω)|ω=0 = 1 y φ = 0 cuando ω = 0 (v´ease (6.9)). Es interesante darse cuenta que esto tambi´en se cumple, en estado estacionario, cuando a un sistema de control se le aplica una entrada tipo escal´on. En la secci´on 3.8 se muestra que si vi (t) es un escal´on de altura A entonces el valor final (en estado estacionario) de la salida se calcula usando el teorema del valor final, es decir: l´ım v0 (t) = l´ım sV0 (s) = l´ım sG(s)

t→∞

s→0

s→0

A = G(0)A s

donde es importante observar que que si s = σ + jω → 0 tambi´en se tiene que ω → 0. En la siguiente secci´on se explica que estos resultados tambi´en se pueden generalizar al caso en que G(s) es una funci´on de transferencia arbitraria de orden n. Por tanto, se puede afirmar que dada una funci´on de transferencia G(s), la cantidad |G(jω)|ω=0 representa: i) la relaci´on entre la entrada y la salida cuando la entrada es constante, o bi´en ii) la relaci´on entre la entrada y la salida, en estado estacionario, cuando la entrada es un escal´on. N´otese que en una funci´on de transferencia arbitraria no se cumple, en general, que G(0) = 1.

306

6 Dise˜ no usando la respuesta en frecuencia

Considere el sistema en (6.13). Las componentes de alta frecuencia que contiene la entrada vi (t) son fuertemente atenuadas, es decir casi no tienen efecto sobre la salida v0 (t), porque |G(jω)| → 0 conforme ω → ∞ (v´ease (6.14), (6.15) y (6.8)). De nuevo, este resultado puede extenderse al caso de una funci´on de transferencia arbitraria G(s) de orden n que cumpla que |G(jω)| → 0 conforme ω → ∞. Esta condici´on tiene dos consecuencias importantes: i) Suponga que vi (t) es un escal´on. Tal como se menciona en la secci´on previa, las componentes de alta frecuencia son las que generan la discontinuidad que tiene esta funci´on en t = 0. Como el efecto de estas componentes es fuertemente atenuado, entonces la salida v0 (t) no presentar´a ninguna discontinuidad en t = 0 (v´ease la figura 3.1 en el cap´ıtulo 3). ii) El efecto del ruido sobre la salida es fuertemente atenuado. La rapidez de respuesta del sistema en (6.13) se incrementa al aumentar el par´ametro a > 0. Esto se concluye del siguiente modo. Se ha mencionado que la rapidez de una se˜ nal se incrementa al aumentar su contenido de frecuencias mayores. Por tanto, la rapidez de respuesta del sistema en (6.13) se puede incrementar si v0 (t) tiene una mayor contribuci´on de componentes de frecuencias mayores. En la figura 6.11 se muestra que el valor de |G(jω)| puede incrementarse para frecuencias mayores si se usa un valor m´as grande de a. Esto se comprueba con lo expuesto en la secci´on 3.1 del cap´ıtulo 3 donde se explica que la rapidez de un sistema con funci´on de transferencia G(s) = a/(s + a) se incrementa al aumentar el valor de a. jG (j!)j 1

1=

p

2

0

a1

a2

!

a Figura 6.11. Un valor mayor de a en el sistema s+a permite un mayor efecto de las frecuencias intermedias y, por tanto, una mayor rapidez de respuesta en el tiempo.

Es importante subrayar que se busca incrementar la contribuci´on de frecuencias mayores pero no aquellas que son demasiado elevadas (ω → ∞) las cuales acentuar´ıan el efecto del ruido. Con el fin de resaltar esta ca-

6.2 Sistemas arbitrarios de orden n

307

racter´ıstica, se usa el t´ermino “frecuencias intermedias” para referirse a aquellas frecuencias que se utilizan para mejorar la rapidez de respuesta. Esta idea puede extenderse al caso de una funci´on de transferencia arbitraria G(s) de orden n, indicando que su rapidez de respuesta es mayor conforme sus polos se colocan m´as lejos del origen.

6.2.

Sistemas arbitrarios de orden n

Los conceptos presentados en la secci´on 6.1 se han realizado considerando la funci´on de transferencia en (6.13). Esto se ha hecho con el prop´osito de explicar de manera sencilla los conceptos introducidos ah´ı. En la presente secci´on se muestra que todas las ideas expuestas en la secci´on 6.1 tambi´en pueden generalizarse al caso de sistemas lineales arbitrarios de orden n. Considere la funci´on de transferencia arbitraria de orden n: Y (s) E(s) = G(s) = U (s) N (s)

(6.16)

N (s) = sn + an−1 sn−1 + · · · + a1 s + a0 E(s) = b0 + b1 s + · · · + bm sm ω donde n ≥ m y u(t) = A sin(ωt), por lo que U (s) = A s2 +ω 2 . Sustituyendo U (s) en (6.16) y usando expansi´on en fracciones parciales:

Y (s) = G(s)A

ω Cs + D = Yn (s) + 2 s2 + ω 2 s + ω2

(6.17)

donde Yn (s) = L{yn (t)} es la respuesta natural la cual, de acuerdo al cap´ıtulo 3, satisface l´ımt→∞ yn (t) = 0 si G(s) es estable. Con el fin de facilitar la exposici´on se supone que G(s) no tiene polos en s = ±jω. Multiplicando ambos miembros de (6.17) por el factor s2 + ω 2 y evaluando en s = jω se encuentra: ωAG(jω) = jωC + D Igualando partes reales e imaginarias se obtiene: C = AIm(G(jω)),

D = ωARe(G(jω))

donde G(jω) = Re(G(jω)) + jIm(G(jω)). Por tanto: s ω Cs + D = AIm(G(jω)) 2 + ARe(G(jω)) 2 2 2 2 s +ω s +ω s + ω2 Usando los pares transformados: L{cos(ωt)} =

s , s2 + ω 2

L{sin(ωt)} =

ω s2 + ω 2

308

6 Dise˜ no usando la respuesta en frecuencia

se obtiene: L−1

½

Cs + D s2 + ω 2

¾

= A[Im(G(jω)) cos(ωt) + Re(G(jω)) sin(ωt)]

Usando la figura 6.12 se encuentra que: ¾ ½ Cs + D = A|G(jω)| [sin(φ) cos(ωt) + cos(φ) sin(ωt)] L−1 s2 + ω 2 = B sin(ωt + φ), B = A|G(jω)|, ¶ µ Im(G(jω)) , φ = atan Re(G(jω)) q |G(jω)| = Re2 (G(jω)) + Im2 (G(jω))

(6.18)

Entonces, de acuerdo a (6.17) se encuentra que:

2

j! ) G( ( p Re

)+

Im

) (j! (G

)

Im (G (j!) )

2

þ

Re (G (j!) )

Figura 6.12. Tri´ angulo definido por la fase φ.

y(t) → A|G(jω)| sin(ωt + φ) conforme t → ∞ si G(s) es estable. Por tanto, si la entrada u(t) de un sistema lineal G(s) de orden n es una funci´on seno, entonces la salida y(t) tambi´en es, en estado estacionario, una funci´on seno de la misma frecuencia pero con una amplitud y una fase que son, en general, diferentes a la amplitud y a la fase de la entrada. La relaci´on entre la amplitud de la entrada y la amplitud de la salida a la frecuencia ω se puede calcular como: B = |G(jω)| A y se conoce como magnitud de la funci´on de transferencia mientras que la diferencia de fase entre la entrada y la salida est´a dada por φ en (6.18) y se conoce como fase de la funci´on de transferencia. Este resultado es id´entico al

6.3 Gr´ aficas polares y de Bode

309

encontrado en la secci´on 6.1. Por tanto, todas las afirmaciones realizadas para G(s) en esa secci´on son v´alidas cuando G(s) es una funci´on de transferencia arbitraria de orden n. Entonces, se est´a en posici´on de afirmar lo siguiente: Por respuesta en frecuencia debemos entender, la descripci´on de: C´omo var´ıa el cociente de la amplitud de la se˜ nal de salida entre la amplitud de la se˜ nal de entrada cuando se var´ıa la frecuencia de la se˜ nal de entrada. C´omo var´ıa el defasaje entre la se˜ nal de entrada y la se˜ nal de salida cuando se var´ıa la frecuencia de la se˜ nal de entrada Estas dos cracter´ısticas son muy importantes, pues permiten determinar de manera exacta la manera en que responde un sistema de control: respuesta transitoria (rapidez y oscilaciones) y respuesta en estado estacionario. Adem´as, tal como se muestra en las secciones subsecuentes, tambi´en se pueden establecer m´etodos que permiten determinar la estabilidad de un sistema en lazo cerrado. En este sentido es importante mencionar que todas las ideas expuestas en las secciones 6.1 y 6.2 tambi´en pueden ser extendidas a funciones de transferencia inestables: s´olo hay que recordar que, aunque en tal caso la respuesta natural no desaparece al crecer el tiempo, la respuesta forzada es una sinusoide si la entrada tambi´en lo es.

6.3.

Gr´ aficas polares y de Bode

Un concepto importante en gr´aficas de Bode es el denominado “d´ecada” cuya abreviaci´on es “dec”. En gr´aficas de Bode es de mucho inter´es analizar la frecuencia ω por d´ecadas. Una d´ecada representa un incremento de diez veces en el valor de la frecuencia. Por ejemplo si ω1 = 2.5 y ω2 = 25 entonces se dice que hay una d´ecada entre ω1 y ω2 . La funci´on de transferencia arbitraria de orden n definida en (6.16) se puede escribir como: Qj=m bm j=1 (s − zj ) G(s) = Qi=n i=1 (s − pi )

(6.19)

donde zj , j = 1, . . . , m, son los ceros de G(s) y pi , i = 1, . . . , n, son los polos de G(s). Dado que los polos y los ceros pueden ser reales o complejos conjugados entonces las gr´aficas polares y de Bode de G(s) siempre pueden construirse a partir del conocimiento de las gr´aficas polares y de Bode de los siguientes factores fundamentales de primero y segundo orden: s+a 1 , , s a s2 + 2ζωn s + ωn2 , ωn2

s,

a , s+a ωn2 2 s + 2ζωn s + ωn2

(6.20)

310

6 Dise˜ no usando la respuesta en frecuencia

por esta raz´on, en las figuras 6.13, 6.14, 6.15 y 6.16 se presentan las gr´aficas de Bode y polares de estos factores. Recu´erdese que las gr´aficas de Bode de magnitud son curvas que representan la cantidad: 20 log (|G(jω)|) como funci´on de la frecuencia ω. Las gr´aficas de Bode de fase son curvas que representan la cantidad: µ ¶ Im(G(jω)) φ = atan Re(G(jω)) como funci´on de la frecuencia ω. Por otro lado, cada punto de las gr´aficas polares representa la cantidad: G(jω) = Re(G(jω)) + jIm(G(jω)) = |G(jω)|∠φ Las flechas que aparecen en las gr´aficas polares siempre apuntan en el sentido en el que la frecuencia crece, es decir, desde ω = −∞ pasando por ω = 0 hasta ω = +∞. El lector puede recurrir a [3], [4] si desea conocer el m´etodo detallado que se utiliza normalmente para obtener las gr´aficas mostradas en las figuras 6.13, 6.14, 6.15 y 6.16. Las l´ıneas gruesas en las gr´aficas de Bode de las figuras 6.13 y 6.14 se conocen como as´ıntotas, mientras que las l´ıneas finas representan el valor exacto de las funciones representadas. Las as´ıntotas s´olo son aproximaciones que, sin embargo, son de mucha utilidad para reconocer la forma fundamental de las gr´aficas de Bode correspondientes. N´otese que en algunas de las gr´aficas de Bode de magnitud las as´ıntotas forman una esquina. La frecuencia a la cual ocurre dicha esquina se conoce como “frecuencia de esquina” y est´a directamente relacionada con el cero o el polo del factor de primero o segundo orden que se representa. Recu´erdese que, de acuerdo a la secci´on 3.3, ωn es la distancia medida desde la ra´ız correspondiente (polo o cero) hasta el origen y que p las ra´ıces de un factor de segundo orden est´an dadas como s = −ζωn ± jωn 1 − ζ 2 . De acuerdo a lo que describen las as´ıntotas, para frecuencias menores a la frecuencia de esquina la magnitud de todos los factores en (6.20) (a excepci´on de s y 1/s) es de 0[dB], pero para frecuencias mayores que la frecuencia de esquina la magnitud crece (ceros) o disminuye (polos) con una rapidez de ±20[dB/dec] para los factores de primer orden y de ±40[dB/dec] para los factores de segundo orden. N´otese que en el caso de los factores de segundo orden, el comportamiento de la curva exacta cerca de la frecuencia de esquina depende fuertemente del factor de amortiguamiento ζ. De hecho, si ζ < 0.7071, alrededor de la frecuencia de esquina existe un m´aximo de magnitud cuyo valor crece hacia el infinito conforme ζ tiende a cero. Este m´aximo de magnitud se conoce como pico de resonancia y su valor se representa por Mr .

6.3 Gr´ aficas polares y de Bode

311

jG(j!)j [dB]

pendiente : à 20 dB=dec

G(j!) [grados]

0:1

10 ! [rad=s]

1

(a) G(s) =

1 s

jG(j!)j [dB]

pendiente : + 20 dB=dec

G(j!) [grados]

0:1

10 ! [rad=s]

1

(b) G(s) = s

jG(j!)j [dB]

pendiente : à 20 dB=dec

G(j!) [grados] ï à 45

0:01a

0:1a

(c) G(s) =

a

10a

100a ! [rad=s]

a s+a

Figura 6.13. Gr´ aficas de Bode de los factores de primero y segundo orden en (6.20).

312

6 Dise˜ no usando la respuesta en frecuencia jG(j!)j [dB]

pendiente : + 20 dB=dec

G(j!) [grados] ï + 45

0:01a

a

0:1a

0:3

[dB]

0:7

ð = 0:1

0:9

pendiente : à 40 dB=dec

2

G(j!)

100a ! [rad=s]

s+a a

(a) G(s) = jG(j!)j

10a

ð = 0:1 0:5 0:3

[grados]

ï à 90

0:9 2 0:7

!n

0:1! n

(b) G(s) =

10! n ! [rad=s]

2 ωn 2 s2 +2ζωn s+ωn

jG(j!)j [dB]

pendiente : + 40dB=dec

2

0:9 0:7 0:3

ð = 0:1

G(j!) [grados]

0:7

0:9 2

ï+ 90

0:5

0:3

ð = 0:1 !n

0:1! n

(c) G(s) =

10! n ! [rad=s]

2 s2 +2ζωn s+ωn 2 ωn

Figura 6.14. Gr´ aficas de Bode de los factores de primero y segundo orden en (6.20) (cont.).

6.3 Gr´ aficas polares y de Bode

313

Im (G(j!))

! ! 0à

ï

! ! à1

Re (G(j!))

! ! +1

! ! 0+

(a) G(s) =

1 s

Im (G(j!)) ! ! +1

ï

!=0

Re (G(j!))

! ! à1

(b) G(s) = s Im (G(j!))

ï

! ! à1

ï !=0

! ! +1

(c) G(s) =

Re (G(j!))

a s+a

Figura 6.15. Gr´ aficas polares de los factores de primero y segundo orden en (6.20).

314

6 Dise˜ no usando la respuesta en frecuencia Im (G(j!)) ! ! +1

! = 0ï

Re (G(j!))

! ! à1

(a) G(s) =

s+a a

Im (G(j!))

ð = 0:1

0:3 0:5

0:7 2 à1 0:9 ! ! ï ! ! +1

(b) G(s) =

ï

!=0

Re (G(j!))

2 ωn 2 s2 +2ζωn s+ωn

Figura 6.16. Gr´ aficas polares de los factores de primero y segundo orden en (6.20) (cont.).

En cuanto a las gr´aficas de Bode de fase se puede decir lo siguiente. Cada factor de primer orden introduce una fase que va de cero hasta +90 grados (ceros) o hasta −90 grados (polos). Cada factor de segundo orden introduce una fase que va de cero hasta +180 grados (ceros) o hasta −180 grados (polos). En todos los casos, cuando la frecuencia es igual a la frecuencia de esquina la fase es igual a la mitad del rango correspondiente. De nuevo, en el caso de factores de segundo orden y alrededor de la frecuencia de esquina, la curva de fase depende fuertemente del factor de amortiguamiento ζ: la fase cambia m´as r´apidamente entre 0 y ±180 grados conforme ζ tiende a cero. Es importante observar que si el factor en (6.20) contiene ceros, entonces las gr´aficas polares y de Bode correspondientes muestran que dicho factor se comporta como un filtro pasa altas y que esto va acompa˜ nado de un adelanto de fase, es decir el factor contribuye con fase positiva. Esta observaci´on es im-

6.3 Gr´ aficas polares y de Bode

315

portante porque significa que los ceros de una funci´on de transferencia tienden a incrementar el efecto que el ruido tiene sobre un sistema de control. Esto implica que el uso de una ganancia derivativa excesivamente grande en un controlador PD o PID puede resultar en un sistema de control cuyo desempe˜ no se ve deteriorado. Para entender esto obs´ervese que un controlador PD introduce un cero de lazo abierto mientras que un controlador PID introduce dos ceros de lazo abierto. Por otro lado, tal como se menciona en la secci´on 5.1.1, un cero de lazo abierto tiende a mejorar la estabilidad de un sistema de control en lazo cerrado. As´ı que al dise˜ nar un sistema de control se debe de tratar de establecer un compromiso entre estabilidad y deterioro del desempe˜ no por efectos del ruido. En la secci´on 6.6 se explica que el efecto estabilizante de un cero de lazo abierto se debe al adelanto de fase que introduce en la respuesta en frecuencia de la funci´on de transferencia de lazo abierto. Por otro lado, si el factor en (6.20) contiene polos, entonces las gr´aficas polares y de Bode correspondientes muestran que dicho factor se comporta como un filtro pasa bajas y que esto va a compa˜ nado de un atraso de fase, es decir el factor contribuye con fase negativa. Esto significa que los polos de una funci´on de transferencia reducen el efecto del ruido. Por otro lado, tal como se menciona en la secci´on 5.1.1, un polo de lazo abierto tiende a deteriorar la estabilidad de un sistema de control en lazo cerrado. En la secci´on 6.6 se explica que este efecto se debe al atraso de fase que un polo introduce en la respuesta en frecuencia de la funci´on de transferencia de lazo abierto. Las gr´aficas de respuesta en frecuencia de la funci´on de transferencia arbitraria de orden n definida en (6.19) se obtiene mediante la combinaci´on de los factores en (6.20). En el caso de las gr´aficas de Bode este proceso de combinaci´on de factores de primero y segundo orden es muy sencillo, como se explica a continuaci´on. N´otese que la funci´on de transferencia arbitraria de orden n, G(s), dada en (6.19) se puede escribir como: G(s) = β

k=r Y

Gk (s)

k=1

para alguna constante real β y alg´ un n´ umero entero positivo r, donde Gk (s), para k = 1, . . . , r, tiene la forma de uno de los factores presentados en (6.20). Entonces: ¯ k=r ¯ k=r ¯ Y ¯ Y ¯ ¯ |G(jω)| = ¯β Gk (jω)¯ = |β| |Gk (jω)| ¯ ¯ k=1

k=1

De acuerdo a esto, a la definici´on de decibeles |G(jω)|dB = 20 log(|G(jω)|) y a la propiedad log(xy) = log(x) + log(y) presentada en (6.2) se puede escribir: |G(jω)|dB = 20 log(|β|) +

k=r X

k=1

20 log(|Gk (jω)|)

316

6 Dise˜ no usando la respuesta en frecuencia

Esto significa que la gr´afica de Bode de magnitud (y la gr´afica de Bode de fase) de una funci´on de transferencia arbitraria de orden n, G(s), siempre se puede obtener como la suma de las gr´aficas de Bode de magnitud (y de las gr´aficas de Bode de fase) de todos los factores de primero y de segundo orden de G(s)1 . N´otese, sin embargo, que esto no es cierto para las gr´aficas polares donde se deber´a realizar el producto de las magnitudes y la suma de las fases de todos los factores de primero y segundo orden de G(s). Para simplificar este procedimiento se recomienda obtener primero las gr´aficas de Bode y a partir de ellas obtener la informaci´on requerida para dibujar las gr´aficas polares correspondientes. En la siguiente secci´on se presentan algunos ejemplos de aplicaci´on de estas ideas. Ejemplo 6.1 (Resonancia). Sea el sistema masa-resorte-amortiguador mostrado en la figura 6.17. La funci´ on de transferencia es en este caso igual a la del ejemplo 3.6 del cap´ıtulo 3, es decir: kωn2 X(s) = G(s)F (s), G(s) = 2 s + 2ζωn s + ωn2 r 1 b K , k= ωn = , ζ= √ m K 2 mK donde x = 0 se define como la posici´ on en la cual el sistema alcanza el reposo cuando f (t) = 0 y bajo el efecto del peso de la masa y el resorte. La disposici´ on de la figura 6.17 es equivalente a la de un autom´ ovil que se encuentra en reposo sobre el suelo: m representa la masa del autom´ ovil, K representa la rigidez del sistema de suspensi´ on y b representa el efecto de los amortiguadores. La experiencia cotidiana nos ha ense˜ nado que, aunque es muy pesado, un auto peque˜ no puede ser volteado por unas pocas personas si las personas lo someten a una fuerza como la siguiente. Se empuja el auto hacia arriba y se le suelta para que despu´es de rebotar abajo se le vuelve a aplicar la misma fuerza hacia arriba cuando el auto se encuentra movi´endose hacia arriba. Aunque la fuerza aplicada cada vez es peque˜ na como para voltear al auto, sin embargo, despu´es de aplicar esta misma acci´ on varias veces se consigue voltear el auto. Este es un ejemplo claro de lo que puede conseguirse cuando se somete un autom´ ovil a resonancia y a continuaci´ on se analiza dicha situaci´ on. La fuerza que es aplicada por las personas tiene una forma peri´ odica que tiene una componente fundamental con forma de onda coseno. Cuando esta fuerza es positiva se empuja al auto hacia arriba, cuando es negativa se deja caer el auto. El hecho de aplicar fuerza s´ olo cuando el auto se mueve hacia arriba implica que esta componente cosenoidal tiene una frecuencia ω que es igual a la frecuencia natural de oscilaci´ on del auto ωn . Si se supone que no hay amortiguadores entonces b = 0, lo cual implica que ζ = 0. De acuerdo a la figura 6.14(b), bajo esta situaci´ on la salida x(t) (posici´ on del 1

Recu´erdese que dados tres n´ umeros complejos z, x, y tales que z = xy, la fase de z es igual a la suma de las fases de x y de y

6.3 Gr´ aficas polares y de Bode

317

f x

m

K

b

Figura 6.17. Suspensi´ on de un autom´ ovil.

auto) est´ a atrasada 90◦ respecto de la fuerza aplicada. Esto significa que si f (t) = A cos(ωt) entonces x(t) = B sin(ωt), para alguna constante B positiva, si ω = ωn . Entonces, de acuerdo a la figura 6.18, se aplica una fuerza m´ axima (f tiene una cresta) justo cuando el auto se est´ a moviendo hacia arriba (x est´ a pasando de un valle a una cresta), lo cual est´ a en completo acuerdo con la aplicaci´ on intuitiva de fuerza por parte de las personas. Adem´ as si ω = ωn y ζ = 0 la amplitud B de la osiclaci´ on descrita por el auto crecer´ a sin l´ımite a´ un cuando la amplitud de la fuerza de entrada A sea peque˜ na (B = |G(ωn )|A y |G(ωn )| → ∞) por lo que finalmente el auto podr´ a ser volteado. Ahora se presentar´ a una explicaci´ on desde el punto de vista de la f´ısica que ayude a entender porqu´e sucede esto. La energ´ıa del sistema est´ a dada como la suma de la energ´ıa cin´etica m´ as la energ´ıa potencial: E = E c + Ep , 1 1 Ec = mx˙ 2 , Ep = Kx2 2 2 El efecto de la gravedad no se toma en consideraci´ on porque se ha supuesto que x = 0 es la posici´ on en la que el cuerpo alcanza el reposo cuando f = 0 bajo el efecto de la gravedad y del resorte. Conforme el tiempo transcurre la variaci´ on de esta energ´ıa est´ a dada como: E˙ = E˙ c + E˙ p = mx¨ ˙ x + Kxx˙ Utilizando el modelo para calcular x ¨, es decir: x ¨=− se obtiene que:

K 1 b x˙ − x + f m m m

318

6 Dise˜ no usando la respuesta en frecuencia

f(t) = Acos(! n t) x(t) = Bsin(! n t)

tiempo Figura 6.18. Fuerza aplicada y posici´ on resultante cuando se somete a resonancia el cuerpo de la figura 6.17.

E˙ = −bx˙ 2 + xf ˙ Consid´erense dos casos: 1.

ζ = 0, f = A cos(ωn t). En este caso b = 0 y de acuerdo a la figura 6.14(b), la salida x(t) est´ a atrasada 90◦ respecto de la fuerza aplicada, es decir x(t) = B0 sin(ωn t) y x˙ = ωn B0 cos(ωn t) para alguna B0 positiva y, entonces: E˙ = xf ˙ = ωn AB0 cos2 (ωn t) Por lo que la energ´ıa de la masa crece sin l´ımite conforme el tiempo aumenta porque, dado que cos2 (ωn t) ≥ 0 para todo t: Z t B0 cos2 (ωn r)dr → ∞, cuando t → ∞ E = ωn A 0

2.

Como E = Ec + Ep con x(t) y x˙ sinusoidales entonces la amplitud de estas oscilaciones crece sin l´ımite tambi´en, tal como lo describe la figura 6.14(b). ζ > 0, f = A cos(ωn t). En este caso b > 0 y de acuerdo a la figura 6.14(b), la salida x(t) converge (despu´es de que la respuesta natural se hace despreciable) a una funci´ on que est´ a atrasada un a ´ngulo igual a 90◦ respecto de la fuerza aplicada, es decir x(t) = B0 sin(ωn t) y x˙ = ωn B0 cos(ωn t) para alguna B0 positiva y, entonces:

6.4 Gr´ aficas de respuesta en frecuencia. Ejemplos

319

E˙ = −bx˙ 2 + xf ˙ = −bωn2 B02 cos2 (ωn t) + ωn AB0 cos2 (ωn t) Por tanto, la energ´ıa de la masa est´ a dada como: Z t [−bωn2 B02 cos2 (ωn r) + ωn AB0 cos2 (ωn r)]dr E= 0 Z t [−bωn2 B02 + ωn AB0 ] cos2 (ωn r)dr =

(6.21)

0

on sea peque˜ na se cumplir´ a que Mientras la amplitud B0 de la posici´ −bωn2 B02 + ωn AB0 > 0 y, por tanto, la energ´ıa E y la amplitud B0 aumentan. Entonces B0 aumentar´ a hasta que −bωn2 B02 + ωn AB0 < 0 porque A es constante. En ese momento, la energ´ıa deja de aumentar y se obtiene un estado estacionario cuando bωn2 B 2 = ωn AB, es decir, la amplitud de la posici´ on B permanece constante en un valor finito dado como: B=

A A A kA q = = √ = bωn 2ζK 2ζ 2ζ mK K m

(6.22)

N´ otese que la amplitud de la posici´ on B crece sin l´ımite conforme ζ tiende a cero, lo cual est´ a en completo acuerdo con la figura 6.14(b) y al mismo tiempo explica porqu´e el pico de resonancia disminuye conforme aumenta ζ. En este sentido, obs´ervese que el t´ermino −bx˙ 2 ≤ 0 si b > 0 (es decir, si ζ > 0). Esto representa la energ´ıa que se disipa en forma de calor por motivos de rozamiento (fricci´ on). As´ı que la fricci´ on es la que evita que la energ´ıa y, por tanto, la amplitud de las oscilaciones crezcan sin l´ımite. Se puede afirmar que mientras m´ as rozamiento haya un mayor porcentaje de la energ´ıa suministrada a la masa mediante la fuerza f se convierte en calor y es menos la energ´ıa que se almacena en la masa y por ello la menor amplitud de las oscilaciones. k , lo cual est´ a en completo acuerFinalmente n´ otese que |G(jω)|ω=ωn = 2ζ do con (6.22). Tambi´en es importante recordar que el pico de resonancia ocurre a una frecuencia ligeramente diferente a ωn cuando ζ > 0. Sin embargo, la magnitud de la funci´ on de transferencia en ω = ωn tambi´en crece cuando ζ se aproxima a cero.

6.4. 6.4.1.

Gr´ aficas de respuesta en frecuencia. Ejemplos Ejemplo 1

Considere la siguiente funci´on de transferencia: Gd (s) =

s + T1 1 , s + ξT

0 < ξ < 1,

T >0

(6.23)

320

6 Dise˜ no usando la respuesta en frecuencia

De acuerdo a las propiedades en (6.2) la gr´afica de Bode de magnitud (en dB) de Gd (s) en (6.23) se obtiene como la suma de las gr´aficas de Bode de magnitud de dos factores de primer orden: Gd (s) =

1 T 1 ξT

s+ 1 T

1 ξT

1 T

s+

(6.24)

1 ξT

1 la cual es mayor que la El polo tiene una frecuencia de esquina en ω = ξT 1 frecuencia de esquina del cero ω = T porque 0 < ξ < 1. Este hecho determina que Gd (s) introduzca un adelanto de fase y que tenga las caracter´ısticas de un filtro pasa altas: las frecuencias bajas son atenuadas pero las frecuencias altas no. El adelanto de fase m´aximo producido y la atenuaci´on a bajas frecuencias dependen s´olamente de la constante ξ, es decir de la separaci´on existente entre las frecuencias de esquina del polo y del cero. Estas observaciones pueden apreciarse en la figura 6.19 donde se muestran las gr´aficas de Bode de Gd (s) y de los factores que la componen.

dB

ii) iv)

0

1 T

1 øT

i)

!

iii)

fase [grados] + 90

ii) 0

à 90

iv)

1 T

1 øT

!

iii)

Figura 6.19. Gr´ aficas de Bode para el ejemplo 1 (v´ease (6.24)): i) 0 < 1 s+ T 1 T

, iii)

1 ξT 1 s+ ξT

1 T 1 ξT

< 1, ii)

, iv) Gd (s).

La funci´on de transferencia en (6.23) es muy u ´til para dise˜ nar un tipo especial de controladores que reciben el nombre de compensadores de adelanto.

6.4 Gr´ aficas de respuesta en frecuencia. Ejemplos

321

Esta aplicaci´on, sin embargo, es facilitada si se utilizan algunas manipulaciones algebraicas: Gd (T s) =

Ts + 1 T s + 1ξ

Al hacer el cambio de variable s = jω se obtiene: Gd (jωT ) =

jωT + 1 jωT + 1ξ

Las gr´aficas de Bode se pueden obtener f´acilmente al descomponer esta expresi´on en los factores de primer orden que la componen: Gd (jωT ) =

jωT + 1 1/ξ ξ 1 jωT + 1ξ

considerando que el producto ωT es la variable que se usa como variable independiente, es decir en el eje horizontal de la figura 6.20. Aqu´ı se muestran las gr´aficas de Bode de Gd (s) para diferentes valores de 0 < ξ < 1. Por otro lado, la gr´afica polar de Gd (T s) se puede obtener f´acilmente utilizando la informaci´on proporcionada por las gr´aficas de Bode en la figura 6.19. Para esto se debe recordar que la gr´afica de Bode de magnitud est´a en dB pero la gr´afica polar no. Se deben observar la magnitud y la fase para las frecuencias cero e infinito para dibujar en la gr´afica polar trazos que representen los comportamientos correspondientes. Luego se dibujan trazos que representen, aproximadamente, los comportamientos a las frecuencias intermedias y que satisfagan los trazos correspondientes a las frecuencias cero e infinito. Finalmente, las gr´aficas polares para frecuencias negativas, es decir desde ω = −∞ hasta ω = 0 son las im´agenes al espejo de las gr´aficas para frecuencias positivas. Compare la gr´afica polar mostrada en la figura 6.21 y las gr´aficas de Bode en la figura 6.19. 6.4.2.

Ejemplo 2

Considere la funci´on de transferencia: G(s)H(s) =

Ax γk ρ s + a s3

(6.25)

donde las constantes Ax , γ, k, a, ρ son todas positivas. Descomponiendo esta funci´on de transferencia en los factores fundamentales que la forman se puede escribir: G(s)H(s) =

1 ρAx γk a a s + a s3

De acuerdo a las propiedades en (6.2), la gr´afica de Bode de magnitud del factor s13 es una linea recta de pendiente igual a −60[dB/dec]. En la figura

322

6 Dise˜ no usando la respuesta en frecuencia 0:9 0:7 0:4

0:2

ø = 0:14

ø = 0:14 0:2

0:4 0:7 0:9 0:01

0:1

1

10

100

!T 1000

Figura 6.20. Gr´ aficas de Bode para Gd (s) en (6.23).

Im (G d (j! ))

0

ï

ø !=0

1 ! ! +1 ï ! ! à1

Re (G d (j! ))

Figura 6.21. Gr´ afica polar de Gd (s) en (6.23).

6.22 se presentan las gr´aficas de Bode de G(s)H(s), as´ı como de los factores que la componen. Tal como se explica en el ejemplo previo, la gr´afica polar de la figura 6.23 se puede obtener f´acilmente a partir de las gr´aficas de Bode la figura 6.22. 6.4.3.

Ejemplo 3

Siguiendo procedimientos como los descritos en los dos ejemplos previos se pueden obtener las gr´aficas polares y de Bode de las siguientes funciones de transferencia:

6.4 Gr´ aficas de respuesta en frecuencia. Ejemplos

dB ii) 0

323

i)

a 1

!

iii) iv)

fase [grados]

a

0 à 90 à 180

!

iii)

ii)

à 270

iv)

à 360

Figura 6.22. Gr´ aficas de Bode de G(s)H(s) definida en (6.25): i) a , iv) G(s)H(s). iii) s+a

Im (G (j! ) H (j! ) )

ρAx γk , a

ii)

1 , s3

! = 0+

!! +1 !! à1

Re (G (j! ) H (j! ) )

! = 0à Figura 6.23. Gr´ afica polar de G(s)H(s) en (6.25).

s+b k ρ s + c s(s + a) s2 αkAθ Ax γ s + b ρ G(s)H(s) = Aθ s + c s2 + (a + kv kAθ )s + αkAθ s2 G(s)H(s) = Ax γ

(6.26) (6.27)

324

6 Dise˜ no usando la respuesta en frecuencia

donde Ax , Aθ , γ, k, a, ρ, b, c, α, kv son constantes positivas. Las gr´aficas correspondientes se muestran en las figuras 6.24, 6.25, 6.26 y 6.27.

dB

0

ii) b v)

c

1

i)

a iii)

iv)

!

vi)

fase [grados] + 90 0 à 90 à 180

b

v) c

a iv)

!

iii)

ii) vi)

à 270

à 360

Figura 6.24. Gr´ aficas de Bode de G(s)H(s) en (6.26): i) c iv) s+c , v) s+b , vi) G(s)H(s). b

Im (G (j! ) H (j! ) )

Ax γbkρ , ac

! = 0+

!! +1 !! à1

Re (G (j! ) H (j! ) )

! = 0à

Figura 6.25. Gr´ afica polar de G(s)H(s) en (6.26).

ii)

1 , s3

iii)

a , s+a

6.5 Criterio de estabilidad de Nyquist

325

dB

ii) b v)

0

1

c

iv)

p

i)

ëkA ò

iii)

!

vi)

fase [grados] + 90

v)

0 à 90 à 180

c

b

iv)

p

ëkA ò iii)

ii)

à 270

vi)

à 360

Figura 6.26. Gr´ aficas de Bode de G(s)H(s) en (6.27): i) αkAθ s2 +(a+kv kAθ )s+αkAθ

, iv)

!

c , s+c

v)

s+b , b

Ax γbρ , Aθ c

ii)

1 , s2

iii)

vi) G(s)H(s).

Im (G (j! ) H (j! ) )

! = 0à ! = 0+

!! +1

! ! à 1 Re (G (j! ) H (j! ) )

Figura 6.27. Gr´ afica polar de G(s)H(s) en (6.27).

6.5.

Criterio de estabilidad de Nyquist

En la literatura existente sobre control cl´asico es com´ un utilizar el criterio de Routh como el m´etodo que sirve para determinar si un sistema tiene alguno

326

6 Dise˜ no usando la respuesta en frecuencia

de sus polos en el semiplano derecho. De no ser as´ı entonces todos los polos deben estar en el semiplano izquierdo y entonces se asegura su estabilidad. El criterio de Routh debe aplicarse al polinomio caracter´ıstico del sistema en lazo cerrado y se introduce como el criterio de estabilidad para sistemas de control cuando se estudian desde el punto de vista de su respuesta en el tiempo. El lector puede consultar el cap´ıtulo 4 de la presente obra, o las referencias [3], [4], para mayor informaci´on a cerca del uso del criterio de Routh. Ahora se introduce un nuevo criterio de estabilidad para sistemas de control en lazo cerrado que est´a fundamentado, sin embargo, en la respuesta en frecuencia del mismo sistema pero en lazo abierto. Esta curiosa caracter´ıstica debe ser entendida correctamente pues es frecuente confundirse por completo debido a la siguiente pregunta: ¿Como es posible determinar la estabilidad del sistema en lazo cerrado estudiando la respuesta en frecuencia del sistema en lazo abierto? En esta secci´on se presenta la respuesta a tal pregunta y el criterio que resuelve este problema se conoce como el Criterio de Nyquist. 6.5.1.

Recorridos cerrados alrededor de polos y ceros

Considere la siguiente funci´on de transferencia: G(s) = s − a donde a es cualquier n´ umero constante, real o complejo. N´otese que este sistema s´olo posee un cero en s = a. Considere una trayectoria cerrada Γ trazada sobre el plano s encerrando al cero en s = a y que es recorrida en sentido horario (v´ease la figura 6.28). Cuando G(s) se eval´ ua sobre Γ significa que el argumento s de G(s) toma sucesivamente todos los valores de s que se encuentran sobre Γ . Eval´ uese G(s) sobre Γ : G(s) = l∠θ,

l = |s − a|,

θ = ∠(s − a)

N´otese que s − a puede ser representado como un vector que inicia en a y termina en s. Es f´acil observar que cada vez que el recorrido sobre Γ se completa una vez el ´angulo θ tiene un incremento negativo (sentido horario) de −2π radianes. Por otro lado, como Γ no pasa sobre s = a entonces l > 0 en todo el recorrido. Esto significa que cada que el recorrido horario Γ es completado una vez el vector l∠θ describe una vuelta horaria alrededor del origen. Como G(s) = l∠θ decimos que la vuelta horaria ha sido completada alrededor del origen del plano G(s), es decir, alrededor de G(s) = 0 (v´ease la figura 6.29). A partir de esto no es dif´ıcil ver que si G(s) s´olo tiene m ceros y si Γ encierra por completo a todos esos ceros, entonces cada vez que se completa un recorrido horario sobre Γ se completan m vueltas horarias alrededor del origen del plano G(s). Considere ahora la siguiente funci´on de transferencia:

6.5 Criterio de estabilidad de Nyquist

Im (s) s

l

ò a

È

Re (s)

Figura 6.28. Recorrido cerrado alrededor de un cero.

Im (G (s)) G (s )

l

ò

à 2ù

Re (G (s))

Figura 6.29. Recorrido horario alrededor del origen del plano G(s).

327

328

6 Dise˜ no usando la respuesta en frecuencia

G(s) =

1 s−a

donde a es cualquier n´ umero constante, real o complejo. N´otese que este sistema s´olo posee un polo en s = a. Considere una trayectoria cerrada Γ trazada sobre el plano s encerrando al polo en s = a y que es recorrida en sentido horario (v´ease la figura 6.30). Eval´ uese G(s) sobre Γ : G(s) =

1 1 = ∠ − θ, l∠θ l

l = |s − a|,

θ = ∠(s − a)

N´otese, de nuevo, que s − a puede ser representado como un vector que inicia Im (s) s

l

ò a

È

Re (s)

Figura 6.30. Recorrido cerrado alrededor de un polo.

en a y termina en s. Es f´acil observar que cada vez que el recorrido sobre Γ se completa una vez el ´angulo −θ tiene un incremento positivo (sentido antihorario) de +2π radianes. Por otro lado, como Γ no pasa sobre s = a entonces 1/l > 0 (y es finito) en todo el recorrido. Esto significa que cada vez que el recorrido horario Γ es completado una vez el vector 1l ∠ − θ describe una vuelta antihoraria alrededor del origen. Como G(s) = 1l ∠ − θ decimos que la vuelta antihoraria ha sido completada alrededor del origen del plano G(s), es decir, alrededor de G(s) = 0 (v´ease la figura 6.31). A partir de esto no es dif´ıcil ver que si G(s) s´olo tiene n polos y si Γ encierra por completo a todos esos polos, entonces cada vez que se completa

6.5 Criterio de estabilidad de Nyquist

329

Im (G (s))

+ 2ù

Re (G (s))

àò 1=l

G (s )

Figura 6.31. Recorrido antihorario alrededor del origen del plano G(s).

un recorrido horario sobre Γ se completan n vueltas antihorarias alrededor del origen del plano G(s). 6.5.2.

Trayectoria de Nyquist

R(s) +

G(s)

C(s)

à H(s) Figura 6.32. Sistema en lazo cerrado.

Considere la funci´on de transferencia del sistema en lazo cerrado de la figura 6.32: C(s) G(s) = R(s) 1 + G(s)H(s)

330

6 Dise˜ no usando la respuesta en frecuencia

Si se consigue probar que esta funci´on de transferencia no tiene polos en el semiplano derecho entonces la estabilidad del sistema en lazo cerrado est´a asegurada. La idea es investigar la existencia de tales polos usando una trayectoria cerrada como en la secci´on previa. Suponga que se usa una trayectoria cerrada como la mostrada en figura 6.33, la cual es recorrida en sentido horario. N´otese que esta trayectoria encierra por completo a cualquier polo o cero que G(s) tenga en el semiplano derecho. Esta trayectoria cerrada la funci´on 1+G(s)H(s) se conoce como “Trayectoria de Nyquist”. Suponga que la funci´on de transfeG(s) rencia 1+G(s)H(s) tiene p polos y z ceros en el semiplano derecho. De acuerdo a la secci´on anterior, si se recorre la trayectoria de Nyquist una vez el n´ umeG(s) ser´a igual a ro de vueltas horarias alrededor del origen del plano 1+G(s)H(s) z − p, donde un resultado negativo significa n´ umero de vueltas antihorarias. Suponga que tal n´ umero de vueltas es igual a z, es decir, z − p = z. Esto implicar´ıa que p = 0, es decir, no habr´ıa ning´ un polo de lazo cerrado en el semiplano derecho y por tanto se asegurar´ıa estabilidad del sistema en lazo cerrado. Esta es la idea fundamental detr´as del criterio de Nyquist que se desarrolla a continuaci´on. Sin embargo, algunas sutilezas deben ser consideradas antes. Im (s) +1

r!1 0

Re (s)

à1 Figura 6.33. Trayectoria de Nyquist.

6.5 Criterio de estabilidad de Nyquist

331

El criterio de Nyquist fue desarrollado bajo la siguiente consigna. Dado un sistema en lazo cerrado, la funci´on de transferencia de lazo abierto G(s)H(s) es conocida (planta y controlador) pero la funci´on de transferencia de lazo G(s) cerrado 1+G(s)H(s) es desconocida. Es decir, a´ un cuando los polos y ceros de G(s)H(s) son conocidos, los polos de

G(s) 1+G(s)H(s)

son desconocidos. Si se cono-

G(s) 1+G(s)H(s)

cieran los polos de el problema de estabilidad ya estar´ıa resuelto y cualquier criterio de estabilidad estar´ıa de m´as. Entonces, una de las consignas del criterio de Nyquist es determinar la estabilidad en lazo cerrado a partir del conocimiento de la funci´on de transferencia de lazo abierto s´olamente. G(s) no puede ser evaluada mienLo anterior significa que la funci´on 1+G(s)H(s) tras se hace el recorrido de la trayectoria de Nyquist como se describe en los p´arrafos anteriores. Esto implica que no puede conocerse el n´ umero de vueltas G(s) y, por tanto, dicho m´etodo debe obtenidas al rededor del origen de 1+G(s)H(s) ser modificado. Esto es lo que se hace en las siguientes secciones. 6.5.3.

Polos y ceros

Considere la funci´on de transferencia del sistema en lazo cerrado de la figura 6.32: C(s) G(s) = R(s) 1 + G(s)H(s)

(6.28)

Los polos del sistema en lazo cerrado son los ceros de 1 + G(s)H(s). Recu´erdese que los polos de lazo cerrado son los valores de s que satisfacen 1 + G(s)H(s) = 0. Los polos de G(s)H(s) (polos de lazo abierto) tambi´en son los polos de 1 + G(s)H(s). N´otese que si G(s)H(s) → ∞ entonces 1 + G(s)H(s) → ∞ tambi´en. 6.5.4.

Criterio de Nyquist. Caso especial

Suponga que G(s)H(s) tiene P polos en el semiplano derecho (polos de lazo abierto inestables con parte real positiva), es decir, de acuerdo a la secci´on previa, la funci´on 1+G(s)H(s) tiene P polos en el semiplano derecho. Tambi´en suponga que la funci´on 1 + G(s)H(s) tiene Z ceros en el semiplano derecho (polos de lazo cerrado inestables). Suponga que, una vez que se recorre en sentido horario la trayectoria de Nyquist, se obtienen N vueltas alrededor del origen del plano 1 + G(s)H(s), es decir N = Z − P . Si N = −P < 0 es decir, si se consiguen P vueltas antihorarias alrededor del origen del plano 1 + G(s)H(s) entonces el n´ umero de polos de lazo cerrado inestables es cero, Z = 0, y se asegura la estabilidad del sistema en lazo cerrado. S´olo falta un peque˜ no detalle para terminar de establecer el criterio de Nyquist. El origen del plano 1+G(s)H(s) satisface la condici´on 1+G(s)H(s) =

332

6 Dise˜ no usando la respuesta en frecuencia

0 que equivale a G(s)H(s) = −1. Por tanto, el origen del plano 1 + G(s)H(s) corresponde al punto (−1, j0) del plano G(s)H(s). Esto significa que el n´ umero de vueltas N alrededor del origen del plano 1+G(s)H(s) es id´entico al n´ umero de vueltas alrededor del punto (−1, j0) en el plano G(s)H(s). Esto es algo muy conveniente porque s´olo se requiere conocer G(s)H(s) (en lugar de 1 + G(s)H(s)). Finalmente, n´otese que si G(s)H(s) es una funci´on que tiene un n´ umero de polos que es mayor o igual al n´ umero de ceros, entonces l´ıms→∞ G(s)H(s) = constante. Esto significa que mientras se recorre toda la parte semicircular de radio infinito de la trayectoria de Nyquist la funci´on G(s)H(s) representa un u ´nico punto. Entonces, la parte realmente interesante de G(s)H(s) es la que se obtiene durante el recorrido del eje imaginario, desde jω = −j∞ hasta jω = +j∞. N´otese que durante este recorrido G(s)H(s) se convierte en G(jω)H(jω) lo que representa la gr´afica polar del sistema en lazo abierto que ya se ha aprendido a dibujar. Todo lo anterior permite establecer el siguiente criterio. Criterio de Nyquist. Caso especial en el que G(s)H(s) no tiene polos y/o ceros sobre sobre el eje imaginario. En el sistema de lazo cerrado mostrado en la figura 6.32, si la funci´on de transferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho del plano s y l´ıms→∞ G(s)H(s) = constante, entonces para que haya estabilidad en lazo cerrado la gr´afica polar de G(jω)H(jω) (al variar ω de −∞ a +∞) debe rodear P veces en sentido antihorario al punto (−1, j0). La clave para recordar el criterio de Nyquist es expres´andolo en la forma: Z =N +P donde P representa el n´ umero de polos de lazo abierto inestables, Z representa el n´ umero de polos de lazo cerrado inestables y N representa el n´ umero de vueltas que la gr´afica polar G(jω)H(jω) realiza alrededor del punto (−1, j0), cuando ω var´ıa desde −∞ hasta +∞. Un valor positivo de N representa vueltas horarias y mientras que un valor negativo de N representa vueltas antihorarias. La estabilidad en lazo cerrado se asegura cuando Z = 0, es decir cuando N = −P . 6.5.5.

Criterio de Nyquist. Caso general

El truco del recorrido cerrado Γ introducido en la secci´on 6.5.1 s´olo es v´alido si dicho recorrido contiene por completo a los polos y ceros en cuesti´on. As´ı que no es aplicable en el caso en que un polo o un cero est´an sobre el recorrido cerrado. N´otese que en el caso en que la funci´on de lazo abierto G(s)H(s) tiene polos o ceros sobre el eje imaginario la trayectoria de Nyquist contiene a dichos polos o ceros por lo que el criterio establecido en la secci´on

6.5 Criterio de estabilidad de Nyquist

333

6.5.4 no es aplicable. Este problema se resuelve definiendo un nuevo recorrido conocido como la “trayectoria de Nyquist modificada” que se muestra en la figura 6.34. Esta trayectoria es id´entica a la trayectoria de Nyquist introducida en la figura 6.33 y s´olo difiere de ´esta en los puntos que contienen a los polos o ceros de G(s)H(s) sobre el eje imaginario. La idea es rodear tales puntos usando una trayectoria semicircular de radio peque˜ no ε → 0 que describe un ´angulo que var´ıa de −90o a +90o . La raz´on de introducir un radio muy peque˜ no es el asegurar que la trayectoria de Nyquist modificada encierre por completo a cualquier posible polo o cero de lazo cerrado (desconocidos) que se encuentren en el semiplano derecho cerca del eje imaginario. La forma general del criterio de Nyquist puede establecerse del siguiente modo.

Im (s)

r!1

polos y ceros de G (s ) H (s )

Re (s)

Figura 6.34. Trayectoria de Nyquist modificada.

Criterio de Nyquist. Caso general en el que G(s)H(s) tiene polos y/o ceros sobre sobre el eje imaginario. En el sistema de lazo cerrado mostrado en la figura 6.32, si la funci´on de transferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho del plano s, entonces para que haya estabilidad en lazo cerrado, cuando un punto representativo s recorre la trayectoria de Nyquist modificada en sentido horario la gr´afica de G(s)H(s) debe rodear P veces en sentido antihorario al

334

6 Dise˜ no usando la respuesta en frecuencia

punto (−1, j0). Es importante subrayar que en este caso tambi´en se requiere que G(s)H(s) → constante cuando s → ∞, es decir, que G(s)H(s) tenga un n´ umero de polos mayor o igual al n´ umero de sus ceros. Adem´as, tambi´en sigue aplic´andose la relaci´on Z = N + P con Z el n´ umero de polos inestables de lazo cerrado, P el n´ umero de polos inestables de lazo abierto y N el n´ umero de vueltas alrededor del punto (−1, j0).

6.6.

M´ argenes de estabilidad

El criterio de Nyquist es v´alido para sistemas cuyas funciones de transferencia son de fase m´ınima o de fase no m´ınima, es decir, se trata de un resultado que se puede aplicar a cualquier caso. Sin embargo, lo que a continuaci´on se describe se hace suponiendo que el sistema tiene una funci´on de transferencia de lazo abierto de fase m´ınima (todos los polos y ceros tienen parte real menor o igual que cero), pues esta consideraci´on simplifica grandemente la exposici´on de las ideas. Si el sistema es de fase m´ınima entonces P = 0 por lo que la estabilidad de lazo cerrado queda asegurada si N = 0, entonces el criterio de Nyquist puede simplificarse a lo siguiente: “Considere que la frecuencia ω var´ıa u ´nicamente desde 0 hasta +∞. Trace la gr´afica polar de G(s)H(s) correspondiente a estas frecuencias. Suponga que esta gr´afica representa un camino que usted puede recorrer sobre el papel desde ω = 0 hasta ω → +∞. Si el punto (−1, j0) queda a la izquierda de dicho camino recorrido entonces el sistema en lazo cerrado es estable. Si tal punto queda a la derecha entonces hay inestabilidad.” Ante esta descripci´on salta a la vista la siguiente pregunta: ¿Qu´e sucede si la gr´afica polar obtenida pasa exactamente sobre el punto (−1, j0)? En tal caso se dice que se est´a en el l´ımite de la estabilidad, lo que significa que hay polos de lazo cerrado que tienen parte real cero. En base a esto se puede afirmar que mientras el punto (−1, j0) est´e mas lejos de la gr´afica polar de G(s)H(s)|s=jω pero siempre a su izquierda entonces el sistema en lazo cerrado ser´a m´as estable (m´as lejos de la inestabilidad). A la lejan´ıa que guarda el sistema en lazo cerrado respecto a la inestabilidad se le llama margen de estabilidad y existen dos maneras de medir dicha lejan´ıa: el margen de fase y el margen de ganancia. Margen de fase. Es la cantidad de atraso de fase que se requiere a˜ nadir a la frecuencia de cruce de ganancia ω1 , para llevar el sistema al borde de la inestabilidad. La frecuencia de cruce de ganancia es aquella a la cual |G(jω1 )H(jω1 )| = 1. Sea Kf el margen de fase y φ la fase de G(jω1 )H(jω1 ), entonces: Kf = 180o + φ

6.6 M´ argenes de estabilidad

335

En la figura 6.35 puede observarse que un margen de fase negativo implica inestabilidad en lazo cerrado, mientras que un margen de fase positivo implica estabilidad en lazo cerrado. De acuerdo a estos razonamientos un cero que se agregue en lazo abierto tiende a mejorar la estabilidad del sistema en lazo cerrado porque introduce una fase positiva, es decir, incrementa o hace positivo el valor de Kf . N´otese que, de acuerdo a las gr´aficas en las figuras 6.13 y 6.15, el adelanto de fase debido un cero es mayor para una frecuencia espec´ıfica conforme la frecuencia de esquina es menor (la cual es num´ericamente igual al valor absoluto de la ubicaci´on del cero). Por tanto, el efecto estabilizante del cero de lazo abierto aumenta conforme ´este se coloca m´as cerca del origen (dentro del semiplano izquierdo). Por otro lado, un polo que se agregue en lazo abierto tiende a hacer menos estable al sistema en lazo cerrado porque introduce una fase negativa, es decir, disminuye o hace negativo el valor de Kf . N´otese que, de acuerdo a las gr´aficas en las figuras 6.13 y 6.15, el atraso de fase debido un polo es mayor para una frecuencia espec´ıfica conforme la frecuencia de esquina es menor (la cual es num´ericamente igual al valor absoluto de la ubicaci´on del polo). Por tanto, el efecto inestabilizante del polo de lazo abierto aumenta conforme ´este se coloca m´as cerca del origen (dentro del semiplano izquierdo). Margen de ganancia. Sea Kg el margen de ganancia, entonces: Kg =

1 |G(jω2 )H(jω2 )|

donde ω2 representa la frecuencia en la que la fase de G(jω2 )H(jω2 ) es −180[grados ] (ω2 tambi´en es conocida como frecuencia de cruce de fase). En la figura 6.35 puede observarse que Kg > 1 (20 log(Kg ) > 0[dB]) implica estabilidad en lazo cerrado, mientras que Kg < 1 (20 log(Kg ) < 0[dB]) implica inestabilidad en lazo cerrado. Es importante resaltar que los m´argenes de fase y de ganancia est´an definidos sobre las gr´aficas de respuesta en frecuencia de la funci´ on de transferencia de lazo abierto y, sin embargo, dan informaci´on sobre la estabilidad y las caracter´ısticas de respuesta transitoria del sistema en lazo cerrado.

336

6 Dise˜ no usando la respuesta en frecuencia

dB

dB !1

0

!1

!

!2

fase [grados]

0

!2

fase ! [grados] 0 à 90 à 180

0 à 90 à 180

!

!

(b) Inestabilidad en lazo cerrado.

(a) Estabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

ï

à1

! = 0+

ï1

Kg

!! +1

Re (G (j! ) H (j! ) )

(c) Estabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

1 Kg

! = 0+

ï ï

à1

!! +1

Re (G (j! ) H (j! ) )

(d) Inestabilidad en lazo cerrado. Figura 6.35. Respuesta en frecuencia de G(jω)H(jω). Los m´ argenes de fase y de ganancia se determinan a partir de la respuesta en frecuencia obtenida a partir de la funci´ on de transferencia de lazo abierto.

6.7. Relaci´ on entre las caracter´ısticas de respuesta en la frecuencia y en el tiempo Como se menciona en el cap´ıtulo 5, la respuesta de un sistema de control se compone de dos partes: la respuesta transitoria y la respuesta en estado es-

6.7 Relaci´ on entre las caracter´ısticas de respuesta en la frecuencia y en el tiempo

337

tacionario. Es importante saber como se relacionan las caracter´ısticas de estas respuestas en el tiempo con las caracter´ısticas de la respuesta en frecuencia del sistema a controlar, a fin de saber qu´e es lo que se debe modificar en estas u ´ltimas para poder dise˜ nar adecuadamente las primeras. A continuaci´on se describen los puntos m´as sobresalientes de esta relaci´on. 6.7.1.

Respuesta en lazo abierto

Existe una relaci´on muy estrecha entre las caracter´ısticas de respuesta en frecuencia de un sistema en lazo abierto y las caracter´ısticas de respuesta en el tiempo del mismo sistema en lazo abierto, como se describe a continuaci´on. 1.

2.

3.

La altura del pico de resonancia Mr est´a relacionada inversamente con el valor del amortiguamiento, ζ: cuanto mayor es Mr menor es ζ (v´ease la figura 6.14(b)). Recu´erdese que menores amortiguamientos ζ producen mayores sobre pasos, Mp ( %), en la respuesta en el tiempo cuando se aplica un escal´on. Por tanto, el sobre paso es mayor (y el sistema presenta m´as oscilaciones) conforme Mr es mayor. En t´erminos muy generales puede afirmarse que cuando 1.0 < Mr < 1.4 (0[dB]< Mr < 3[dB]) entonces el amortiguamiento est´a en el rango 0.7 > ζ > 0.4 [3] p´ag. 571, [4] p´ag. 637. La magnitud de la frecuencia de esquina indica la velocidad de respuesta del sistema [3] p´ag. 573, [4] p´ag 638. Recu´erdese que en un sistema de segundo orden la frecuencia de esquina es ωn la cual, cuando aumenta, reduce el tiempo de subida (v´ease la secci´on 3.3). En el caso de un sistema de primer orden la frecuencia de esquina es igual al valor absoluto del polo del sistema. De acuerdo a la secci´on 3.1 el tiempo de respuesta (constante de tiempo) se reduce si el valor absoluto del polo tiene un valor mayor. En el caso general de un sistema arbitrario de orden n se define el ancho de banda para describir su rapidez de respuesta en el tiempo en t´erminos de su respuesta en frecuencia. El ancho de banda es la frecuencia a la cual la magnitud de la funci´on de transferencia se reduce en −3[dB] respecto de su magnitud a frecuencia cero. La rapidez de respuesta en el tiempo del sistema es mayor conforme su ancho de banda es mayor. El valor final de la salida del sistema definido por Y (s) = G(s)U (s) ante una entrada tipo escal´on de altura A est´a determinada por la respuesta del sistema a frecuencia cero G(jω)|ω=0 : l´ım y(t) = l´ım sG(s)

t→∞

s→0

A = G(0)A = |G(j0)|A s

N´otese que los dos u ´ltimos puntos est´an en completo acuerdo con lo examinado en la secci´on 6.1.4. 6.7.2.

Respuesta en lazo cerrado

Tambi´en existe una relaci´on entre la respuesta en frecuencia de la funci´on de lazo abierto G(s)H(s) y la respuesta en el tiempo del sistema en lazo

338

6 Dise˜ no usando la respuesta en frecuencia

cerrado C(s) on es muy importante para el dise˜ no de sistemas de R(s) . Esta relaci´ control realimentados. 1.

El margen de fase Kf (medido a partir de la respuesta en frecuencia del sistema en lazo abierto) se relaciona con el factor de amortiguamiento del sistema en lazo cerrado de acuerdo a la siguiente tabla [3] p´ag. 570,[4] p´ag. 648:

Tabla 6.3. Relaci´ on entre el margen de fase (lazo abierto) y el amortiguamiento de un sistema en lazo cerrado. Kf [grados] 0 11 23 33 43 52 59 65 70 74 76 ζ 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

2.

3.

N´otese que para el rango 0 ≤ ζ ≤ 0.6 se cumple aproximadamente que K ζ = 100f . Debe aclararse que estas relaciones se calculan a partir de la respuesta de un sistema de segundo orden sin ceros. Aunque para sistemas de orden mayor y con ceros se esperan diferencias respecto a estos valores sin embargo es posible considerarlos como directivas para el dise˜ no. A mayor frecuencia de cruce de ganancia (medida a partir de la respuesta en frecuencia del sistema en lazo abierto) mayor es la rapidez del sistema en lazo cerrado [3], p´ag. 571. Esto puede explicarse del siguiente modo. La frecuencia de cruce de ganancia es la frecuencia a la cual |G(jω)H(jω)| = 0[dB] y generalmente esta magnitud disminuye al aumentar la frecuencia. Por tanto, una mayor frecuencia de cruce de ganancia en lazo abierto implica un mayor ancho de banda en lazo cerrado y esto u ´ltimo implica una mayor rapidez de respuesta del sistema en lazo cerrado. El error en estado estacionario de la respuesta en lazo cerrado se obtiene a partir de la respuesta de la funci´on de lazo abierto a frecuencia cero. Por ejemplo, si en el sistema en lazo cerrado se tiene que R(s) = A/s entonces: ess = l´ım [r(t) − y(t)] = t→∞

6.8. 6.8.1.

A , 1 + kp

kp = G(0)H(0) = |G(jω)H(jω)|ω=0

Ejemplos Ejemplo de an´ alisis

En esta parte se presenta un ejemplo de an´alisis usando la t´ecnica de la respuesta en frecuencia. Este ejemplo es estudiado usando el m´etodo del lugar de las ra´ıces en la secci´on 5.2.6.

6.8 Ejemplos

339

An´ alisis de estabilidad Considere la siguiente funci´on de transferencia: 116137 k (6.29) s3 + 72.54s2 − 1250s − 9.363 × 104 116137 k = (s − 35.7377)(s + 36.5040)(s + 71.7721) 35.7377 36.5040 71.7721 116137 k = (35.7377)(36.5040)(71.7721) (s − 35.7377) (s + 36.5040) (s + 71.7721) G(s)H(s) =

Para este ejemplo es importante encontrar las caracter´ısticas de respuesta en frecuencia de la siguiente funci´on de transferencia: a , a>0 G1 (s) = s−a Usando el cambio de variable s = jω se puede obtener: a G1 (jω) = jω − a a −jω − a = jω − a −jω − a a(−jω − a) = ω 2 + a2 √ ¶ µ a ω 2 + a2 −ω = ∠atan ω 2 + a2 −a µ ¶ −ω a ∠atan = √ −a ω 2 + a2 µ ¶ −ω a , ∠G1 (jω) = atan |G1 (jω)| = √ −a ω 2 + a2

De aqu´ı se encuentra que: si ω = 0 : |G1 (jω)| = 1, ∠G1 (jω) = −180o si ω → ∞ : |G1 (jω)| → 0, ∠G1 (jω) → −90o 1 si ω = a : |G1 (jω)| = √ , ∠G1 (jω) = −135o 2 Usando esta informaci´on y los resultados de la secci´on 6.3 se obtienen las gr´aficas de Bode mostradas en la figura 6.36. Usando estas gr´aficas de Bode se obtiene la gr´afica polar de la figura 6.37. Es conveniente aclarar que tambi´en es correcto decir que: si ω = 0 : |G1 (jω)| = 1,

si ω → ∞ : |G1 (jω)| → 0, 1 si ω = a : |G1 (jω)| = √ , 2

∠G1 (jω) = +180o ∠G1 (jω) → +270o ∠G1 (jω) = +225o

340

6 Dise˜ no usando la respuesta en frecuencia

Esto trae como consecuencia que en este caso la gr´afica de Bode de fase est´e desplazada 360◦ hacia arriba respecto de la gr´afica de Bode de fase mostrada en la figura 6.36. Sin embargo, el lector puede verificar que la gr´afica polar en ambos casos es id´entica a la mostrada en la figura 6.37. Por esta raz´on, el an´alisis presentado en la siguiente subsecci´on para estudiar el efecto de un compensador es v´alido en ambos casos. Continuando con la figura 6.37, n´otese que para k mayores crece la distancia al origen de cualquier punto sobre la gr´afica polar. Por tanto, para k peque˜ nas se tiene que N = 0 y para k grandes se tiene N = 1. N´otese que el n´ umero de polos inestables de lazo abierto es P = 1. Entonces, de acuerdo al criterio de Nyquist el n´ umero de polos inestables en lazo cerrado es Z = P + N > 0. Esto significa que el sistema en lazo cerrado es inestable para cualquier valor de k > 0. A continuaci´on se muestra que este problema puede ser resuelto si se introduce convenientemente un adelanto de fase, es decir, si se adiciona un cero a la funci´on de transferencia de lazo abierto. dB i) 0

35:73

71:77

!

36:5

ii)

iii)

iv)

v) fase [grados] 35:73 36:5

71:77

!

0

iii) à 90

iv)

ii)

à 180 à 270

v)

Figura 6.36. Gr´ aficas de Bode de G(s)H(s) en (6.29): i) 35.7377 36.5040 71.7721 ii) (s−35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s).

116137 k , (35.7377)(36.5040)(71.7721)

Considere la siguiente funci´on de transferencia de lazo abierto:

6.8 Ejemplos

341

Im (G(j!)H(j!))

!=0

ï

ï à1

! ! +1

! ! à1 0

Re (G(j!)H(j!))

Figura 6.37. Gr´ afica polar de G(s)H(s) en (6.29).

116137(s + b) (6.30) + 72.54s2 − 1250s − 9.363 × 104 116137(s + b) =k (s − 35.7377)(s + 36.5040)(s + 71.7721) 35.7377 36.5040 71.7721 s + b 116137 k b = (35.7377)(36.5040)(71.7721) (s − 35.7377) (s + 36.5040) (s + 71.7721) b G(s)H(s) = k

s3

con b una constante positiva. Si se elige b < 35.7377 entonces se obtienen las gr´aficas de Bode mostradas en la figura 6.38 y con ellas la gr´afica polar de la figura 6.39. Esto significa que si k es suficientemente grande entonces N = −1 y como P = 1 entonces el sistema en lazo cerrado es estable porque Z = P + N = 0. An´ alisis usando gr´ aficas de Bode En esta parte se usan las gr´aficas de Bode para analizar las caracter´ısticas del sistema en lazo cerrado estudiado en la secci´on 5.2.6. En la figura 6.40 se muestran las gr´aficas de Bode de la funci´on de transferencia: s3

+

72.54s2

116137 − 1250s − 9.363 × 104

N´otese que el adelanto de fase del polo en s = 35.73, y que se muestra en la figura 6.36, no se aprecia en la figura 6.40 debido a la presencia del polo en s = −36.50. Obs´ervese tambi´en que el margen de fase2 es negativo por lo que 2

De acuerdo a la secci´ on 6.6, el margen de fase y el margen de ganancia se definen para sistemas de fase m´ınima y aunque el sistema aqu´ı estudiado es de fase no m´ınima (por el polo inestable en s = 35.7377), se utilizar´ a el t´ermino “margen de fase” para indicar la comparaci´ on de la fase del sistema respecto del valor fundamental de −180◦ .

342

6 Dise˜ no usando la respuesta en frecuencia

dB 0

i)

vi) 35:73 36:5 b

71:77

ii)

! iv)

iii) v)

fase [grados] + 90 0

vi) 35:73 36:5 b

71:77

iii)

!

iv)

à 90

ii)

à 180

v)

116137 k b Figura 6.38. Gr´ aficas de Bode de G(s)H(s) en (6.30): i) (35.7377)(36.5040)(71.7721) , 36.5040 71.7721 s+b 35.7377 ii) (s−35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s), vi) b , b < 35.7377.

Im (G(j!)H(j!))

ï

!=0

ï ï à1

! ! à1 0 ! ! +1

Re (G(j!)H(j!))

Figura 6.39. Gr´ afica polar de G(s)H(s) en (6.30).

el sistema en lazo cerrado es inestable. Tal como se describe en la subsecci´on previa, se puede conseguir estabilidad en lazo cerrado si se introduce suficiente adelanto de fase colocando en cascada un factor de la forma: k(s + b)

(6.31)

Al mismo tiempo, se puede hacer r´apida la respuesta del sistema en lazo cerrado si se consigue una frecuencia de cruce de ganancia suficientemente grande. Estas dos caracter´ısticas pueden ser conseguidas si seleccionan adecuadamente los valores de k y de b. Usando b =31.2463 y k =0.0396 determinados en

6.8 Ejemplos

Figura

6.40. 116137

Gr´ aficas .

de

Bode

del

sistema

sin

343

compensar

s3 +72.54s2 −1250s−9.363×104

la secci´on 5.2.6 se consigue lo siguiente. Para ω =38.5[rad/s] la magnitud y la fase son de −5.85[dB] y −208[grados], respectivamente, en la figura 6.40. La figura 6.41 muestra que a esta misma frecuencia la magnitud y la fase son de 5.87[dB] y 50.9[grados] para el factor en (6.31). En la figura 6.42 se muestra que con esto se consigue que la funci´on de transferencia G(s)H(s) mostrada en (6.30) tenga una magnitud de 0[dB] y una fase de −157[grados] cuando ω =38.5[rad/s]. Esto significa que el sistema en lazo cerrado tiene un margen de fase de 23[grados]. De acuerdo a la secci´on 6.7.2, si el sistema fuera de segundo orden y sin ceros, esto corresponder´ıa a un amortiguamiento en lazo cerrado de aproximadamente 0.2. As´ı que, aunque el sistema estudiado es de tercer orden y tiene un cero, es de esperarse que la respuesta del sistema en lazo cerrado est´e poco amortiguada.

344

6 Dise˜ no usando la respuesta en frecuencia

Figura 6.41. Gr´ aficas de Bode del compensador k(s + b), b =31.2463, k =0.0396.

6.8.2.

Un sistema ball and beam

En esta parte se presenta un ejemplo de dise˜ no usando la t´ecnica de la respuesta en frecuencia. Este ejemplo constituye la aplicaci´on a un prototipo conocido como ball and beam el cual es construido y controlado experimentalmente en el cap´ıtulo 12. An´ alisis de estabilidad Considere el diagrama de bloques mostrado en la figura 6.43, donde Ax , a, ρ, γ y k son constantes positivas. La funci´on de transferencia de lazo abierto est´a dada como: G(s)H(s) =

ρAx γk a 1 a s + a s3

(6.32)

Esta funci´on de transferencia de lazo abierto tiene tres polos en el origen, es decir sobre el eje imaginario del plano complejo s. Por tanto, se deber´a utilizar

6.8 Ejemplos

345

Figura 6.42. G(s)H(s) en (6.30), b =31.2463 y k =0.0396.

Xd (s) +

Ax

í

k s ( s+ a )

ú s2

X(s)

à

Figura 6.43. Sistema en lazo cerrado. Primera propuesta.

la trayectoria de Nyquist modificada que se muestra en la figura 6.44. La gr´afica polar de G(s)H(s), dada en (6.32), obtenida al recorrer la trayectoria de Nyquist modificada se muestra en la figura 6.45. A continuaci´on se explica como se obtiene esta gr´afica polar. En la figura 6.23 se muestra la gr´afica polar de (6.32). Para considerar el rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se procede del siguiente modo. En primer lugar se hace el cambio de variable s = ε∠φ en la funci´on de transferencia (6.32) para obtener:

346

6 Dise˜ no usando la respuesta en frecuencia

Im (s) j!

! = 0+ þ = + 90

ä s=" þ

"

r!1

! = 0à þ = à 90

Re (s)

à j! Figura 6.44. Trayectoria de Nyquist modificada usada en la secci´ on 6.8.2.

G(s)H(s) =

ρAx γk 1 ∠ − 3φ ε∠φ + a ε3

Como ε → 0 es un valor constante muy peque˜ no se puede considerar que a ≫ ε para aproximar: G(s)H(s) =

ρAx γk ∠ − 3φ = β1 ∠ − 3φ aε3

donde β1 = ρAaεx3γk → +∞ es una constante real muy grande porque ε → 0. Por otro lado, φ var´ıa desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ). Entonces se tiene que: ½ β1 ∠ + 270, cuando ω = 0− G(s)H(s) = β1 ∠ − 3φ = (6.33) β1 ∠ − 270, cuando ω = 0+ Esto explica la presencia de las circunferencias de radio infinito que aparecen en la figura 6.45 y que, de acuerdo a (6.33), deben ser recorridas en sentido horario al pasar desde ω = 0− hasta ω = 0+ .

6.8 Ejemplos

347

Im (G (j! ) H (j! ) )

à 270 o ! = 0+

r!1

!! +1

à1

!! à1

Re (G (j! ) H (j! ) )

+ 270 oà !=0

Figura 6.45. Gr´ afica polar de G(s)H(s) en (6.32) obtenida al recorrer la trayectoria de Nyquist modificada mostrada en la figura 6.44.

N´otese que P = 0 porque G(s)H(s) dada en (6.32) no tiene polos con parte real positiva y que N = 2 porque al recorrer la trayectoria de Nyquist modificada en el sentido mostrado, la gr´afica polar en la figura 6.45 da dos vueltas en sentido horario al punto (−1, j0). Por tanto, la aplicaci´on del criterio de Nyquist Z = N + P = 2 indica que existen dos polos de lazo cerrado que est´an en el semiplano complejo derecho y, por tanto, el sistema en lazo cerrado de la figura 6.43 es inestable. N´otese tambi´en que debido a que en la figura 6.45 hay circunferencias de radio infinito este resultado no cambia a´ un cuando se redujera el valor de la ganancia: ρAx γk a

(6.34)

reduciendo por ejemplo el valor del par´ametro γ. Esto se debe a que el valor de β1 tiende a infinito para cualquier valor finito de (6.34) porque ε → 0 y, por tanto, se sigue cumpliendo que P = 0, N = 2 y Z = 2. Xd (s) +

Ax

î í s+ s+ c

k s ( s+ a )

ú s2

à

Figura 6.46. Sistema en lazo cerrado. Segunda propuesta.

X(s)

348

6 Dise˜ no usando la respuesta en frecuencia

Ahora considere el diagrama de bloques mostrado en la figura 6.46, donde δ y c son constantes positivas. La motivaci´on para usar este diagrama de bloques es el tratar de conseguir estabilidad en lazo cerrado mediante el uso de un controlador PD con funci´on de transferencia (γs + γδ). Sin embargo, en lugar de un controlador PD se propone usar una red de adelanto con funci´on de transferencia γ s+δ s+c con δ < c pues este tipo de controlador reduce el efecto del ruido que introduce un controlador PD. En este caso la funci´on de transferencia de lazo abierto est´a dada como: G(s)H(s) =

a 1 ρAx γδk s + δ c ac δ s + c s + a s3

(6.35)

Esta funci´on de transferencia de lazo abierto tambi´en tiene tres polos en el origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se deber´a utilizar la trayectoria de Nyquist modificada que se muestra en la figura 6.44. La gr´afica polar de G(s)H(s), dada en (6.35), obtenida al recorrer la trayectoria de Nyquist modificada se muestra en la figura 6.47. A continuaci´on se explica como se obtiene esta gr´afica polar. Im (G (j! ) H (j! ) )

à 270 o+ !=0

à1

!! +1

r!1

!! à1

Re (G (j! ) H (j! ) )

o + 270 à !=0

Figura 6.47. Gr´ afica polar de G(s)H(s) en (6.35) obtenida al recorrer la trayectoria de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.25 se muestra la gr´afica polar de (6.35). Para considerar el rodeo al rededor de s = 0 que incluye la trayectoria de Nyquist modificada se procede del siguiente modo. Primero se hace el cambio de variable s = ε∠φ en la funci´on de transferencia (6.35) para obtener: G(s)H(s) = ρAx γk

1 ε∠φ + δ ∠ − 3φ (ε∠φ + c)(ε∠φ + a) ε3

6.8 Ejemplos

349

Como ε → 0 es un valor constante muy peque˜ no se puede considerar que a ≫ ε, c ≫ ε y δ ≫ ε para aproximar: G(s)H(s) =

ρAx γkδ ∠ − 3φ = β2 ∠ − 3φ acε3

x γkδ donde β2 = ρAacε → +∞ es una constante muy grande porque ε → 0. Por 3 otro lado, φ var´ıa desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ). Entonces se tiene que: ½ β2 ∠ + 270, cuando ω = 0− G(s)H(s) = β2 ∠ − 3φ = (6.36) β2 ∠ − 270, cuando ω = 0+

Esto explica la presencia de las circunferencias de radio infinito que aparecen en la figura 6.47 y que, de acuerdo a (6.36), deben ser recorridas en sentido horario al pasar desde ω = 0− hasta ω = 0+ . N´otese que, de nuevo, P = 0, N = 2 y Z = N + P = 2. Por tanto, existen dos polos de lazo cerrado que tienen parte real positiva y el sistema en lazo cerrado es inestable. Adem´as, usando argumentos similares al los usados en el ejemplo anterior, se concluye que la inestabilidad no se puede corregir dando valores peque˜ nos a la siguiente ganancia: ρAx γkδ (6.37) ac As´ı que ni el uso de una red de adelanto es suficiente para conseguir estabilidad en lazo cerrado. Es momento entonces de analizar cuidadosamente lo que esta sucediendo. Recu´erdese que en la secci´on 6.6 se mencion´o que cuando se introduce un polo de lazo abierto (con parte real negativa) el sistema en lazo cerrado se acerca hacia la inestabilidad. Tambi´en se dijo que este efecto inestabilizante crece conforme dicho polo se coloca m´as cerca del origen. Ahora observe que las funciones de transferencia en (6.32) y en (6.35) tienen tres polos en el origen. Entonces es razonable preguntarse si los problemas de inestabilidad que se han encontrado hasta ahora son debidos a que la funci´on de transferencia de lazo abierto tiene demasiados polos en el origen. Xd (s) +

Ax à

s+ b í s+ c

ï 1

+

ë à

+

k s ( s+ a )

ï 2

à

ký s

ú s2

X(s)





Figura 6.48. Sistema en lazo cerrado. Tercera propuesta.

Considere el diagrama de bloques de la figura 6.48, donde α, Aθ , kv , b y c son constantes positivas. El objetivo de los dos lazos internos alrededor

350

6 Dise˜ no usando la respuesta en frecuencia

k de la funci´on de transferencia s(s+a) es sacar uno de los polos del origen recorri´endolo hacia la izquierda. N´otese tambi´en que la red de adelanto est´a dada como:

Gc (s) = γ

s+b , s+c

0
(6.38)

La funci´on de transferencia entre los puntos 1 y 2 de la figura 6.48 est´a dada como: Gm (s) =

s2

αk + (a + kv kAθ )s + αkAθ

Por tanto, la funci´on de transferencia de lazo abierto es: G(s)H(s) =

αkAθ 1 Ax ρ γb s + b c (6.39) 2 cAθ b s + c s + (a + kv kAθ )s + αkAθ s2

N´otese que esta funci´on de transferencia de lazo abierto tiene dos polos en el origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se deber´a utilizar la trayectoria de Nyquist modificada que se muestra en la figura 6.44. La gr´afica polar de G(s)H(s), dada en (6.39), obtenida al recorrer la trayectoria de Nyquist modificada se muestra en la figura 6.49. A continuaci´on se explica como se obtiene esta gr´afica polar. Im (G (j! ) H (j! ) )

à + 180 î ! = 0

î

à 180 ! = 0 +

! ! +1

à1

! ! à1

Re (G (j! ) H (j! ) )

r!1

Figura 6.49. Gr´ afica polar de G(s)H(s) en (6.39) obtenida al recorrer la trayectoria de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.27 se muestra la gr´afica polar de (6.39). Para considerar el rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se

6.8 Ejemplos

351

procede del siguiente modo. Primero se hace el cambio de variable s = ε∠φ en la funci´on de transferencia (6.39) para obtener: G(s)H(s) = Ax ρ γ

ε∠φ + b αk 1 ∠ −(6.40) 2φ ε∠φ + c ε2 ∠2φ + (a + kv kAθ )ε∠φ + αkAθ ε2

Como ε → 0 es un valor constante muy peque˜ no se puede aproximar: G(s)H(s) =

Ax ρ γ b ∠ − 2φ cAθ ε2

(6.41)

x ρ γ b donde β3 = AcA → +∞ es una constante muy grande porque ε → 0. Por 2 θε otro lado, φ var´ıa desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ). Entonces se tiene que: ½ β3 ∠ + 180, cuando ω = 0− G(s)H(s) = β3 ∠ − 2φ = (6.42) β3 ∠ − 180, cuando ω = 0+

Esto explica la presencia de la circunferencia de radio infinito que aparece en la figura 6.49 y que, de acuerdo a (6.42), debe ser recorrida en sentido horario al pasar desde ω = 0− hasta ω = 0+ . N´otese que ahora se tiene P = 0, N = 0 y Z = N + P = 0. Por tanto, no existe ning´ un polo de lazo cerrado con parte real positiva y entonces el sistema en lazo cerrado es estable. Dise˜ no usando gr´ aficas de Bode Considere los siguientes valores num´ericos: k = 16.51, Ax = 5.64,

a = 3.04, ρ = 5,

Aθ = 1.43,

α = 4,

(6.43)

kv = 0.2

Las constantes α y kv forman parte del controlador a dise˜ nar, por lo que se requiere de un criterio para su selecci´on. Sin embargo, este criterio depende de aspectos pr´acticos y s´olo puede definirse en base a las condiciones del prototipo experimental que se va a controlar. En el cap´ıtulo 12 se define dicho criterio y se explica como se pueden seleccionar α y kv . En la figura 6.50 se muestran las gr´aficas de Bode de la siguiente funci´on de transferencia: Ax ρ αkAθ 1 2 Aθ s + (a + kv kAθ )s + αkAθ s2

(6.44)

las cuales son obtenidas usando los valores presentados en (6.43). Puede verse que la fase es aproximadamente igual a −208 grados cuando la magnitud es igual a 0[dB] (cuando ω = 4.8[rad/s]). Esto significa que el margen de fase es negativo y, por tanto, el sistema en lazo cerrado obtenido con (6.44) como funci´on de transferencia de lazo abierto ser´ıa inestable. Con el fin de estabilizar

352

6 Dise˜ no usando la respuesta en frecuencia Bode Diagram 50

Magnitude (dB)

System: gh Frequency (rad/sec): 4.84 Magnitude (dB): −0.0804 0

−50

−100 −180

System: gh Frequency (rad/sec): 4.84 Phase (deg): −208

Phase (deg)

−225

−270

−315

−360 0

10

1

10 Frequency (rad/sec)

2

10

Figura 6.50. Gr´ aficas de Bode de la funci´ on de transferencia en (6.44)

el sistema en lazo cerrado se introduce el compensador presentado en (6.38), por lo que la funci´on de transferencia en lazo abierto del sistema compensado es la presentada en (6.39). El compensador en (6.38) se dise˜ na bajo el criterio de que el margen de fase del sistema compensado sea de 20 grados. Esto representa un margen de fase razonable y no requiere un adelanto de fase excesivo. M´as adelante se mencionan las desventajas de introducir demasiado adelanto de fase. El´ıjase ω = 4.8[rad/s] como la frecuencia a la cual el sistema en lazo abierto compensado debe tener una magnitud de 0[dB]. N´otese lo siguiente: El sistema sin compensar tiene una fase de −208 grados y una magnitud de 0[dB] a la frecuencia ω = 4.8[rad/s]. Esto puede apreciarse en la figura 6.50. El compensador en (6.38) debe introducir, a la frecuencia ω = 4.8[rad/s], un adelanto de fase de 208−160=48 grados, para tener un margen de fase de 20 grados, y una magnitud igual a 0[dB], para que la magnitud del sistema compensado sea de 0[dB] a la frecuencia ω = 4.8[rad/s]. En la figura 6.51 se muestran las gr´aficas de Bode de la funci´on de transferencia (v´ease la secci´on 6.4.1):

6.8 Ejemplos

Gd (s) =

s + T1 1 , s + ξT

ξ = 0.14

353

(6.45)

Se elige un valor de ξ = 0.14 porque en la figura 6.51 se observa que esto

!T

!T

!T

Figura 6.51. Gr´ aficas de Bode para Gd (s) en (6.45)

consigue que la red en (6.45) produzca un m´aximo adelanto de fase de aproximadamente 48 grados. Esto ocurre cuando ωT = 2.6 lo cual introduce una magnitud de aproximadamente −8.7[dB]. El valor de T se calcula del siguiente modo: T =

2.6 2.6 = = 0.541 ω 4.8

porque ω = 4.8[rad/s] es la frecuencia a la cual se debe introducir el adelanto de fase de 48 grados. Por tanto, (6.45) toma la forma: Gd (s) =

s + 1.84 s + 13.2

N´otese que el compensador en (6.38) se puede obtener como:

354

6 Dise˜ no usando la respuesta en frecuencia

Gc (s) = γGd (s)

(6.46)

si se selecciona b = 1.84 y c = 13.2. El compensador Gc (s) debe introducir una magnitud de 0[dB] a la frecuencia ω = 4.8[rad/s]. De acuerdo a (6.46), esta cantidad est´a dada como la suma en decibeles de la magnitud de la funci´on de transferencia Gd (s) a dicha frecuencia (es decir, −8.7[dB]) y el equivalente en decibeles de la ganancia γ: −8.7[dB] + 20 log(γ) = 0[dB] Despejando se obtiene: 8.7

γ = 10 20 ≈ 2.6 Finalmente, se puede escribir: Gc (s) = 2.6

s + 1.84 s + 13.2

(6.47)

En la figura 6.52 se muestra la gr´afica de Bode del sistema compensado (6.39) usando el controlador (6.47). N´otese que la frecuencia de cruce de ganancia es aproximadamente ω = 4.8[rad/s] y que el margen de fase es de aproximadamente 22 grados, lo cual comprueba que se satisfacen las especificaciones de dise˜ no. En la figura 6.53 se muestra la respuesta al escal´on del sistema en lazo cerrado de la figura 6.48 usando (6.47) y los valores num´ericos en (6.43). N´otese que la respuesta es poco amortiguada debido al peque˜ no margen de fase. Sin embargo, este tipo de respuesta es satisfactoria en la pr´actica para un sistema ball and beam. Finalmente, es conveniente aclarar los siguiente. La frecuencia de cruce de ganancia (4.8[rad/s] en este ejemplo) determina la rapidez de respuesta del sistema en lazo cerrado. Sin embargo, (exceptuando las aproximaciones de segundo orden) no existe una regla exacta que permita calcular el valor de la frecuencia de cruce de ganancia en funci´on de la rapidez deseada. Lo que se sabe es que aumentando esta frecuencia se obtienen respuestas m´as r´apidas. Por otro lado, elegir una frecuencia de cruce de ganancia grande tambi´en incrementa el efecto del ruido. As´ı que es recomendable proponer una frecuencia de cruce de ganancia, hacer el dise˜ no con ella y al final verificar si la rapidez en lazo cerrado es la deseada y si el efecto del ruido no es prohibitivo. Si la respuesta fuera muy lenta y el efecto del ruido no es importante, entonces prop´ongase una frecuencia de cruce de ganancia mayor y repita el proceso hasta obtener la rapidez y el desempe˜ no que se deseen. En este ejemplo se ha decidido no intentar mejorar la rapidez de los resultados obtenidos en la figura 6.53. Por un lado, puede observarse en esta figura que el sistema alcanza el reposo en casi 3[s] lo cual es un tiempo muy bueno para un sistema ball and beam en la pr´actica. Por otro lado, de acuerdo a la figura 6.50, si se elige una frecuencia de cruce de ganancia mayor entonces se necesitar´a incrementar el adelanto de fase que debe introducir el compensador

6.8 Ejemplos

355

Bode Diagram 20

Magnitude (dB)

0 System: ghctrl Frequency (rad/sec): 4.68 Magnitude (dB): 0.00958

−20

−40

−60

−80

−100 −135 System: ghctrl Frequency (rad/sec): 4.68 Phase (deg): −158

Phase (deg)

−180

−225

−270

−315

−360 0

10

1

10 Frequency (rad/sec)

2

10

Figura 6.52. Gr´ aficas de Bode del sistema ball and beam compensado.

Gc (s) (o equivalentemente Gd (s)). Esto implica elegir un valor de ξ menor que el utilizado, es decir 0.14, que dicho sea de paso ya es un valor peque˜ no. El problema de usar valores peque˜ nos de ξ es que se incrementa el efecto del ruido en el sistema de control lo cual, como se explica en el cap´ıtulo 12, es una limitante en la pr´actica. De hecho, el haber elegido ω = 4.8[rad/s] como frecuencia de cruce de ganancia responde a la necesidad de poder conseguir un margen de fase satisfactorio (20 grados) sin usar un valor de ξ demasiado peque˜ no. 6.8.3.

Control PD de posici´ on de un motor de CD

Considere el modelo de un motor de CD presentado en (5.12), cap´ıtulo 5, el cual se reescribe a continuaci´on: k I ∗ (s) (6.48) θ(s) = s(s + a) nkm b >0 a = > 0, k = J J donde θ(s) e I ∗ (s) representan la posici´on (salida) y la consigna de corriente (entrada), respectivamente. Las gr´aficas de Bode correspondientes a la funci´on

356

6 Dise˜ no usando la respuesta en frecuencia Step Response

2

1.8

1.6

1.4

Amplitude

1.2

1

0.8

0.6

0.4

0.2

0

0

0.5

1

1.5 Time (sec)

2

2.5

3

Figura 6.53. Respuesta del sistema en la figura 6.48 ante una referencia xd = 1[m]. La se˜ nal graficada es x(t).

de transferencia: G(s) =

k s(s + a)

(6.49)

se muestran en la figura 6.54. Usando este resultado se obtiene la gr´afica polar mostrada en la figura 6.55, la cual corresponde al recorrido de la trayectoria de Nyquist modificada mostrada en la figura 6.56. Es conveniente aclarar que G(s) tiene un polo sencillo en s = 0 y eso da origen al semic´ırculo de radio infinito que aparece en la figura 6.55. Esto se consigue de manera similar a como se procedi´o en la secci´on 6.8.2. Es decir, se hace el cambio de variable s = ε∠φ para reescribir (6.49) como: G(s) =

k k k = = ∠−φ ε∠φ(ε∠φ + a) ε∠φ(a) εa

Recordando que ε → 0 y que φ pasa de −90◦ a +90◦ conforme se hace el rodeo alrededor de s = 0, mostrado en la figura 6.56, entonces se obtiene el semic´ırculo de radio infinito que aparece en la figura 6.55. Debido a que la fase de G(jω) tiende asint´oticamente a −180◦ conforme ω → +∞, es claro que la gr´afica polar mostrada en la figura 6.55 nunca rodear´a al punto (−1, j0) para cualquier valor positivo de k y a. Es decir N = 0. Como G(s) no tiene polos en el semiplano derecho, entonces P = 0. Por esta raz´on, si se cierra el lazo alrededor de G(s) agregando una ganancia kp positiva para obtener un

6.8 Ejemplos

357

sistema de control de posici´on proporcional, entonces el sistema de control en lazo cerrado ser´a estable para cualquier kp positiva porque Z = N + P = 0. Sin embargo, para valores mayores de kp , la gr´afica polar de la figura 6.55 se aproxima m´as y m´as al punto (−1, j0) por lo que el margen de fase disminuye (n´otese que el margen de ganancia es infinito ya que el eje real negativo es tocado s´olo en el origen). Como consecuencia, la respuesta es m´as r´apida pero cada vez oscila m´as (lo cual coincide con lo concluido en la secci´on 5.2.1). Con el fin de conseguir una respuesta en el tiempo que sea r´apida (usando valores de kp mayores) pero suficientemente amortiguadas, a continuaci´on se realiza el dise˜ no de un controlador proporcional-derivativo (PD).

dB 0

i)

a

!

1 ii)

iv)

fase [grados]

0 à 90 à 180

a

iii)

!

iii)

ii) iv)

a Figura 6.54. Gr´ aficas de Bode de G(s) presentada en (6.49). i) ka , ii) 1s , iii) s+a , k iv) s(s+a) .

Considere el modelo de un motor de CD, presentado en (6.48), junto con el siguiente controlador proporcional-derivativo: de , e = θd − θ dt Aplicando la transformada de Laplace se obtiene: i∗ = kp e + kd

I ∗ (s) = (kp + kd s)E(s),

E(s) = θd (s) − θ(s)

El diagrama de bloques del sistema de control en lazo cerrado es se muestra en la figura 6.57. La funci´on de transferencia de lazo abierto es: µ ¶ kp k G(s)H(s) = kd s + (6.50) kd s(s + a) En particular, el controlador se puede reescribr, sucesivamente, del siguiente modo:

358

6 Dise˜ no usando la respuesta en frecuencia Im (G (j!))

! = 0à

1 !! à1 !! +1

Re (G (j!))

! = 0+

Figura 6.55. Gr´ afica polar de G(s) presentada en (6.49). Im (s) j!

! = 0+ þ = + 90

! = 0à þ = à 90

"

ä s=" þ r!1

Re (s)

à j!

Figura 6.56. Trayectoria de Nyquist modificada para la funci´ on de transferencia en (6.49).

6.8 Ejemplos

òd(s) +

à

ð ñ Iã(s) kp kd s + k d

k s(s+a)

359

ò(s)

Figura 6.57. Sistema de control proporcional-derivativo de posici´ on.

I ∗ (s) kp = kd (s + b), b = E(s) kd µ ¶ 1 s+b = kd b s+1 = kd b b b

(6.51)

Definiendo el cambio de variable z = 1b s se tiene: I ∗ (s) = kd b(z + 1) E(s) En la figura 6.58 se muestran las gr´aficas de Bode del factor z + 1. N´otese que el eje horizontal de estas gr´aficas de Bode corresponde a 1b ω (v´ease la secci´on 6.4.1). Por tanto, la funci´on de transferencia de lazo abierto, dada en (6.50), ahora se escribe como: G(s)H(s) = kd b(z + 1)

k s(s + a)

(6.52)

Considere el caso del motor de CD estudiado experimentalmente en el cap´ıtulo 10. Los valores num´ericos de este motor son: k = 675.4471,

a = 2.8681

k Usando estos datos se obtienen las gr´aficas de Bode del factor s(s+a) , las cuales se muestran en la figura 6.59. En estas gr´aficas se observa que la frecuencia de cruce de ganancia es ω1 = 25.9[rad/s] y que la fase a esa frecuencia es de −174◦ , que corresponde a un margen de fase de +6◦ . Como este margen de fase es muy peque˜ no, la respuesta en el tiempo es muy oscilatoria cuando se usa un controlador proporcional con kp = 1, lo cual se muestra en la figura 6.60. N´otese que el tiempo de subida es tr = 0.0628[s] y el sobre paso es Mp = 83 %. A continuaci´on se dise˜ na un controlador proporcional-derivativo (PD) de modo que la respuesta en el tiempo, en lazo cerrado, mantenga el mismo tiempo de subida tr = 0.0628[s] pero que el sobre paso sea Mp = 20 %. Con el fin de mantener la misma rapidez de respuesta se propone mantener la misma frecuencia de cruce de ganancia, es decir, se usar´a:

ω1 = 25.9[rad/s]

(6.53)

360

6 Dise˜ no usando la respuesta en frecuencia Bode Diagram 25

Magnitude (dB)

20

15

10 System: gc Frequency (rad/sec): 0.882 Magnitude (dB): 2.5

5

0

Phase (deg)

90

45 System: gc Frequency (rad/sec): 0.882 Phase (deg): 41.4

0 −1

10

0

10 Frequency (rad/sec)

1

10

Figura 6.58. Gr´ afica de Bode del factor z + 1, donde z = 1b s.

Por otro lado, usando el sobre paso deseado Mp = 20 % y: v ´ ³ u u ln2 M p( %) 100 u ³ ´ ζ=t 2 M p( %) ln + π2 100

se obtiene ζ = 0.4559. Usando interpolaci´on lineal en la tabla 6.3 se encuentra que este amortiguamiento corresponde a un margen de fase de: Kf = +47.5◦

(6.54)

Como el margen de fase del motor sin compensar es de +6◦ , entonces se necesita que el controlador introduzca un adelanto de fase de +47.5◦ − 6◦ = 41.5◦ . En la figura 6.58 se observa que esto sucede cuando 1b ω = 0.882. Por tanto, el par´ametro b se obtiene forzando que esto suceda cuando ω = ω1 = 25.9[rad/s], es decir: ω ¯¯ b= = 29.3984 ¯ 0.882 ω=25.9

Por otro lado, como se desea que el sistema compensado tenga la misma frecuencia de cruce de ganancia que el sistema sin compensar, ω = ω1 =

6.8 Ejemplos

361

Bode Diagram 20 15 10

System: gh Frequency (rad/sec): 25.9 Magnitude (dB): 0.00458

Magnitude (dB)

5 0 −5 −10 −15 −20 −25 −30 −160

Phase (deg)

−165

−170

−175

System: gh Frequency (rad/sec): 25.9 Phase (deg): −174

−180 1

2

10

10 Frequency (rad/sec)

Figura 6.59. Gr´ afica de Bode del factor

k , s(s+a)

donde k = 675.4471 y a = 2.8681.

25.9[rad/s], es necesario que el controlador completo introduzca una magnitud de 0[dB] cuando ω = ω1 . Esto se consigue imponiendo lo siguiente sobre la magnitud del controlador completo: |kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 0[dB]

(6.55)

donde, de acuerdo a la figura 6.58, se debe usar |z +1|dB = 2.5[dB]. Por tanto, despejando kd y realizando los c´alculos correspondientes se encuentra: kd =

1 −2.5 10 20 = 0.0255 b

Finalmente, usando (6.51) se obtiene: kp = bkd = 0.7499 En la figura 6.61 se muestran las gr´aficas de Bode de la funci´on de transferencia de lazo abierto del sistema compensado (mostrada en (6.50)). En esta figura se puede verificar que la frecuencia de cruce de ganancia es ω = 25.9[rad/s] y que la fase a esa frecuencia es −132◦ , lo cual corresponde a un margen de fase de +48◦ . Esto significa que se han conseguido las especificaciones de respuesta

362

6 Dise˜ no usando la respuesta en frecuencia

ò [rad]

2

1.8

System: Mc Time (sec): 0.119 Amplitude: 1.83

1.6

1.4

1.2

System: Mc Time (sec): 0.0628 Amplitude: 1

1

0.8

0.6

0.4

0.2

0

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

tiempo [s] Figura 6.60. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la figura 6.57 cuando kp = 1, kd = 0, k = 675.4471 y a = 2.8681.

en frecuencia establecidas en (6.53) y (6.54). Por otro lado, en la figura 6.62 se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspondiente, cuando el valor deseado de posici´on es un escal´on unitario. Se puede observar que el tiempo de subida es de 0.0612[s] y que el sobre paso es del 30 %. Aunque estos valores no son exactamente iguales a los especificados al principio (tr = 0.0628[s] y Mp = 20 %), sin embargo son relativamente cercanos. Esta diferencia se atribuye al hecho de que el cero que posee la funci´on de transferencia de lazo cerrado, y que es introducido por el controlador PD, modifica un tanto la forma de la respuesta transitoria de una manera que no se ha cuantificado de manera exacta. Si se desea cumplir exactamente con las especificaciones de respuesta en el tiempo que se han indicado al principio, se puede proceder a hacer un redise˜ no. Es decir, proponga un margen de fase un poco mayor para reducir el sobre paso. Si al conseguir el sobre paso deseado el sistema sigue siendo m´as r´apido que lo deseado, entonces proponga una frecuencia de cruce de ganancia un poco menor para obtener un tiempo de subida un poco m´as grande. Sin embargo, en lugar de hacer esto, en la siguiente secci´on se buscar´a cumplir con otra especificaci´on para el tiempo de subida.

6.8 Ejemplos

363

Bode Diagram 60 50

Magnitude (dB)

40 30 20 System: ghcomp Frequency (rad/sec): 25.9 Magnitude (dB): 0.0325

10 0 −10 −20

Phase (deg)

−90

−120

System: ghcomp Frequency (rad/sec): 25.8 Phase (deg): −132 −150 0

10

1

2

10 Frequency (rad/sec)

10

Figura 6.61. Gr´ aficas de Bode de la funci´ on de transferencia en (6.50), cuando kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

6.8.4.

Redise˜ no del control PD de posici´ on de un motor de CD

Considere de nuevo el control PD de posici´on de un motor de CD. Es decir, el diagrama de bloques del sistema de control en lazo cerrado es el que se muestra en la figura 6.57 y la funci´on de transferencia de lazo abierto es la que se muestra en (6.50), expresi´on que se reescribe a continuaci´on para facilitar la referencia: G(s)H(s) = kd (s + b)

k , s(s + a)

b=

kp kd

(6.56)

En la secci´on 6.8.3 se mostr´o que cuando los valores num´ericos del motor son: k = 675.4471,

a = 2.8681

k entonces la frecuencia de cruce de ganancia es y se usa s´olo el factor s(s+a) ω1 = 25.9[rad/s]. Adem´as, en lazo cerrado se obtiene un tiempo de subida de tr = 0.0628[s] y un sobre paso de Mp = 83 % cuando se usa un controlador proporcional de ganancia kp = 1. A continuaci´on se dise˜ nar´a un controlador

364

6 Dise˜ no usando la respuesta en frecuencia

ò [rad]

1.4

System: Mc Time (sec): 0.116 Amplitude: 1.3

1.2

1 System: Mc Time (sec): 0.0612 Amplitude: 1 0.8

0.6

0.4

0.2

0

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

tiempo [s] Figura 6.62. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la figura 6.57, cuando kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

proporcional-derivativo para conseguir la mitad del tiempo de subida y un sobre paso del 20 %, es decir ahora se desea: tr =

0.0628 = 0.0314[s], 2

Mp = 20 %

(6.57)

Como ya se ha mencionado, para reducir el tiempo de subida (aumentar la rapidez de respuesta en el tiempo), se debe aumentar la frecuencia de cruce de ganancia ω1 . Sin embargo, no se ha definido una expresi´on matem´atica que relacione al tiempo de subida con la frecuencia de cruce de ganancia. A continuaci´on se explicar´a como puede seleccionar ω1 a fin de obtener un valor especificado de tr . Primero, considere el sistema en lazo cerrado de la figura 6.63. La funci´on de transferencia de lazo abierto es: kp k (6.58) G(s) = s(s + a) mientras que la funci´on de transferencia de lazo cerrado es: G(s) ωn2 θ(s) , = = 2 θd (s) 1 + G(s) s + 2ζωn s + ωn2

ωn2 = kp k,

2ζωn = a (6.59)

6.8 Ejemplos

òd ( s) +

kp

I ã(s)

365

ò(s)

k s ( s+a)

à

Figura 6.63. Control proporcional de posici´ on.

Las gr´aficas de Bode de (6.58) tienen la forma presentada en la figura 6.64, mientras que las gr´aficas de Bode de (6.59) tienen la forma presentada en la figura 6.14(b). De acuerdo a esta u ´ltima figura, la funci´on de transferencia en (6.59) tiene magnitud unitaria cuando ω → 0. Esto puede entenderse a G(s) partir de la expresi´on 1+G(s) y la figura 6.64, observando que |G(jω)| → +∞ cuando ω → 0. Esto significa que la funci´on de transferencia de lazo cerrado ¯ ¯ ¯ G(jω) ¯ ¯ 1+G(jω) ¯ → 1 cuando ω → 0.

dB 0

i)

a

!

1 ii)

iv)

fase [grados]

0 à 90 à 180

a

iii)

!

iii)

ii) iv)

Figura 6.64. Gr´ aficas de Bode de G(s) presentada en (6.58). i)

kp k , a

a ii) 1s , iii) s+a ,

kp k . iv) s(s+a)

Por otro lado, de acuerdo a la figura 6.14(b), la funci´on de transferencia en (6.59) tiene magnitud que tiende a cero cuando ω → +∞. De nuevo, esto pueG(s) de entenderse a partir de la expresi´on 1+G(s) y la figura 6.64, observando que |G(jω)| → 0 cuando ω →¯ +∞. Esto significa que la funci´on de transferencia ¯ ¯ G(jω) ¯ de lazo cerrado ¯ 1+G(jω) ¯ → 0 cuando ω → +∞. De acuerdo a estas ideas, la frecuencia de esquina que la funci´on de transferencia en (6.59) presenta en ω = ωn (v´ease la figura 6.14(b)) debe ocurrir

366

6 Dise˜ no usando la respuesta en frecuencia

aproximadamente cuando se alcanza la frecuencia de cruce de ganancia en la ¯ ¯ ¯ G(jω) ¯ figura 6.64 (cuando |G(jω)| ≈ 1 y, por tanto, ¯ 1+G(jω) ¯ empieza a decrecer de manera importante). Esta observaci´on permite concluir que ωn en la figura 6.14(b) crece si ω1 , medida en la figura 6.64, tambi´en crece. Por otro lado, de acuerdo a: " Ãp !# p 1 − ζ2 1 p π − arctan , ωd = ω n 1 − ζ 2 , tr = 2 ζ ωn 1 − ζ

si se desea reducir el tiempo de subida a la mitad (despreciando el efecto debido a la variaci´on del amortiguamiento ζ) entonces debe aumentarse ωn al doble. Esto significa, de acuerdo a la discusi´on anterior, que la frecuencia de cruce de ganancia ω1 debe aumentarse al doble. Entonces, si tr = 0.0628[s] cuando ω1 = 25.9[rad/s], debe usarse: ω1 = 51.8[rad/s]

(6.60)

para conseguir el tiempo de subida tr = 0.0314[s]. Por otro lado, en la secci´on 6.8.3 se encontr´o que para obtener un sobre paso del 20 % se debe buscar un margen de fase de: Kf = +47.5◦

(6.61)

k En la figura 6.65 se muestran las gr´aficas de Bode de s(s+a) cuando k = 675.4471 y a = 2.8681. Se observa que la magnitud y la fase valen −12[dB] y −177◦ cuando ω = 51.8[rad/s]. Esto corresponde a un margen de fase de +3◦ . Como el margen de fase deseado es de +47.5◦ entonces se necesita que el controlador introduzca una fase positiva de 47.5◦ − 3◦ = 44.5◦ cuando ω = 51.8[rad/s]. Recu´erdese que, de acuerdo a (6.52), la funci´on de transferencia de lazo abierto del sistema compensado est´a dada como:

G(s)H(s) = kd b(z + 1)

k s(s + a)

k

donde kd b(z + 1) = kd s + kp , con b = kpd y z = 1b s, es el controlador PD. En la figura 6.66 se muestran las gr´aficas de Bode del factor z + 1. Recu´erdese que en ´estas gr´aficas el eje horizontal corresponde a 1b ω (v´ease la secci´on 6.4.1). El adelanto de fase requerido de +44.5◦ ocurre cuando 1b ω = 0.982. Como este adelanto de fase debe ocurrir cuando la frecuencia sea igual a la frecuencia de cruce de ganancia deseada ω = 51.8[rad/s] entonces: ω ¯¯ b= = 52.8033 ¯ 0.982 ω=51.8

Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω = 51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,

6.8 Ejemplos

367

Bode Diagram 60 50 40 Magnitude (dB)

30 20 10

System: gh Frequency (rad/sec): 51.8 Magnitude (dB): −12

0 −10 −20 −30 −40

Phase (deg)

−90

−120

−150 System: gh Frequency (rad/sec): 51.7 Phase (deg): −177 −180 0

1

10

10 Frequency (rad/sec)

Figura 6.65. Gr´ aficas de Bode de

k s(s+a)

2

10

cuando k = 675.4471 y a = 2.8681.

la misma magnitud, pero de signo contrario, que la magnitud introducida k en esta frecuencia (para que la magnitud del (−12[dB]) por el factor s(s+a) sistema compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia). Esto implica que se debe exigir lo siguiente: |kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 12[dB]

(6.62)

donde, de acuerdo a la figura 6.66, se debe usar |z + 1|dB = 2.95[dB]. Por tanto, despejando kd y realizando los c´alculos correspondientes se encuentra: kd = Finalmente, usando b =

kp kd

1 12−2.95 10 20 = 0.0537 b

se obtiene: kp = bkd = 2.8347

En la figura 6.67 se muestran las gr´aficas de Bode de la funci´on de transferencia de lazo abierto del sistema compensado (mostrada en (6.56)). En esta figura se puede verificar que la frecuencia de cruce de ganancia es ω = 51.8[rad/s]

368

6 Dise˜ no usando la respuesta en frecuencia Bode Diagram 25

Magnitude (dB)

20

15

10 System: gc Frequency (rad/sec): 0.983 Magnitude (dB): 2.95

5

0

Phase (deg)

90

45 System: gc Frequency (rad/sec): 0.982 Phase (deg): 44.5

0 −1

0

10

10 Frequency (rad/sec)

1

10

Figura 6.66. Gr´ aficas de Bode del factor z + 1.

y que la fase a esa frecuencia es −132◦ , lo cual corresponde a un margen de fase de +48◦ . Esto significa que se han conseguido las especificaciones de respuesta en frecuencia establecidas en (6.60) y (6.61). Por otro lado, en la figura 6.68 se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspondiente, cuando el valor deseado de posici´on es un escal´on unitario. Se puede observar que el tiempo de subida es de 0.03[s] y que el sobre paso es del 31 %. Aunque estos valores no son exactamente iguales a los especificados al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente cercanos. La raz´on de esta diferencia y la manera de corregirla ya ha sido explicada en la secci´on 6.8.3 por lo que se sugiere consultar dicha parte de la presente obra. 6.8.5.

Control PID de posici´ on de un motor de CD

Considere el modelo de un motor de CD presentado en (5.12), cap´ıtulo 5, el cual se reescribe a continuaci´on para facilitar la referencia: θ(s) =

k I ∗ (s) s(s + a)

(6.63)

6.8 Ejemplos

369

Bode Diagram 30 25

Magnitude (dB)

20 15 10 System: ghcomp Frequency (rad/sec): 51.9 Magnitude (dB): −0.0529

5 0 −5 −10

Phase (deg)

−90

−120

System: ghcomp Frequency (rad/sec): 51.8 Phase (deg): −132

−150

−180 1

2

10

10 Frequency (rad/sec)

Figura 6.67. Gr´ aficas de Bode de la funci´ on de transferencia en (6.56), cuando kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

a=

b > 0, J

k=

nkm >0 J

donde θ(s) e I ∗ (s) representan la posici´on (salida) y la consigna de corriente (entrada), respectivamente. En esta parte se dise˜ nar´a el siguiente controlador PID de posici´on: Z t de i∗ = kp e + kd + ki e(r)dr, e = θd − θ dt 0 donde θd es la posici´on deseada y las constantes kp , kd y ki se conocen como las ganancias proporcional, derivativa e integral, respectivamente. Usando la transformada de Laplace se obtiene: E(s) I ∗ (s) = kp E(s) + kd sE(s) + ki s µ ¶ ki = kp + kd s + E(s) s = kd

s2 +

kp kd s

s

+

ki kd

E(s)

370

6 Dise˜ no usando la respuesta en frecuencia

ò [rad]

System: Mc Time (sec): 0.0579 Amplitude: 1.31

1.4

1.2 System: Mc Time (sec): 0.03 Amplitude: 1 1

0.8

0.6

0.4

0.2

0

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

tiempo [s] Figura 6.68. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la figura 6.57, cuando kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

Entonces, el sistema en lazo cerrado se representa por el diagrama de bloques mostrado en la figura 6.69. La funci´on de transferencia de lazo abierto es: ò d(s)

+

à

kp

kd

k

s 2+k s+k i d

k s(s+a)

d

s

ò(s)

Figura 6.69. Sistema en lazo cerrado del control PID de posici´ on de un motor de CD.

G(s)H(s) = kd

s2 +

kp kd s

s

+

ki kd

k s(s + a)

Definiendo: s2 +

kp ki s+ = (s + z1 )(s + z2 ) = s2 + (z1 + z2 )s + z1 z2 kd kd

(6.64)

6.8 Ejemplos

371

se concluye que: kp = z1 + z2 , kd

ki = z1 z2 kd

(6.65)

En la figura 6.70 se muestra un bosquejo de la gr´afica polar de (6.64) cuando se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56. N´otese que existen dos polos en s = 0 y se debe proceder de nuevo como en la secci´on 6.8.3 para rodear el origen en el plano s. Esta es la raz´on para el c´ırculo de radio infinito en la figura 6.70. Adem´as, no es dif´ıcil darse cuenta k que, para 0 < ω < +∞, la gr´afica polar del factor s2 (s+a) es como la mostrada ◦ en la figura 6.55, pero girada 90 en sentido horario (en sentido antihorario para −∞ < ω < 0). Por tanto, el adelanto de fase debido al factor de segundo k orden s2 + kdp s + kkdi debe modificar la gr´afica polar como en la figura 6.70. De este modo se obtiene estabilidad en lazo cerrado pues P = 0, N = 0 y Z = N + P = 0. Para alcanzar este objetivo se propone usar el siguiente criterio de dise˜ no: Im (G (j!) H (j!) )

à + 180 î ! = 0

î

à 180 ! = 0 +

! ! +1

à1

! ! à1

Re (G (j!) H (j!) )

r!1

Figura 6.70. Gr´ afica polar de (6.64) cuando se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56.

z1 = a

(6.66)

porque esto simplifica a la funci´on de transferencia de lazo abierto, presentada en (6.64), del siguiente modo: G(s)H(s) = kd (s + z2 )

k s2

(6.67)

372

6 Dise˜ no usando la respuesta en frecuencia

Se debe subrayar que la cancelaci´on de los factores s + z1 y s + a es v´alida porque ambos corresponden a polos y ceros con parte real negativa pues a > 0 y z1 > 0. Realizando algunos pasos algebraicos adicionales en (6.67) se obtiene: µ ¶ s + z2 k 1 k k G(s)H(s) = kd z2 = kd z2 s + 1 2 = kd z2 (z + 1) 2 (6.68) z2 s2 z2 s s donde se ha definido z = z12 s. Ahora el factor sk2 representa el sistema sin compensar y sus gr´aficas de Bode se presentan en la figura 6.71 cuando se usan los valores num´ericos del motor de CD controlado experimentalmente en el cap´ıtulo 10, es decir: k = 675.4471

Bode Diagram 60 50 40 Magnitude (dB)

30 20 10

System: gh Frequency (rad/sec): 51.9 Magnitude (dB): −12

0 −10 −20 −30 −40 −179

Phase (deg)

−179.5

−180 System: gh Frequency (rad/sec): 51.7 Phase (deg): −180

−180.5

−181 0

10

1

2

10 Frequency (rad/sec)

Figura 6.71. Gr´ aficas de Bode del factor

10

k s2

cuando k = 675.4471.

Se puede observar que la magnitud y la fase son iguales a −12[dB] y −180◦ cuando la frecuencia es igual a 51.8[rad/s]. De acuerdo a la secci´on 6.8.4, se propone usar la siguiente frecuencia de cruce de ganancia: ω1 = 51.8[rad/s]

(6.69)

6.8 Ejemplos

373

y el siguiente margen de fase: Kf = +47.5◦

(6.70)

para conseguir el tiempo de subida tr = 0.0314[s] y un sobre paso de 20 %. Por tanto, el controlador definido por kd z2 (z + 1) debe introducir un adelanto de fase de +47.5◦ y una magnitud de +12[dB] cuando la frecuencia sea igual a 51.8[rad/s]. En la figura 6.72 se observa que el factor z + 1 introduce una fase de +47.4◦ cuando z12 ω = 1.09 (v´ease la secci´on 6.4.1). Como esto debe ocurrir cuando ω = 51.8[rad/s], entonces: ω ¯¯ = 47.5229 z2 = ¯ 1.09 ω=51.8 Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω = Bode Diagram 25

Magnitude (dB)

20

15

10 System: gc Frequency (rad/sec): 1.09 Magnitude (dB): 3.4

5

0

Phase (deg)

90

45 System: gc Frequency (rad/sec): 1.09 Phase (deg): 47.4

0 −1

10

0

10 Frequency (rad/sec)

1

10

Figura 6.72. Gr´ aficas de Bode del factor z + 1.

51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia, la misma magnitud, pero de signo contrario, que la magnitud introducida (−12[dB]) por el factor sk2 en esta frecuencia (para que la magnitud del sistema compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia). Esto implica que se debe exigir lo siguiente:

374

6 Dise˜ no usando la respuesta en frecuencia

|kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 12[dB]

(6.71)

donde, de acuerdo a la figura 6.72, se debe usar |z +1|dB = 3.4[dB]. Por tanto, despejando kd y realizando los c´alculos correspondientes se encuentra: kd =

1 12−3.4 10 20 = 0.0566 z2

Finalmente, usando (6.65), (6.66) y a = 2.8681 (v´ease el cap´ıtulo 10) se obtiene: kp = kd (z1 + z2 ) = 2.8540,

ki = kd z1 z2 = 7.7196

En la figura 6.73 se muestran las gr´aficas de Bode de la funci´on de transferencia de lazo abierto, del sistema compensado, mostrada en (6.64). En esta figura se puede verificar que la frecuencia de cruce de ganancia es ω = 51.8[rad/s] y que la fase a esa frecuencia es −133◦ , lo cual corresponde a un margen de fase de +47◦ . Esto significa que se han conseguido las especificaciones de respuesta en frecuencia establecidas en (6.69) y (6.70). Por otro lado, en la figura 6.74 se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspondiente, cuando el valor deseado de posici´on es un escal´on unitario. Se puede observar que el tiempo de subida es de 0.0291[s] y que el sobre paso es del 33 %. Aunque estos valores no son exactamente iguales a los especificados al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente cercanos. La raz´on de esta diferencia y la manera de corregirla ya ha sido explicada en la secci´on 6.8.3 por lo que se sugiere consultar dicha parte de la presente obra.

6.8 Ejemplos

375

Bode Diagram 30 25

Magnitude (dB)

20 15 10 System: ghcomp Frequency (rad/sec): 51.8 Magnitude (dB): 0.0218

5 0 −5 −10

Phase (deg)

−90

−120

System: ghcomp Frequency (rad/sec): 51.7 Phase (deg): −133

−150

−180 1

2

10

10 Frequency (rad/sec)

Figura 6.73. Gr´ aficas de Bode de la funci´ on de transferencia en (6.64), cuando kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.

ò [rad]

1.4

System: Mc Time (sec): 0.0577 Amplitude: 1.33

1.2

1 System: Mc Time (sec): 0.0291 Amplitude: 1 0.8

0.6

0.4

0.2

0

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

tiempo [s] Figura 6.74. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la figura 6.69, cuando kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.

376

6 Dise˜ no usando la respuesta en frecuencia

6.9. Caso de estudio. Control PID de un sistema de levitaci´ on magn´ etica Considere el modelo de un sistema de levitaci´on magn´etica presentado en (11.31), cap´ıtulo 11, el cual se reescribe a continuaci´on para facilitar la referencia: G(s) =

s3

+

2739s2

11613700 − 1250s − 3.536 × 106

El polinomio caracter´ıstico de esta funci´on de transferencia se puede factorizar del siguiente modo s3 + 2739s2 − 1250s − 3.536 × 106 = (s + 35.9)(s − 35.9)(s + 2739). As´ı que este sistema es inestable en lazo abierto debido a que tiene un polo con parte real positiva ubicado en s = 35.9. Para resolver este problema se usar´a el siguiente controlador PID (v´ease la secci´on 6.8.5): kd

s2 +

kp kd s

s

+

ki kd

= kd (s + z1 )(s + z2 ) = kd (s2 + (z1 + z2 )s + z1 z2 )

kp = z1 + z2 , kd

ki = z1 z2 kd

(6.72)

Entonces la funci´on de transferencia de lazo abierto es: k (s + z1 )(s + z2 ) (6.73) s s3 + 2739s2 − 1250s − 3.536 × 106 k (s + z1 )(s + z2 ) = kd , k = 11613700 s (s + 35.9)(s − 35.9)(s + 2739)

G(s)H(s) = kd

De esta manera, el sistema es de tipo 1 y, ante una referencia constante, el error en estado estacionario ser´a igual a cero si el sistema en lazo cerrado es estable. El controlador PID deber´a ser dise˜ nado para asegurar que esta condici´on se cumple. Para esto se considerar´a el siguiente criterio de dise˜ no: z1 = 35.9

(6.74)

De este modo se obtiene: G(s)H(s) = kd (s + z2 )

k s(s − 35.9)(s + 2739)

o bi´en: G(s)H(s) = kd z2 (z + 1)

k s(s − 35.9)(s + 2739)

(6.75)

donde se ha definido z = z12 s. Se debe subrayar que la cancelaci´on de los factores s + z1 y s + 35.9 es v´alida porque ambos corresponden a polos y ceros con parte real negativa pues 35.9 > 0 y z1 > 0. En la figura 6.75 se muestra un bosquejo de las gr´aficas de Bode de la funci´on de transferencia:

6.9 Caso de estudio

377

dB i) 0

35:9 1

ii)

2739

!

iii)

iv)

v)

fase [grados] 0

35:9

2739

!

iv) à 90

ii) iii)

à 180

v)

à 270

35.9 2739 k , ii) 1s , iii) s−35.9 , iv) s+2739 , Figura 6.75. Gr´ aficas de Bode de (6.76). i) (35.9)(2739) k v) s(s−35.9)(s+2739) .

G0 (s) =

k s(s − 35.9)(s + 2739)

(6.76)

donde se ha hecho uso de los resultados obtenidos en la secci´on 6.8.1 para a con a > 0. Usando obtener las gr´aficas de Bode de un factor de la forma s−a la figura 6.75 se procede a dibujar la gr´afica polar mostrada en la figura 6.76. Es importante subrayar que la funci´on de transferencia en (6.76) tiene un polo en el origen por lo que se debe usar la trayectoria de Nyquist modificada mostrada en la figura 6.56. De acuerdo a esto, se debe dar un rodeo alrededor de s = 0 del siguimiente modo. En (6.76) se debe hacer el cambio de variable s = ε∠φ: k k = ε∠φ(ε∠φ − 35.9)(ε∠φ + 2739) ε∠φ(−35.9)(2739) k k ∠−φ= ∠(−φ − 180o ) = ε(−35.9)(2739) ε(35.9)(2739)

G0 (ε∠φ) =

378

6 Dise˜ no usando la respuesta en frecuencia

recordando que ε → 0. Esto justifica el semic´ırculo de radio infinito que Im ( G 0 (j!)) ! = 0+

à1

à 270 o

!! +1 !! à1

r!1

Re ( G 0 (j!))

à 90 o ! = 0à

Figura 6.76. Gr´ afica polar de (6.76) cuando se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56.

pasa de −90◦ cuando ω = 0− a −270◦ cuando ω = 0+ (v´ease la figura 6.56). En la figura 6.76 es claro que N = 1 y como P = 1 (v´ease (6.76) entonces Z = N +P = 2, por lo que habr´ıa inestabilidad en lazo cerrado. Por esta raz´on, para conseguir estabilidad en lazo cerrado usando la funci´on de transferencia de lazo abierto (6.75) (con un controlador PID), el factor kd z2 (z + 1) debe introducir un adelanto de fase suficiente como para que se obtenga una gr´afica polar como se muestra en la figura 6.77. De este modo N = −1 y como P = 1 entonces Z = N + P = 0 y el sistema en lazo cerrado ser´a estable. En la figura 6.78 se muestran las gr´aficas de bode de (6.76). Se puede observar que la magnitud y la fase son iguales a 0[dB] y −212◦ cuando la frecuencia es igual a 60[rad/s]. Se propone mantener la misma frecuencia de cruce de ganancia: ω1 = 60[rad/s]

(6.77)

y conseguir el siguiente margen de fase3 : Kf = +20◦ 3

(6.78)

Aunque el margen de fase fue presentado en la secci´ on 6.6 para sistemas de fase m´ınima, este concepto es aplicable de manera directa en este ejemplo

6.9 Caso de estudio Im(G(j!)H(j!)) ! = 0+

à1

379

à 270 o

!! à1 !! +1 Re(G(j!)H(j!))

r!1

! = 0 à à 90 o

Figura 6.77. Gr´ afica polar de (6.75) cuando se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56. Bode Diagram 50

Magnitude (dB)

0 System: gh Frequency (rad/sec): 60 Magnitude (dB): 0.0673

−50

−100

−150

−200

Phase (deg)

−180

System: gh Frequency (rad/sec): 60.1 Phase (deg): −212

−225

−270 0

10

1

10

2

3

10 10 Frequency (rad/sec)

4

10

5

10

Figura 6.78. Gr´ aficas de Bode de (6.76).

Ya que la planta a controlar es naturalmente inestable, la idea es simplemente asegurar estabilidad en lazo cerrado sin preocuparse por ninguna otra especificaci´on como podr´ıan ser el tiempo de subida y el sobrepaso. Por tanto,

380

6 Dise˜ no usando la respuesta en frecuencia

el controlador definido por kd z2 (z + 1) debe introducir un adelanto de fase de +52◦ y una magnitud de 0[dB] cuando la frecuencia sea igual a 60[rad/s]. En la figura 6.79 se observa que el factor z + 1 introduce una fase de +52◦ cuando z12 ω = 1.28 (v´ease la secci´on 6.4.1). Como esto debe ocurrir cuando ω = 60[rad/s], entonces: ω ¯¯ = 46.875 z2 = ¯ 1.28 ω=60 Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω = Bode Diagram 40 35

Magnitude (dB)

30 25 20 15 System: Adel Frequency (rad/sec): 1.28 Magnitude (dB): 4.24

10 5 0

Phase (deg)

90

45

System: Adel Frequency (rad/sec): 1.28 Phase (deg): 52

0 −2

10

−1

10

0

10 Frequency (rad/sec)

1

10

2

10

Figura 6.79. Gr´ aficas de Bode del factor z + 1.

60[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia, una magnitud de 0[dB] para que la magnitud del sistema compensado sea de 0[dB] a la frecuencia de cruce de ganancia. Esto implica que se debe exigir lo siguiente: |kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 0[dB]

(6.79)

donde, de acuerdo a la figura 6.79, se debe usar |z + 1|dB = 4.24[dB]. Por tanto, despejando kd y realizando los c´alculos correspondientes se encuentra: kd =

1 −4.24 10 20 = 0.0131 z2

Finalmente, usando (6.72) y (6.74) se obtiene:

6.9 Caso de estudio

kp = kd (z1 + z2 ) = 1.0838,

381

ki = kd z1 z2 = 22.0341

En la figura 6.80 se muestran las gr´aficas de Bode de la funci´on de transferencia (dada en (6.73), es decir, G(s)H(s) = ¡de lazo abierto ¢del sistema compensado k kp + kd s + ksi × s3 +2739s2 −1250s−3.536×10 6 ). En esta figura se puede verificar que la frecuencia de cruce de ganancia es ω = 60[rad/s] y que la fase a esa frecuencia es −160◦ , lo cual corresponde a un margen de fase de +20◦ . Esto significa que se han conseguido las especificaciones de respuesta en frecuencia establecidas en (6.77) y (6.78). Finalmente, en la figura 6.81 se muestra la respuesta en el tiempo, ante un escal´on¢ unitario, cuando se cierra el lazo ¡ k alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10 6 . Se puede observar que el tiempo de subida es de 0.0166[s] y que el sobre paso es del 89 %. Como se dijo anteriormente, no se ha procurado hacer nada por conseguir un tiempo de subida y un sobre paso espec´ıficos y s´olo se busca asegurar la estabilidad en lazo cerrado. Por esta raz´on, la respuesta en el tiempo de la figura 6.81 se considera satisfactoria. Se deja como ejercicio al lector el conseguir un dise˜ no con el cual se consiga una respuesta m´as amortiguada. Para esto, debe especificar un margen de fase mayor. Bode Diagram 50

Magnitude (dB)

System: gh Frequency (rad/sec): 60 Magnitude (dB): 0.0784 0

−50

−100 −90

Phase (deg)

−135

System: gh Frequency (rad/sec): 60 Phase (deg): −160

−180

−225

−270 0

10

1

10

2

3

10 10 Frequency (rad/sec)

4

10

5

10

Figura 6.80. Gr´ on de transferencia en (6.73), es de³aficas de Bode´ de la funci´ k cir, G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10 6 con kd = 0.0131, kp = 1.0838, ki = 22.0341.

382

6 Dise˜ no usando la respuesta en frecuencia Step Response 2

System: M Time (sec): 0.0449 Amplitude: 1.89

1.8

1.6

1.4

Amplitude

1.2

System: M Time (sec): 0.0166 Amplitude: 1

1

0.8

0.6

0.4

0.2

0

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Time (sec)

Figura 6.81. Respuesta en el tiempo, ante un´escal´ on unitario, cuando se cierra el ³ k lazo alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10 6 con kd = 0.0131, kp = 1.0838, ki = 22.0341.

6.10.

Resumen del cap´ıtulo

Un resultado fundamental del estudio de las ecuaciones diferenciales lineales es el siguiente. Dada una ecuaci´on diferencial lineal totalmente arbitraria, si se aplica a la entrada una funci´on sinusoidal del tiempo entonces la respuesta forzada a la salida es otra funci´on sinusoidal del tiempo. Estas funciones sinusoidales difieren en sus amplitudes y sus fases pero son de la misma frecuencia. Las relaciones entre las amplitudes y las fases de estas funciones dependen de su frecuencia y la forma en que var´ıan se conoce como respuesta en frecuencia. La propiedad fundamental de la respuesta en frecuencia que la teor´ıa de control explota es el hecho de que la manera en que var´ıan las relaciones entre amplitudes y fases de las funciones a la entrada y a la salida depende de la ubicaci´on de los polos y los ceros de la funci´on de transferencia correspondiente. En sistemas de lazo abierto, esto permite interpretar a las ecuaciones diferenciales lineales, y a los sistemas de control lineales, como filtros. Esto significa que la rapidez y las oscilaciones presentes en la respuesta de un sistema de control dependen del contenido de componentes de frecuencia de la entrada y de qu´e componentes de frecuencia deja pasar el sistema de control: i) las componentes de frecuencia altas favorecen una respuesta r´apida, ii) si una banda de frecuencias es favorecida (pico de resonancia) entonces la respuesta

6.11 Preguntas de repaso

383

es oscilatoria, iii) del tratamiento que se d´e a las componentes de frecuencias bajas (cero) depende el valor de la salida en estado estacionario, iv) el efecto del ruido se reduce si las componentes de muy alta frecuencia son fuertemente atenuadas. Un logro importante del estudio de los sistemas de control bajo el enfoque de la respuesta en frecuencia es el poder relacionar las caracter´ısticas de respuesta en frecuencia en lazo abierto (frecuencia de cruce de ganancia y m´argenes de estabilidad) con las caracter´ısticas de respuesta en el tiempo (rapidez y oscilaciones de la respuesta) del sistema de control en lazo cerrado. De esta manera se puede dise˜ nar un controlador buscando que ´este modifique convenientemente las gr´aficas de respuesta en frecuencia del sistema en lazo abierto.

6.11. 1. 2.

3.

4. 5.

6.

7. 8.

9. 10.

Preguntas de repaso

¿Qu´e entiende por respuesta en frecuencia? ¿Qu´e representan la magnitud y la fase de una funci´on de transferencia? Las funciones de transferencia est´an constituidas por polos y ceros ¿Cu´ales de estos componentes contribuyen como filtros pasa altas y cu´ales como filtros pasa bajas? ¿Cu´ales de ellos introducen fase positiva y cuales fase negativa? Dado un sistema de control en lazo cerrado ¿Por qu´e los ceros contribuyen a la estabilidad cuando son colocados en la funci´on de transferencia de lazo abierto? ¿C´omo contribuyen los polos de lazo abierto a la estabilidad? ¿Cu´al es la ventaja de agregar polos en la funci´on de transferencia de lazo abierto? ¿Cu´al es la relaci´on del criterio de estabilidad de Nyquist con los m´argenes de estabilidad? Dado un sistema en lazo abierto ¿Por qu´e una frecuencia de corte (o de esquina) mayor contribuye a una mayor rapidez de la respuesta en el tiempo? ¿Qu´e se debe hacer con la frecuencia de cruce de ganancia para conseguir que el sistema en lazo cerrado tenga una respuesta m´as r´apida en el tiempo? ¿C´omo afecta el margen de fase a la respuesta en el tiempo del sistema en lazo cerrado? ¿Cu´al es la modificaci´on que se debe hacer al criterio de estabilidad de Nyquist para que pueda ser aplicado a funciones de transferencia de lazo abierto con polos y/o ceros sobre el eje imaginario? ¿Cu´al es la raz´on para esto? ¿Qu´e es un sistema de fase m´ınima? ¿Qu´e es la trayectoria de Nyquist y qu´e es la trayectoria de Nyquist modificada?

384

6 Dise˜ no usando la respuesta en frecuencia

6.12. 1.

2.

Ejercicios propuestos

¿C´omo obtiene el error en estado estacionario de un sistema en lazo cerrado ante referencias tipo escal´on, rampa y par´abola, a partir de las gr´aficas de Bode? Investigue. Considere un sistema integrador: Z t u dt y(t) = k 0

y un sistema derivador: y(t) = k u(t) ˙ a)

En ambos casos suponga que u = A cos(ωt), con A una constante, y calcule y(t). Haga una gr´afica donde muestre como var´ıa la amplitud de y(t) respecto de la frecuencia en cada caso y compare con las gr´aficas de Bode mostradas en las figuras 6.13(a) y 6.13(b). b) ¿Cual es el efecto de un derivador cuando u tiene alto contenido de ruido? (sinusoide de alta frecuencia). En base a lo anterior responda que piensa que suceder´a en los siguientes casos: ¿Que efecto tiene un controlador que contiene alguna acci´on derivativa en un sistema de control de posici´on que tiene alto contenido de ruido? ¿Cual es el efecto del ruido en un sistema de control que contiene una acci´on integral u ´nicamente? c) Considere el caso de un pist´on neum´atico. El flujo de aire de entrada es u y la posici´on del ´embolo del pist´on es y. Suponga que el aire no se comprime ni se expande (que es incompresible) dentro del pist´on y que el ´embolo del pist´on no tiene masa. Si se extrae flujo de aire del pist´on entonces u < 0, si se introduce flujo de aire al pist´on entonces u > 0. Bajo estas condiciones este sistema se comporta como un integrador. Suponga que se aplica una entrada de la forma u = A cos(ωt) con un valor de ω que cada vez se acerca m´as a cero. Usando su experiencia cotidiana explique que sucede con la posici´on del pist´on y compare con lo que indican las gr´aficas de Bode correspondientes a este problema y las gr´aficas obtenidas en el primer inciso de este ejercicio. ¿Qu´e significa el t´ermino “ganancia infinita a frecuencia cero”? Aunque un motor de CD con escobillas no es exactamente un integrador, use su experiencia cotidiana para ver si tiene un comportamiento similar al descrito cuando y es la posici´on y u = A cos(ωt) el voltaje aplicado. Desde el punto de vista del modelo del motor ¿Como puede explicar este comportamiento? 3. Considere el siguiente sistema: Y (s) =

a U (s), s+a

a>0

6.12 Ejercicios propuestos

4.

5.

385

Suponga que u(t) es una onda cuadrada (de per´ıodo igual a 2) que es igual a la unidad durante el primer medio per´ıodo e igual a cero durante el segundo medio per´ıodo. Utilice alg´ un software especializado para realizar varias simulaciones utilizando diferentes valores de a desde valores muy cercanos a cero hasta valores considerablemente grandes. Observe la forma de y(t) en estas simulaciones. ¿Por qu´e cree que y(t) sea muy diferente de u(t) cuando a es muy cercana a cero? ¿Por qu´e cree que y(t) sea cada vez m´as parecida a u(t) cuando a es considerablemente grande? ¿Puede explicar este comportamiento desde el punto de vista de conceptos basados a ? en la respuesta en frecuencia de la funci´on de transferencia s+a Existe un resultado fundamental en la teor´ıa de sistemas lineales que afirma que si Y (s) = G(s)U (s) con u(t) una funci´on peri´odica y si todos los polos de G(s) tienen parte real estrictamente negativa, entonces y(t) converge a una funci´on peri´odica con el mismo per´ıodo de u(t) pero posiblemente no con la misma forma de onda [5], p´ag. 389 (v´ease tambi´en el ejercicio 13 del cap´ıtulo 3) ¿El ejemplo planteado en el ejercicio 3 de este cap´ıtulo le sugiere alguna explicaci´on acerca de porque u(t) y y(t) puedan no tener la misma forma de onda? ¿De qu´e depende el que las formas de onda de u(t) y y(t) sean parecidas o muy diferentes? Considere la siguiente ecuaci´on diferencial: y¨ + ωn2 y = ωn2 u El problema de calcular y(t) cuando t → ∞ y u(t) = A sin(ωt) se simplifica enormemente usando las gr´aficas de Bode de la figura 6.14(b). Usando esta informaci´on elabore gr´aficas donde se aprecie c´omo cambia y(t) cuando t → ∞ conforme ω cambia desde un valor ω = ω1 < ωn hasta otro valor ω = ω 2 > ωn . A partir de lo anterior explique qu´e sucede cuando se hace el mismo experimento pero ahora se tiene una ecuaci´on diferencial como la siguiente: y¨ + 2ζωn y˙ + ωn2 y = ωn2 u

6.

7.

con ωn > 0 y ζ > 0. ¿Qu´e sucede conforme ζ crece? ¿Por qu´e la resonancia se considera peligrosa en muchas aplicaciones? Considere un sistema en lazo cerrado como el de la figura 4.10 y la corres1 R(s) donde pondiente expresi´on para el error dada como E(s) = 1+G(s) E(s) = R(s) − C(s). Si el valor deseado es una sinusoide r(t) = A sin(ωt) ¿Qu´e debe hacer para que el error l´ımt→∞ e(t) sea cada vez menor? ¿Es posible que se pueda tener que l´ımt→∞ e(t) = 0? Si la respuesta es afirmativa, ¿Bajo qu´e condiciones? Verifique su respuesta mediante una simulaci´on. Considere el circuito RLC paralelo mostrado en la figura 6.82. Demuestre que la funci´on de transferencia est´a dada como: V (s) kωn2 s = 2 I(s) s + 2ζωn s + ωn2

(6.80)

386

6 Dise˜ no usando la respuesta en frecuencia

q 1 L 1 donde ωn = √LC , ζ = 2R aficas de Bode corresC , k = L. Dibuje las gr´ pondientes cuando ζ es cercana a cero (¿C´omo puede ser esto posible en la pr´actica?) y compruebe que se trata de un filtro pasa banda alrededor de la frecuencia ω ≈ ωn (de hecho ω → ωn conforme ζ → 0). ¿C´omo puede variar el valor de ωn en la pr´actica?

I(s) +

L

R

C

V(s)

à Figura 6.82. Circuito RLC paralelo.

Una aplicaci´on interesante e importante de este ejercicio es el radioreceptor de AM mostrado en la figura 6.83 [6], p´ag. 94-99. Se sugiere al lector que construya este receptor pues no es dif´ıcil hacerlo y a continuaci´on se detalla sobre la elaboraci´on de las partes m´as importantes. La inductancia se construye enrollando alambre magneto sobre un n´ ucleo cil´ındrico de cart´on o de pl´astico de aproximadamente 2.6[cm] de di´ametro y aproximadamente 10[cm] de largo. Las espiras deben estar colocadas una junto a la otra sin encimarse y sin dejar huecos apreciables entre ellas. Entonces se utiliza papel lija para retirar completamente el barniz que cubre al alambre de cobre sobre una franja a lo largo de todo el cilindro de aproximadamente 0.5[cm] de ancho. Entonces, la inductancia L se puede variar deslizando un contacto el´ectrico a lo largo de esta franja de alambre desnudo. La antena consiste de un alambre de cobre de 30[m] de largo. Uno de los extremos se fija, a trav´es de material aislante, a un punto s´olido sobre una pared o un poste mientras que el otro extremo se conecta al circuito sintonizador (LC en paralelo). Es importante que la antena no tenga contacto el´ectrico con ning´ un punto que no sea el indicado en la figura 6.83. N´otese que la funci´on de la antena es recoger la se˜ nales el´ectricas que son transportadas por las ondas electromagn´eticas que emiten las estaciones radiodifusoras comerciales de AM. Mientras m´as larga sea la antena m´as intensas ser´an las se˜ nales recuperadas. La conexi´on a tierra se realiza conectando firmemente dicho punto a una tuber´ıa de agua de cobre. Es importante que la tuber´ıa sea de cobre y que llegue a una profundidad suficiente dentro del suelo.

6.12 Ejercicios propuestos

387

El diodo 1N34A es de germanio y tiene la funci´on de elemento detector, es decir, es quien extrae la informaci´on que porta la onda electromagn´etica transmitida. Es importante que este diodo sea de germanio pues tiene una barrera de potencial mucho menor que la de un diodo de silicio. Esto facilita que la d´ebil se˜ nal captada por la antena pueda vencer dicha barrera de potencial. Precisamente debido a lo d´ebil de esta se˜ nal tambi´en es importante que todo el circuito de audio represente una alta impedancia. Entonces el circuito basado en amplificador operacional debe tener una ganancia elevada y su resistencia de entrada debe ser grande (aunque se sugiere de 100K[Ohm] pueden utilizarse otros valores para ajustar convenientemente la ganancia de este amplificador). El lector puede sintonizar diferentes estaciones simplemente variando la inductancia L. Si la antena es suficientemente larga, si adem´as se tiene una buena conexi´on a tierra y si los aud´ıfonos son de alta impedancia entonces se podr´an escuchar estaciones de radio incluso sin necesidad de bater´ıas, es decir, se puede sustituir todo el circuito contenido por las l´ıneas punteadas por un simple corto. En caso de usar el amplificador operacional se sugiere usar dos bater´ıas de 9[V] para proveer la alimentaci´on necesaria. ¿Puede explicar el funcionamiento del circuito de sinton´ıa de este receptor a partir de la respuesta en frecuencia de la funci´on de transferencia en (6.80)? ¿Por qu´e s´olo aparecen los elementos L y C pero no R en la figura 6.83? ¿Qu´e variables en el radio receptor juegan los papeles de V (s) y I(s) en (6.80)? Antena

1M

100K

1N34A

à

+

L

C

NA741

Audifonos

Tierra Figura 6.83. Radio-receptor de AM b´ asico.

8.

Considere el circuito RC mostrado en la figura 6.84. Si vi (t) es un escal´on, encuentre vo (t) y grafique estas dos se˜ nales. ¿La se˜ nal vo (t) es continua o

388

6 Dise˜ no usando la respuesta en frecuencia (s) discontinua en t = 0? Obtenga la funci´on de transferencia VVoi (s) , obtenga las gr´aficas de Bode correspondientes y diga si se trata de un filtro pasa altas o pasa bajas. En base a estas observaciones ¿C´omo puede explicar la continuidad (o discontinuidad) de vo (t) en t = 0 cuando vi (t) es un escal´on?

C +

à

+

vi

+ à

vo

R à

Figura 6.84. Circuito RC.

9.

10.

En este cap´ıtulo se ha explicado c´omo se obtienen las gr´aficas de Bode correspondientes a una funci´on de transferencia conocida. Sin embargo, tambi´en es posible el proceso inverso: dadas las gr´aficas de Bode se puede obtener la funci´on de transferencia correspondiente. En este tipo de problemas las gr´aficas de Bode son obtenidas experimentalmente y se dice que al encontrar la funci´on de transferencia correspondiente se ha identificado al sistema bajo estudio. En la figura 6.85 se muestran unas gr´aficas de Bode que se han obtenido experimentalmente. Encuentre la funci´on de transferencia correspondiente. Verifique su respuesta dibujando las gr´aficas de Bode de la funci´on de transferencia identificada y compar´andolas con las de la figura 6.85. En el ejercicio 7 del cap´ıtulo 2 se explica como obtener el modelo matem´atico de un volt´ımetro anal´ogico de CD. Si se supone que la inductancia del volt´ımetro es despreciable (L ≈ 0) el modelo se reduce a un sistema masa-resorte-amortiguador giratorio (de segundo orden). Con esta informaci´on en mente realice el siguiente experimento. Conecte el volt´ımetro anal´ogico en el modo de corriente directa. Tome un generador de funciones y progr´amelo para que genere una forma de onda sinusoidal. Tambi´en progr´amelo de manera que dicha funci´on sinusoidal de voltaje sea entregada montada sobre una componente de CD constante. El valor de esta componente de CD debe ser igual a la mitad de la escala utilizada del volt´ımetro de CD. Adem´as, el generador de funciones debe entregar un voltaje cuyos valores m´aximo

6.12 Ejercicios propuestos

389

Bode Diagram 25

Magnitude (dB)

20

15

10

5

0

−5

Phase (deg)

45

0

−45

−90 −4

10

−3

10

−2

10

−1

0

10 10 Frequency (rad/sec)

1

2

10

10

3

10

Figura 6.85. Gr´ aficas de Bode de una planta a identificar.

y m´ınimo (cuando aparece la funci´on sinusoidal junto con la componente de CD) no excedan la escala seleccionada del volt´ımetro anal´ogico. Conecte directamente a las terminales del volt´ımetro la salida del generador de funciones. Aplique una se˜ nal sinusoidal de frecuencia ω y obtenga los valores vmin y vmax como los valores m´ınimo y m´aximo obtenidos en la escala del volt´ımetro anal´ogico. Utilice un osciloscopio para medir el voltaje de pico a pico de la se˜ nal sinusoidal entregada por el generador de funciones y des´ıgnelo como A. Utilice diferentes valores de frecuencia ω y forme la siguiente tabla: Tabla 6.4. Datos de respuesta en frecuencia de un volt´ımetro de CD. ω, [rad/seg] B = vmax − vmin , [Volts] A, [Volts]

B A

390

6 Dise˜ no usando la respuesta en frecuencia

Con estos datos dibuje la gr´afica de Bode de magnitud correspondiente y, a partir de ella, obtenga los valores num´ericos de la funci´on de (s) transferencia G(s) = VVoi (s) donde Vi (s) y Vo (s) son las transformadas de la place del voltaje entregado por el generador de funciones y el voltaje medido por el volt´ımetro, respectivamente. N´otese que esta funci´on de transferencia debe ser de ganancia unitaria a frecuencia cero porque a este valor de frecuencia es cuando un volt´ımetro de CD entrega un valor correcto del voltaje medido. N´otese tambi´en que el valor de ωn es un dato que da informaci´on a cerca de cual es el valor m´aximo de frecuencia a la cual el volt´ımetro de CD entrega mediciones correctas. Esta parte del resultado depende mucho de que el osciloscopio y el volt´ımetro entreguen la misma medici´on de voltaje a bajas frecuencias.

Referencias

1. E. Kreyszig, Matem´ aticas avanzadas para ingenier´ıa, Vol. 1, Limusa, M´exico, 1980. 2. H. P. Hsu, An´ alisis de Fourier, Fondo Educativo Interamericano, M´exico, 1973. 3. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 4. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 5. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New York, 1984. 6. Fundaci´ on Thomas Alva Edison, Experimentos f´ aciles e incre´ıbles, Ediciones Roca, M´exico, 1993. 7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edici´ on, Pearson Prentice-Hall, Madrid, 2008. 8. B.C. Kuo, Sistemas de control autom´ atico, 7a. edici´ on, Prentice-Hall Hispanoamericana, M´exico, 1995. 9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edici´ on en espa˜ nol, McGraw-Hill, M´exico, 1992.

7 La t´ ecnica de las variables de estado

A finales de la d´ecada de 1950 lleg´o la era de los vuelos espaciales. El lanzamiento, direccionamiento, navegaci´on y seguimiento de naves espaciales consiste b´asicamente en el control de objetos bal´ısticos. Estos problemas requieren de la construcci´on de modelos f´ısicos detallados que puedan ser construidos en t´erminos de ecuaciones diferenciales, lineales y no lineales. Basados en el trabajo de Poincar´e, los ingenieros que trabajaban en las industrias aeroespaciales empezaron a formular los problemas de control en t´erminos de un conjunto de ecuaciones diferenciales de primer orden. As´ı naci´o el enfoque que hoy conocemos como el de las variables de estado.

394

7 La t´ecnica de las variables de estado

Objetivos del cap´ıtulo Entender el concepto de variables de estado. Conocer las herramientas principales usadas en el enfoque de las variables de estado. Conocer la relaci´ on entre la representaci´ on en variables de estado y la representaci´ on en funci´ on de transferencia. Analizar y dise˜ nar sistemas de control usando el enfoque de las variables de estado. Los m´etodos de dise˜ no presentados en los cap´ıtulos 5 y 6 constituyen la base de lo que se conoce hoy en d´ıa como los m´etodos de Control Cl´asico. Una de las caracter´ısticas del control cl´asico es que se basa en el enfoque entradasalida dictado por el uso de la funci´on de transferencia. Esto significa que una funci´on de transferencia es como una caja negra a la que se le aplica una se˜ nal (la entrada) y s´olo se ve el efecto que se produce en la salida, es decir no se sabe que es lo que ocurre en el interior de la caja negra. Una desventaja de este m´etodo es que para dise˜ nar un sistema de control s´olo se puede utilizar la informaci´on suministrada por una sola se˜ nal: la salida. Esto establece un l´ımite en el desempe˜ no que se puede conseguir. La t´ecnica de las variables de estado se introduce con el fin de mejorar algunos de los aspectos mencionados en el p´arrafo anterior. Por ejemplo, dado que la variable de estado es una t´ecnica que permite utilizar la informaci´on suministrada por todas las variables internas de un sistema, adem´as de la salida, es posible dise˜ nar sistemas de control que tienen mejores desempe˜ nos. Esta es la idea fundamental detr´as del control por realimentaci´on del estado que es explotado por la t´ecnica de las variables de estado. El estudio formal de la t´ecnica de las variables de estado es un tema complejo porque involucra el manejo de herramientas matem´aticas avanzadas. Sin embargo, el objetivo de este cap´ıtulo no es presentar una exposici´on formal detallada de esta t´ecnica sino presentar los conceptos b´asicos que permiten usar esta t´ecnica para controlar plantas sencillas. As´ı, s´olo se consideran plantas que tienen una entrada y una salida y que son controlables y observables.

7.1.

Representaci´ on en variables de estado

Considere las siguientes dos ecuaciones diferenciales lineales de coeficientes constantes: L

di = u − R i − n ke θ˙ dt J θ¨ = −b θ˙ + n km i

(7.1) (7.2)

N´otese que cada una de estas ecuaciones diferenciales tiene efecto sobre la otra ecuaci´on diferencial. Se dice que estas ecuaciones diferenciales deben ser

7.1 Representaci´ on en variables de estado

395

resueltas simultaneamente. Una manera muy u ´til de estudiar este tipo de ecuaciones diferenciales es el enfoque de las variables de estado. Las variables de estado pueden ser definidas de la siguiente manera. Definici´ on 7.1 ( [1], p´ ag. 83) Si se conoce la entrada u(t) para t ≥ t0 , las variables de estado son el conjunto de variables cuyo conocimiento en t = t0 permite calcular la soluci´ on de las ecuaciones diferenciales para todo t ≥ t0 . N´otese que las variables de estado se definen de una manera muy ambigua. Aunque esto pudiera parecer una desventaja, sin embargo se convierte en una ventaja porque permite que las variables de estado sean seleccionadas de la manera que m´as convenga. De acuerdo a ´esto, aunque en la literatura se proponen varios criterios diferentes para seleccionar las variables de estado, se debe entender que sin importar cual criterio se utilice las variables seleccionadas deben ser tales que permitan conocer la soluci´on de las ecuaciones diferenciales para todo tiempo futuro. Siguiendo esta l´ınea de ideas en esta obra se utilizar´a el siguiente criterio para seleccionar las variables de estado. Criterio 7.1 Identifique la variable inc´ ognita de cada una de las ecuaciones diferenciales involucradas. Identifique el orden de cada una de las ecuaciones diferenciales y des´ıgnelo como r. Seleccione las variables de estado como el conjunto formado por las variables inc´ ognita y sus primeras r − 1 derivadas en cada una de las ecuaciones diferenciales involucradas. Tambi´en se puede seleccionar a alguna de estas variables multiplicada por alguna constante diferente de cero. Es una costumbre usar la letra n para designar el n´ umero de variables de estado. Por otro lado, el estado es un vector cuyas componentes est´an dadas por cada una de las variables de estado. Entonces el estado es un vector de n dimensiones. De acuerdo a este criterio las variables de estado seleccionadas ˙ por lo que n = 3 y el estado se para las ecuaciones (7.1), (7.2) son i, θ, θ, puede formar como el siguiente vector:     i x1 x =  x2  =  θ  x3 θ˙ Usando esta nomenclatura, las ecuaciones diferenciales en (7.1), (7.2) se pueden escribir como: L x˙ 1 = u − R x1 − n ke x3 J x˙ 3 = −b x3 + n km x1 o, de manera vectorial:     (u − R x1 − n ke x3 )/L x1 d     x3 x2 = dt (−b x3 + n km x1 )/J x3

(7.3) (7.4)

(7.5)

396

7 La t´ecnica de las variables de estado

lo cual se puede escribir de manera compacta como: x˙ = Ax + Bu  R  − L 0 − nLke A =  0 0 1 , n km 0 − Jb J



1 L



B=0 0

(7.6)

Por otro lado, se acostumbra usar la letra y para representar la salida a controlar. Se debe resaltar que el estado x est´a constituido por variables que son internas al sistema y, por tanto, en general no se conocen y no se pueden medir. En cambio, la salida y representa una variable que siempre se puede medir. Si la salida se define como la posici´on, es decir, si y = θ = x2 entonces se puede escribir: y = Cx,

C = [0 1 0]

Al conjunto de las dos ecuaciones: x˙ = Ax + Bu y = Cx

(7.7) (7.8)

se le conoce como ecuaci´on din´amica lineal e invariante en el tiempo (A, B y C son constantes). La ecuaci´on en (7.7) se conoce como ecuaci´on de estado y la ecuaci´on en (7.8) se conoce como ecuaci´on de salida. Aunque la ecuaci´on de estado en (7.7) se ha obtenido a partir de una ecuaci´on diferencial que cuenta s´olo con una entrada, es decir u es un escalar, es muy sencillo extender (7.7) al caso en el que existen p entradas, s´olo hay que definir u como un vector de p componentes, cada una de las cuales representa una entrada, y B debe ser definida como una matriz de n renglones y p columnas. Por otro lado, tambi´en es muy sencillo generalizar la ecuaci´on de salida en (7.8) al caso en que se tienen q salidas, s´olo hay que definir y como un vector de q componentes, cada una de las cuales representa una salida, y C debe ser definida como una matriz de q renglones y n columnas. N´otese que una ecuaci´on de estado esta constituida por un conjunto de n ecuaciones diferenciales de primer orden. Una caracter´ıstica de (7.7), (7.8), es decir de una ecuaci´on din´amica lineal e invariante en el tiempo, es que el miembro derecho de cada una de las ecuaciones diferenciales involucradas en (7.7) est´a dado como una combinaci´on lineal de las variables de estado y la entrada a trav´es del uso de coeficientes constantes. N´otese tambi´en que el miembro derecho de (7.8) esta constituido por la combinaci´on lineal de las variables de estado a trav´es del uso de coeficientes constantes. Una propiedad fundamental de las ecuaciones de estado lineales e invariantes en el tiempo es que satisfacen el principio de superposici´on, lo cual es l´ogico ya que este tipo de ecuaciones de estado se obtienen, seg´ un se acaba de explicar, a partir de ecuaciones diferenciales lineales, ordinarias y de coeficientes constantes las cuales, seg´ un se explica en la secci´on 3.10, tambi´en satisfacen el principio de superposici´on.

7.1 Representaci´ on en variables de estado

397

Ejemplo 7.1 Considere el sistema mec´ anico mostrado en la figura 7.1. El modelo matem´ atico correspondiente fue obtenido en el ejemplo 2.5 del cap´ıtulo 2 y a continuaci´ on se reescribe para facilitar la referencia

F(t)

x1

K1

x2

K2

m1

K3

m2

b Figura 7.1. Sistema mec´ anico.

b (x˙ 1 − x˙ 2 ) + m1 b x ¨2 − (x˙ 1 − x˙ 2 ) + m2 x ¨1 +

K1 x1 + m1 K3 x2 − m2

K2 1 (x1 − x2 ) = F (t) m1 m1 K2 (x1 − x2 ) = 0 m2

(7.9) (7.10)

N´ otese que se tienen dos ecuaciones diferenciales de segundo orden cada una. Esto significa que s´ olo habr´ an cuatro variables de estado: la inc´ ognita de cada una de estas ecuaciones diferenciales, es decir x1 y x2 , y la primer derivada de cada una de estas inc´ ognitas, es decir x˙ 1 y x˙ 2 :     x1 x1  x2   x2     , u = F (t) x= =  x˙ 1  x3 x˙ 2 x4

Usando esta nomenclatura, las ecuaciones diferenciales en (7.9), (7.10) se pueden escribir como: b K1 K2 1 (x3 − x4 ) − x1 − (x1 − x2 ) + u m1 m1 m1 m1 K3 K2 b (x3 − x4 ) − x2 + (x1 − x2 ) x ¨2 = x˙ 4 = m2 m2 m2 x ¨1 = x˙ 3 = −

o, de manera vectorial:     x3 x1    x4 d   x2  =  b  K1 K2 1     − (x − x ) − x − (x − x ) + u x 3 4 1 2 dt 3 m1 m1 1 m1 m1 K3 K2 b x4 (x − x ) − x + (x − x ) 3 4 1 2 m2 m2 2 m2 de donde se obtiene la ecuaci´ on de estado:

(7.11)

398

7 La t´ecnica de las variables de estado

x˙ = Ax + Bu  0  0 A= K1 −m − 1 K2 m2

K2 m1

0 0

1 0

K2 m1

− mb1

K2 −m − 2

K3 m2

b m2

 0 1   b , m1 − mb2

 0  0   B=  1  m1 0 

(7.12)

Por otro lado, la ecuaci´ on de salida depende de qu´e se desea controlar. Por ejemplo, si lo que interesa controlar es la posici´ on de la masa 1 entonces: y = Cx = x1 ,

C = [1 0 0 0]

pero si se desea controlar la posici´ on de la masa 2 entonces: y = Cx = x2 ,

C = [0 1 0 0]

Ejemplo 7.2 En el cap´ıtulo 12 se estudia un mecanismo conocido como el sistema ball and beam. En ese cap´ıtulo se obtiene el modelo matem´ atico correspondiente y se presenta en la ecuaci´ on (12.16). A continuaci´ on se reescribe dicho modelo con el fin de facilitar la referencia: X(s) ρ = 2, θ(s) s

θ(s) =

k I ∗ (s) s(s + a)

Usando la transformada inversa de Laplace se pueden recuperar las ecuaciones diferenciales de las que se han obtenido las funciones de transferencia involucradas en las expresiones anteriores, es decir: x ¨ = ρθ,

θ¨ + aθ˙ = ki∗

(7.13)

Como se trata de dos ecuaciones diferenciales de segundo orden entonces habr´ a cuatro variables de estado: las inc´ ognitas de cada ecuaci´ on diferencial, es ˙ decir x y θ, y las primeras derivadas de dichas inc´ ognitas, es decir x˙ y θ:     x z1  z2   x˙  ∗    z=  z3  =  θ  , u = i z4 θ˙ Usando esta nomenclatura, las ecuaciones diferenciales en (7.13) se pueden escribir como: x ¨ = z˙2 = ρz3 ,

θ¨ = z˙4 = −az4 + ku

o, de manera vectorial:    z2 z1    d  ρz3   z2  =      z z dt 4 3 −az4 + ku z4 

(7.14)

7.2 Linealizaci´ on aproximada

399

de donde se obtiene la ecuaci´ on de estado: z˙ = Az + Bu   010 0 0 0 ρ 0   A= 0 0 0 1 , 0 0 0 −a

  0 0  B= 0 k

(7.15)

Tal como se explica en el cap´ıtulo 12 la variable que se desea controlar es x y, por tanto, la ecuaci´ on de salida est´ a dada como: y = Cz = x = z1 ,

C = [1 0 0 0]

7.2. Linealizaci´ on aproximada de ecuaciones de estado no lineales Es muy frecuente encontrar ecuaciones de estado que no son lineales, es decir, ecuaciones de estado dadas como: x˙ = f (x, u)   f1 (x, u)  f2 (x, u)    f = , ..   . fn (x, u)





x1  x2    x =  . ,  ..  xn





(7.16)

u1  u2    u= .   ..  up

donde al menos una de las funciones fi (x, u), i = 1, . . . , n, es una funci´on escalar no lineal de x y/o de u, es decir, que no se puede escribir como una combinaci´on lineal de las componentes de x y/o de u. Por ejemplo, para una ecuaci´on de estado con tres variables de estado y dos entradas se puede tener: fi (x, u) = 3 sin(x3 ) + x1 u2 ex1 fi (x, u) = 5x2 fi (x, u) = u21 Es importante subrayar que la notaci´on fi (x, u) significa que la componente i del vector f es funci´on, en general, de las componentes de los vectores estado x y entrada u. Sin embargo, tal como se muestra en los ejemplos anteriores, no es forzoso que fi (x, u) sea funci´on de todas las variables de estado y de todas la entradas. M´as a´ un, puede darse el caso en que fi (x, u) no es funci´on de ninguna variable de estado pero s´ı lo es de algunas entradas y viceversa. Una ecuaci´on de estado de la forma (7.16) que tiene las caracter´ısticas mencionadas se conoce como una ecuaci´on de estado no lineal invariante en el tiempo (no depende expl´ıcitamente del tiempo).

400

7 La t´ecnica de las variables de estado

El estudio de ecuaciones de estado no lineales es mucho mas complejo que el estudio de ecuaciones de estado lineales. Sin embargo, la mayor´ıa de los procesos f´ısicos que son de inter´es para los ingenieros de control son no lineales por naturaleza, es decir, sus modelos tienen la forma dada en (7.16). As´ı que deben desarrollarse m´etodos de estudio y dise˜ no para este tipo de ecuaciones de estado. Uno de los m´etodos mas sencillos consiste en encontrar una ecuaci´on de estado lineal como la mostrada en (7.7) que represente satisfactoriamente la evoluci´on de (7.16). La ventaja de este m´etodo es que las ecuaciones de estado lineales de la forma (7.7) pueden ser estudiadas con mayor facilidad. Entonces el an´alisis y el dise˜ no de controladores para (7.16) se realizan utilizando un modelo m´as sencillo de la forma (7.7). Aunque este m´etodo es muy u ´til se debe mencionar que su principal desventaja es que los resultados que se obtienen s´olo son v´alidos en una regi´on restringida del espacio de trabajo del proceso que se desea controlar. En las siguientes secciones se explican en detalle todas estas ideas. 7.2.1. Procedimiento para ecuaciones de primer orden sin entrada Considere una ecuaci´on diferencial no lineal de primer orden sin entrada: x˙ = f (x)

(7.17)

donde x es un escalar y f (x) es una funci´on no lineal de x. Se desea obtener

m

h (x ) f (x )

f (x ã )



x

Figura 7.2. Aproximaci´ on de una funci´ on no lineal f (x) usando una linea recta h(x).

una ecuaci´on diferencial lineal que represente a (7.17) al menos de manera

7.2 Linealizaci´ on aproximada

401

aproximada. Def´ınase un punto de equilibrio x∗ de (7.17) como aquel valor de x que satisface f (x∗ ) = 0. De acuerdo a (7.17) esto significa que en un punto de equilibrio x˙ ∗ = f (x∗ ) = 0, es decir, el sistema puede permanecer en “reposo” en ese punto. En t´erminos pr´acticos esto significa que un punto de equilibrio x∗ representa la configuraci´on constante en la que puede mantenerse sin movimiento un robot, por ejemplo, bajo la acci´on de la gravedad. Suponga que f (x) est´a representada por la curva que se muestra en la figura 7.2. La linea recta punteada h(x) es tangente a f (x) en el punto x∗ . Debido a esta caracter´ıstica, h(x) y f (x) son aproximadamente iguales para valores de x que sean cercanos a x∗ , es decir, si x − x∗ ≈ 0. Sin embargo, la diferencia entre h(x) y f (x) crece conforme los valores de x se alejan de x∗ , es decir, para valores grandes de x − x∗ . As´ı que se puede usar h(x) en lugar de f (x) si la variable x se restringe a tomar s´olamente valores que sean cercanos a x∗ . En el caso del ejemplo del robot, esto significa que aunque s´ı se permitir´a que el robot se mueva, sin embargo estos movimientos no deben ser tales que la configuraci´on del robot sufra cambios demasiado grandes respecto de su configuraci´on de equilibrio o “reposo”. En la figura 7.2 se observa que: ¯ df (x) ¯¯ h(x) − f (x∗ ) (7.18) , m= m= x − x∗ dx ¯x=x∗ donde la constante m es la pendiente de h(x), es decir, la derivada de f (x) evaluada en el punto de punto de equilibrio x∗ . Entonces, de la primera expresi´on: h(x) = m(x − x∗ ) + f (x∗ )

(7.19)

y debido a que h(x) ≈ f (x), se puede escribir: f (x) ≈ m(x − x∗ ) + f (x∗ )

(7.20)

Como x∗ es un punto de equilibrio entonces f (x∗ ) = 0 y se obtiene: f (x) ≈ m(x − x∗ )

(7.21)

Entonces la ecuaci´on (7.17) se puede aproximar por: x˙ = m(x − x∗ )

(7.22)

Definiendo una nueva variable z = x − x∗ , se tiene z˙ = x, ˙ porque x˙ ∗ = 0. Por tanto, la aproximaci´on lineal de (7.17) est´a dada por: z˙ = m z

(7.23)

la cual es v´alida s´olamente bajo la restricci´on x − x∗ ≈ 0. Una vez que se usa (7.23) para calcular z se puede usar z = x − x∗ para obtener x ya que el punto de equilibrio x∗ es conocido.

402

7 La t´ecnica de las variables de estado

7.2.2. Procedimiento general para ecuaciones de orden arbitrario y n´ umero de entradas arbitrario Considere ahora la ecuaci´on diferencial: x˙ = f (x, u)

(7.24)

donde x ∈ Rn es un vector de n dimensiones y u ∈ Rp es un vector de p dimensiones que representa la entrada o excitaci´on de la ecuaci´on diferencial. N´otese que f (x) debe ser una funci´on vectorial de n dimensiones. Esto significa que (7.24) tiene la forma definida en (7.16). En este caso se prefiere usar el concepto “punto de operaci´on” en lugar de “punto de equilibrio” ya que este u ´ltimo concepto se define s´olamente para ecuaciones diferenciales sin entradas. Un punto de operaci´on se define como aquella pareja (x∗ , u∗ ) tal que f (x∗ , u∗ ) = 0. Esto significa que la soluci´on de la ecuaci´on diferencial puede permanecer en “reposo” en el valor constante x∗ , porque x˙ ∗ = f (x∗ , u∗ ) = 0, si se aplican las entradas adecuadas u∗ (p entradas) que tambi´en resultan ser constantes. N´otese que f (x, u) depende de n + p variables. Def´ınase el siguiente vector: · ¸ x (7.25) y= u de n + p dimensiones. Entonces (7.24) se puede escribir como: x˙ = f (y)

(7.26)

Siguiendo las ideas de la secci´on previa, se desea aproximar la funci´on no lineal f (y) mediante una funci´on h(y) que sea “tangente” a f (y) en el punto de operaci´on y ∗ definido como: · ∗¸ x y∗ = u∗ Generalizando la expresi´on en (7.19) al caso de n+p variables se puede escribir: ¯ ¯ donde M = ∂f∂y(y) ¯ 

   M =  

h(y) = M (y − y ∗ ) + f (y ∗ ) y=y ∗

∂f1 (x,u) ∂f1 (x,u) ∂x1 ∂x2 ∂f2 (x,u) ∂f2 (x,u) ∂x1 ∂x2

.. .

.. .

∂fn (x,u) ∂fn (x,u) ∂x1 ∂x2

(7.27)

es una matriz constante definida como: ... ... .. . ...

∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) ∂xn ∂u1 ∂u2 ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) ∂xn ∂u1 ∂u2

.. .

.. .

.. .

∂fn (x,u) ∂fn (x,u) ∂fn (x,u) ∂xn ∂u1 ∂u2

Usando f (y) ≈ h(y) se puede aproximar (7.26) por:

... ... .. . ...

∂f1 (x,u) ∂up ∂f2 (x,u) ∂up

.. .

∂fn (x,u) ∂up

      

x=x∗ ,u=u∗

7.2 Linealizaci´ on aproximada

x˙ = M (y − y ∗ ) + f (y ∗ )

403

(7.28)

Como f (y ∗ ) = f (x∗ , u∗ ) = 0 y x˙ − x˙ ∗ = x, ˙ porque x˙ ∗ = 0, se tiene: z˙ = Az + Bv  ∂f1 (x,u)

  A=  



   B=  

∂f1 (x,u) ∂x1 ∂x2 ∂f2 (x,u) ∂f2 (x,u) ∂x1 ∂x2

.. .

.. .

∂fn (x,u) ∂fn (x,u) ∂x1 ∂x2 ∂f1 (x,u) ∂f1 (x,u) ∂u1 ∂u2 ∂f2 (x,u) ∂f2 (x,u) ∂u1 ∂u2

.. .

.. .

∂fn (x,u) ∂fn (x,u) ∂u1 ∂u2

... ... .. . ... ... ... .. . ...

∂f1 (x,u) ∂xn ∂f2 (x,u) ∂xn

.. .

∂fn (x,u) ∂xn ∂f1 (x,u) ∂up ∂f2 (x,u) ∂up

.. .

∂fn (x,u) ∂up

     

(7.29)

(7.30)

x=x∗ ,u=u∗

      

(7.31)

x=x∗ ,u=u∗

donde se ha definido z = x − x∗ y v = u − u∗ . Las expresiones (7.29), (7.30), (7.31) constituyen el modelo lineal aproximado que se utiliza para el estudio y el dise˜ no de controladores para el sistema no lineal en (7.24). N´otese que este modelo lineal aproximado s´olo es v´alido si el estado x y la entrada u son tales que no se alejan mucho del punto de operaci´on (x∗ , u∗ ), es decir, s´olo si z = x − x∗ ≈ 0 y v = u − u∗ ≈ 0. Normalmente es dif´ıcil determinar desde el punto de vista pr´actico cuales valores de x y de u satisfacen estas condiciones y lo que se hace es simplemente limitar sus variaciones de manera emp´ırica. Ejemplo 7.3 En la figura 7.3 se muestra un p´endulo simple. En el ejemplo 2.13 del cap´ıtulo 2 se encontr´ o que el modelo matem´ atico correspondiente est´ a dado por la siguiente ecuaci´ on diferencial no lineal: T(t)

l

ò

g

m

d Figura 7.3. P´endulo simple.

ml2 θ¨ + bθ˙ + mgl sin(θ) = T (t)

(7.32)

404

7 La t´ecnica de las variables de estado

La caracter´ıstica de ser una ecuaci´ on diferencial no lineal es determinada exclusivamente por la funci´ on sin(θ) que aparece por efecto de la gravedad. Al tratarse de una ecuaci´ on diferencial de segundo orden, entonces s´ olo hay dos ˙ estados: la inc´ ognita θ y su primer derivada θ: · ¸ · ¸ θ x1 x= = ˙ , u = T (t) x2 θ Usando esta nomenclatura, la ecuaci´ on diferencial en (7.32) se puede escribir como: b g 1 θ¨ = x˙ 2 = − 2 x2 − sin(x1 ) + u ml l ml2 o, de manera vectorial: · ¸ · d x1 = − mlb 2 x2 − dt x2

x2 g l sin(x1 ) +

1 ml2 u

¸

(7.33)

de donde se obtiene la ecuaci´ on de estado: x˙ = f (x, u) ¸ · · f1 (x, u) = f (x, u) = f2 (x, u) − mlb 2 x2 −

x2 g l sin(x1 ) +

1 ml2 u

¸

N´ otese que en este caso no se puede obtener la forma lineal x˙ = Ax+Bu debido a la presencia de la funci´ on sin(θ). Con el fin de obtener una aproximaci´ on lineal de esta ecuaci´ on de estado no lineal, primero se encuentran los puntos de operaci´ on, es decir las parejas (x∗ , u∗ ) que satisfacen f (x∗ , u∗ ) = [0 0]T : ¸ · ¸ · x∗2 0 ∗ ∗ = f (x , u ) = 0 − mlb 2 x∗2 − gl sin(x∗1 ) + ml1 2 u∗ de donde se obtiene: x∗2 = 0,

u∗ = −mgl sin(x∗1 )

Esto significa que el valor de la entrada, en el punto de operaci´ on, depende del valor de la posici´ on del p´endulo en el punto de operaci´ on. Esto es debido a que, para mantener al p´endulo en reposo, es necesario que la entrada compense de manera exacta al efecto de la gravedad. Para continuar, debe seleccionarse alg´ un valor espec´ıfico para x∗1 . Aqu´ı se considerar´ an dos casos: Cuando x∗1 = 0, x∗2 = 0, u∗ = 0. Usando las expresiones en (7.29), (7.30), (7.31) se encuentra que: z˙ = Az + Bv "

A=

∂f1 (x,u) ∂f1 (x,u) ∂x1 ∂x2 ∂f2 (x,u) ∂f2 (x,u) ∂x1 ∂x2

#

x=x∗ ,u=u∗

·

0 1 = − gl cos(x1 ) − mlb 2

¸

x1 =x2 =u=0

7.2 Linealizaci´ on aproximada

= B=

·

0 1 − gl − mlb 2 # " ∂f1 (x,u) ∂u ∂f2 (x,u) ∂u

¸ =

x=x∗ ,u=u∗

·

0 1 ml2

405

¸

donde se ha definido z = x − x∗ = x y v = u − u∗ = u. N´ otese que esta ecuaci´ on de estado especifica que: 1 b g z2 + v z˙2 = − z1 − l ml2 ml2

z˙1 = z2 ,

Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene la siguiente ecuaci´ on diferencial de segundo orden, lineal y de coeficientes constantes: z¨1 +

b g 1 z˙1 + z1 = v 2 ml l ml2

(7.34)

La cual puede ser analizada utilizando los conceptos vistos en las secciones 3.3 (ra´ıces complejas conjugadas con parte real menor o igual a cero), 3.5 (ra´ıces reales, repetidas y negativas) y 3.4 (ra´ıces reales, diferentes y negativas) del cap´ıtulo 3, ya que corresponde a una ecuaci´ on diferencial de la forma: y¨ + 2ζωn y˙ + ωn2 y = kωn2 v donde: y = z1 ,

2ζωn =

b , ml2

ωn2 =

g , l

k=

1 mgl

con ζ ≥ 0, ωn > 0 y k > 0 porque m > 0, g > 0, l > 0 y b ≥ 0. Cuando x∗1 = ±π, x∗2 = 0, u∗ = 0. Usando las expresiones en (7.29), (7.30), (7.31) se encuentra que: z˙ = Az + Bv "

A=

= B=

·

"

∂f1 (x,u) ∂f1 (x,u) ∂x1 ∂x2 ∂f2 (x,u) ∂f2 (x,u) ∂x1 ∂x2

0

1

g l

− mlb 2

∂f1 (x,u) ∂u ∂f2 (x,u) ∂u

¸

#

#

x=x∗ ,u=u∗

x=x∗ ,u=u∗

=

·

0 1 ml2

·

0 1 = − gl cos(x1 ) − mlb 2

¸

x1 =±π,x2 =u=0

¸

donde se ha definido z = x − x∗ = [x1 − x∗1 , x2 ]T y v = u − u∗ = u. N´ otese que esta ecuaci´ on de estado especifica que:

406

7 La t´ecnica de las variables de estado

z˙1 = z2 ,

z˙2 =

g 1 b z2 + v z1 − 2 l ml ml2

Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene la siguiente ecuaci´ on diferencial de segundo orden, lineal y de coeficientes constantes: z¨1 +

g 1 b z˙1 − z1 = v 2 ml l ml2

(7.35)

La cual puede ser analizada utilizando los conceptos vistos en la secci´ on 3.4 del cap´ıtulo 3 (ra´ıces reales, diferentes, una positiva y la otra negativa, v´ease el ejemplo 3.9) ya que corresponde a una ecuaci´ on diferencial de la forma: y¨ + cy˙ + dy = ev donde: y = z1 ,

c=

b ≥ 0, ml2

d=−

g < 0, l

e=

1 ml2

N´ otese que de acuerdo a (7.34) y a la secci´ on 3.3 del cap´ıtulo 3, cuando el p´endulo funciona alrededor del punto de operaci´ on x∗1p= 0, x∗2 = 0, u∗ = 0, g oscila con una frecuencia natural dada como ωn = l . Esto significa que un p´endulo m´ as largo oscila m´ as lentamente mientras que un p´endulo m´ as corto oscila m´ as r´ apidamente. Estas observaciones son u ´tiles, por ejemplo, cuando se desea ajustar la rapidez de un reloj de p´endulo que se “atrasa” o se “adelanta”. M´ as a´ un, reacomodando (7.34) se obtiene: ml2 z¨1 + bz˙1 + mglz1 = v

(7.36)

De acuerdo al ejemplo 2.6 del cap´ıtulo 2 que trata sobre el sistema masaresorte-amortiguador rotativo mostrado en la figura 7.4, (7.36) significa que el factor K = mgl > 0 equivale al coeficiente de rigidez de un resorte que es introducido por el efecto de la gravedad. Por otro lado, usando argumentos

b

I

K

T(t) Figura 7.4. Sistema masa-resorte-amortiguador rotativo.

similares se observa que, reacomodando (7.35): ml2 z¨1 + bz˙1 − mglz1 = v

7.3 Algunos resultados del ´ algebra lineal

407

cuando el p´endulo funciona alrededor de los puntos de operaci´ on x∗1 = ±π, ∗ ∗ x2 = 0, u = 0, su comportamiento es an´ alogo al de un sistema masa resorte amortiguador que cuenta con un resorte con coeficiente de rigidez negativo K = −mgl < 0. Esto puede verse del siguiente modo. Un coeficiente de rigidez positivo K > 0 indica que la fuerza ejercida por el resorte siempre va dirigida en sentido contrario a la deformaci´ on y por eso el resorte forza al cuerpo a regresar a la posici´ on donde el resorte no est´ a deformado. Esa es la raz´ on por la que el p´endulo oscila alrededor del punto de operaci´ on x∗1 = 0, x∗2 = 0, u∗ = 0. Por otro lado y debido al cambio de signo, un resorte con coeficiente de rigidez negativo K < 0 debe hacer lo contrario, es decir, la fuerza ejercida por el resorte ahora va dirigida en el mismo sentido que la deformaci´ on. Esto significa que al deformarse el resorte con K < 0 ´este forza a que el resorte se deforme a´ un m´ as por lo que el cuerpo se aleja de la configuraci´ on en la que el resorte tiene deformaci´ on cero (es decir donde z1 = 0). Esto es precisamente lo que sucede con el p´endulo alrededor de los puntos de operaci´ on x∗1 = ±π, ∗ ∗ x2 = 0, u = 0: si z1 6= 0 entonces la fuerza de la gravedad forza al p´endulo a caer y, por tanto a alejarse cada vez m´ as de la configuraci´ on donde z1 = on 0, es decir donde x1 = x∗1 = ±π. Este comportamiento es la comprobaci´ experimental de lo que anal´ıticamente queda demostrado al tener un polinomio caracter´ıstico con una ra´ız positiva: los puntos de operaci´ on x∗1 = ±π, x∗2 = 0, ∗ u = 0 son inestables. Se recomienda consultar las secciones 11.2 (en el cap´ıtulo 11), 13.2 (en el cap´ıtulo 13) y 14.4 (en el cap´ıtulo 14) para ver otros ejemplos de c´omo utilizar las expresiones en (7.29), (7.30), (7.31) para encontrar ecuaciones de estado lineales aproximadas de ecuaciones de estado no lineales.

7.3.

Algunos resultados del ´ algebra lineal

En esta secci´on se presentan algunos resultados que son u ´tiles para el estudio de la t´ecnica de las variables de estado. Resultado 7.1 ( [1], cap. 2) Sean w1 , w2 , . . . , wn , n vectores de n componentes cada uno. Estos vectores son linealmente dependientes si y s´ olo si existen n escalares α1 , α2 , . . . , αn , no todos cero tales que: α1 w1 + α2 w2 + . . . + αn wn = 0

(7.37)

donde el cero del lado derecho representa un vector de n componentes todas ellas con valor cero. Si la u ´nica manera de satisfacer la expresi´ on anterior es que α1 = α2 = . . . = αn = 0 entonces se dice que w1 , w2 , . . . , wn , son vectores linealmente independientes. En la versi´on m´as simple de la dependencia lineal de vectores, dos vectores de dos componentes son linealmente dependientes si son paralelos. Esto puede

408

7 La t´ecnica de las variables de estado

verse del siguiente modo. Sean w1 y w2 dos vectores de n = 2 componentes cada uno. Estos vectores son linealmente dependientes si existen dos constantes α1 6= 0 y α2 6= 0 tales que: α1 w1 + α2 w2 = 0 lo cual significa que se puede escribir: w1 = −

α2 w2 α1

N´otese que α1 no puede ser cero por razones obvias. Por otro lado, si α2 fuera igual a cero entonces w1 = 0 es la u ´nica posibilidad por lo que no interesa este caso y, por tanto, se supone que ambos α1 6= 0 y α2 6= 0. Por tanto, como el α2 es un escalar (positivo o negativo), lo anterior significa que w1 y factor − α 1 w2 son vectores que tienen la misma direcci´on, es decir, que son paralelos1 . Cuando se tienen 3 o m´as vectores, entonces la dependencia lineal significa que uno (aunque no todos) de los vectores puede ser obtenido mediante la suma de los otros vectores cuando son “amplificados” convenientemente usando las “ganancias” αi (esto es lo que se conoce como combinaci´on lineal de vectores). Es decir: w1 = −

α2 α3 w2 − w3 α1 α1

se obtiene directamente de (7.37) cuando n = 3 y α1 6= 0. Como n = 3, esto significa que w1 , w2 y w3 pertenecen a un mismo plano (o una linea recta, en el peor de los casos) que esta incrustado en un volumen (en R3 ), es decir, que la combinaci´on lineal de w1 , w2 y w3 no permite obtener otro vector (o vectores) que no pertenezcan a dicho plano. De acuerdo a todo esto, tres vectores de 3 componentes son linealmente independientes si la combinaci´on lineal de ellos permite generar vectores que “cubren” por completo tres dimensiones. Generalizando, la combinaci´on lineal de n vectores (de n componentes) linealmente independientes “cubre” un espacio de n dimensiones. La combinaci´on lineal de n vectores (de n componentes) linealmente dependientes “cubre” un espacio con un n´ umero de dimensiones menor que n. Resultado 7.2 ( [1], cap. 2, [2], cap. 10) Sea la siguiente matriz de n × n: £ ¤ E = w1 w2 . . . wn

donde w1 , w2 , . . . , wn , son n vectores columna de n componentes. Los vectores w1 , w2 , . . . , wn son linealmente independientes si y s´ olo si la matriz E es no singular, es decir, si y s´ olo si el determinante de E es diferente de cero (det(E) 6= 0). 1

Algunos autores usan el t´ermino “antiparalelos” para designar dos vectores que tienen la misma direcci´ on pero sentido contrario. En esta obra se utiliza el t´ermino “paralelos” para designar dos vectores que tienen la misma direcci´ on sin importar su sentido.

7.3 Algunos resultados del ´ algebra lineal

409

Para explicar este resultado se hace uso de lo siguiente. Resultado 7.3 ([1], cap. 2) Suponga una matriz E de n × n. La u ´nica soluci´ on de la expresi´ on Ew = 0, donde w representa un vector de n componentes, es w = 0 si y s´ olo si la matriz E es no singular. N´otese que la suma de vectores mostrada en (7.37) se puede escribir como:     α1 0    α £ ¤  2  0 α1 w1 + α2 w2 + . . . + αn wn = w1 w2 . . . wn  .  =  .   ..   ..  αn 0

De acuerdo al resultado 7.3, el vector [α1 α2 . . . αn ] = [0 0 . . . 0] es la u ´nica soluci´on de este sistema homog´eneo si y s´olo si la matriz E = [w1 w2 . . . wn ] es no singular. Esto implica que los vectores w1 , w2 , . . . , wn son linealmente independientes si y s´olo si det(E) 6= 0. Resultado 7.4 ([1], cap. 2) El rango de una matriz E de n × n es el orden del determinante m´ as grande y diferente de cero que puede formarse con los elementos de E. El rango de E es n si y s´ olo si E es no singular. La matriz inversa E −1 existe si y s´ olo si la matriz E es no singular [2], cap. 10. Resultado 7.5 ([1], cap. 2) Los eigenvalores de una matriz E de n × n son aquellos escalares λ que satisfacen: det(λI − E) = 0 donde I representa la matriz identidad de n × n. La expresi´ on det(λI − E) es un polinomio de grado n en la variable λ y se conoce como el polinomio caracter´ıstico de la matriz E. Los eigenvalores de una matriz E pueden ser n´ umeros reales o complejos. La matriz E tiene exactamente n eigenvalores incluyendo aquellos que se puedan repetir. ¯ ambas de n×n, Resultado 7.6 ([3], cap. 7) Suponga que dos matrices E y E, se relacionan a trav´es de: ¯ = P EP −1 E

(7.38)

donde P es una matriz constante y no singular de n × n, entonces ambas ¯ tienen los mismos eigenvalores. Esto significa que: matrices E y E ¯ det(λI − E) = det(λI − E)

(7.39)

Para explicar esto es de mucha utilidad lo siguiente. Resultado 7.7 ([4], p´ ag. 303) Sean D y G dos matrices de n × n. Entonces: det(DG) = det(D) det(G)

(7.40)

410

7 La t´ecnica de las variables de estado

Como P P −1 = I y det(I) = 1, entonces usando (7.40) se encuentra que 1 det(P ) det(P −1 ) = 1, es decir det(P −1 ) = det(P ) . Por otro lado, de acuerdo a ¯ (7.38), (7.40), el polinomio caracter´ıstico de E es: ¯ = det(λI − P EP −1 ) = det(P [λI − E]P −1 ) det(λI − E) = det(P ) det(λI − E) det(P −1 ) = det(λI − E) N´otese que en la u ´ltima expresi´on se ha recuperado (7.39), lo que comprueba ese resultado. Resultado 7.8 ([4], p´ ag. 334) Sean E y F dos matrices de n×n con F = E T . Los eigenvalores de F son id´enticos a los eigenvalores de E. Para explicar esto es de mucha utilidad lo siguiente. Resultado 7.9 ([2], p´ ag. 504) El determinante de una matriz E es igual a la suma de los productos de los elementos de cualquier columna o rengl´ on de E y sus respectivos cofactores. Resultado 7.10 ([2], p´ ag. 507) Si det(D) es un determinante cualquiera y det(G) es el determinante cuyos renglones son las columnas de det(D), entonces det(D) = det(G). De acuerdo a lo anterior, det(λI − E) puede calcularse usando, por ejemplo, la primera columna de la matriz λI − E, mientras que det(λI − F ) se puede calcular usando, por ejemplo, el primer rengl´on de la matriz λI − F . N´otese que la primera columna de λI − E es igual al primer rengl´on de λI − F ya que (λI − E)T = λI − F debido a que F = E T . Por esta misma raz´on, los renglones del cofactor del elemento en el rengl´on i y la columna 1 en la matriz λI − E son iguales a las columnas del cofactor del elemento en el rengl´on 1 y la columna i en la matriz λI − F . Esto demuestra que E y F tienen el mismo polinomio caracter´ıstico, es decir que: det(λI − E) = det(λI − F )

(7.41)

y por tanto, los eigenvalores de F son iguales a los eigenvalores de E.

7.4. Soluci´ on de una ecuaci´ on din´ amica, lineal e invariante en el tiempo El c´alculo de la soluci´on de la ecuaci´on din´amica: x˙ = Ax + Bu, y = Cx,

y∈R

x ∈ Rn ,

u∈R

(7.42) (7.43)

es un problema complejo que require del manejo de conceptos avanzados de ´algebra lineal y c´alculo que est´an fuera del alcance de esta obra. Sin embargo,

7.4 Soluci´ on de una ecuaci´ on din´ amica

411

se pueden explicar las ideas fundamentales involucradas en el procedimiento correspondiente si se establece una analog´ıa con el problema de resolver la siguiente ecuaci´on diferencial de primer orden: x˙ = ax + bu,

x, u ∈ R

Aplicando la transformada de Laplace se tiene: sX(s) − x(0) = aX(s) + bU (s) donde X(s), U (s) representan, respectivamente, las transformadas de Laplace de x y u. Esto se puede escribir del siguiente modo: X(s) =

b x(0) U (s) + s−a s−a

(7.44)

Usando los pares transformados [5]:

© ª 1 = G(s) L eat = s−a ½Z t ¾ b L g(t − τ )bu(τ )dτ = U (s), (convoluci´on) s − a 0

(7.45)

g(t) = L−1 {G(s)}

se encuentra que, al aplicar la transformada inversa da Laplace a (7.44), se obtiene: Z t g(t − τ )bu(τ )dτ + eat x(0) x(t) = 0

Finalmente, usando (7.45) de nuevo se encuentra: Z t ea(t−τ ) bu(τ )dτ, x, u, a, b ∈ R x(t) = eat x(0) + 0

La soluci´on de la ecuaci´on de estado en (7.42) es similar a esta u ´ltima ecuaci´on y s´olo se debe utilizar notaci´on matricial, es decir, la soluci´on de (7.42) es [1], p´ag. 142: Z t At eA(t−τ ) Bu(τ )dτ, x ∈ Rn , u ∈ R (7.46) x(t) = e x(0) + 0

At

donde e es una matriz de n × n (n´otese que eA(t−τ ) = eAr |r=t−τ ) y a continuaci´on se explica como est´a dada. Si λ es un eigenvalor real (positivo, negativo o cero) y no repetido de la matriz A entonces al menos uno de lo elementos de la matriz eAt incluye la siguiente funci´on: ceλt donde c es una constante real.

412

7 La t´ecnica de las variables de estado

Si λ es un eigenvalor real (positivo, negativo o cero) y repetido r veces de la matriz A entonces cada una de las siguientes funciones: c0 eλt ,

c1 teλt ,

c2 t2 eλt ,

...,

cr−1 tr−1 eλt

donde ck , k = 1, 2, . . . , r − 1, son constantes reales, est´a incluida en al menos uno de los elementos de la matriz eAt . √ Si λ = a+jb es un eigenvalor complejo de la matriz A donde j = −1 con a un n´ umero real (positivo, negativo o cero) y b un n´ umero real estrictamente positivo, si el complejo conjugado de λ tambi´en es un eigenvalor de la matriz A y si estos eigenvalores no est´an repetidos entonces cada una de las siguientes funciones: ceat sin(bt),

deat cos(bt)

donde c y d son constantes reales, est´a incluida en al menos uno de los elementos de la matriz eAt . √ Si λ = a+jb es un eigenvalor complejo de la matriz A donde j = −1 con a un n´ umero real (positivo, negativo o cero) y b un n´ umero real estrictamente positivo, si el complejo conjugado de λ tambi´en es un eigenvalor de la matriz A y si estos eigenvalores est´an repetidos r veces entonces cada una de las siguientes funciones: c0 eat sin(bt), , c1 teat sin(bt), c2 t2 eat sin(bt), . . . , cr−1 tr−1 eat sin(bt) d0 eat cos(bt), , d1 teat cos(bt), d2 t2 eat cos(bt), . . . , dr−1 tr−1 eat cos(bt) (7.47) donde ck y dk , k = 1, 2, . . . , r − 1, son constantes reales, est´a incluida en al menos uno de los elementos de la matriz eAt . Finalmente, la salida de la ecuaci´on din´amica en (7.42), (7.43) se calcula usando (7.46) como: Z t eA(t−τ ) Bu(τ )dτ (7.48) y(t) = CeAt x(0) + C 0

7.5.

Estabilidad de una ecuaci´ on din´ amica

De particular inter´es resulta el estudio de la estabilidad de la siguiente ecuaci´on din´amica sin entrada: x˙ = Ex y = Cx

(7.49)

donde x ∈ Rn , y ∈ R, E es una matriz constante de n × n y C es un vector rengl´on constante de n componentes. Aunque una ecuaci´on din´amica sin

7.6 Controlabilidad y observabilidad

413

entrada puede parecer algo que no corresponde a la realidad, sin embargo en la secci´on 7.10 se muestra que una ecuaci´on din´amica realimentada puede ser escrita en la forma (7.49), debido a que en un sistema realimentado la entrada se escoge como u = −Kx donde K es un vector rengl´on de n componentes. Entonces, sustituyendo esta entrada en (7.42) y definiendo E = A − BK se encuentra (7.49). Esta es la principal motivaci´on para estudiar la estabilidad de dicha ecuaci´on din´amica sin entrada. Aunque definici´on formal de la estabilidad de (7.49) es algo elaborada, podemos simplificarla diciendo que la ecuaci´on din´amica (7.49) es estable si l´ımt→∞ x(t) = 0 (y por tanto, l´ımt→∞ y(t) = 0 tambi´en) para cualquier estado inicial x(0) ∈ Rn . Esto significa que si:   x1 (t)  x2 (t)    x(t) =  .   ..  xn (t) entonces l´ımt→∞ xi (t) = 0 para toda i = 1, 2, . . . , n, y a partir de cualquier estado inicial. De acuerdo a la soluci´on encontrada en (7.46), la soluci´on de (7.49) se encuentra usando u = 0 y A = E en (7.46), es decir: x(t) = eEt x(0) Como x(0) es un vector constante, la expresi´on anterior implica que si se ha de conseguir que l´ımt→∞ x(t) = 0 entonces se debe conseguir que l´ımt→∞ eEt = 0 donde el “0” representa una matriz de n × n con todos sus elementos iguales a cero. De acuerdo a lo expuesto en la secci´on previa a cerca de como est´an formados los elementos de la matriz eAt (recuerde que A = E) se llega a la siguiente conclusi´on: Teorema 7.1 ([1], p´ ag. 409) La soluci´ on de (7.49) satisface l´ımt→∞ x(t) = 0, sin importar cual sea el estado inicial x(0), si y s´ olo si todos los eigenvalores de la matriz E tienen parte real estrictamente negativa. Se dice que bajo estas condiciones el origen x = 0 de (7.49) es globalmente asint´ oticamente estable. Para comprobar esto es de mucha utilidad recordar que en la secci´on 3.5 del cap´ıtulo 3 se ha demostrado que l´ım tj ept = 0

t→∞

para cualquier j > 0 entero y cualquier n´ umero real p < 0.

7.6.

Controlabilidad y observabilidad

Dos propiedades importantes de la ecuaci´on din´amica

414

7 La t´ecnica de las variables de estado

x˙ = Ax + Bu, x ∈ Rn , u ∈ R y = Cx, y ∈ R

(7.50) (7.51)

que ser´an utilizadas a lo largo de este cap´ıtulo son la controlabilidad y la observabilidad. A continuaci´on se definen y estudian estas propiedades. 7.6.1.

Controlabilidad

Definici´ on 7.2 ([1], p´ ag. 176) Una ecuaci´ on de estado es controlable en el instante t0 si existe un tiempo finito t1 > t0 tal que dados cualquiera dos estados x0 y x1 existe una entrada u que aplicada desde t = t0 hasta t = t1 consigue trasferir el estado desde x0 en t = t0 hasta x1 en t = t1 . De otro modo la ecuaci´ on de estado es no controlable. N´otese que esta definici´on no especifica la trayectoria que se deba seguir para transferir el estado desde x0 hasta x1 por lo que queda en total libertad. Adem´as, no es necesario que el estado del sistema permanezca en x1 para instantes posteriores a t1 . N´otese tambi´en que la controlabilidad es una propiedad que s´olo tiene que ver con la entrada, es decir con la ecuaci´on de estado, por lo que la ecuaci´on de salida no juega ning´ un papel. Finalmente, esta definici´on es muy general pues tambi´en considera la posibilidad de que la ecuaci´on de estado sea variante en el tiempo, es decir, que los elementos de A y B sean funciones del tiempo. En el caso de una ecuaci´on de estado invariante en el tiempo como la mostrada en (7.50), es decir cuando los elementos de A y B son constantes, si la ecuaci´on de estado es controlable entonces lo es para cualquier t0 ≥ 0 y el instante t1 es cualquier valor tal que t1 > t0 , es decir, la transferencia desde x0 a x1 puede ser realizada en cualquier intervalo de tiempo de duraci´on no zero. Esto permite obtener una manera muy simple de verificar si una ecuaci´on de estado es controlable: Teorema 7.2 ([6], p´ ag. 145) La ecuaci´ on de estado en (7.50) es controlable si y s´ olo si cualquiera de las dos siguientes condiciones equivalentes se satisface: 1.

La siguiente matriz de n × n: Z t Z t ´T ³ ¡ ¢T eA(t−τ ) BB T eA(t−τ ) dτ eAτ BB T eAτ dτ = Wc (t) = 0

0

(7.52)

2.

es no singular para cualquier t > 0. La matriz de controlabilidad de n × n: £ ¤ B AB A2 B · · · An−1 B

(7.53)

tiene rango igual a n, es decir, su determinante es diferente de cero.

7.6 Controlabilidad y observabilidad

415

La raz´on de este resultado puede explicarse a grandes rasgos del siguiente modo. La siguiente entrada: ´T ³ (7.54) u(t) = −B T eA(t1 −t) Wc−1 (t1 )[eAt1 x0 − x1 ]

transfiere el estado del sistema desde x0 = x(0) en t0 = 0 hasta x1 en t1 > 0. Esto se puede verificar sustituyendo en la soluci´on presentada en (7.46), pero evaluada en t = t1 , es decir: Z t1 eA(t1 −τ ) Bu(τ )dτ x(t1 ) = eAt1 x(0) + 0

la entrada en (7.54), pero evaluada en t = τ , es decir: ´T ³ u(τ ) = −B T eA(t1 −τ ) Wc−1 (t1 )[eAt1 x0 − x1 ] para obtener:

x(t1 ) = eAt1 x(0) ¾ ½ Z t1 ´T ³ eA(t1 −τ ) B −B T eA(t1 −τ ) Wc−1 (t1 )[eAt1 x0 − x1 ] dτ + 0 At1

x(0) ½Z t1 ´T ¾ ³ − eA(t1 −τ ) BB T eA(t1 −τ ) dτ Wc−1 (t1 )[eAt1 x0 − x1 ] | 0 {z }

=e

Wc (t1 )

= x1

N´otese que este resultado necesita que la matriz Wc (t) de n × n definida en (7.52) sea no singular (para que Wc−1 (t1 ) exista), lo cual es cierto para cualquier t1 = t > 0 si la ecuaci´on din´amica es controlable. El hecho de que t1 sea cualquier instante positivo significa que el estado puede pasar de x0 a x1 en cualquier intervalo de tiempo de duraci´on no cero. Por otro lado, la igualdad en (7.52) se puede comprobar del siguiente modo. Def´ınase v = t − τ , entonces: Z τ =t Z t ´T ³ ´T ³ eA(t−τ ) BB T eA(t−τ ) dτ eA(t−τ ) BB T eA(t−τ ) dτ = τ =0 v=0

0

=

Z

v=t v=t

=

Z

v=0

¡ ¢T eAv BB T eAv (−dv)

¡ ¢T eAv BB T eAv dv

lo cual comprueba la igualdad en (7.52) si se usa τ en lugar de v en la u ´ltima integral, lo cual es v´alido porque el uso de v o de τ como variable de integraci´on en la u ´ltima integral no afecta el resultado.

416

7 La t´ecnica de las variables de estado

Finalmente, el hecho de que el rango n de la matriz en (7.53) sea una condici´on equivalente a la no singularidad de Wc (t) es de mucha utilidad porque es m´as f´acil verificar que (7.53) tenga rango n que la no singularidad de Wc (t). 7.6.2.

Observabilidad

Definici´ on 7.3 ([1], p´ ag. 193) Una ecuaci´ on din´ amica es observable en el instante t0 si existe un tiempo finito t1 > t0 tal que para cualquier estado desconocido x0 en t = t0 , es suficiente el conocimiento de la entrada u y de la salida y sobre el intervalo de tiempo [t0 , t1 ] para determinar de manera u ´nica el estado x0 . De otro modo la ecuaci´ on din´ amica es no observable. N´otese que la observabilidad es una propiedad que tiene que ver con la posibilidad de conocer el estado (interno al sistema) a partir u ´nicamente del conocimiento de mediciones externas al sistema, es decir a partir de la entrada y de la salida. N´otese tambi´en que esta definici´on es muy general pues tambi´en considera la posibilidad de que la ecuaci´on de estado sea variante en el tiempo, es decir, que los elementos de A, B y C sean funciones del tiempo. En el caso de una ecuaci´on din´amica invariante en el tiempo como la mostrada en (7.50), (7.51), es decir cuando los elementos de A, B y C son constantes, si la ecuaci´on de estado es observable entonces lo es para cualquier t0 ≥ 0 y el instante t1 es cualquier valor tal que t1 > t0 , es decir, la determinaci´on del estado inicial puede ser conseguida en cualquier intervalo de tiempo de duraci´on no zero. Esto permite obtener una manera muy simple de verificar si una ecuaci´on de estado es observable: Teorema 7.3 ([6], p´ ag. 155,156) La ecuaci´ on din´ amica en (7.50), (7.51), es observable si y s´ olo si cualquiera de las dos siguientes condiciones equivalentes se satisface: 1.

La siguiente matriz de n × n: Z t ¡ Aτ ¢T T Aτ e C Ce dτ Wo (t) =

(7.55)

0

2.

es no singular para cualquier t > 0. La matriz de observabilidad de n × n:  C  CA   CA2   ..  .

CAn−1

      

(7.56)

tiene rango igual a n, es decir, su determinante es diferente de cero.

7.6 Controlabilidad y observabilidad

417

La raz´on de este resultado puede explicarse a grandes rasgos del siguiente modo. Considere la soluci´on dada en (7.48) y defina: y(t) = CeAt x(0) Z t eA(t−τ ) Bu(τ )dτ = y(t) − C

(7.57) (7.58)

0

N´otese que de acuerdo a (7.58) la funci´on y(t) se puede calcular a partir del conocimiento exclusivo de la entrada y de la salida. Multiplicando ambos lados ¡ ¢T de (7.57) por eAt C T e integrando sobre [0, t1 ] se obtiene: ½Z

|

t1

0

¡

e

¢ At T

T

At

¾

C Ce dt x(0) = {z }

Z

0

Wo (t1 )

t1

¡

eAt

¢T

C T y(t)dt

Si la matriz Wo (t1 ) es no singular, lo cual es cierto si el sistema es observable, entonces el estado inicial x(0) = x0 se puede calcular de manera u ´nica como: x0 = Wo−1 (t1 )

Z

t1 0

¡

eAt

¢T

C T y(t)dt

N´otese que este resultado necesita que la matriz Wo (t) de n × n definida en (7.55) sea no singular (para que Wo−1 (t1 ) exista), lo cual es cierto para cualquier t1 = t > 0 si la ecuaci´on din´amica es observable. El hecho de que t1 sea cualquier instante positivo significa que el estado x0 puede ser calculado con la informaci´on obtenida desde la entrada y desde la salida en cualquier intervalo de tiempo de duraci´on no cero. Finalmente, el hecho de que el rango n de la matriz en (7.56) sea una condici´on equivalente a la no singularidad de Wo (t) es de mucha utilidad porque es m´as f´acil verificar que (7.56) tenga rango n que la no singularidad de Wo (t). Ejemplo 7.4 Una manera de estimar el estado actual x(t) (y no el estado inicial x(0)) es utilizando mediciones de la salida y de la entrada as´ı como algunas de sus derivadas respecto al tiempo. A continuaci´ on se muestra que una condici´ on necesaria para este c´ alculo es, de nuevo, que la matriz en (7.56) tenga rango n. Considere la ecuaci´ on din´ amica en (7.50), (7.51). Las primeras n − 1 derivadas de la salida se obtienen como: y = Cx, y˙ = C x˙ = CAx + CBu, y¨ = CAx˙ + CB u˙ = CA2 x + CABu + CB u, ˙ y (3) = CA2 x˙ + CAB u˙ + CB u ¨ = CA3 x + CA2 Bu + CAB u˙ + CB u ¨, .. .

418

7 La t´ecnica de las variables de estado

y (i) = CAi x + CAi−1 Bu + CAi−2 B u˙ + · · · + CBu(i−1) , .. . y (n−1) = CAn−1 x + CAn−2 Bu + CAn−3 B u˙ + · · · + CBu(n−2) donde el exponente entre par´entesis representa el orden de la derivada respecto al tiempo. Acomodando matricialmente estas expresiones: Y˙ = Dx(t) + U˙ donde: 

y y˙ y¨



       (3)  ˙ Y = y ,    ..   .  y (n−1)      U˙ =    



    D=   

C CA CA2 CA3 .. . CAn−1



    ,   

0 CBu CABu + CB u˙ CA2 Bu + CAB u˙ + CB u ¨ .. .

CAn−2 Bu + CAn−3 B u˙ + · · · + CBu(n−2)

        

Por tanto, si la matriz en (7.56) tiene rango n entonces la matriz D de n × n es invertible y el estado actual se puede calcular como: x(t) = D−1 (Y˙ − U˙ )

(7.59)

es decir, utilizando u ´nicamente mediciones de la salida y la entrada as´ı como algunas de las derivadas respecto al tiempo de estas variables. La gran desventaja de esta manera de calcular el valor del estado x(t) es que generalmente las mediciones de cualquier variable est´ an contaminadas de ruido en la pr´ actica y este problema es m´ as grave conforme se calculan derivadas de orden mayor a partir de estas mediciones. Esta es la raz´ on por la que (7.59) no se utiliza para calcular el estado x(t) y se prefieren m´etodos como el presentado en la secci´ on 7.11.

7.7.

Funci´ on de transferencia de una ecuaci´ on din´ amica

Sea la siguiente ecuaci´on din´amica de una entrada-una salida: x˙ = Ax + Bu y = Cx

(7.60)

7.7 Funci´ on de transferencia de una ecuaci´ on din´ amica

419

donde x ∈ Rn , u ∈ R, y ∈ R son funciones del tiempo, A es una matriz constante de n × n, B es un vector columna constante de n componentes y C es un vector rengl´on constante de n componentes. Aplicando la transformada de Laplace a (7.60) se obtiene: sX(s) − x(0) = AX(s) + BU (s) Y (s) = CX(s)

(7.61) (7.62)

donde X(s), Y (s), U (s) representan, respectivamente, la transformada de Laplace del vector de estado x, de la salida escalar y y de la entrada escalar u mientas que x(0) es el valor inicial del estado x. Recu´erdese que dado un vector x = [x1 , x2 , . . . , xn ]T que es funci´on del tiempo, su transformada de Laplace se obtiene aplicando esta operaci´on a cada elemento de dicho vector, es decir [3], cap. 4:   L {x1 }  L {x2 }    X(s) =  .   ..  L {xn }

Una funci´on de transferencia siempre se define bajo la suposici´on de condiciones iniciales cero. Sustituyendo x(0) = 0 en (7.61) y despejando X(s): X(s) = (sI − A)−1 BU (s)

(7.63)

donde I representa la matriz identidad de n × n. Sustituyendo (7.63) en (7.62) se obtiene: Y (s) = G(s) = C(sI − A)−1 B U (s)

(7.64)

N´otese que la funci´on de transferencia G(s) dada en (7.64) es un escalar. Ahora se procede a analizar dicha funci´on de transferencia. Con el fin de presentar una exposici´on m´as clara de las ideas, a continuaci´on se supone que n = 3, es decir que A es una matriz de 3 × 3, I es una matriz identidad de 3 × 3 y que B y C son vectores columna y rengl´on, respectivamente, de 3 componentes:     b1 a11 a12 a13 £ ¤ A =  a21 a22 a23  , B =  b2  , C = c1 c2 c3 b3 a31 a32 a33 Sin embargo, el lector puede darse cuenta de que el mismo procedimiento es v´alido para cualquier valor arbitrario de n. Primero calc´ ulese la matriz:   s − a11 −a12 −a13 sI − A =  −a21 s − a22 −a23  −a31 −a32 s − a33

420

7 La t´ecnica de las variables de estado

cuya matriz inversa est´a dada de acuerdo a la f´ormula (sI − A)−1 = donde [2], cap. 10:

Adj(sI−A) det(sI−A)

T Cof11 Cof12 Cof13 Adj(sI − A) = Cof T (sI − A) =  Cof21 Cof22 Cof23  Cof31 Cof32 Cof33 

donde Cof (sI − A) es la matriz de cofactores de sI − A y Cofij = (−1)i+j Mij y Mij es el determinante de (n − 1) × (n − 1), es decir de 2 × 2, que queda al eliminar el rengl´on i y la columna j del determinante de la matriz sI − A [2], cap. 10. Calculando expl´ıcitamente estos elementos se puede observar que Cofij es un polinomio de s cuyo grado es estrictamente menor que n = 3. Por otro lado, desarrollando a trav´es del primer rengl´on se encuentra que: ¯ ¯ ¯ ¯ ¯ −a21 −a23 ¯ ¯ s − a22 −a23 ¯ ¯ ¯ ¯ ¯ + a12 ¯ det(sI − A) = (s − a11 ) ¯ −a31 s − a33 ¯ −a32 s − a33 ¯ ¯ ¯ ¯ −a21 s − a22 ¯ ¯ ¯ −a13 ¯ −a31 −a32 ¯

es decir, det(sI − A) es un polinomio de s de grado igual a n = 3. A partir de estas observaciones se concluye que todos los elementos de la matriz:   Inv11 Inv12 Inv13 Adj(sI − A) (sI − A)−1 = =  Inv21 Inv22 Inv23  det(sI − A) Inv31 Inv32 Inv33

est´an dados como el cociente de dos polinomios de s de manera que el polinomio del numerador es de grado estrictamente menor que n = 3 y el polinomio del denominador es, para todos los elementos de (sI − A)−1 , un polinomio de grado n = 3 que est´a dado como det(sI − A). Por otro lado, el producto (sI − A)−1 B es un vector columna de n = 3 componentes. Cada uno de estos componentes se obtiene como:     Inv11 b1 + Inv12 b2 + Inv13 b3 d1 (sI − A)−1 B =  d2  =  Inv21 b1 + Inv22 b2 + Inv23 b3  Inv31 b1 + Inv32 b2 + Inv33 b3 d3 De acuerdo a lo expuesto en el p´arrafo anterior sobre la manera en que est´a dado cada uno de los elementos Invij de la matriz (sI − A)−1 y recurriendo a la suma de fracciones con el mismo denominador, se concluye que cada uno de los elementos di del vector columna (sI − A)−1 B tambi´en esta dado como el cociente de dos polinomios de s de manera que el polinomio del numerador tiene grado estrictamente menor que n = 3 mientras que el polinomio del denominador es det(sI − A) que tiene grado igual a n = 3. Finalmente, se encuentra lo siguiente: C(sI − A)−1 B = c1 d1 + c2 d2 + c3 d3

7.7 Funci´ on de transferencia de una ecuaci´ on din´ amica

421

Razonando de manera similar es posible concluir lo siguiente, lo cual es v´alido para cualquier valor de n: Resultado 7.11 ( [1], caps. 6, 7) La funci´ on de transferencia dada en (7.64) es un escalar que est´ a dado como el cociente de dos polinomios de s de manera que el polinomio del numerador tiene grado estrictamente menor que n y el polinomio del denominador es igual a det(sI − A) el cual tiene grado igual a n, es decir: bm sm + bm−1 sm−1 + · · · + b1 s + b0 Y (s) = G(s) = C(sI − A)−1 B = U (s) sn + an−1 sn−1 + · · · + a1 s + a0 (7.65) det(sI − A) = sn + an−1 sn−1 + · · · + a1 s + a0 para algunas constantes reales bk , al , k = 0, 1, . . . , m, l = 0, 1, . . . , n − 1, con n > m. Sin embargo, para que esta afirmaci´on sea cierta es necesario incluir la siguiente condici´on adicional [1], cap 7: Condici´ on 7.1 La ecuaci´ on din´ amica en (7.60) debe ser controlable, es decir, el determinante de la matriz en (7.53) debe ser diferente de cero. Si adem´as se cumple lo siguiente, entonces los polinomios bm sm +bm−1 sm−1 + · · · + b1 s + b0 y sn + an−1 sn−1 + · · · + a1 s + a0 no tienen ra´ıces comunes [1], cap 6: Condici´ on 7.2 La ecuaci´ on din´ amica en (7.60) es observable, es decir, el determinante de la matriz en (7.56) es diferente de cero. Ejemplo 7.5 Con el fin de poner en pr´ actica estas ideas, a continuaci´ on se considera un caso sencillo: un motor de CD. En el cap´ıtulo 9 se muestra que el modelo de un motor de CD es el siguiente (v´ease (9.8)): J θ¨ + bθ˙ = n km i∗

(7.66)

cuando no existe perturbaci´ on externa. Adem´ as, se puede considerar que la corriente el´ectrica i∗ es la se˜ nal de entrada cuando se utiliza un lazo interno de corriente de alta ganancia. Definiendo las variables de estado como la posici´ on y la velocidad, no es dif´ıcil darse cuenta de que se obtiene la siguiente ecuaci´ on din´ amica: x˙ = Ax + Bu, y = Cx ¸ · · ¸ · ¸ θ 0 1 x1 , x= = ˙ , A= x2 0 − Jb θ

B=

·

0 nkm J

¸

(7.67) ,

u = i∗

donde C es un vector rengl´ on que se definir´ a m´ as adelante dependiendo de la salida que se desee considerar. N´ otese que la siguiente matriz:

422

7 La t´ecnica de las variables de estado

£

¤ B AB =

·

0 nkm J

nkm J − nkJm Jb

¸

¢2 ¡ tiene rango n = 2 ya que su determinante es igual a − nkJm 6= 0. A partir de las definiciones en (7.67) se obtienen los siguientes resultados: ¸ µ ¶ · b s −1 , det(sI − A) = s s + , sI − A = 0 s + Jb J · ¸ · ¸ s + Jb 0 s + Jb 1 Cof (sI − A) = , Adj(sI − A) = Cof T (sI − A) = , 1 s 0 s · ¸ Adj(sI − A) 1 s + Jb 1 (sI − A)−1 = = 0 s det(sI − A) s(s + b ) J

Para obtener la funci´ on de transferencia correspondiente se considerar´ an los siguientes dos casos: La salida es la posici´ on, es deicr y = θ = x1 = Cx, donde C = [1 0]. Entonces: ¸· · ¸ £ ¤ 1 0 s + Jb 1 G(s) = C(sI − A)−1 B = 1 0 nkm 0 s s(s + b ) J J

G(s) =

nkm J

s(s + Jb )

N´ otese que en este caso la siguiente matriz: ¸ ¸ · · 10 C = 01 CA tiene rango igual a n = 2 ya que su determinante es igual a la unidad, es decir, es diferente de cero. La salida es la velocidad, es decir y = θ˙ = x2 = Cx, donde C = [0 1]. Entonces: ¸· · ¸ £ ¤ 1 0 s + Jb 1 −1 G(s) = C(sI − A) B = 0 1 nkm 0 s s(s + Jb ) J G(s) =

nkm J s s(s + Jb )

En este caso la siguiente matriz: · ¸ · ¸ 0 1 C = CA 0 − Jb tiene rango menor que n = 2 ya que su determinante es igual a cero.

7.8 Funci´ on de transferencia y ecuaci´ on din´ amica

423

N´ otese que en ambos casos la funci´ on de transferencia obtenida cumple con lo establecido en (7.65): que el polinomio del denominador es igual a det(sI −A). N´ otese tambi´en que esto es cierto gracias a que la matriz [B AB] tiene rango igual a n = 2 en ambos casos. Finalmente, se puede apreciar el efecto de que el sistema sea o no observable: en el segundo de los casos el sistema no es observable y por ello la funci´ on de transferencia correspondiente tiene un polo y un cero que se cancelan lo cual no ocurre en el primero de los casos porque es observable. Dicha cancelaci´ on polo-cero en el segundo de los casos trae como consecuencia que la funci´ on de transferencia sea de primer orden lo cual significa que s´ olo uno de los estados (la velocidad) es descrito por la correspondiente funci´ on de transferencia. Es decir, la posici´ on del motor no tiene ning´ un efecto cuando se trata de controlar la velocidad del motor. De esta manera se puede dar una nueva interpretaci´ on a la observabilidad, como se explica a continuaci´ on. Cuando la salida es la posici´ on, el sistema es observable porque conociendo la posici´ on se puede calcular la velocidad (que es la otra variable de estado) derivando la posici´ on, por ejemplo. Pero si la salida es la velocidad el conocimiento de esta variable no es suficiente para conocer la posici´ on (que es la otra variable de estado) como se explica a continuaci´ on. Aunque se podr´ıa argumentar que la posici´ on θ(t) se puede calcular simplemente integrando la velocidad θ˙ sin embargo, de acuerdo a: Z t ˙ θ(r)dr θ(t) − θ(0) = 0

adem´ as de conocer la velocidad es necesario conocer la posici´ on inicial θ(0) la cual es desconocida. Por esto, el sistema no es observable cuando la velocidad es la salida. Sin embargo, como ya se mencion´ o, si lo u ´nico que se desea es controlar la velocidad esto no trae ning´ un problema porque para eso no se necesita conocer la posici´ on. As´ı que la observabilidad es importante en otro tipo de problemas que se abordar´ an m´ as adelante (secciones 7.11 y 7.12). Finalmente, el lector puede comprobar la exactitud de estos resultados comparando estas funciones de transferencia con las obtenidas en los cap´ıtulos 9 y 10.

7.8. Una de las ecuaciones din´ amicas que corresponden a una funci´ on de transferencia Una de las caracter´ısticas de la representaci´on en variables de estado es que no es u ´nica. Es decir, dado un mismo sistema f´ısico existen muchas ecuaciones din´amicas que lo representan correctamente. Esto significa tambi´en que dada una funci´on de transferencia existen muchas ecuaciones din´amicas que la representan correctamente. A continuaci´on se muestra la manera de obtener una de esas ecuaciones din´amicas. Considere la siguiente funci´on de transferencia: bm sm + bm−1 sm−1 + · · · + b1 s + b0 Y (s) = G(s) = U (s) sn + an−1 sn−1 + · · · + a1 s + a0

(7.68)

424

7 La t´ecnica de las variables de estado

Desp´ejese la salida: Y (s) =

bm sm + bm−1 sm−1 + · · · + b1 s + b0 U (s) sn + an−1 sn−1 + · · · + a1 s + a0

Def´ınase la nueva variable: V (s) =

sn

+ an−1

para escribir:

sn−1

1 U (s) + · · · + a1 s + a0

Y (s) = (bm sm + bm−1 sm−1 + · · · + b1 s + b0 )V (s)

(7.69)

(7.70)

Considere la expresi´on (7.69). Pasando el denominador multiplicando al lado izquierdo, aplicando la transformada inversa de Laplace y despejando la derivada de mayor orden se obtiene: v (n) = −an−1 v (n−1) − · · · − a1 v˙ − a0 v + u

(7.71)

donde V (s) = L {v}. De acuerdo a lo expuesto en la secci´on 7.1, def´ınanse las variables de estado como la inc´ognita de la ecuaci´on diferencial (7.71), v, y sus primeras n − 1 derivadas: x ¯1 = v,

x ¯2 = v, ˙

x ¯3 = v¨,

...,

x ¯n = v (n−1)

(7.72)

Entonces, (7.71) se puede escribir como: x ¯˙ n = −an−1 x ¯n − · · · − a1 x ¯2 − a0 x ¯1 + u

(7.73)

Por otro lado, aplicando la transformada inversa de Laplace a (7.70) se obtiene: y = bm v (m) + bm−1 v (m−1) + · · · + b1 v˙ + b0 v Si se considera que m toma su valor m´aximo, es decir m = n − 1 (recu´erdese que n > m) entonces puede usarse (7.72) para escribir: y = bn−1 x ¯n + bn−2 x ¯n−1 + · · · + b1 x ¯ 2 + b0 x ¯1

(7.74)

Usando (7.72), (7.73) y (7.74) se obtiene: ¯x + Bu ¯ x ¯˙ = A¯ y = C¯ x ¯   0 1 0 0 ··· 0 0  0 0 1 0 ··· 0 0     0 0 0 1 ··· 0 0     0 0 0 ··· 0 0  A¯ =  0 ,  .. ..  .. .. . . .. ..   . . . . . . .    0 0 0 0 ··· 0 1  −a0 −a1 −a2 −a3 · · · −an−2 −an−1 £ ¤ C¯ = b0 b1 b2 b3 · · · bn−2 bn−1 , £ ¤T ¯1 x ¯2 x ¯3 x ¯4 · · · x ¯n−1 x ¯n x ¯= x

(7.75)   0 0   0    ¯= B 0,  ..  .   0 1

7.9 Ecuaciones din´ amicas equivalentes

425

La expresi´on (7.75) representa una ecuaci´on din´amica que corresponde a la funci´on de transferencia dada en (7.68) y se dice que est´a en la forma can´onica de controlabilidad. Como se ver´a m´as adelante la forma can´onica de controlabilidad es muy u ´til para dise˜ nar un controlador por realimentaci´on del estado.

7.9.

Ecuaciones din´ amicas equivalentes

En la secci´on 7.7 se ha mostrado a que cualquier ecuaci´on din´amica de una entrada y una salida que sea controlable y que cuya forma sea la mostrada en (7.60) le corresponde una funci´on de transferencia de la forma presentada en (7.65). N´otese que el requisito de la observabilidad s´olo sirve para asegurar que no hay cancelaciones de polos y ceros en la funci´on de transferencia (7.65). Por otro lado, en la secci´on 7.8 se ha mostrado que cualquier funci´on de transferencia de la forma (7.65) puede escribirse en la forma de la ecuaci´on din´amica mostrada en (7.75). Esto significa que cada una de las ecuaciones din´amicas en (7.60) y (7.75) puede ser obtenida a partir de la otra, es decir, que ambas son equivalentes. A continuaci´on se muestra como pasar de (7.60) a (7.75), y viceversa, sin necesidad del paso intermedio de una funci´on de transferencia. Considere la ecuaci´on din´amica (7.60) de una entrada y una salida y defina la siguiente transformaci´on lineal: x ¯ = Px

(7.76)

donde P es una matriz constante de n × n que se define a partir de su inversa como se indica a continuaci´on [1], cap. 7: £ ¤ P −1 = q1 · · · qn−2 qn−1 qn , (7.77) qn = B, qn−1 = AB + an−1 B, qn−2 = A2 B + an−1 AB + an−2 B, .. . q1 = An−1 B + an−1 An−2 B + · · · + a1 B

det(sI − A) = sn + an−1 sn−1 + · · · + a1 s + a0

Es importante subrayar que la matriz P −1 es invertible, es decir, su inversa P siempre existe si la matriz definida en (7.53) tiene rango n [1], cap. 7, es decir si (7.60) es controlable. Esto puede explicarse del siguiente modo. Si la matriz definida en (7.53) tiene rango n, es decir todas sus columnas son linealmente independientes, entonces cuando sus columnas se suman como en las expresiones anteriores que definen a los vectores q1 , . . . , qn−2 , qn−1 , qn , las columnas q1 , . . . , qn−2 , qn−1 , qn resultan ser linealmente independientes. Esto

426

7 La t´ecnica de las variables de estado

significa que el determinante de P −1 es diferente de cero y, por tanto, su inversa P existe. Usando (7.76) en (7.60), es decir x ¯˙ = P x, ˙ se obtiene: ¯x + Bu ¯ x ¯˙ = A¯ y = C¯ x ¯ ¯ ¯ = P B, A = P AP −1 , B

C¯ = CP −1

(7.78)

¯ C¯ en (7.78) est´an dados como en la forma La matriz A¯ y los vectores B, can´onica de controlabilidad (7.75) sin importar la forma que tengan A, B y C mientras la matriz definida en (7.53) tenga rango n. La demostraci´on de esta u ´ltima afirmaci´on requiere de herramientas matem´aticas que est´an fuera del alcance de este libro y por ello no se presenta. Se recomienda consultar la referencia [1] para una soluci´on completa de este problema. El lector puede verificar estas ideas proponiendo valores num´ericos para las matrices A, B, C y realizando los c´alculos correspondientes. Esto significa que cada una de las ecuaciones din´amicas (7.60) y (7.75) puede ser obtenida a partir de la otra y que la relaci´on entre las matrices involucradas est´a dada por (7.78), es decir, que ambas son equivalentes. N´otese que la condici´on fundamental para que exista esta equivalencia es que la matriz definida en (7.53) tenga rango n [1], cap 5. Esto se resume del siguiente modo: Teorema 7.4 ([1], cap. 7) Si (7.60) es controlable, entonces esta ecuaci´ on din´ amica es equivalente a (7.75) mediante la transformaci´ on lineal (7.76), (7.77), es decir, a trav´es de (7.78). Ejemplo 7.6 En el cap´ıtulo 13 se obtiene la aproximaci´ on lineal de un mecanismo conocido como el p´endulo de Furuta. Este modelo se presenta en (13.13), (13.14), y a continuaci´ on se reescribe para facilitar la referencia: z˙ = Az + Bv  01 0 −gm21 l12 L0 0 0  I0 (J1 +m1 l12 )+J1 m1 L20 A= 0 0 0  (I0 +m1 L20 )m1 l1 g 0 0 I0 (J1 +m1 l2 )+J1 m1 L2 1

0



0 0  , 1 0



0 J1 +m1 l12  2 2  B =  I0 (J1 +m1 l1 )+J1 m1 L0  0 −m1 l1 L0 I0 (J1 +m1 l12 )+J1 m1 L20



(7.79)

k  m   ra

Para facilitar la manipulaci´ on algebraica se definen las siguientes constantes: (I0 + m1 L20 )m1 l1 g −gm21 l12 L0 , b= 2 2 I0 (J1 + m1 l1 ) + J1 m1 L0 I0 (J1 + m1 l12 ) + J1 m1 L20 km km −m1 l1 L0 J1 + m1 l12 , d= c= 2 2 2 2 I0 (J1 + m1 l1 ) + J1 m1 L0 ra I0 (J1 + m1 l1 ) + J1 m1 L0 ra

a=

La siguiente matriz tiene la forma: 

0  £ ¤ c Co = B AB A2 B A3 B =  0 d

c 0 d 0

 0 ad ad 0   0 bd  bd 0

7.9 Ecuaciones din´ amicas equivalentes

427

Despu´es de un desarrollo algebraico sencillo, aunque laborioso, se obtiene: det(Co ) =

4 m41 l14 L20 g 2 km 6= 0 2 2 4 [I0 (J1 + m1 l1 ) + J1 m1 L0 ] ra4

(7.80)

Por tanto, la ecuaci´ on din´ amica en (7.79) es controlable para cualquier conjunto de par´ ametros del p´endulo de Furuta. Es decir, este resultado no cambia si el mecanismo con el que se cuenta es grande o peque˜ no o si es ligero o pesado. Esto significa que la matriz P introducida en (7.76) es no singular y a continuaci´ on es construida utilizando la f´ ormula presentada en (7.77). Para simplificar los c´ alculos se utilizar´ an los siguientes valores num´ericos: 2

2

I0 = 1.137 × 10−3 [kgm ], l1 = 0.1875[m],

2

J1 = 0.38672 × 10−3 [kgm ], g = 9.81[m/s ] km m1 = 0.033[kg], L0 = 0.235[m], = 0.0215[Nm/V] ra

que corresponden a los par´ ametros del p´endulo de Furuta que es construido y controlado en el cap´ıtulo 13. Con estos valores se encuentra:     0 01 0 0   0 0 −35.81 0    , B =  13.4684  A=  0 0  0 0 1 −12.6603 0 0 72.90 0

Con estos datos, y calculando num´ericamente, se encuentra que las ra´ıces del polinomio det(λI − A) son: λ1 = 0,

λ2 = 0,

λ3 = 8.5381,

λ4 = −8.5381

Entonces se realiza el producto: (λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = λ4 + a3 λ3 + a2 λ2 + a1 λ + a0 de donde se encuentra, al igualar coeficientes: a3 = 0,

a2 = −72.8992,

a1 = 0,

a0 = 0

(7.81)

Usando estos valores en (7.77) se encuentra:   −527.8686 0 13.4600 0  0 −527.8686 0 13.4600   P −1 =   −0.0101  0 −12.6600 0 0 −0.0101 0 −12.6600 y, por tanto:



 −0.0019 0 −0.0020 0  0 −0.0019 0 −0.0020   P =  0.0000  0 −0.0790 0 0 0.0000 0 −0.0790

(7.82)

428

7 La t´ecnica de las variables de estado

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los siguientes productos:     0 0 1.0000 0 0     0.0008 0 1.0000 0 , PB = 0 P AP −1 =  0  0 0 0 1.0000  1 0.0583 0 72.8992 0 N´ otese que, una vez que se identifican y eliminan algunos errores num´ericos, estas matrices tienen exactamente la forma presentada en (7.75) para A¯ = ¯ = P B. P AP −1 y B

7.10.

Control por realimentaci´ on del estado

Considere la ecuaci´on de estado de una entrada una salida presentada en (7.60) en lazo cerrado con el siguiente controlador: u = −Kx = −(k1 x1 + k2 x2 + . . . + kn xn ) £ ¤ K = k1 k2 . . . kn

(7.83)

x˙ = (A − BK)x

(7.84)

donde ki , i = 1, . . . , n, son n escalares constantes. Sustituyendo (7.83) en (7.60) se obtiene:

Al igual que (7.49), la ecuaci´on din´amica en (7.84) no tiene entrada. Por tanto, el criterio de estabilidad establecido para (7.49) es aplicable a (7.84). Esto significa que el vector x(t) soluci´on de (7.84) satisface l´ımt→∞ x(t) = 0 si y s´olo si todos los eigenvalores de la matriz A − BK tienen parte real estrictamente negativa. Sin embargo, desde el punto de vista de una aplicaci´on pr´actica ´esto no es suficiente debido a que, adem´as, se requiere un buen desempe˜ no del sistema en lazo cerrado. Es importante subrayar que la forma de la respuesta x(t) de la ecuaci´on en (7.84) depende de la ubicaci´on de los eigenvalores de A − BK. Por tanto, los eigenvalores de la matriz A − BK deben poder ser asignados en donde se desee. Esto se indica diciendo que tales eigenvalores deben poder ser asignados arbitrariamente. Dado que el vector rengl´on K puede seleccionarse a voluntad, es de inter´es saber c´omo seleccionar K de manera que los eigenvalores de A − BK queden asignados en donde se especifique. A continuaci´on se presenta la soluci´on a este problema. Considere la transformaci´on lineal (7.76), (7.77) y sustit´ uyala en (7.84) para obtener: ¯x − B ¯K ¯x x ¯˙ = A¯ ¯ −1 ¯ K = KP

(7.85)

7.10 Control por realimentaci´ on del estado

429

¯ dados como en (7.78) y (7.75). N´otese que K ¯x con A¯ y B ¯ es un escalar dado como: ¯x K ¯ = k¯1 x ¯1 + k¯2 x ¯2 + . . . + k¯n x ¯n , ¤ £ ¯ ¯ ¯ ¯ = k1 k2 . . . kn K

que, de acuerdo a (7.75), s´olo afecta el u ´ltimo rengl´on de (7.85) la cual, por tanto, puede escribirse como: ¯ K)¯ ¯ x, x ¯˙ = (A¯ − B ¯K ¯ = A¯ − B  0 1 0 0  0 0 1 0   0 0 0 1   0 0 0 0   .. .. .. ..  . . . .   0 0 0 0 −k¯1 − a0 −k¯2 − a1 −k¯3 − a2 −k¯4 − a3

··· ··· ··· ··· .. .

0 0 0 0 .. .



0 0 0 0 .. .

··· 0 1 · · · −k¯n−1 − an−2 −k¯n − an−1

Entonces, si se selecciona: £ ¤ ¯ = a ¯0 − a0 a ¯1 − a1 . . . a ¯n−1 − an−1 K

         

(7.86)

se consigue:



0 0 0 0 .. .

1 0 0 0 .. .

0 1 0 0 .. .

0 0 1 0 .. .

··· ··· ··· ··· .. .

0 0 0 0 .. .

0 0 0 0 .. .



          ¯K ¯ = A¯ − B         0 0 0 0 ··· 0 1  −¯ a0 −¯ a1 −¯ a2 −¯ a3 · · · −¯ an−2 −¯ an−1

N´otese que de acuerdo a (7.78) y (7.85) se puede escribir:

¯K ¯ = P AP −1 − P BKP −1 = P (A − BK)P −1 A¯ − B

(7.87)

¯K ¯ y A − BK satisfacen (7.38) por lo que ambas Es decir, las matrices A¯ − B tienen los mismos eigenvalores. De acuerdo a lo visto en las secciones previas, ¯K ¯ satisfacen: los eigenvalores λ de A¯ − B ¯ K]) ¯ = λn + a det(λI − [A¯ − B ¯n−1 λn−1 + · · · + a ¯1 λ + a ¯0 n Y ¯i) (λ − λ = i=1

430

7 La t´ecnica de las variables de estado

¯ i , i = 1, . . . , n son los eigenvalores deseados y se proponen a voluntad donde λ del dise˜ nador. Debe tenerse el cuidado de que todos los eigenvalores deseados complejos aparezcan con sus parejas conjugadas para asegurar que todos los coeficientes a ¯i , i = 0, 1, . . . , n − 1 sean reales lo cual, a su vez, asegura que las ¯ y K sean reales. A continuaci´on se resume el procedimiento [1], ganancias K cap. 7, para calcular el vector de ganancias K que asigne los eigenvalores que se deseen a la matriz de lazo cerrado A − BK. Encuentre el polinomio: det(λI − A) = λn + an−1 λn−1 + · · · + a1 λ + a0 ¯1, λ ¯2, . . . , λ ¯ n . Si alguProponga los eigenvalores deseados en lazo cerrado λ no de estos eigenvalores es complejo entonces tambi´en debe proponerse su pareja conjugada como uno de los eigenvalores deseados. Calcule: n Y

i=1

¯ i ) = λn + a (λ − λ ¯n−1 λn−1 + · · · + a ¯1 λ + a ¯0

Calcule: £ ¤ ¯ = a ¯0 − a0 a ¯1 − a1 . . . a ¯n−1 − an−1 K

Calcule los vectores q1 , . . . , qn−2 , qn−1 , qn de acuerdo a (7.77), obtenga la matriz P −1 definida en dicha expresi´on y encuentre su matriz inversa P . ¯ . Calcule la matriz de ganancias del controlador en (7.83) como K = KP Ejemplo 7.7 Continuando con el ejemplo 7.6, donde se aborda el estudio del p´endulo de Furuta, ahora se desea encontrar el vector de ganancias K que, al ser utilizado en el controlador (7.83) (con x = z), asigne en: ¯ 1 = −94, λ

¯ 2 = −18, λ

¯ 3 = −0.5, λ

¯ 4 = −1 λ

a los eigenvalores de la matriz A − BK. Para esto, utilizando los valores anteriores se forma el siguiente polinomio: ¯ 1 )(λ − λ ¯ 2 )(λ − λ ¯ 3 )(λ − λ ¯ 4 ) = λ4 + a (λ − λ ¯ 3 λ3 + a ¯ 2 λ2 + a ¯1 λ + a ¯0 de donde se encuentra, al igualar coeficientes: a ¯3 = 113.5,

a ¯2 = 1860.5,

a ¯1 = 2594,

a ¯0 = 846

¯ de acuerdo Con estos valores y los obtenidos en (7.81) se calcula el vector K a(7.86): £ ¤ ¯ = 846 2594 1933.3 113.5 K Finalmente, usando estos valores y la matriz P mostrada en (7.82) se calcula ¯ : el vector de ganancias K de acuerdo a K = KP

7.11 Observadores de estado

431

£ ¤ K = −1.5997 −4.9138 −154.4179 −14.1895

el cual, a excepci´ on de algunos errores de redondeo, es el vector de ganancias utilizado para controlar experimentalmente el p´endulo de Furuta en el cap´ıtulo 13.

7.11.

Observadores de estado

Como se indic´o en la secci´on 7.1, el estado x est´a constituido por variables que son internas al sistema y, por tanto, en general no se conocen y no se pueden medir. En cambio, la salida y representa una variable que siempre se puede medir. Esto significa que la construcci´on pr´actica de un controlador de la forma (7.83) puede ser no posible si no se puede medir todo el estado. Por esta raz´on es importante contar con una variable x b(t) que sea el estimado del estado x(t), el cual pueda ser utilizado para construir un controlador de la forma: u = −K x b = −(k1 x b1 + k2 x b2 + . . . + kn x bn ) ¤T £ ¤ £ b1 x b2 . . . x bn K = k1 k2 . . . kn , x b= x

(7.88)

El mecanismo que se utiliza para calcular el estimado x b recibe el nombre de “observador de estado” o simplemente “observador”. Un observador debe calcular x b exclusivamente a partir de informaci´on que pueda ser medida, es decir usando la entrada y la salida exclusivamente. Por otro lado, si el controlador (7.88) ha de sustituir al controlador en (7.83), entonces una propiedad fundamental que debe satisfacer el observador a construir es que debe producir un estimado x b que converja lo m´as r´apido posible al valor real de x, o al menos que lo haga de manera sint´otica, es decir, que se asegure que: l´ım x b(t) = x(t)

t→∞

Un observador que cumple con esta caracter´ıstica es el siguiente: x b˙ = (A − LC)b x + Ly + Bu

(7.89)

donde L = [L1 , L2 , . . . , Ln ]T es un vector columna constante. Esto puede explicarse del siguiente modo. Def´ınase el error de estimaci´on como x ˜ = x−x b. Entonces, restando (7.89) a (7.60) se obtiene: x ˜˙ = Ax − (A − LC)b x − Ly

Usando y = Cx en esta expresi´on: x ˜˙ = A˜ x − LC x ˜

= (A − LC)˜ x

432

7 La t´ecnica de las variables de estado

Por tanto, usando los resultados de la secci´on 7.5 se concluye que l´ımt→∞ x ˜(t) = 0 y, por tanto, l´ımt→∞ x b(t) = x(t) si y s´olo si todos los eigenvalores de la matriz A−LC tienen parte real estrictamente negativa. As´ı que el u ´nico problema que resta es c´omo seleccionar el vector (columna) de ganancias L de manera que todos los eigenvalores de la matriz A−LC tengan parte real estrictamente negativa. Este problema queda resuelto del siguiente modo: Teorema 7.5 ([1], p´ ag. 358) Si la ecuaci´ on din´ amica en (7.60) es observable, entonces su estado puede ser estimado usando el observador en (7.89) y todos los eigenvalores de la matriz A − LC pueden ser asignados arbitrariamente previendo que los eigenvalores complejos aparecen con sus parejas conjugadas. Para explicar esta afirmaci´on es de mucha utilidad el siguiente resultado: Teorema 7.6 ([1], p´ ag. 195) Considere las dos ecuaciones din´ amicas siguientes: x˙ = Ax + Bu y = Cx

(7.90)

z˙ = −AT z + C T u

(7.91)

T

γ=B z

donde u, y, γ ∈ R, mientras que x, z ∈ Rn . La ecuaci´ on en (7.90) es controlable (observable) si y s´ olo si la ecuaci´ on en (7.91) es observable (controlable). Por tanto, volviendo al problema del observador, como el par (A, C) es observable entonces el par (−AT , C T ) y, por tanto, el par (AT , C T ) son controlables (porque el signo “−” de la matriz AT no afecta la independencia lineal de las columnas de la matriz en (7.53), v´ease la secci´on 7.3). A partir de esto se concluye que, siguiendo el procedimiento presentado en la secci´on 7.10, siempre se puede encontrar un vector rengl´on K constante tal que la matriz AT − C T K posee cualquier conjunto de eigenvalores deseados (eigenvalores arbitrarios). Como los eigenvalores de una matriz son iguales a los eigenvalores de su matriz transpuesta (v´ease la secci´on 7.3), entonces la matriz A − K T C tiene los mismos eigenvalores que la matriz AT − C T K (los eigenvalores deseados). Definiendo L = K T se obtiene el vector columna de ganancias que se necesita para dise˜ nar el observador en (7.89). Cabe aclarar que la idea de que todos los eigenvalores de la matriz A − LC puedan ser asignados arbitrariamente significa que puedan ser colocados donde se desee seg´ un el criterio del dise˜ nador. Obviamente todos los eigenvalores deben tener parte real estrictamente negativa pero, adem´as, se debe buscar que est´en colocados en lugares del plano complejo que aseguren una r´apida convergencia de x b(t) a x(t). Para decidir donde se deben colocar los eigenvalores de la matriz A − LC, son de mucha utilidad los conceptos sobre respuesta transitoria que se estudiaron en el cap´ıtulo 3 respecto de la ubicaci´on de los polos de funciones de transferencia como la presentada en (7.65).

7.12 El principio de separaci´ on

7.12.

433

El principio de separaci´ on

Cuando se tiene una ecuaci´on din´amica (planta): x˙ = Ax + Bu y = Cx

(7.92)

x b˙ = (A − LC)b x + Ly + Bu

(7.93)

u = −K x b = −(k1 x b1 + k2 x b2 + . . . + kn x bn )

(7.94)

y un observador:

y se utiliza el siguiente controlador para unirlos (v´ease la figura 7.5):

surge la pregunta de c´omo se ver´a afectada la estabilidad del sistema en lazo cerrado (7.92), (7.93), (7.94), es decir es importante asegurar que se a´ un se cumple que l´ımt→∞ x b(t) = x(t) y que l´ımt→∞ x(t) = 0. La respuesta a esta pregunta se conoce como el “principio de separaci´on” el cual establece lo siguiente: Resultado 7.12 ([1], p´ ag. 367) Los eigenvalores del sistema en lazo cerrado (7.92), (7.93), (7.94), son la uni´ on de los eigenvalores de las matrices A−BK y A − LC. Esto significa que los eigenvalores del observador no son afectados por la realimentaci´on en (7.94) y que, al menos en cuanto a los eigenvalores se refiere, no hay diferencia entre realimentar el estimado x b(t) o el estado real x(t). Sin embargo, se debe prevenir al lector sobre el hecho de que la respuesta transitoria del sistema generalmente es diferente si se usa x(t) o si se usa x b(t) para construir la entrada. Lo importante es que se sigue cumpliendo que l´ımt→∞ x b(t) = x(t) y l´ımt→∞ x(t) = 0. Por tanto, el dise˜ no de las ganancias K del controlador y el dise˜ no de las ganancias L del observador pueden ser realizados de manera independiente. Ejemplo 7.8 Considere el motor de CD visto en el ejemplo 7.5, es decir, considere la ecuaci´ on din´ amica: x˙ = Ax + Bu, y = Cx · · ¸ · ¸ ¸ θ 0 1 x1 x= = ˙ , A= , x2 0 − Jb θ

B=

·

0 nkm J

¸

(7.95) ,

C = [1 0],

u = i∗

donde se considera que la salida es la posici´ on mientras que la velocidad no se puede medir y, por tanto, deber´ a ser estimada usando un observador de estado. Suponga que se desea controlar el motor para que alcance una posici´ on constante, es decir, los valores deseados de posici´ on y de velocidad son: x1d = θd ,

x2d = 0

434

7 La t´ecnica de las variables de estado

u

y

planta

observador

c x

àK

Figura 7.5. Sistema realimentado usando un observador para estimar el estado.

donde θd es una constante que representa la posici´ on deseada y la velocidad deseada es cero porque la posici´ on deseada es constante. Definiendo las variables de estado: x ˜1 = x1 − x1d ,

x ˜2 = x2

y calculando x ˜˙ 1 = x˙ 1 − x˙ 1d = x2 = x ˜2 y x ˜˙ 2 = x˙ 2 = θ¨ se obtiene la ecuaci´ on din´ amica: x ˜˙ = A˜ x + Bu, γ = Cx ˜

(7.96)

donde γ es la nueva salida y la matriz A y los vectores B y C est´ an definidos como en (7.95). N´ otese que la salida medida ahora es el error de posici´ on γ=x ˜1 . A partir de este momento se considerar´ an los valores num´ericos del motor controlado en el cap´ıtulo 10, es decir: k=

nkm = 675.4471, J

a=

b = 2.8681 J

(7.97)

A continuaci´ on se muestra como dise˜ nar el observador de estado correspondiente. En el ejemplo 7.5 se mostr´ o que la ecuaci´ on din´ amica en (7.95) es observable y, por tanto, tambi´en la ecuaci´ on din´ amica en (7.96). De acuerdo al teorema 7.6, esto implica que los pares (−AT , C T ) y (AT , C T ) son controlables, es decir, que las siguientes matrices tienen rango n = 2: £ T ¤ £ T T T¤ C −AT C T , C A C porque el signo “−” que acompa˜ na a la matriz A no afecta la independencia lineal de estas columnas (v´ease la secci´ on 7.3). Con los valores num´ericos en (7.97) se calculan las r´ıces del polinomio det(λI − AT ):

7.12 El principio de separaci´ on

λ1 = 0,

435

λ2 = −2.8681

Entonces se realiza el producto: (λ − λ1 )(λ − λ2 ) = λ2 + a1 λ + a0 de donde se encuentra, al igualar coeficientes: a1 = 2.8681,

a0 = 0

(7.98)

Usando B = C T y AT en lugar de A, la f´ ormula en (7.77) se convierte en: £ ¤ P −1 = q1 q2 , q2 = C T , q1 = AT C T + a1 C T ,

Usando los valores num´ericos en (7.97) y (7.98), as´ı como la matriz A y el vector C definidos en (7.95) se obtiene: · ¸ 2.8681 1.0000 P −1 = 1.0000 0 y, por tanto: P =

·

0 1.0000 1.0000 −2.8681

¸

(7.99)

Suponga que se desea asignar los siguientes eigenvalores para la matriz A−LC: ¯ 1 = −150, λ

¯ 2 = −100 λ

(7.100)

Para esto se forma el siguiente polinomio: ¯ 1 )(λ − λ ¯ 2 ) = λ2 + a (λ − λ ¯1 λ + a ¯0 de donde se encuentra, al igualar coeficientes: a ¯1 = 250,

a ¯0 = 15000

¯ de acuerdo Con estos valores y los obtenidos en (7.98) se calcula el vector K a (7.86): £ ¤ ¯ = 15000 247 K Usando estos valores y la matriz P mostrada en (7.99) se calcula el vector K, ¯ , y se asigna L = K T : de acuerdo a K = KP ¸ · 247 (7.101) L= 14291

436

7 La t´ecnica de las variables de estado

Por otro lado, siguiendo un procedimiento similar al de los ejemplos 7.13.1 y 7.13.2 se encuentra que el vector de ganancias: £ ¤ K = 1.6889 0.0414 (7.102) asigna en:

−15.4 + 30.06j,

−15.4 − 30.06j

(7.103)

a los eigenvalores de la matriz A−BK. N´ otese que los valores de las ganancias en (7.102) son iguales a las ganancias proporcional y de realimentaci´ on de velocidad en el controlador dise˜ nado y probado experimentalmente en la secci´ on 10.2.1 del cap´ıtulo 10, en donde los polos de lazo cerrado se asignan en los valores indicados en (7.103). Finalmente, debe aclararse que el observador a construir es: z˙ = (A − LC)z + Lγ + Bu

(7.104)

donde z = [z1 z2 ]T es el estimado del vector x ˜ = [˜ x1 x2 ]T y u = i∗ . Mientras que el controlador es: · ¸ z u = −K 1 (7.105) z2 donde L y K toman los valores indicados en (7.101) y (7.102). N´ otese que el controlador debe utilizar z1 , es decir el estimado de x ˜1 , a pesar de que x ˜1 es una variable que se conoce por medici´ on. Esto es debido a que toda la teor´ıa vista hasta aqu´ı supone que es todo el estado estimado el que se realimenta. En este sentido es conveniente aclarar que tambi´en existen observadores llamados de orden reducido, los cuales s´ olo estiman una parte del estado si la otra parte es conocida. Al lector interesado en este tema se le recomienda consultar la referencia [1]. En la figura 7.6 se muestran resultados en simulaci´ on cuando se utiliza el observador en (7.104) y la realimentaci´ on en (7.105) junto con las ganancias en (7.101) y (7.102) para controlar el motor cuyos par´ ametros se muestran en (7.97). La posici´ on deseada es θd = 2, las condiciones iniciales de observador ˙ son z(0) = [0 0]T , mientras que θ(0) = 0 (es decir, x ˜1 (0) = −2) y θ(0) = 2. Obs´ervese como los estimados z1 y z2 convergen asint´ oticamente a los valores reales x ˜1 y x2 . Es interesante darse cuenta de que esta convergencia es conseguida antes de que el motor termine de responder. Esto se ha conseguido gracias a que los eigenvalores seleccionados para la matriz A − LC (mostrados en (7.100)) son mucho m´ as r´ apidos que los eigenvalores asignados a la matriz A − BK (mostrados en (7.103)). Este es el criterio que normalmente se debe utilizar para asignar los eigenvalores del observador.

7.12 El principio de separaci´ on

[rad]

437

x1

2,5

2

x 1d

1,5

1

0,5

0 0

0,1

0,2

0,3

0,4

t [ s] (a) Posici´ on del motor

[rad] 0,5

0

-0,5

-1

z1 -1,5

f x1

-2 0

0,1

0,2

0,3

0,4

t [ s]

(b) Error de posici´ on x ˜1 y su estimado z1 .

[rad=s]

x2

60

40

20

0

-20

-40

z2 -60 0

0,1

0,2

0,3

0,4

t [ s] (c) Velocidad del motor x2 y su estimado z2 . Figura 7.6. Simulaciones. Uso del observador en (7.104) para controlar un motor de CD.

438

7 La t´ecnica de las variables de estado

7.13.

Caso de estudio. El p´ endulo con rueda inercial

7.13.1.

Obtenci´ on de la forma en (7.75)

En el cap´ıtulo 14 se obtiene la aproximaci´on lineal de un mecanismo conocido como el p´endulo con rueda inercial. Este modelo se presenta en (14.32), (14.35), y a continuaci´on se reescribe para facilitar la referencia: z˙ = Az + Bw,  0 1 A =  d11 mg 0 d21 mg 0





0 0, 0

(7.106)



0 km B =  d12  R d22

Para simplificar la manipulaci´on algebraica se definen las siguientes constantes: a = d11 mg, km c = d12 , R

b = d21 mg km d = d22 R

La siguiente matriz tiene la forma: 

 0c 0 Co = B AB A2 B =  c 0 ac  d 0 bc £

¤

Despu´es de un desarrollo algebraico sencillo se obtiene: µ ¶3 km 2 mg(d11 d22 − d12 d21 ) 6= 0 det(Co ) = (d12 ) R

(7.107)

debido a que d11 d22 − d12 d21 6= 0 es una propiedad del mecanismo, tal como se explica en el cap´ıtulo 14. Por tanto, la ecuaci´on din´amica en (7.106) es controlable para cualquier conjunto de par´ametros del p´endulo con rueda inercial. Es decir, este resultado no cambia si el mecanismo con el que se cuenta es grande o peque˜ no o si es ligero o pesado. Esto significa que la matriz P introducida en (7.76) es no singular y a continuaci´on es construida utilizando la f´ormula presentada en (7.77). Para simplificar los c´alculos se utilizar´an los siguientes valores num´ericos: d11 = 0.0014636, d21 = 0.0000076,

d12 = 0.0000076, d22 = 0.0000076,

mg = 0.12597 donde: D

−1

·

d d = 11 12 d21 d22

¸

1 = d11 d22 − d12 d21

·

d22 −d12 −d21 d11

¸

7.13 Caso de estudio. El p´endulo con rueda inercial

439

que corresponden a los par´ametros del p´endulo con rueda inercial que es construido y controlado en el cap´ıtulo 14. Con estos valores se encuentra:     0 1.0000 0 0 0 0  , B =  −1.2758  A =  86.5179 −86.5179 0 0 245.6998 Con estos datos, y calculando num´ericamente, se encuentra que las ra´ıces del polinomio det(λI − A) son: λ1 = 0,

λ2 = 9.3015,

λ3 = −9.3015

Entonces se realiza el producto: (λ − λ1 )(λ − λ2 )(λ − λ3 ) = λ3 + a2 λ2 + a1 λ + a0 de donde se encuentra, al igualar coeficientes: a2 = 0,

a1 = −86.5179,

a0 = 0

(7.108)

Usando estos valores en (7.77) se encuentra:   0 −1.275 0 0 −1.275  P −1 =  5.467 × 10−5 −21147.049 0 245.6998

y, por tanto:



 0 −910.6662 −4.7287  0 0 P = 10−5 ×  −78379.7677 0 −78379.8067 −0.0002

(7.109)

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los siguientes productos:     0 0 1.0000 0 0 1.0000  , P B =  0  P AP −1 =  −0.0000 1 0 86.5179 0 N´otese que estas matrices tienen exactamente la forma presentada en (7.75) ¯ = P B. para A¯ = P AP −1 y B

7.13.2.

Control por realimentaci´ on del estado

Ahora se desea encontrar el vector de ganancias K que, al ser utilizado en el controlador (7.83) (con x = z y u = w), asigne en: ¯ 1 = −5.8535 + 17.7192j, λ

¯ 2 = −5.8535 − 17.7192j, λ

¯ 3 = −0.5268 λ

440

7 La t´ecnica de las variables de estado

a los eigenvalores de la matriz A − BK. Para esto, utilizando los valores anteriores se forma el siguiente polinomio: ¯ 1 )(λ − λ ¯ 2 )(λ − λ ¯ 3 ) = λ3 + a (λ − λ ¯ 2 λ2 + a ¯1 λ + a ¯0 de donde se encuentra, al igualar coeficientes: a ¯2 = 12.2338,

a ¯1 = 354.4008,

a ¯0 = 183.4494

¯ de acuerdo Con estos valores y los obtenidos en (7.108) se calcula el vector K a (7.86): £ ¤ ¯ = 183.44 440.91 12.23 K Finalmente, usando estos valores y la matriz P mostrada en (7.109) se calcula ¯ : el vector de ganancias K de acuerdo a K = KP £ ¤ K = −345.5910 −11.2594 −0.0086

el cual, a excepci´on de algunos errores de redondeo, es el vector de ganancias utilizado para controlar experimentalmente el p´endulo con rueda inercial en el cap´ıtulo 14.

7.14.

Resumen del cap´ıtulo

La t´ecnica de las variables de estado constituye la primera herramienta de lo que hoy se conoce como control moderno. La manera de trabajar los problemas en este enfoque es representando los modelos utilizando un conjunto de ecuaciones diferenciales de primer orden que deben ser resueltas simult´aneamente. Por tanto, el estudio se realiza de acuerdo a la respuesta en el tiempo y se abandona el uso de la transformada de Laplace. Esta u ´ltima caracter´ıstica es fundamental para permitir el estudio de sistemas no lineales, es decir, aquellos representados por ecuaciones diferenciales no lineales (v´ease el cap´ıtulo 14 para un ejemplo de tales aplicaciones). Recu´erdese que la transformada de Laplace no se puede utilizar cuando se tienen ecuaciones diferenciales no lineales. Aunque existe una equivalencia entre la representaci´on en variables de estado y la representaci´on en funci´on de transferencia, la primera es m´as general. Esto se ve reflejado en el hecho de que la funci´on de transferencia s´olo representa la parte de lo que en variables de estado es controlable y observable de manera simultanea. Es decir, hay partes de un sistema que no pueden ser descritas por la funci´on de transferencia. Sin embargo, el hecho de que un sistema sea controlable y observable simplifica mucho las tareas de an´alisis y dise˜ no de sistemas de control. De hecho, existen resultados muy poderosos para este caso como los presentados en las secciones 7.10 y 7.11.

7.16 Ejercicios propuestos

441

Una ventaja del enfoque de las variables de estado es que con ´el se pueden resolver problemas que ser´ıan m´as elaborados si se usara el enfoque de la funci´on de transferencia. Dos ejemplos de esta situaci´on son los prototipos controlados experimentalmente en los cap´ıtulos 13 y 14, donde se deben controlar dos variables simultaneamente: las posiciones del brazo y del p´endulo (en el cap´ıtulo 13) y la posici´on del p´endulo y la velocidad de la rueda inercial (en el cap´ıtulo 14). Estos problemas se complican usando el enfoque de la funci´on de transferencia donde s´olo se puede controlar una variable: la salida. Adem´as, otra ventaja del enfoque de las variables de estado es que con ´el se puede desarrollar una metodolog´ıa general para obtener aproximaciones lineales de sistemas no lineales (v´ease la secci´on 7.2 y los cap´ıtulos 11, 13 y 14)

7.15. 1. 2. 3. 4. 5. 6. 7.

8. 9. 10. 11. 12.

¿Qu´e significa el hecho de que una ecuaci´on din´amica sea controlable? ¿Qu´e significa que una ecuaci´on din´amica sea observable? ¿C´omo verifica si una ecuaci´on din´amica es controlable y observable? ¿Qu´e utilidad tiene el hecho de que una ecuaci´on din´amica sea controlable? ¿Qu´e utilidad tiene el hecho de que una ecuaci´on din´amica sea observable? ¿Qu´e diferencia existe entre la salida y el estado? Suponga una ecuaci´on din´amica que es controlable y observable ¿Qu´e relaci´on existe entre los polos de la funci´on de transferencia correspondiente y los eigenvalores de la matriz A? ¿Qu´e significa que el origen sea globalmente asint´oticamente estable? ¿Cu´ales son las condiciones para que el origen sea globalmente asint´oticamente estable? ¿Por qu´e es importante que el origen del estado de una ecuaci´on din´amica sin entrada sea globalmente asint´oticamente estable? ¿Qu´e significa control por realimentaci´on del estado? ¿Qu´e es un observador de estado y para que sirve?

7.16. 1. 2. 3. 4.

Preguntas de repaso

Ejercicios propuestos

Diga que entiende por estado y proponga un ejemplo de una planta o proceso f´ısico indicando cu´al es su estado. ¿C´omo sabe si un sistema es controlable u observable? Una vez que sabe esto ¿Cu´al es su utilidad? ¿Qu´e significa que el estado x = 0 sea globalmente asint´oticamente estable y c´omo se asegura esto? Verifique que las siguientes ecuaciones din´amicas son controlables:

442

7 La t´ecnica de las variables de estado



21 A = 5 9 02

  0 B = 0, 2

 3 7, 8

 0 1 0 A =  0 −20 50  , 0 −5 −250 



 01 0 0  0 0 −0.5 0   A= 0 0 0 1, 0 0 50 0

5.

6.

£ ¤ C= 472

 0 B =  0 , 100 



 0  1   B=  0 , −5

£ ¤ C= 100

£ ¤ C= 1010

Calcule la matriz P definida en (7.77). ¯ = P B, C¯ = CP −1 Calcule las matrices y vectores A¯ = P AP −1 , B definidos en (7.78). Compruebe que estas matrices y vectores tienen las formas definidas en (7.75). Con estos resultados diga cual es la funci´on de transferencia de la ecuaci´on din´amica dada. Utilice software especializado para calcular la funci´on de transferencia de la ecuaci´on din´amica dada. Verifique que este resultado y el del inciso anterior sean iguales. Use software especializado para simular la respuesta de la ecuaci´on din´amica dada y de la funci´on de transferencia encontrada ante una entrada escal´on unitario. Grafique la salida en ambas simulaciones y comp´arelas. ¿Que concluye? Haga un programa de computadora que ejecute el procedimiento listado al final de este cap´ıtulo para calcular el vector de ganancias K que asigne los eigenvalores que se deseen a la matriz de lazo cerrado A − BK. Utilice este programa para calcular las ganancias de los controladores por realimentaci´on de estado de los cap´ıtulos 13 y 14. La siguiente expresi´on constituye un filtro donde y(t) es una aproximaci´on de la derivada respecto al tiempo de u(t). Y (s) =

as U (s), s+a

a>0

De hecho, y(t) es conocida como la derivada “sucia” de u(t) y es muy utilizada para estimar la velocidad y(t) en sistemas mec´anicos a partir de la posici´on u(t). Con el fin de construir en la pr´actica este filtro se procede obtener una ecuaci´on din´amica que lo represente. Encuentre dicha ecuaci´on din´amica. Recuerde que u(t) debe ser la entrada. ¿Puede usar los conceptos de respuesta en frecuencia para elegir el valor de a?

7.16 Ejercicios propuestos

7.

443

Considere el sistema ball and beam estudiado en el ejemplo 7.2 del presente cap´ıtulo, junto con los siguientes valores num´ericos: k = 16.6035,

a = 3.3132,

ρ=5

Obtenga la ecuaci´on din´amica correspondiente cuando el estado se ˙ T y la salida es γ = x − xd , donde xd define como z˜ = [x − xd , x, ˙ θ, θ] es una constante que representa el valor deseado de la posici´on x. Dise˜ ne un controlador por realimentaci´on de estado que permita estabilizar el sistema en x = xd , x˙ = θ = θ˙ = 0. Seleccione los eigenvalores deseados del siguiente modo. Proponga dos parejas de tiempo de subida y sobre paso deseados. Usando las expresiones presentadas en (3.59) en el cap´ıtulo 3, determine dos parejas de eigenvalores complejos conjugados de manera que se obtengan las dos parejas de tiempo de subida y sobre paso deseados. Dise˜ ne un observador de estado que permita estimar todo el estado del sistema. Recuerde que los eigenvalores de la matriz A − LC deben ser varias veces m´as r´apidos que los eigenvalores de la matriz A − BK. Construya un sistema en lazo cerrado que use el observador arriba dise˜ nado y un controlador que realimente el estado estimado para estabilizar el sistema en x = xd , x˙ = θ = θ˙ = 0. Mediante simulaciones verifique si se han obtenido las caracter´ısticas de respuesta transitoria deseadas.

Referencias

1. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New York, 1984. 2. C.R. Wylie, Matem´ aticas superiores para ingenier´ıa, 2a. edici´ on en espa˜ nol, McGraw-Hill, M´exico, 1994. 3. W.L. Brogan, Modern control theory, 3rd. edition, Prentice Hall, Upper Saddle River, 1991. 4. E. Kreyszig, Matem´ aticas avanzadas para ingenier´ıa, Vol. 1, Limusa, M´exico, 1980. 5. M. R. Spiegel, Manual de f´ ormulas y tablas matem´ aticas., McGraw-Hill, Serie Schaum, M´exico, 2002. 6. C.-T. Chen, Linear system theory and design, Oxford University Press, New York, 1999. 7. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 8. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 9. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edici´ on, Pearson Prentice-Hall, Madrid, 2008.

8 Circuitos electr´ onicos realimentados

n

R

R2

L

Q

ýCC

C1

Rt CBP

C3

R1 RE

C2

La primera aplicaci´on importante de la realimentaci´on, desde el punto de vista tecnol´ogico, fue el regulador de velocidad para la m´aquina de vapor desarrollado por Watt. Sin embargo, las t´ecnicas de control cl´asico surgieron como una soluci´on para los problemas que se presentaban en los circuitos electr´onicos de las compa˜ n´ıas telef´onicas. Se descubri´o que si se realimentaba una peque˜ na cantidad de la se˜ nal a la salida de un amplificador electr´onico entonces se pod´ıa disminuir la distorsi´on que produc´ıa dicho amplificador. Las t´ecnicas de control cl´asico tambi´en demostraron ser fundamentales para dise˜ nar circuitos que, realimentados, son capaces de producir se˜ nales con forma de onda sinusoidal como el oscilador Colpitts mostrado en la figura.

448

8 Circuitos electr´ onicos realimentados

Objetivos del cap´ıtulo Usar la realimentaci´ on para reducir la distorsi´ on producida por circuitos electr´ onicos no lineales. Construir controladores anal´ ogicos usando circuitos electr´ onicos realimentados. Dise˜ nar y construir osciladores de audiofrecuencia y de radiofrecuencia con forma de onda sinusoidal. En este cap´ıtulo se presentan algunas aplicaciones de los sistemas realimentados al dise˜ no de circuitos electr´onicos. Algunas de estas aplicaciones ser´an utilizadas en el dise˜ no de otros sistemas de control que se presentan en los cap´ıtulos subsecuentes. Por otro lado, algunas de estas aplicaciones, como los circuitos osciladores, son en s´ı mismas sistemas de control completos que requieren el empleo de los conceptos de teor´ıa de control vistos en la cap´ıtulos precedentes.

8.1.

Circuitos electr´ onicos para reducir no linealidades C ( s)

R ( s) +

A

à

ì Figura 8.1. Sistema en lazo cerrado.

Considere el sistema en lazo cerrado mostrado en la figura 8.1. La correspondiente funci´on de transferencia es: R(s) A = C(s) 1 + βA donde A y β son constantes positivas. Suponga que βA ≫ 1, entonces se puede escribir: A 1 R(s) = ≈ C(s) 1 + βA β

(8.1)

Las aplicaciones de este hecho son importantes en circuitos electr´onicos realimentados como se explica a continuaci´on.

8.1 Circuitos electr´ onicos para reducir no linealidades

449

Suponga que A es la ganancia de un amplificador de potencia. Tal como su nombre lo indica, este tipo de amplificadores normalmente est´an construidos de manera que tengan la capacidad para manejar altas potencias. Esto significa que sus componentes deber´an soportar, entre otras cosas, grandes variaciones de temperatura. Por esta raz´on, es com´ un que estos componentes no sean de gran precisi´on y es de esperarse que el valor de sus par´ametros cambien en un amplio rango. Por tanto, suponer que el valor de A est´a sujeto a cambios es algo que seguramente ocurre en la realidad. De acuerdo a (8.1) el uso de realimentaci´on alrededor de un amplificador de ganancia A tiene la ventaja de conseguir que la ganancia del circuito realimentado s´olo tenga variaciones muy peque˜ nas a pesar de que A presente grandes variaciones. Por tanto, la realimentaci´on puede resolver el problema de un amplificador de potencia cuya ganancia varia fuertemente. Un aspecto importante es que la ganancia β no tenga variaciones y esto se consigue si tal ganancia es fijada por componentes que s´olo manejan peque˜ nas cantidades de potencia y, por tanto, que puedan ser seleccionados como dispositivos de precisi´on. A continuaci´on se presentan algunas aplicaciones donde se usa la realimentaci´on para reducir las variaciones de las ganancias de algunos circuitos electr´onicos, lo cual tambi´en puede entenderse como la reducci´on del comportamiento no lineal de dichas ganancias. 8.1.1.

Reducci´ on de la distorsi´ on en amplificadores

Vi +

Preamplificador

u

Amplificador no lineal

Vo

à

ì

Figura 8.2. Uso de realimentaci´ on en un amplificador no lineal para reducir la distorsi´ on.

Considere el diagrama mostrado en la figura 8.2. El amplificador no lineal es un amplificador que tiene una ganancia A1 = 2 cuando el voltaje de entrada u es negativo y una ganancia A2 = 0.5 cuando el voltaje de entrada u es positivo. Esta caracter´ıstica puede representarse como se muestra en la figura 8.3. Por tanto, dicho amplificador entrega a su salida una versi´on distorsionada de lo que se aplica a su entrada. En la figura 8.4 se muestra la se˜ nal a la salida del amplificador no lineal cuando se aplica a su entrada una se˜ nal sinusoidal. Este es un buen ejemplo de lo que se quiere decir cuando se habla de distorsi´on.

450

8 Circuitos electr´ onicos realimentados Vo

0:5

u 2

Figura 8.3. Caracter´ıstica del amplificador no lineal en la figura 8.2.

Combinando el efecto de todos los amplificadores en el trayecto directo se concluye que el diagrama de bloques de la figura 8.2 se puede representar por un diagrama de bloques como el de la figura 8.1 donde: A = A1 A0 , A = A2 A0 , β = 1,

u < 0, u > 0,

por ejemplo

A0 es la ganancia del preamplificador y tiene un valor muy grande. N´otese que se obtiene la siguiente funci´on de transferencia de lazo cerrado: A 1 R(s) = ≈ =1 C(s) 1 + βA β si las ganancias A0 y β son tales que βA ≫ 1 para ambos valores A1 , A2 . De esta manera el circuito en lazo cerrado de la figura 8.2 funciona como un amplificador de ganancia constante β para ambos signos de la se˜ nal que se desea amplificar. Esto significa que se ha eliminado la distorsi´on debida al amplificador no lineal de ganancias A1 y A2 . Esto representa la principal ventaja de usar la realimentaci´on mostrada en la figura 8.2 a pesar de que se haya tenido que cambiar la ganancia total del amplificador que ahora es 1/β = 1. En la figura 8.5 se muestra la forma de onda obtenida Vo a la salida del del sistema realimentado de la figura 8.2 cuando Vi es una se˜ nal sinusoidal. Observe como es que Vo tiene amplitudes iguales en ambos semiciclos cuando un amplificador no lineal (de ganancia A) se encuentra inmerso en el sistema realimentado. A esto se le llama eliminaci´on o reducci´on de la distorsi´on.

8.1 Circuitos electr´ onicos para reducir no linealidades

451

t

u Vo Figura 8.4. Voltajes a la entrada u y a la salida Vo del amplificador no lineal de la figura 8.3.

V i; V o

t

Figura 8.5. Voltajes de entrada Vi y de salida Vo en la figura 8.2.

8.1.2.

Reducci´ on de la zona muerta en amplificadores.

En la figura 8.6 se muestra un amplificador de potencia en base a dos transistores conectados en simetr´ıa complementaria. Este circuito tiene una zona muerta entre −0.6[V] y +0.6 [V] debido al voltaje de polarizaci´on requerido en las uniones base-emisor de los transistores. Esto significa que la se˜ nal de salida Vo se mantiene en cero mientras la se˜ nal de entrada u se mantenga en el rango [−0.6, +0.6][V]. En la figura 8.7 se muestra la caracter´ıstica que representa a este amplificador no lineal. En la figura 8.8 se muestra la se˜ nal obtenida a la salida del amplificador Vo cuando se aplica una se˜ nal sinusoidal a la entrada u. N´otese el efecto que la zona muerta tiene para valores de u cercanos a cero. El circuito de la figura 8.9 se utiliza para reducir el efecto de dicha zona muerta. El objetivo es conseguir que la forma de onda obtenida a la salida Vo sea id´entica, o muy parecida, a la forma de onda de la se˜ nal aplicada Vi , tal como se muestra en la figura 8.10 y, de este modo, reducir fuertemente

452

8 Circuitos electr´ onicos realimentados

+ V cc

u

Vo

à V cc Figura 8.6. Transistores conectados en simetr´ıa complementaria. Ejemplo de un amplificador de potencia no lineal.

Vo

1

à 0:6 1

+ 0:6

u

Figura 8.7. Caracter´ıstica del amplificador no lineal de la figura 8.6.

o eliminar el efecto de la zona muerta gracias al uso de realimentaci´on. A continuaci´on se explica como es que se consigue esto. El circuito de la figura 8.9 se puede representar por el diagrama de bloques de la figura 8.1. Este sistema realimentado tiene un funci´on de transferencia en lazo cerrado dada como: A R(s) = , R(s) = Vo (s), C(s) 1 + βA R1 β= ≤1 R1 + R2

C(s) = Vi (s)

8.1 Circuitos electr´ onicos para reducir no linealidades

453

u Vo t

Figura 8.8. Voltajes a la entrada u y a la salida Vo del amplificador de la figura 8.6.

+ V cc Vi +

Vo

u

à

à V cc R1

R2

Figura 8.9. Circuito realimentado para reducir el efecto de la no linealidad presente en el amplificador de la figura 8.6.

donde A = αA0 , con A0 la ganancia de lazo abierto del amplificador operacional utilizado para realizar el punto de suma y α la ganancia de la caracter´ıstica mostrada en la figura 8.7 (zona muerta). Es bien sabido que A0 tiene un valor muy grande, del orden de 100 000, mientas que α tiene un valor que, aunque variable, es del orden de la unidad. Por tanto, βA = αA0 β ≫ 1 y se puede aproximar, con poco margen de error a: A 1 Vo (s) = ≈ Vi (s) 1 + βA β

(8.2)

454

8 Circuitos electr´ onicos realimentados

V i; V o

t

Figura 8.10. Voltajes a la entrada Vi y a la salida Vo del circuito de la figura 8.9.

La expresi´on (8.2) indica que el circuito completo se comporta como un amplificador de ganancia constante 1/β que elimina o reduce fuertemente el efecto de la zona muerta de modo que la forma de onda de Vo is igual a la de Vi . N´otese que R1 y R2 se pueden seleccionar de valor grande para asegurar que manejen poca corriente (poca potencia) por lo que pueden usarse resistencias de precisi´on. Tambi´en es importante aclarar lo siguiente. De acuerdo a la figura 8.7 el valor de α es cero para valores de u en el rango [−0.6, +0.6][V]. Esto sugiere que la condici´on βA = αA0 β ≫ 1 no se cumple. Sin embargo, debe entenderse que la caracter´ıstica mostrada en la figura 8.7 es una idealizaci´on de lo que realmente sucede en la pr´actica y que en la realidad Vo s´olo es cero cuando u tambi´en es cero. En la figura 8.11 se muestran los voltajes u y Vo correspondientes a la figura 8.6 obtenidos durante un experimento. Se utilizan los transistores tipo Darlington TIP 141 (NPN) y TIP 145 (PNP). Esto significa que el voltaje de uni´on base-emisor tiene un voltaje nominal de polarizaci´on directa de alrededor de 1.2[V] y, por tanto, la zona muerta en este caso est´a en el intervalo [-1.2,+1.2][V] del voltaje de entrada u. El voltaje u es una se˜ nal sinusoidal de 2.083[KHz] de 1[V] de pico. Esto sit´ ua al voltaje de la uni´on base-emisor claramente por debajo de su valor de polarizaci´on directa. Es importante mencionar que se conecta una resistencia de carga de 1[KOhm] entre los emisores y tierra. N´otese que el voltaje Vo tiene una forma de onda muy distinta a una sinusoide (compare con el trazo punteado en la figura 8.8), por lo que se confirma experimentalmente que la conexi´on en simetr´ıa complementaria de dos transistores distorsiona fuertemente la se˜ nal. En la figura 8.12 se muestran las formas de onda de las se˜ nales Vi y Vo correspondientes a la figura 8.9. Estas mediciones se obtuvieron en un experimento donde se utilizan los transistores tipo Darlington TIP 141 (NPN) y TIP 145 (PNP) y el voltaje Vi es una se˜ nal sinusoidal de 2.083[KHz] de 1[V] de pico, es decir, como en el experimento de la figura 8.11. Tambi´en se utilizan los valores de resistencia R1 = R2 = 10[KOhm] y una resistencia de carga de 1[KOhm] entre los emisores y tierra. El amplificador operacional utilizado es el TL081. N´otese que la forma de onda de Vo es como la de Vi , es decir, ambas son sinusoides de la misma frecuencia, aunque la amplitud de Vo es el doble

8.1 Circuitos electr´ onicos para reducir no linealidades

455

que la de Vi . Esto se debe a que, de acuerdo (8.2) se tiene que: Vo (s) 1 = = 2, Vi (s) β

β=

R1 = 0.5 R1 + R2

Figura 8.11. Resultados experimentales. Voltajes a la entrada y a la salida del circuito de la figura 8.6. Trazo superior: Vo , trazo inferior: u.

Figura 8.12. Resultados experimentales. Voltajes a la entrada y a la salida del circuito de la figura 8.9. Trazo superior: Vo , trazo inferior: Vi .

456

8 Circuitos electr´ onicos realimentados

Para el estudio de otras aplicaciones de la realimentaci´on en circuitos electr´onicos se recomienda consultar [1].

8.2.

Construcci´ on anal´ ogica de controladores

Z2 (s) Z1 (s)

V 1 (s)

E i (s)

E o (s)

Figura 8.13. Construcci´ on de un controlador anal´ ogico usando un amplificador operacional.

Considere el circuito de la figura 8.13 donde Z1 (s) y Z2 (s) representan las impedancias de dos redes pasivas colocadas en esos lugares. En el amplificador operacional se cumple: Eo (s) = (0 − V1 (s))A0 = −V1 (s)A0

(8.3)

donde A0 es la ganancia de lazo abierto del amplificador operacional la cual es muy grande (del orden de 100 000 [2], p´ag. 500). Para calcular el valor de V1 se usan los circuitos auxiliares mostrados en las figuras 8.14(a) y 8.14(b). De aqu´ı se encuentra que: Z1 (s) (Eo (s) − Ei (s)) + Ei (s) Z1 (s) + Z2 (s) ¶ µ Z1 (s) Z1 (s) = Eo (s) + Ei (s) 1 − Z1 (s) + Z2 (s) Z1 (s) + Z2 (s)

V1 (s) =

Usando (8.3) se encuentra: · ¶¸ µ Z1 (s) Z1 (s) A0 Eo (s) = − Eo (s) + Ei (s) 1 − Z1 (s) + Z2 (s) Z1 (s) + Z2 (s) de donde se obtiene: Eo (s) = Ei (s)

³ −A0 1 −

Z1 (s) Z1 (s)+Z2 (s)

Z1 (s) 1 + A0 Z1 (s)+Z 2 (s)

´

8.2 Construcci´ on anal´ ogica de controladores

457

Z2 (s) V Z1 (s)

Z1 (s) V 1 (s)

E o (s) E i (s)

(a)

Z2 (s)

V Z1 (s)

E o (s) à E i (s)

Z1 (s)

(b) Figura 8.14. Circuitos equivalentes del circuito mostrado en la figura 8.13

Reduciendo t´erminos: −A0

³

Z2 (s) Z1 (s)+Z2 (s)

´

Eo (s) = Z1 (s) Ei (s) 1 + A0 Z1 (s)+Z 2 (s)

Z1 (s) Se puede considerar que A0 Z1 (s)+Z ≫ 1, debido a que A0 es muy grande, 2 (s) y por tanto:

Eo (s) Z2 (s) =− Ei (s) Z1 (s)

(8.4)

Z1 (s) ≫1 N´otese, sin embargo, que el cumplimiento de la condici´on A0 Z1 (s)+Z 2 (s) depende del valor de A0 . Es importante mencionar que en los amplificadores operacionales que se usan en la pr´actica, la ganancia A0 no es constante sino que varia con la frecuencia de las se˜ nales que est´a procesando el amplificador operacional. Es com´ un que A0 disminuya al aumentar dicha frecuencia del mismo modo en que var´ıa la caracter´ıstica de magnitud de un filtro pasa Z1 (s) bajas [2], p´ag. 500. Como consecuencia, la condici´on A0 Z1 (s)+Z ≫ 1 y 2 (s) (8.4) dejan de ser ciertas a altas frecuencias. Por otro lado, la manera en que var´ıa A0 con la frecuencia depende del amplificador operacional utilizado. Esto significa que se debe tener cuidado de seleccionar el amplificador operacional

458

8 Circuitos electr´ onicos realimentados

correcto de acuerdo al tipo de aplicaci´on en cuesti´on, es decir, de acuerdo a la rapidez de respuesta de la planta o sistema a controlar. En la tabla 8.1 se muestran algunos ejemplos de redes usadas para formar Z1 (s) y Z2 (s), as´ı como el controlador anal´ogico que puede ser construido al utilizarlas. Se deja como ejercicio que el lector calcule los valores de Z1 (s) y Z2 (s) para cada una de las redes el´ectricas mostradas y que verifique, usando (8.4), que se obtiene la funci´on de transferencia del controlador mostrado en la columna del extremo derecho de la figura. Enti´endase con esto la manera de construir pr´acticamente y de manera anal´ogica una gran parte de los controladores que se utilizan en control cl´asico. V´ease [3] para una tabla m´as completa que incluye controladores adicionales. Se aclara que, sin embargo, estos mismos controladores pueden ser construidos usando una computadora digital o un microcontrolador si no se desea utilizar electr´onica anal´ogica. Tabla 8.1. Construcci´ on anal´ ogica de controladores. Controlador PI

Z1 (s) R1

Z2 (s) R2 , C en serie

2 (s) −Z Z1 (s) 2 −R R1

³

s+ R 1C 2

s

´

³

´ R1 , C R2 −R2 C s + R11C en paralelo ¸ ·³ ´ 1 R1 , C1 R2 , C2 R1 C2 C1 2 + R C s + + PID − R 2 1 R1 C2 s en paralelo en serie ´ ³ 1 s+ R1 , C1 R2 , C2 R C 1 1´ 1 ³ Red de adelanto −C , R1 C1 > R2 C2 C2 s+ 1 en paralelo en paralelo R2 C2 PD

8.3.

Dise˜ no de osciladores con forma de onda sinusoidal

El prop´osito de esta secci´on es mostrar como se puede usar la teor´ıa de control para dise˜ nar circuitos electr´onicos realimentados que generen se˜ nales con forma de onda sinusoidal. Se presenta un dise˜ no basado en un amplificador operacional y un dise˜ no basado en un transistor. El circuito que se propone usando amplificadores operacionales simplifica enormemente el an´alisis y el dise˜ no, adem´as es muy u ´til para trabajar a frecuencias bajas ya que evita el uso de inductancias. Es importante subrayar que el valor de las inductancias que se necesitan para generar oscilaciones de baja frecuencia es tan grande que el tama˜ no geom´etrico de la inductancia se convierte en un problema. La principal desventaja de este dise˜ no es que no es u ´til para trabajar en altas frecuencias (en la banda de radiofrecuencia) debido a las limitaciones de operaci´on de los amplificadores operacionales. Por otro lado, el uso de transistores tiene la caracter´ıstica de que la impedancia del circuito de entrada se ve reflejada en el circuito de salida. Esto hace

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

459

un poco m´as elaborado el an´alisis y dise˜ no simplemente porque la obtenci´on de las funciones de transferencia involucradas ahora require de m´as desarrollos algebraicos. Sin embargo, la principal ventaja de usar transistores es que se puede construir osciladores que trabajan a altas frecuencias, es decir, en la banda de radiofrecuencia. Tambi´en resulta interesante el uso de transistores por la siguiente situaci´on. Tal como se muestra en lo que resta de esta secci´on, cuando se usan amplificadores operacionales el circuito resultante es completamente lineal y se debe introducir, de manera artificial, un elemento no lineal para conseguir la construcci´on pr´actica del oscilador. Por el contrario, dado que el transistor es un dispositivo no lineal es precisamente ´esta caracter´ıstica la que permite, de manera natural, el correcto funcionamiento del oscilador. 8.3.1. Wien

Dise˜ no basado en un amplificador operacional. Puente de

Considere el circuito mostrado en la figura 8.15. En el ejemplo 2.16 del cap´ıtulo 2, se encontr´o que la relaci´on entre los voltajes Eo (s) y Ei (s) est´a dada en (2.143), expresi´on que se reescribe a continuaci´on para facilitar la referencia:

I(s)

R

C +

+

E i (s)

C

E o (s)

R

à

à Figura 8.15. Circuito RC serie-paralelo.

Eo (s) Ts = GT (s) = 2 2 , Ei (s) T s + 3T s + 1

T = RC

(8.5)

Ahora considere el circuito de la figura 8.16 donde se introduce un amplificador no inversor a base de un amplificador operacional. Siguiendo el procedimiento presentado en la secci´on 8.2 se encuentra que la ganancia del circuito de la figura 8.17 es constante e igual a: A=

Vo R1 + Rf = R1 Vi

N´otese que que a partir de este circuito se puede obtener el diagrama de bloques mostrado en la figura 8.18(a) de donde se obtiene el diagrama de bloques

460

8 Circuitos electr´ onicos realimentados

C

R

Vo

R

Vi

C

Rf R1

Figura 8.16. Circuito oscilador en base a un amplificador operacional.

Vi

Vo Rf R1

Figura 8.17. Amplificador no inversor.

de la figura 8.18(b). Es importante observar que de acuerdo a estos diagramas de bloques el circuito de la figura 8.16 es un circuito con realimentaci´on positiva. Dado que toda la teor´ıa desarrollada en sistemas de control esta hecha pensando en que se dise˜ nar´an sistemas de control con realimentaci´on negativa como el mostrado en la figura 8.18(d) es necesario transformar el diagrama de ´ bloques de la figura 8.18(b) en una forma m´as conveniente. Esto se consigue en la figura 8.18(c) donde se introduce un signo negativo en la realimentaci´on que se ve compensado con un cambio de signo en la funci´on de transferencia de trayecto directo. Esto significa que ahora se cuenta con un sistema con realimentaci´on negativa que es equivalente al de la figura 8.18(b) y al de la figura 8.18(d). Por tanto, la funci´on de transferencia de lazo abierto est´a dada

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

461

como: G(s)H(s) = −GT (s)A

0

E i ( s)

+ +

(8.6)

E o ( s)

Circuito RC serie à paralelo

Amplificador no inversor

Vo

Vi

(a) 0

E i ( s)

+

E o ( s)

G T (s)

+

R f +R 1 R1

Vo

Vi

(b) 0

+

à E i ( s)

àG T (s)

E o ( s)

à R f +R 1 R1

Vo

Vi

(c) R (s)

+

G (s)

C(s)

à H (s)

(d) Figura 8.18. Diagramas de bloques equivalentes del circuito en la figura 8.16.

462

8 Circuitos electr´ onicos realimentados

An´ alisis basado en la respuesta en el tiempo Este m´etodo se refiere al estudio del circuito a trav´es de localizar la ubicaci´on de sus polos. A partir del estudio sobre ecuaciones diferenciales en el cap´ıtulo 3 se sabe que para tener oscilaciones sostenidas los polos de lazo cerrado deben ser imaginarios puros, es decir, con parte real cero y parte imaginaria diferente de cero. Bajo esta situaci´on, la frecuencia de oscilaci´on, en radianes/segundo, es igual a la parte imaginaria de dichos polos. Se sabe que los polos de lazo cerrado satisfacen: 1 + G(s)H(s) = 0 Sustituyendo las ecuaciones (8.6) y (8.5) se obtiene: 1 + G(s)H(s) = 1 − GT (s)A = 1 − =

T 2 s2

T As + 3T s + 1

T 2 s2 + 3T s + 1 − T As =0 T 2 s2 + 3T s + 1

y, por tanto, los polos de lazo cerrado satisfacen: T 2 s2 + (3 − A)T s + 1 = 0 Los polos de lazo cerrado son las ra´ıces del polinomio del lado izquierdo, es decir: p −(3 − A)T + (3 − A)2 T 2 − 4T 2 s1 = 2 p2T −(3 − A)T − (3 − A)2 T 2 − 4T 2 s2 = 2T 2 N´otese lo siguiente: Ambos polos tienen parte imaginaria diferente de cero y, por tanto, el circuito presentar´a oscilaciones si: (3 − A)2 T 2 − 4T 2 < 0 es decir, si 5 > A > 1. Si A > 3, entonces ambos polos tienen parte real positiva, es decir, el circuito es inestable lo cual es altamente indeseable. Si A < 3, entonces ambos polos tienen parte real negativa, es decir, el circuito es estable. Esto, sin embargo, tampoco es deseable porque la respuesta del circuito ser´a tal que poco a poco dejar´a de oscilar. Si A = 3, entonces los dos polos tienen parte real cero y, por tanto, son imaginarios puros, tal como se desea. Estos polos est´an ubicados en s1,2 = 1 ±j T1 . Por tanto, la frecuencia de oscilaci´on es ω = T1 = RC .

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

463

An´ alisis basado en la respuesta en la frecuencia Introd´ uzcase el cambio de variable s = jω en (8.5): GT (jω) =

jT ω T 2 (jω)2 + 3jT ω + 1

Evaluando en la frecuencia ω = 1/T = 1/(RC) se obtiene: GT (j/T ) =

1 3

Para obtener la gr´afica de Bode de GT (s) se reescribe: GT (s) = T s

s2 +

1 T2 3 Ts

+

(8.7)

1 T2

La gr´afica de Bode de GT (s) se muestra en la figura 8.19. La magnitud de GT (jω) es m´axima (e igual a 13 ) en la frecuencia ω = 1/T = 1/(RC), justo cuando la fase de GT (jω) es cero.

dB 0

1 T

1 iv)

i)

fase + 90 [grados] 0 à 90 à 180

ii) !

iii) 1 T

iv) iii)

ii) !

Figura 8.19. Gr´ aficas de Bode de GT (s) en (8.7). i) T , ii) s, iii) GT (s).

1 T2

3 s+ 1 s2 + T 2

, iv)

T

La gr´afica polar de G(s)H(s) dada en (8.6) se muestra en la figura 8.20. El uso de la gr´afica de Bode de GT (s) mostrada en la figura 8.19 permite concluir que la gr´afica polar de G(s)H(s), mostrada en en la figura 8.20, consiste en una trayectoria cerrada que es recorrida dos veces en sentido horario. Obs´ervese que el signo negativo en (8.6) cambia la fase en 180◦ de cada uno de los puntos de la gr´afica de Bode de GT (s). N´otese tambi´en que la gr´afica polar de la figura R +R 8.20 cruza el eje real negativo en el punto − 13R1 f a la frecuencia ω = 1/T =

464

8 Circuitos electr´ onicos realimentados Im (G(j!)H(j!))

ï (à 1; j0)

à A3

ï! = æ 1

T

! =+1

!=0 ! = à 1 Re (G(j!)H(j!))

Figura 8.20. Gr´ afica polar de G(s)H(s) en (8.6).

1/(RC). Por otro lado, como la gr´afica polar incluye frecuencias positivas y negativas y es sim´etrica respecto al eje real para frecuencias negativas y R +R positivas entonces el eje real negativo tambi´en es cruzado en el punto − 13R1 f a la frecuencia ω = −1/T = −1/(RC). N´otese tambi´en que el n´ umero de polos inestables de lazo abierto que tiene la funci´on dada en (8.6) es cero, es decir P = 0, ya que todos los coeficientes del polinomio del denominador de GT (s) son positivos (v´ease la secci´on 4.2.1). Finalmente, antes de aplicar el criterio de Nyquist se debe observar lo siguiente. Como G(s)H(s) tiene un cero en s = 0, es decir sobre el eje imaginario, se debe hacer un rodeo como el mostrado en la figura 6.44 s´olo que en este caso es un cero (en lugar de un polo) el que se debe rodear. Sin embargo, sobre todo ese rodeo s = ε∠φ donde ε → 0 y, por tanto, G(s)H(s) → 0 tambi´en sobre todo ese rodeo. Es decir, G(s)H(s) representa un s´olo punto en el origen para todo ese rodeo. Por tanto, al aplicar el criterio de Nyquist se tienen tres casos: 1.

2.

3.

R +R

umero de vueltas alrededor del punto (−1, j0) Si 13R1 f > 1, entonces el n´ es N = 2, por lo que el n´ umero de polos inestables de lazo cerrado es Z = N + P = 2. Esto significa inestabilidad del circuito lo cual es altamente indeseable. R +R Si 13R1 f < 1, entonces el n´ umero de vueltas alrededor del punto (−1, j0) es N = 0, por lo que el n´ umero de polos inestables de lazo cerrado es Z = N + P = 0. Aunque esto significa que el circuito es estable, sin embargo tampoco es deseable porque la respuesta del circuito ser´a tal que poco a poco dejar´a de oscilar. R +R Si 13R1 f = 1, entonces el circuito es marginalmente estable, es decir se tienen polos de lazo cerrado que est´an sobre el eje imaginario. Esto tambi´en puede entenderse del siguiente modo. De acuerdo a la discusi´on previa,

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

465

la gr´afica polar de la figura 8.20 cruza el eje real negativo en el punto (−1, j0) a las frecuencias ω = 1/T = 1/(RC) y ω = −1/T = −1/(RC). ´ Esto significa que G(jω)H(jω)|ω=1/T = −1 y G(jω)H(jω)|ω=−1/T = −1, es decir, 1 + G(s)H(s)|s=j/T = 0 y 1 + G(s)H(s)|s=−j/T = 0. Dado que 1 + G(s)H(s) = 0 es la condici´on que deben satisfacer los valores de s que son polos de lazo cerrado, se concluye que hay dos polos de lazo cerrado que son imaginarios puros conjugados colocados en s = j/T y s = −j/T . Por tanto, el circuito oscilar´a permanentemente con frecuencia ω = 1/T . Un circuito oscilador pr´ actico A partir de la discusi´on previa se concluye que la ganancia del amplificador basado en amplificadores operacionales se debe seleccionar como: A=

R1 + Rf =3 R1

Sin embargo, el circuito de la figura 8.16 no podr´a oscilar de manera satisfactoria. La raz´on de esto es que es no se pueden obtener resistencias reales R +R Rf y R1 cuyos valores satisfagan exactamente 1R1 f = 3, adem´as la m´as peque˜ na variaci´on en sus valores har´a inestable al circuito o har´a que deje de oscilar. Esta es una muestra de un hecho bien conocido: un circuito oscilador lineal no oscila satisfactoriamente en la pr´actica por lo que todos los circuitos osciladores que se construyen son no lineales.

4:7kÒ

33nF

+ à 10kÒ

25:6kÒ 4:7kÒ

Zeners 3:6V

eo

33nF 10kÒ

Figura 8.21. Circuito oscilador pr´ actico.

La manera de construir un oscilador pr´actico usando los conceptos te´oricos presentados previamente es utilizando el circuito de la figura 8.21, al cual

466

8 Circuitos electr´ onicos realimentados

se le incluye una no linealidad mediante la introducci´on de dos diodos zener. Suponga que A > 3 por lo que el circuito es inestable y empieza a oscilar con una amplitud que crece con cada oscilaci´on. La funci´on de los diodos zener es poner en corto a la resistencia de 10[KOhm] cuando alcancen su voltaje de avalancha. De esta manera se reducir´a la ganancia A del amplificador cuando la amplitud del voltaje de salida supere un umbral determinado. Esto har´a que que A < 3 por lo que la amplitud de la oscilaci´on tender´a a disminuir lo cual, a su vez, reduce el voltaje en los diodos zener que dejar´an de conducir por lo que desaparecer´a el corto alrededor de la resistencia de 10[KOhm] y se obten-

Figura 8.22. Forma de onda del voltaje a la salida del amplificador operacional de la figura 8.21. El potenci´ ometro est´ a ajustado a 20[KOhm].

Figura 8.23. Forma de onda del voltaje a la salida del amplificador operacional de la figura 8.21. El potenci´ ometro est´ a ajustado a 25.6[KOhm].

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

467

dr´a A > 3 de nuevo. Finalmente, este proceso producir´a un estado estacionario en el que habr´a una oscilaci´on sinusoidal de amplitud constante. N´otese que, usando los valores de las resistencias en la figura 8.21, A = 45/10 = 4.5 si no conducen los diodos zener y A = 35/10 = 3.5 si conducen los diodos zener. As´ı que se debe ajustar el valor del potenci´ometro de 25.6[KOhm] para obtener un valor de A ligeramente mayor que 3 y conseguir la oscilaci´on sostenida. N´otese que la frecuencia de oscilaci´on esperada es: 1 1 1 = = = 6447[rad/s], T RC (4.7 × 103 )(0.033 × 10−6 ) 6447 ω = = 1.026[KHz] f = 2π 2π

ω=

En las figuras 8.22 y 8.23 se muestran los resultados experimentales obtenidos con el circuito de la figura 8.21. El amplificador operacional utilizado es el UA741. La frecuencia obtenida experimentalmente es 1[KHz]. La amplitud de oscilaci´on puede ser modificada si se incrementa el valor de la resistencia del potenci´ometro de 25.6[KOhm], lo cual incrementa la ganancia de del amplificar operacional realimentado A. Sin embargo, si esta ganancia es muy grande la forma de onda sinusoidal se distorsiona. Esto es lo que ocurre en la figura 8.23 donde se usa el potenci´ometro 25.6[KOhm] ajustado a su m´aximo valor de resistencia. Por el contrario, en la figura 8.22 el potenci´ometro de 25.6[KOhm] se usa ajustado a un valor de aproximadamente 20[KOhm]. Este comportamiento significa que la conducci´on en la zona de avalancha de los diodos zener es progresiva, y no abrupta, conforme aumenta la amplitud del voltaje en la salida del amplificador operacional. De esta manera, una mayor ganancia de lazo en (8.6) es reducida a la unidad si aumenta la amplitud de las oscilaciones, es decir, si el funcionamiento de los diodos zener se interna m´as en su regi´on de avalancha. Finalmente, n´otese que, de acuerdo a los diagramas de bloques mostrados en la figura 8.18, el circuito oscilador presentado en esa secci´on constituye un sistema en lazo cerrado sin entrada, es decir, la entrada que se aplica para que el circuito oscile es igual a cero. Esto no debe sorprender al lector pues en la secci´on 3.3 del cap´ıtulo 3 se explica claramente que un sistema de segundo orden (o de orden mayor) puede oscilar aunque la entrada sea cero si las condiciones iniciales son diferentes de cero. En este sentido, debe observarse que a pesar de que el circuito est´e inicialmente desconectado se pueden producir peque˜ nas condiciones iniciales diferentes de cero como consecuencia de que el circuito es perturbado al momento de conectar las fuentes de alimentaci´on. Estas condiciones iniciales diferentes de cero, aunque peque˜ nas, son suficientes para que el circuito empiece a oscilar dada la inestabilidad inicial de circuito (ya que A > 3 cuando se enciende el circuito).

468

8 Circuitos electr´ onicos realimentados

8.3.2. Dise˜ no basado en un amplificador operacional. Red RC de defasaje Considere el circuito mostrado en la figura 8.24. La relaci´on entre los voltajes V1 (s) y V2 (s) se muestra en (2.146) correspondiente al ejemplo 2.17 del cap´ıtulo 2. A continuaci´on se reescribe dicha expresi´on para facilitar la referencia:

C

C

C

+

+ R

I1

V 1(s)

R

I2

I3

R

V 2(s)

à

à

Figura 8.24. Red RC de defasaje.

V2 (s) R3 C 3 s3 = 3 3 3 = F (s) V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

(8.8)

Por otro lado, de acuerdo a la secci´on 8.2, el amplificador inversor mostrado en la figura 8.25 realiza la operaci´on: V1 (s) = −

Rf V2 (s) R

(8.9)

Rf R

+

V 2(s)

-

à

+

+ V 1(s)

-

Figura 8.25. Amplificador inversor.

Ahora consid´erese el circuito mostrado en la figura 8.26. N´otese que este circuito puede representarse usando el diagrama de bloques en la figura

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

469

Rf R

+

+

V 2(s)

-

+ V 1(s)

-

C

C

R

C

R

Figura 8.26. Circuito oscilador con red RC de defasaje.

8.27(a). Adem´as, de acuerdo a las expresiones en (8.8) y (8.9) se obtiene el diagrama de bloques mostrado en la figura 8.27(b), el cual puede representarse como en la figura 8.27(c). Esto u ´ltimo es conveniente para poder utilizar la configuraci´on en lazo cerrado con realimentaci´on negativa. Por tanto, la funci´on de transferencia de lazo abierto est´a dada como: G(s)H(s) =

Rf F (s) R

(8.10)

Se sabe que los polos de lazo cerrado satisfacen: 1 + G(s)H(s) = 0

(8.11)

es decir: 1+

Rf F (s) = 0 R

(8.12)

De esta condici´on se obtiene el siguiente polinomio caracter´ıstico: (R4 C 3 + Rf R3 C 3 )s3 + 6R3 C 2 s2 + 5R2 Cs + R = 0

(8.13)

De acuerdo al cap´ıtulo 3, el comportamiento de este circuito depende de las ra´ıces del polinomio caracter´ıstico en (8.13). Como este polinomio es de tercer orden es de mucha utilidad usar el criterio de Routh (secci´on 4.3) para estudiar dichas ra´ıces y para lo cual se construye la tabla 8.2. A partir de esta tabla se pueden predecir tres comportamientos diferentes:

470

8 Circuitos electr´ onicos realimentados

0

V 2(s)

+

V 1(s)

Amplificador inversor

+ Red RC de defasaje (a)

0

V 2(s)

+

à

+

V 1(s)

Rf R

F(s) (b)

0

V 1(s)

Rf R

+

à

F(s) (c) Figura 8.27. Diagramas de bloques equivalentes del circuito en la figura 8.26. Tabla 8.2. Aplicaci´ on del criterio de Routh al polinomio caracter´ıstico en (8.13). s3 s2

R4 C 3 + Rf R3 C 3 6R3 C 2

5R2 C R

s1 s0

(6R3 C 2 )(5R2 C)−R(R4 C 3 +Rf R3 C 3 ) 6R3 C 2

0

R

(6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) > 0, es decir Rf < 29R. En este caso, todos los elementos de la primer columna de la tabla 8.2 son positivos por lo que todas las ra´ıces del polinomio en (8.13) tienen parte real negativa

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

471

y el circuito es estable. Esto significa que aunque el circuito podr´ıa oscilar, sin embargo esto no ser´ıa de manera permanente ya que las oscilaciones desaparecer´an al crecer el tiempo. (6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) < 0, es decir Rf > 29R. En este caso, hay dos cambios de signo al recorrer la primera columna de la tabla 8.2. Esto significa que hay dos ra´ıces del polinomio en (8.13) que tienen parte real positiva y el circuito es inestable. Esto significa que aunque el circuito podr´ıa oscilar, sin embargo la amplitud de las oscilaciones crecer´ıa sin l´ımite al crecer el tiempo, lo cual no es de utilidad en situaciones pr´acticas. (6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) = 0, es decir Rf = 29R. En este caso hay un rengl´on de la tabla 8.2 que esta formado exclusivamente por ceros (el rengl´on correspondiente a s1 ). El criterio de Routh establece (v´ease la secci´on 4.3, ejemplo 4.14) que en este caso se debe calcular la derivada del polinomio formado con los elementos del rengl´on s2 , es decir dP (s) 3 2 3 2 2 ds = 12R C s, donde P (s) = 6R C s +R, sustituir sus coeficientes en 1 el rengl´on s y continuar con la construcci´on de la tabla como se muestra en la tabla 8.3. Como no hay cambios de signo al recorrer la primera columna de la tabla 8.3 se concluye no existen ra´ıces con parte real positiva y que existen ra´ıces imaginarias conjugadas. As´ı que la condici´on: Tabla 8.3. Aplicaci´ on del criterio de Routh al polinomio caracter´ıstico en (8.13) (continuaci´ on). s3 R4 C 3 + Rf R3 C 3 5R2 C s2 6R3 C 2 R 1 s 12R3 C 2 0 s0 R

Rf = 29R

(8.14)

es necesaria para que el circuito de la figura 8.26 pueda oscilar de manera permanente. Por tanto, lo u ´nico que resta es determinar la frecuencia de oscilaci´on. Para esto, es de utilidad recordar otra propiedad de los datos mostrados en la tabla 8.2 (v´ease la secci´on 4.3, ejemplo 4.14): “si uno de los renglones esta formado exclusivamente por ceros, entonces las ra´ıces del polinomio obtenido con los datos del rengl´on inmediato superior a dicho rengl´on de ceros tambi´en son ra´ıces del polinomio caracter´ıstico en (8.13)”. Es decir, las ra´ıces de: 6R3 C 2 s2 + R = 0 tambi´en son ra´ıces del polinomio caracter´ıstico mostrado en (8.13). Resolviendo la expresi´on anterior se encuentra que las ra´ıces correspondientes son imaginarias, como se esperaba:

472

8 Circuitos electr´ onicos realimentados

s1 = j √ Esto significa que ω = est´a dada como:

√ 1 6RC

1 , 6RC

s2 = −j √

1 6RC

= 2πf , es decir, que la frecuencia en Hertz

f=

1 √ 2π 6RC

(8.15)

Por tanto, para dise˜ nar el circuito oscilador de la figura 8.26 se deben seleccionar los valores de R y C de modo que se obtenga la frecuencia de oscilaci´on de acuerdo a (8.15) para despu´es asegurar la oscilaci´on seleccionando Rf de acuerdo a (8.14). Un circuito oscilador pr´ actico A partir de la discusi´on previa se concluye que la relaci´on entre Rf y R debe cumplir lo establecido en (8.14). Sin embargo, de manera similar a lo que ocurre con el circuito oscilador de la secci´on 8.3.1, el oscilador de la figura 8.26 debe ser modificado como se muestra en la figura 8.28 para conseguir una oscilaci´on satisfactoria. N´otese que, usando los valores de las resistencias R en la figura 8.28, Rf = 80000 2200 = 36.36 si no conducen los diodos zener y Rf 47000 ı que se debe ajustar el R = 2200 = 21.36 si conducen los diodos zener. As´ R valor del potenci´ometro de 47[KOhm] para obtener un valor de Rf ligeramente mayor que 29 y conseguir la oscilaci´on sostenida. N´otese que la frecuencia de oscilaci´on esperada es: f =

1 1 √ √ = = 2.9534[KHz] 2π 6RC 2π 6(2200)(0.01 × 10−6 )

En la figura 8.29 se muestran los resultados experimentales obtenidos con el circuito de la figura 8.28. El amplificador operacional utilizado es el UA741. La frecuencia obtenida experimentalmente es 2.7027[KHz], que es muy cercana a la dise˜ nada: 2.9534[KHz]. 8.3.3.

Dise˜ no basado en un transistor

En esta secci´on se estudia el circuito oscilador mostrado en la figura 8.30, el cual se conoce como oscilador Colpitts. El transistor es un dispositivo no lineal. Por esta raz´on, el problema es abordado de manera similar a como se hace con las ecuaciones diferenciales no lineales. As´ı, se considera que el circuito de la figura 8.30 trabaja en un punto de operaci´on y que permite peque˜ nas variaciones de sus se˜ nales alrededor de dicho punto de operaci´on. El punto de operaci´on est´a determinado por el funcionamiento en corriente directa del circuito de la figura 8.30, mientras que las variaciones alrededor del punto de operaci´on se analizan usando un circuito equivalente de se˜ nal peque˜ na

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

473

Zeners 3:6V 47k 33k

2:2k

-

+

v1

+

-

0:01 öF

2:2k

0:01 öF

0:01 öF

2:2k

Figura 8.28. Circuito oscilador pr´ actico.

para el circuito de la figura 8.30. El circuito de se˜ nal peque˜ na es similar al modelo lineal aproximado obtenido para sistemas (ecuaciones diferenciales) no lineales en la secci´on 7.2, el cual es v´alido s´olo si permiten peque˜ nas variaciones alrededor del punto de operaci´on seleccionado. En el siguiente apartado se

Figura 8.29. Forma de onda del voltaje a la salida del amplificador operacional de la figura 8.28.

474

8 Circuitos electr´ onicos realimentados n

R

R2

L

Q

ýCC

C1

Rt CBP

C3

R1 RE

C2

Figura 8.30. Oscilador Colpitts.

estudia el circuito bajo condiciones de corriente directa. El an´alisis del circuito equivalente de se˜ nal peque˜ na se aborda en las subsecuentes secciones. Dada la gran cantidad de variables involucradas (corrientes y voltajes en cada elemento de circuito), se hace la siguiente aclaraci´on en cuanto a la nomenclatura utilizada. Se usa vR1Q para indicar el voltaje (constante) que hay en la resistencia R1 en el punto de operaci´on, vr1 representa las variaciones de voltaje que hay en la resistencia R1 al rededor del punto de operaci´on y vR1 es el voltaje total en la resistencia R1 , es decir vR1 = vR1Q +vr1 . Las corrientes y voltajes en los otros elementos de circuito se definen de manera an´aloga. Por otro lado, se usan letras may´ usculas para representar la transformada de Laplace de una variable escrita con letras min´ usculas, es decir, I(s) = L{i(t)}. An´ alisis en corriente directa El punto de operaci´on de un transistor est´a determinado por los valores constantes de la corriente de colector iCQ y del voltaje colector-emisor vCEQ . dvC1Q dvC2Q diLQ = 0, iC1Q = C dt = 0, iC2Q = C dt = Primero n´otese que vLQ = L dt dvC3Q 0 e iC3Q = C dt = 0 porque iLQ , vC1Q , vC2Q e vC3Q son constantes. Por tanto, para el an´alisis en corriente directa se usa el circuito de la figura 8.31. Leyes fundamentales que rigen el funcionamiento del transistor en corriente directa indican que [1], cap. 5: iCQ = βiBQ , iEQ = (1 + β)iBQ , β ≫ 1, iEQ ≈ iCQ , vBEQ = 0.7[V], silicio La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido Jc en la figura 8.31 da como resultado: vcc = vCEQ + vREQ vcc = vCEQ + RE iEQ

(8.16)

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

475

R2

+

R1

Jc

Q

ýCC

à Jb

RE

Figura 8.31. Circuito equivalente en corriente directa.

La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido Jb en la figura 8.31 da como resultado: vR1Q = vBEQ + vREQ vR1Q = 0.7 + RE iEQ

(8.17)

Suponga que se dan como datos los valores de iCQ , vCEQ , β y vcc . Usando (8.16) e iEQ ≈ ICQ se calcula el valor de RE . A continuaci´on se propone iR1Q a partir de iCQ = βiBQ y la siguiente consideraci´on importante: iR1Q ≫ iBQ

(8.18)

Entonces puede usarse (8.17) para calcular: vR1Q iR1Q vcc − vR1Q R2 = iR1Q

R1 =

(8.19) (8.20)

El valor de los elementos L, C1 , C2 , C3 , CBP y Rt se calculan a partir del an´alisis del circuito equivalente de se˜ nal peque˜ na como se muestra en los siguientes apartados. Circuito equivalente de se˜ nal peque˜ na Primero se determina el modelo de se˜ nal peque˜ na del transistor. Aunque existen muchos modelos de se˜ nal peque˜ na para el transistor (todos ellos correctos) en esta obra se considera lo siguiente. La corriente de emisor, correspondiente al diodo en la uni´on base-emisor, est´a dada por la ecuaci´on de Shockley [1], cap. 5:

476

8 Circuitos electr´ onicos realimentados

h vBE i iE = IES e VT − 1

(8.21)

donde IES es una constante de valor entre 10−12 [A] y 10−16 [A] mientras que VT = 0.026[V] para temperaturas de 300 grados Kelvin. Una relaci´on importante del transistor indica que iB = (1 − α)iE , donde α es una constante positiva ligeramente menor que 1. Por tanto: i h vBE (8.22) iB = (1 − α)IES e VT − 1

Dado que se considera que el transistor opera en la regi´on activa entonces se puede despreciar el uno que se resta en la expresi´on anterior para escribir: h vBE i (8.23) iB = (1 − α)IES e VT

Recordando que iB = iBQ + ib y vBE = vBEQ + vbe se tiene: · v ¸ BEQ +vbe iBQ + ib = (1 − α)IES e VT = (1 − α)IES e

vBEQ VT

vbe

e VT

(8.24)

Recu´erdese que peque˜ nos cambios en iB se deben a peque˜ nos cambios en vBE , es decir, ib = 0 si vbe = 0. Entonces, de acuerdo a la expresi´on anterior se obtiene: h vBEQ i iBQ = (1 − α)IES e VT Por tanto, (8.24) se puede escribir como:

vbe

iBQ + ib = IBQ e VT

(8.25)

Si s´olo se permiten valores peque˜ nos de vbe se puede hacer la aproximaci´on [4], p´ag. 942: vbe

e VT ≈ 1 +

vbe VT

lo cual, junto con (8.25), implica que: ib =

vbe , rπ

rπ =

VT IBQ

(8.26)

Por otro lado, la siguiente relaci´on tambi´en es v´alida para se˜ nal peque˜ na: ic = βib

(8.27)

8.3 Dise˜ no de osciladores con forma de onda sinusoidal ib

477

ic

C

B

+ rù

ý be

ìib

ie

à E

(a) ie

ic

C

E

à hib

ý be

ìib

ib

+ B

(b) Figura 8.32. Circuitos equivalentes de se˜ nal peque˜ na del transistor.

Usando (8.26) y (8.27) se obtiene el modelo de se˜ nal peque˜ na del transistor que se muestra en la figura 8.32(a). Se puede encontrar una equivalencia entre este modelo y el mostrado en la figura 8.32(b). N´otese que la u ´nica diferencia radica en que el voltaje base-emisor ahora est´a dado como una ca´ıda de voltaje debida a la corriente de emisor. Por tanto, la diferencia debe depender del valor de la nueva resistencia hib , es decir: vbe = hib ie

(8.28)

Comparando (8.26), (8.28), y aclarando que ie = (1 + β)ib tambi´en se cumple, se obtiene: hib =

vbe vbe rπ VT VT = = = = ie (1 + β)ib 1+β (1 + β)IBQ IEQ

(8.29)

N´otese que el valor de hib depende de IEQ , es decir, del punto de operaci´on. Una vez que se cuenta con el modelo de se˜ nal peque˜ na del transistor, se procede a encontrar el circuito equivalente de se˜ nal peque˜ na de todo el circuito oscilador. Considere el circuito de la figura 8.33(a). La ley de voltajes de Kirchhoff aplicada a la malla representada por el recorrido J3 indica que: vcc = L

diL + vCE + vRE dt

478

8 Circuitos electr´ onicos realimentados n J3

R

R2

L

Q

ýCC

C1

Rt C3

CBP

R1 C2

RE

(a) ìib

ic

C

J3

B

ib

hib

C1

ie

Rt

E

C3

RE

L

Rex

Rcobre

C2

(b) Figura 8.33. Obtenci´ on del circuito de se˜ nal peque˜ na para el circuito oscilador completo.

iL = iLQ + il vCE = vCEQ + vce vRE = vREQ + vre

(8.30) (8.31) (8.32)

Sustituyendo convenientemente, la expresi´on anterior se puede escribir como: vcc = L

d (iLQ + il ) + vCEQ + vce + vREQ + vre dt

Usando (8.16) y vLQ = L

diLQ dt

= 0 en la expresi´on anterior se obtiene:

0=L

dil + vce + vre dt

Por tanto, el circuito equivalente de se˜ nal peque˜ na debe tener un trayecto como el indicado por J3 en la figura 8.33(b). Procediendo de manera an´aloga con cada una de las posibles mallas y nodos del circuito de la figura 8.33(a) se encuentra que el circuito equivalente de se˜ nal peque˜ na est´a dado como en la figura 8.33(b). Es importante aclarar que Rcobre es la resistencia equivalente en

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

479

paralelo de la resistencia interna (debida al cobre) de la inductancia, mientras que Rex = n2 R donde R es la carga externa a la cual alimenta el circuito oscilador y n es el cociente del n´ umero de vueltas de L y el n´ umero de vueltas de la inductancia conectada a R. Finalmente, las resistencias R1 y R2 en la figura 8.33(a) desaparecen en la figura 8.33(b) porque se considera que la impedancia de CBP (en paralelo con R1 y R2 ) es muy peque˜ na comparada con el equivalente en paralelo de R2 R1 y R2 a la frecuencia de oscilaci´on ω1 , es decir ω1 C1BP ≪ RR11+R . Adem´as, 2 1 si ω1 CBP ≪ hib la impedancia del capacitor puede despreciarse. Ecuaciones del sistema en lazo cerrado En esta y en las subsecuentes secciones se analiza el circuito oscilador de la figura 8.30 en base al circuito equivalente de se˜ nal peque˜ na dado en la figura 8.33(b). Debe recordarse siempre que todo lo que predice este an´alisis s´olo representa el comportamiento que las se˜ nales tienen al rededor del punto de operaci´on el cual se determina mediante el an´alisis en corriente directa. ì ib

ic C

i ih

B ib

h ib

E

ie

RE

1

i out

C1

v out v out R in

C2

R t i out

C3 L

R ex R cobre v o

2

Figura 8.34. Circuito usado para prop´ ositos de an´ alisis.

Para prop´ositos de an´alisis se abre el lazo de realimentaci´on que hay a trav´es de la resistencia de emisor, tal como se muestra en la figura 8.34 [5], p´ag. 265, [6], p´ag. 64. El valor de Rin en la figura 8.34 est´a dado como: Rin = Rt +

RE hib RE + hib

(8.33)

Ahora se procede a analizar el circuito de la figura 8.34. La impedancia entre los puntos 1 y 2 est´a dada como: Zf (s) =

Rin sC1 2 sRin (C1 + C2 ) + 1 1 1 = = + Yf (s) sC1 sC1 (sC2 Rin + 1) Rin + sC1 2

(8.34)

donde Yf (s) es la admitancia entre los puntos 1 y 2. Por otro lado, Vo (s) e I(s) se relacionan a trav´es de:

480

8 Circuitos electr´ onicos realimentados

Vo (s) = Zc (s)I(s)

(8.35)

1 1 1 1 = Yf (s) + + sC3 + + Zc (s) sL Rex Rcobre

(8.36)

donde:

Despu´es de algunas manipulaciones algebraicas se obtiene: sL(sRin (C1 + C2 ) + 1) a3 s3 + a2 s2 + a1 s + 1 a3 = L(C1 C2 + C3 (C1 + C2 ))Rin Rcobre + Rex LRin (C1 + C2 ) a2 = LC1 + LC3 + Rcobre Rex Rcobre + Rex L a1 = Rin (C1 + C2 ) + Rcobre Rex

Zc (s) =

(8.37)

El voltaje Vout (s) se puede calcular como: Vout (s) = M (s)Vo (s)

(8.38)

donde Vout (s) y Vo (s) se relacionan con la corriente Ih (s) mediante: Vo (s) =

1 Ih (s), Yf (s)

Vout (s) =

1 Rin

1 Ih (s) + sC2

(8.39)

Combinando ambas expresiones en (8.39) se obtiene: Vo (s) =

1 1 + Rin sC2 Vout (s) Yf (s) Rin

Usando (8.34) se puede escribir: M (s) =

2 s(Rin C1 C2 s + Rin C1 ) Vout (s) = 2 Vo (s) Rin C2 (C1 + C2 )s2 + Rin (2C2 + C1 )s + 1

(8.40)

Utilizando sucesivamente (8.38) y (8.35) se encuentra: Iout (s) =

1 1 Vout (s) = M (s)Vo (s) = M (s)Zc (s)I(s) Rin Rin Rin

(8.41)

Por otro lado, aplicando el divisor de corriente en el circuito de emisor de la figura 8.34 se encuentra: Ie (s) = Por tanto, si se cumple:

−RE Iout (s) RE + hib

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

RE ≫ hib ,

β≫1

481

(8.42)

entonces se puede aproximar con buen nivel de exactitud: Iout (s) ≈ −Ie (s) = −(β + 1)Ib (s) ≈ −βIb (s) = I(s)

(8.43)

es decir, la ganancia de corriente del transistor en la configuraci´on en base com´ un es unitaria. Las expresiones en (8.41) y (8.43) dan origen al diagrama de bloques de la figura 8.35(a). Este diagrama de bloques tiene realimentaci´on positiva, lo cual es una caracter´ıstica fundamental para producir oscilaciones sostenidas. En la figura 8.35(b) se muestra un diagrama de bloques equivalente que, sin embargo, ahora se expresa como un sistema con realimentaci´on negativa. Esto permite la aplicaci´on de las herramientas de an´alisis y dise˜ no de la teor´ıa de control ya que todas ellas suponen sistemas en lazo cerrado con realimentaci´on negativa como el mostrado en la figura 8.18(d). Por tanto, la funci´on de transferencia de lazo abierto es: G(s)H(s) = −

I (s)

0

+

1 M (s)Zc (s) Rin

M (s )Z c(s ) R in

(8.44)

Iout (s)

+

(a)

à I (s)

0

+

à

à

M (s )Z c(s ) R in

Iout (s)

(b) Figura 8.35. Diagramas de bloques equivalentes del circuito en la figura 8.34.

Condiciones para conseguir oscilaciones sostenidas Primero se estudian las caracter´ısticas de las funciones de transferencia M (s) y Zc (s). N´otese que todos los coeficientes de estas funciones de transferencia son positivos. De acuerdo a los criterios vistos en las secciones 4.2.1

482

8 Circuitos electr´ onicos realimentados

y 4.2.2 sobre el signo de los coeficientes de polinomios de primero y segundo grado y sus correspondientes ra´ıces, se concluye que M (s) tiene dos polos con parte real negativa, un cero con parte real negativa y un cero en s = 0. Sin embargo, de acuerdo a la secci´on 4.2.3, el criterio de los signos de los coeficientes no puede aplicarse a Zc (s) porque su denominador es un polinomio de tercer grado. Sin embargo, se puede hacer uso de un resultado bien conocido de la teor´ıa de circuitos el´ectricos lineales. Este resultado afirma [7], cap. 19, secciones 5 y 6, que la impedancia de cualquier red formada u ´nicamente por elementos pasivos (resistencias, capacitores e inductancias) es una funci´on de transferencia que s´olo tiene polos con parte real menor o igual a cero. N´otese que este es el caso de Zc (s). M´as a´ un, dado que Zc (s) tiene en su denominador un termino independiente de s igual a la unidad, entonces se asegura que Zc (s) tiene tres polos con parte real negativa, un cero con parte real negativa y un cero en s = 0. De acuerdo a lo anterior y a lo expuesto en el cap´ıtulo 6 se concluye que las gr´aficas de Bode y polares de Zc (s) y M (s) tienen las formas mostradas en las figuras 8.36 y 8.37, respectivamente, mientras que la gr´afica polar de G(s)H(s) dada en (8.44) se muestra en la figura 8.38. Es conveniente subrayar que la gr´afica polar de G(s)H(s) consiste en dos trayectorias cerradas que son recorridas en sentido horario conforme la frecuencia var´ıa de −∞ a +∞. El eje real negativo es cruzado dos veces a las frecuencias ω = ±ω1 . N´otese que en estos valores de frecuencia la funci´on de transferencia G(jω)H(jω) tiene parte imaginaria igual a cero. Finalmente, como G(s)H(s) tiene dos ceros en s = 0 para aplicar el criterio de Nyquist se debe hacer un rodeo como el mostrado en la figura 6.44 alrededor de dichos ceros en el origen. Sin embargo, como s = ε∠φ, con ε → 0, entonces G(s)H(s) → 0 sobre todo ese recorrido y es representado por un u ´nico punto en el origen. El uso del criterio de Nyquist permite obtener las siguiente conclusiones: Si |G(jω)H(jω)|ω=w1 < 1, entonces hay estabilidad de lazo cerrado por lo que las oscilaciones no pueden sostenerse. Esto se debe a que Z = P + N , donde P = 0 representa el n´ umero de polos inestables de G(s)H(s), N = 0 es el n´ umero de vueltas horarias alrededor del punto (−1, 0) en la figura 8.38 y Z = 0 es el n´ umero de polos inestables de lazo cerrado. Si |G(jω)H(jω)|ω=w1 > 1, entonces el sistema en lazo cerrado es inestable porque Z = N + P = 2, con P = 0 y N = 2. Claramente, esta situaci´on es indeseable. Si |G(jω)H(jω)|ω=w1 = 1, entonces hay dos polos imaginarios puros por lo que habr´a oscilaciones sostenidas. La parte imaginaria de estos polos es igual a ±ω1 y representa la frecuencia de oscilaci´on del circuito. A partir de estas observaciones, a continuaci´on se presenta la manera de calcular los elementos del circuito para asegurar que el circuito presentar´a oscilaciones sostenidas. Sin embargo, dada la complejidad de las expresiones que forman a G(s)H(s) se deber´an introducir ciertas consideraciones sobre los componentes del circuito.

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

dB 0

!

fase + 90 [grados] 0 à 90

!

483

(a) Gr´ aficas de Bode de Zc (s) Im (Z c(j!))

! =à1 !=0 ! =+1

Re (Z c(j!))

(b) Gr´ afica polar de Zc (s) (dos vueltas). Figura 8.36. Gr´ aficas de respuesta en frecuencia de Zc (s) en (8.37).

C´ alculo de los componentes del circuito Primero se obtiene la siguiente expresi´on: 1 ω 2 C12 Rin 1 1 = + + + Zc (jω) (ωRin (C1 + C2 ))2 + 1 Rex Rcobre · ¸ 2 ω 2 C2 Rin (C1 + C2 ) + 1 1 + j ωC1 + ωC3 − (ωRin (C1 + C2 ))2 + 1 ωL

(8.45)

al hacer el cambio de variable s = jω en (8.36), y la siguiente expresi´on: M (jω) =

2 Rin ω 2 (C12 + C1 C2 ) + jωRin C1 2 ω 2 (C + C )2 1 + Rin 1 2

(8.46)

al hacer el cambio de variable s = jω en (8.40). Con el fin de facilitar la obtenci´on de esta expresi´on es importante indicar que, durante el procedimiento

484

8 Circuitos electr´ onicos realimentados

dB 0

!

fase + 90 [grados] 0 à 90

!

(a) Gr´ aficas de Bode de M (s). Im (M(j!))

!=0

! =+1 ! =à1 Re (M(j!))

(b) Gr´ afica polar de M (s). Figura 8.37. Gr´ aficas de respuesta en frecuencia de M (s) en (8.40).

Im (Z c(j!))

! = æ !1

! =+1 (à 1; j0) ! = à 1 ! = 0

ï

Re (Z c(j!))

Figura 8.38. Gr´ afica polar de G(s)H(s) en (8.44).

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

485

2 seguido, el factor 1 + Rin ω 2 C22 aparece en el numerador y el denominador de M (jω) por lo que se cancela para obtener finalmente (8.46). Tal como se mencion´o previamente la gr´afica polar de G(jω)H(jω) cruza el eje real negativo a la frecuencia ω1 . Esto significa que las partes imaginarias de (8.45) y (8.46) deben ser cero cuando se eval´ uan en ω = ω1 . Aplicando esta condici´on a (8.45) se obtiene:

1 ω1 = r h i C2 L CC11+C + C 3 2

(8.47)

que representa la frecuencia de oscilaci´on del circuito. Es muy importante mencionar que, con el fin de simplificar las expresiones y obtener (8.47), se deben hacer las siguientes suposiciones: 2 Rin ≫

1 , ω12 C2 (C1 + C2 )

2 Rin ≫

Por otro lado, la fase de (8.46) est´a dada como: Ã 1 ∠M (jω) = arctan

1 ω12 (C1 + C2 )2

ω(C1 +C2 )

Rin

!

(8.48)

(8.49)

N´otese que esta fase es diferente de cero para cualquier valor de frecuencia. La condici´on mencionada previamente que requiere que la parte imaginaria de M (jω) sea cero es equivalente a requerir que la fase en (8.49) sea cero. Aunque ´esto no es posible, sin embargo puede obtenerse una fase cercana a cero para ω = ω1 si: Rin ≫

1 ω1 (C1 + C2 )

(8.50)

Esta y las otras aproximaciones que se han hecho s´olo resultar´an en peque˜ nas diferencias entre los valores calculados y los obtenidos experimentalmente de la frecuencia de oscilaci´on y la ganancia de la funci´on de transferencia de lazo abierto. Finalmente, el valor de G(jω)H(jω)|ω=w1 se obtiene como: |G(jω)H(jω)|ω=w1 =

1 Re(M (jω))|ω=ω1 Re(Zc (jω))|ω=ω1 Rin

(8.51)

donde Re(x) representa la parte real de x. A partir de (8.51) y tomando en cuenta la suposici´on (8.50) se encuentra:   1 1   |G(jω)H(jω)|ω=w1 = C12 2 1 1 Rin C1C+C + + 2 1 Rin (C1 +C2 ) Rex Rcobre

486

8 Circuitos electr´ onicos realimentados

Por tanto, de acuerdo a la condici´on |G(jω)H(jω)|ω=w1 = 1 se concluye que el circuito oscilar´a de manera sostenida a la frecuencia dada en (8.47) si:   1 1 =1  (8.52) C12 2 1 1 Rin C1C+C + + 2 1 Rin (C1 +C2 )

Rex

Rcobre

Al igual que en el caso del oscilador basado en amplificador operacional, es importante subrayar lo siguiente. En la pr´actica no es posible satisfacer la condici´on (8.52) debido a las incertidumbres que existen en los valores de los componentes involucrados en dicha condici´on. Adem´as, estos par´ametros pueden cambiar durante la operaci´on del circuito. La manera de resolver este problema en la pr´actica es utilizar la siguiente condici´on en lugar de (8.52):   1 1 >1  (8.53) C12 2 1 1 Rin C1C+C + + 2 1 Rin (C1 +C2 )

Rex

Rcobre

Esto hace que al encender el circuito ´este sea inestable por lo que sus oscilaciones incrementar´an su amplitud r´apidamente. Sin embargo, este crecimiento en la amplitud de las oscilaciones no se mantendr´a de manera indefinida debido a que, antes de que esto suceda, el transistor alcanzar´a las regiones de saturaci´on (voltaje de colector a emisor cero) y de corte (corriente de colector cero). Por tanto, la relaci´on entre Iout e I en la figura 8.35(b) realmente est´a determinada por una funci´on saturaci´on como I = sat(Iout ) mostrada en la figura 8.39. La ganancia de corriente del transistor corresponde a la pendiente de out ) que depende de la amplitud de Iout . Por tanto, sat(Iout ), es decir, a dsat(I dIout el diagrama de bloques de la figura 8.35(b) debe ser cambiado por el de la figura 8.40 y ahora se tiene que:   dsat(Iout ) 1 1   G(jω)H(jω)|ω=w1 = C12 1 dIout Rin C1C+C2 + 1 2 + 1 Rin (C1 +C2 )

Rex

Rcobre

(8.54)

out ) es igual a la unidad para valores de Iout N´otese que la pendiente dsat(I dIout cercanos a cero pero disminuye hacia cero conforme Iout se aleja de cero. Por tanto, si se satisface (8.53), siempre existe una amplitud de las oscilaciones para la cual el valor dado en (8.54) se convierte en la unidad y se consiguen las oscilaciones sostenidas que se desean. Aunque esto sugiere que se puede dise˜ nar el valor del lado izquierdo de (8.53) tan grande como se desee, sin embargo no es recomendable hacer ´esto y se debe dise˜ nar, en cambio, un valor cercano a la unidad. La raz´on de esto es que valores muy grandes del lado izquierdo de (8.53) requieren que se reduzca fuertemente la ganancia de corriente lo cual implica que el circuito trabaje en una zona fuertemente no lineal y, como consecuencia, la forma de onda sinusoidal sufrir´a fuertes deformaciones.

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

487

I = sat(Iout)

1 1

Iout

Figura 8.39. Caracter´ıstica real entre la corriente de emisor y la corriente de colector en un transistor.

à I (s)

0

+

à

à

M (s )Z c(s ) R in

Iout (s)

dsat (I ou t ) dI ou t

Figura 8.40. Diagrama de bloques que considera la saturaci´ on en la corriente de colector.

Es importante subrayar la diferencia entre lo que sucede en un transistor y lo que sucede en un amplificador operacional. En un transistor aparece una funci´on saturaci´on suave sat(Iout ) como resultado de la naturaleza no lineal del transistor: la ganancia de corriente del transistor disminuye poco a poco al incrementarse la amplitud de las oscilaciones. Por el contrario, un amplificador operacional es un dispositivo completamente lineal y su modelo no cambia al crecer las amplitudes. Por ejemplo, considere el amplificador realimentado R +R de la figura 8.41, el cual tiene ganancia 1R1 f . Cuando se alcanza el voltaje de saturaci´on de salida del amplificador operacional se obtiene una saturaci´on dura como la mostrada en la figura 8.42. Esto significa que no hay una disminuci´on progresiva de la ganancia del amplificador operacional realimentado, R +R sino que hay un cambio abrupto de 1R1 f a cero. Por tanto, no existe una ganancia intermedia que asegure que la magnitud de la funci´on de lazo abierto dada en (8.6) sea igual a la unidad. Esta es la raz´on de porqu´e debe recurrirse R +R a un ajuste artificial de la ganancia 1R1 f usando el truco de los diodos zener que se muestra en la figura 8.21.

488

8 Circuitos electr´ onicos realimentados

ei

eo Rf R1

Figura 8.41. Amplificador lineal.

eo

+ V sat R f+R 1 R1

ei

à V sat

Figura 8.42. Saturaci´ on dura en un amplificador operacional.

Por otro lado, n´otese que las condiciones (8.48), (8.50) se cumplen autom´aticamente si se satisface: Rin ≫

1 ω1 C2

(8.55)

Las condiciones (8.42) y (8.55) son importantes para dise˜ no como se explica a continuaci´on. La primera de estas condiciones asegura que la ganancia de corriente de la configuraci´on base com´ un sea unitaria mientras que la segunda asegura que el capacitor C2 no sea puesto en corto circuito por la resistencia Rin pues si as´ı fuera no funcionar´ıa correctamente la realimentaci´on a trav´es de la red capacitiva formada por C1 y C2 . N´otese tambi´en que la expresi´on entre corchetes en (8.53) representa la resistencia en paralelo de Rex , Rcobre y Rin multiplicada por el factor constante [(C1 +C2 )/C1 ]2 . Normalmente Rin es peque˜ na comparada con Rex y Rcobre . Si el factor (C1 + C2 )/C1 se selecciona grande mediante: C2 ≥ 10C1

(8.56)

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

489

entonces se asegura que el valor del factor entre corchetes en (8.53) es aproximadamente la resistencia equivalente de Rex y Rcobre en paralelo. Entonces el lado izquierdo de (8.53) est´a dado por el valor de esta resistencia equivalente en paralelo (que es muy grande comparada con Rin ) dividido entre el factor Rin (C1 + C2 )/C1 . Por tanto, si se usa (8.56) se puede conseguir que este cociente sea tan s´olo un poco mayor que la unidad. Por tanto, las reglas de dise˜ no del oscilador se resumen en (8.42), (8.55), (8.56), (8.47) y (8.53). Es interesante mencionar que estas condiciones son las que aparecen en los libros que tratan sobre el dise˜ no electr´onico de este tipo de osciladores [6], p´ag. 65, [8], p´ag. 9-13. Finalmente, es interesante resaltar las ventajas que en este problema tiene el enfoque basado en la respuesta en frecuencia respecto del enfoque basado a la respuesta en el tiempo (el estudio de la ubicaci´on de los polos del sistema en lazo cerrado). Si se intenta aplicar el segundo de estos m´etodos se encuentra un polinomio caracter´ıstico de grado cinco. Al intentar usar el criterio de Routh para establecer las condiciones en las que hay polos imaginarios puros de lazo cerrado se encuentra un gran problema: las condiciones resultantes quedan expresadas de manera muy complicada y es muy dif´ıcil encontrar reglas de dise˜ no claras como las indicadas en (8.42), (8.47), (8.53), (8.55), (8.56). Resultados experimentales A continuaci´on se dise˜ na un circuito que genera una onda sinusoidal de 1.8 [MHz]. Los datos de dise˜ no son los siguientes. vCC = 12[V], iEQ ≈ iCQ = 1.3[mA], vCEQ = 10.7[V]. Se selecciona un transistor PN2222A que cuenta con un valor de β = 200. Usando (8.16) se encuentra: RE = 1[KOhm] A partir de iCQ = βiBQ se encuentra que iBQ = 6.5 × 10−3 [mA]. Por tanto, de acuerdo a (8.18) se propone iR1Q = 1[mA]. Con esto y (8.17), (8.19), (8.20) se calcula: R1 = 2[KOhm],

R2 = 10[KOhm]

Se cuenta con una inductancia de valor L = 0.328×10−3 [Hy], con una resistencia interna en paralelo Rcobre = 101677[Ohm], capacitores C1 = 27×10−12 [F], C2 = 200 × 10−12 [F] y se supondr´a que no existe el capacitor C3 , es decir, que C3 = 0. N´otese que esta selecci´on de capacitores satisface aproximadamente (8.56). Por tanto, usando (8.47) se encuentra que la frecuencia de oscilaci´on del circuito es f1 = 1.8018[MHz], es decir ω1 = 2πf1 = 1.132 × 107 [rad/s]. Por otro lado, tambi´en se supondr´a que el oscilador no alimenta ninguna carga externa lo cual significa que Rex → ∞, es decir 1/Rex = 0. Usando Rt = 10000[Ohm], VT = 0.026[V], iEQ = 1.3[mA], (8.29) y (8.33) se encuentra Rin = 10020[Ohm]. Con estos datos se obtiene:

490

8 Circuitos electr´ onicos realimentados

1 2 Rin C1C+C 1

 

1 C12 Rin (C1 +C2 )2

+

1 Rex

+

1 Rcobre



 = 1.1363

es decir, se satisface (8.53) adem´as de (8.55) y (8.42). Por otro lado, se usa un R2 valor de CBP = 0.1 × 10−6 [F], por lo que ω1 C1BP = 0.883[Ohm]≪ RR11+R = 2 1666[Ohm]. Adem´as, 0.883[Ohm]≪ hib = 20[Ohm]. Por tanto, se cumplen todas las condiciones de dise˜ no establecidas en el apartado anterior. En la figura 8.43 se muestran las variaciones de voltaje vo medidas entre las terminales de la inductancia. La frecuencia medida en este experimento es de 1.388[MHz].

Figura 8.43. Forma de onda obtenida con Rt = 10000[Ohm].

Figura 8.44. Forma de onda obtenida con Rt = 11000[Ohm].

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

491

En la figura 8.44 se muestran las variaciones de vo cuando se utiliza un valor de Rt = 11000[Ohm], con lo cual se obtiene:   1 1  = 1.0460  (8.57) C12 2 1 1 Rin C1C+C + + 2 1 Rin (C1 +C2 ) Rex Rcobre

Esto significa que la ganancia de lazo disminuye. N´otese que al tener una ganancia de lazo menor se requieren oscilaciones menos amplias y, por tanto, una incursion menor de la se˜ nal dentro de la regi´on no lineal del transistor para conseguir la ganancia de lazo unitaria que asegura las oscilaciones sostenidas. La mayor amplitud de las oscilaciones en el caso de la figura 8.43, cuando se usa Rt = 10000[Ohm], tambi´en se explica de esta manera. De hecho, puede alcanzarse a apreciar una ligera distorsi´on en la parte inferior de la onda sinusoidal en el caso cuando se usa Rt = 10000[Ohm]. Finalmente, en las figuras 8.45(a), 8.45(b) y 8.46(a) se muestran, respectivamente, las gr´aficas polares de M (s), Zc (s) y G(s)H(s) obtenidas con los valores num´ericos mencionados y Rt = 11000[Ohm]. N´otese el parecido entre las figuras 8.45(a) y 8.37(b) as´ı como entre las figuras 8.45(b) y 8.36(b). Por otro lado, las figuras 8.38 y 8.46(a) tambi´en son muy parecidas. La aparente diferencia a frecuencias cercanas a cero se debe a que dicha parte no se alcanza a apreciar en la figura 8.46(a) porque ocurre a frecuencias muy bajas. Esto se verifica en la figura 8.46(b) donde se presenta un acercamiento en dicha parte de la figura 8.46(a) y se alcanza a apreciar la parte de la gr´afica polar a la cual el eje real positivo es tangente en la figura 8.38. En la figura 8.46(a) se puede apreciar que se cumple (8.57).

492

8 Circuitos electr´ onicos realimentados Nyquist Diagram

0.1

0.08

0.06

0.04 System: M Real: 0.119 Imag: 0.0047 Frequency (rad/sec): 1.2e+007

Imaginary Axis

0.02

0

! = 0ï

!= æ1

ï

-0.02

-0.04

-0.06

-0.08

-0.1 -0.05

0

0.05 Real Axis

0.1

0.15

(a) M (s)

!= à1 =0 ï! != +1

(b) Zc (s) Figura 8.45. Gr´ aficas polares usando los valores num´ericos del circuito construido experimentalmente.

8.3 Dise˜ no de osciladores con forma de onda sinusoidal

493

Nyquist Diagram

1

0.8

0.6

0.4

System: GH Real: -1.04 Imag: 0.00332 Frequency (rad/sec): -1.13e+007

Imaginary Axis

0.2

! = 0; æ 1 ï

0

-0.2

-0.4

-0.6

-0.8

-1 -1.2

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

Real Axis

(a) G(s)H(s) Nyquist Diagram

0.01

0.008

0.006

0.004

Imaginary Axis

0.002

0

−0.002

−0.004

−0.006

−0.008

−0.01 −0.01

−0.008

−0.006

−0.004

−0.002

0 Real Axis

0.002

0.004

0.006

0.008

0.01

(b) G(s)H(s) (acercamiento) Figura 8.46. Gr´ aficas polares usando los valores num´ericos del circuito construido experimentalmente (cont.).

494

8 Circuitos electr´ onicos realimentados

8.4.

Resumen del cap´ıtulo

En este cap´ıtulo se ha mostrado como reducir la distorsi´on producida por circuitos electr´onicos no lineales, construir controladores anal´ogicos usando circuitos electr´onicos realimentados y dise˜ nar y construir circuitos osciladores con forma de onda sinusoidal. La herramienta fundamental para resolver estos problemas es la teor´ıa de control cl´asico, que incluye la respuesta en el tiempo y la respuesta en frecuencia. En el caso de reducir la distorsi´on producida por circuitos electr´onicos no lineales, la idea fundamental es el uso de la funci´on de transferencia de G(s) sistema en lazo cerrado C(s) on no incluye ning´ un R(s) = 1+G(s)H(s) . La soluci´ an´alisis de estabilidad ya que se considera que los circuitos involucrados no tienen din´amica, es decir, que se pueden modelar como simples ganancias (posiblemente no lineales) y no como ecuaciones diferenciales. En el caso de la construcci´on de controladores anal´ogicos es importante seleccionar el amplificador operacional m´as adecuado para cada aplicaci´on. En particular, se debe recordar que la ganancia de lazo abierto del amplificador operacional (denominada A0 en el presente cap´ıtulo) en realidad no es una constante sino que var´ıa con la frecuencia a manera de un filtro pasa bajas. Esto significa que si la planta a controlar funciona a altas frecuencias (lo cual depende de la rapidez de la misma planta) entonces el valor de A0 puede verse reducido a esa frecuencia. Por tanto, se deber´a usar un amplificador operacional que tenga un ancho de banda adecuado. Finalmente, en el caso de los circuitos osciladores, es de fundamental importancia el concepto de estabilidad marginal. Por tanto, los componentes del circuito se deben seleccionar de manera que se alcance esta caracter´ıstica de funcionamiento. Las herramientas fundamentales para analizar y dise˜ nar estos circuitos son la t´ecnica de la respuesta en el tiempo (ubicaci´on de los polos de lazo cerrado), en el caso de circuitos basados en amplificadores operacionales, y la t´ecnica de la respuesta en frecuencia (criterio de estabilidad de Nyquist), en el caso de circuitos basados en transistores.

8.5. 1. 2.

3.

Preguntas de repaso

¿Cu´ando se dice que un sistema es marginalmente estable? ¿Por qu´e es importante este concepto para construir circuitos osciladores? ¿Por qu´e se dice que no se puede construir un buen oscilador usando un circuito electr´onico completamente lineal? ¿Por qu´e un circuito electr´onico no lineal resuelve el problema? Un transistor es un dispositivo electr´onico no lineal, entonces ¿Por qu´e se usan t´ecnicas de control lineal (funci´on de transferencia y respuesta en frecuencia) para dise˜ nar circuitos osciladores basados en transistores?

8.5 Preguntas de repaso

4.

5. 6. 7. 8. 9. 10.

495

¿Por qu´e se necesita usar diodos zener en los osciladores basados en amplificadores operacionales? ¿Por qu´e no se usan diodos zener en los osciladores basados en transistores? ¿Qu´e es un modelo de se˜ nal peque˜ na para un transistor? ¿Por qu´e cree que los circuitos osciladores sean sistemas con realimentaci´on positiva? Explique el mecanismo mediante el cual es posible reducir, usando realimentaci´on, la distorsi´on producida por circuitos electr´onicos no lineales. ¿Por qu´e se debe dise˜ nar un circuito oscilador de manera que sea ligeramente inestable? ¿Qu´e opina de la siguiente afirmaci´on? La funci´on de transferencia de lazo abierto de un circuito oscilador es un filtro pasa banda. De acuerdo a la pregunta anterior, ¿Qu´e determina la frecuencia de oscilaci´on?

Referencias

1. A.R. Hambley, Electronics. A top-down approach to computer-aided circuit design, Macmillan Publishing Company, New York, 1994. 2. R.F. Coughlin and F. F. Driscoll, Amplificadores operacionales y circuitos integrados lineales, 4a. edici´ on, Prentice Hall Hispanoamericana, M´exico, 1993. 3. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 4. M. Alonso and E.J. Finn, F´ısica, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1995. 5. W. Hayward, Introduction to radio frequency design, The American Radio Relay League Inc., 1994. 6. P. H. Young, Electronic communication techniques, Merrill Publishing Company, 1990. 7. C.A. Desoer and E.S. Kuh, Basic circuit theory, International Student Edition, McGraw-Hill, Tokyo, 13th printing 1983. 8. M. Kaufman y A.H. Seidman, Manual para ingenieros y t´ecnicos en electr´ onica, McGraw-Hill, M´exico, 1987.

9 Control de velocidad de un motor de CD

R + u

à

L +

i

ea

à

T

Jm

Ê

T c n1 bm

bL

Tp n2 T L

JL

ò

Figura 9.1. Motor de CD con carga.

El problema del control de velocidad de un motor de CD es quiz´a uno de los m´as sencillos debido a que el modelo de la planta a controlar es de primer orden y a que, dada la disponibilidad de motores de CD comerciales de diferentes capacidades, casi no es necesaria la construcci´on adicional de partes mec´anicas. Por otro lado, los sistemas de control de velocidad tienen diversas e importantes aplicaciones en la industria que van desde las bandas transportadoras hasta los procesos de aplanado de l´aminas met´alicas usando rodillos. Finalmente, otra raz´on para incluir este problema de control en la presente obra es el hecho de que otros procesos de diferente naturaleza, como los sistemas de control de temperatura y los sistemas de control de nivel, pueden controlarse de manera similar (usando controladores proporcionalintegral) ya que sus modelos tienen la misma estructura.

500

9 Control de velocidad de un motor de CD

Objetivos del cap´ıtulo Construir controladores tipo proporcional-integral usando un microcontrolador. Construir la totalidad de las interfases electr´ onicas necesarias para construir el sistema de control completo. Identificar las ventajas y desventajas de los controladores proporcionalintegral. Aplicar a una situaci´ on experimental los conceptos de la teor´ıa de control cl´ asico. Un motor el´ectrico es un dispositivo que es utilizado para proveer movimiento a un sistema mec´anico. Existen muchos tipos de motores el´ectricos: de inducci´on [1], caps. 10 y 11, de paso a paso [2], s´ıncronos [3], de reluctancia variable [4], de CD con escobillas y sin escobillas [5], cap. 10, etc. Sin embargo, el motor de corriente directa (CD) con escobillas y con im´an permanente es el m´as sencillo de controlar. M´as a´ un, dado que su modelo matem´atico es lineal y de una entrada-una salida, es el motor ideal para ser usado como prototipo experimental durante las etapas iniciales de aprendizaje en control autom´atico. En este cap´ıtulo se estudia el control de velocidad de un motor de CD con escobillas y con im´an permanente. En el pr´oximo cap´ıtulo se estudia el control de posici´on de este mismo tipo de motor.

9.1.

Modelo matem´ atico

En la figura 9.1 se muestra un motor de CD con escobillas y con im´an permanente que mueve a una carga a trav´es de una caja de engranes. La nomenclatura utilizada es la siguiente. u es el voltaje aplicado en las terminales de armadura del motor. i es la corriente el´ectrica de armadura. Θ es la posici´on angular del rotor del motor. θ es la posici´on angular de la carga. ea = ke Θ˙ es la fuerza contra-electromotriz, donde ke es la constante de fuerza contra-electromotriz. T = km i es el par electromagn´etico generado, donde km es la constante de par del motor. Tc es el par equivalente de la carga reflejado sobre la flecha del motor. Este par se opone al movimiento del motor (sentido contrario a Θ). TL es el par aplicado (por el motor) sobre la carga. Tp es un par de perturbaci´on que se aplica desde el exterior. Se supone que este par se opone al movimiento de la carga (sentido contrario a θ). Si no es as´ı todo es cuesti´on de considerar que Tp es negativo. L es la inductancia de armadura.

9.1 Modelo matem´ atico

501

R es la resistencia de armadura. Jm es la inercia del rotor del motor. bm es la constante de fricci´on viscosa del motor. JL es la inercia de la carga. bL es la constante de fricci´on viscosa de la carga. n1 y n2 representan el n´ umero de dientes del engrane del eje del motor y del eje de la carga, respectivamente. N´otese que un motor de CD es un sistema electromec´anico compuesto por un subsistema el´ectrico y un subsistema mec´anico. El modelo matem´atico correspondiente se encuentra modelando por separado cada uno de estos subsistemas para luego unirlos. A continuaci´on se obtiene el modelo de cada una de estas partes. Modelo del subsistema el´ ectrico del motor Aplicando la Ley de Kirchhoff de voltajes (v´ease la figura 9.1) se tiene: X voltaje aplicado = ca´ıdas de voltaje en la malla

u = ca´ıda en la inductancia + ca´ıda en la resistencia + +fuerza contraelectromotriz di + R i + ea (9.1) u=L dt

donde, de acuerdo a (2.38) en el cap´ıtulo 2, la fuerza contraelectromotriz est´a dada como: ea = ke Θ˙ y el punto “ ˙ ” representa la primera derivada respecto al tiempo. Modelo del subsistema mec´ anico del motor En esta parte debe usarse la Segunda Ley de Newton. Como existen dos cuerpos diferentes debe aplicarse la Segunda Ley de Newton a cada uno de estos cuerpos por separado. Modelo del rotor

inercia × aceleraci´on angular =

X

pares sobre la inercia Jm

¨ = par generado − par de fricci´on − par de carga Jm Θ ¨ = T − bm Θ˙ − Tc Jm Θ (9.2)

502

9 Control de velocidad de un motor de CD

donde, de acuerdo a (2.39) en el cap´ıtulo 2, el par electromagn´etico generado est´a dado como: T = km i La suma en el miembro derecho de (9.2) es una suma vectorial por lo que el signo indica el sentido en que se aplican los pares. Un signo negativo indica que dicho par se opone al movimiento de la inercia Jm mientras que un signo positivo indica que dicho par favorece el movimiento de la inercia Jm .

Modelo de la carga Dada la presencia de una caja de engranes, es necesario utilizar (2.32) y (2.33), vistas en el cap´ıtulo 2, para concluir que: Θ = n θ,

n=

n2 n1

TL = n T c

(9.3) (9.4)

donde n1 y n2 representan, respectivamente, el n´ umero de dientes del engrane unido al eje del motor y al eje de la carga. Aplicando la Segunda Ley de Newton a la carga: X inercia × aceleraci´on angular = pares sobre la inercia JL JL θ¨ = TL − bL θ˙ − Tp

(9.5)

Usando (9.2), (9.5), (9.3) y (9.4) se obtiene el modelo combinado del motor de CD y la carga como: ¨ = km i − bm Θ˙ − 1 TL Jm Θ n ´ ³ ¨ = km i − bm Θ˙ − 1 JL θ¨ + bL θ˙ + Tp Jm Θ n ´ 1³ JL θ¨ + bL θ˙ + Tp n Jm θ¨ = km i − bm nθ˙ − n ¡ 2 ¢ ¡ 2 ¢ ˙ ¨ (9.6) n Jm + JL θ + n bm + bL θ = n km i − Tp

Si se define:

J = n2 Jm + JL ,

b = n2 bm + bL

(9.7)

entonces se puede escribir (9.6) como: J θ¨ + bθ˙ = n km i − Tp

(9.8)

Finalmente, el modelo matem´atico del motor completo est´a dado por (9.1) y (9.8), es decir:

9.2 Amplificador de potencia

L

di = u − R i − n ke θ˙ dt J θ¨ = −b θ˙ + n km i − Tp

503

(9.9) (9.10)

N´otese que la ecuaci´on diferencial en (9.10) es id´entica a la presentada en (2.92) correspondiente al sistema mostrado en la figura 2.28(a) de cap´ıtulo 2. Las u ´nicas diferencias se deben a que (2.92) se deja expresada en t´erminos del par externo aplicado (igual a km i en un motor de CD) y que en (2.92) no se considera ning´ un par externo sobre el cuerpo 2 (Tp = 0). Las ecuaciones diferenciales (9.9) y (9.10) representan el modelo matem´atico del conjunto motor de CD-carga porque si se conocen todas las constantes as´ı como el voltaje de armadura aplicado, u, se puede resolver la ecuaci´on diferencial para calcular la posici´on de la carga, θ, como una funci´on del tiempo. Aplicando la transformada de Laplace a las ecuaciones (9.9) y (9.10) considerando todas las condiciones iniciales iguales a cero se encuentra: 1 [U (s) − n ke sθ(s)] sL + R 1 θ(s) = 2 [n km I(s) − Tp (s)] s J + sb

I(s) =

(9.11) (9.12)

donde I(s), U (s), θ(s), Tp (s) representan las transformadas de Laplace de i, u, θ y Tp , respectivamente.

9.2.

Amplificador de potencia

Es importante subrayar la necesidad de usar un amplificador de potencia. Un sistema de control se puede dividir en dos partes: i) la parte de control y ii) la parte de potencia. La parte de control incluye a toda la parte electr´onica encargada de procesar la informaci´on (sensores y algoritmos de control) que es utilizada para determinar cual es la orden que debe ser enviada al proceso a controlar. Esta tarea requiere de circuitos precisos que funcionan utilizando niveles bajos de corriente, es decir, procesan informaci´on pero no procesan niveles importantes de potencia por lo que las ordenes que env´ıan son d´ebiles. Sin embargo, estas ordenes deben ser capaces de producir cambios importantes en la entrada del proceso a controlar y generalmente la entrada del proceso maneja niveles importantes de potencia para poder producir los cambios esperados en el proceso. Esta es la raz´on de incluir la etapa de potencia en un sistema de control. La etapa de potencia normalmente consiste de un amplificador de potencia que a su entrada recibe la d´ebil se˜ nal entregada por el controlador (se˜ nal de control) y a su salida entrega una se˜ nal de alta potencia que se aplica directamente a los actuadores colocados en la entrada del proceso a controlar. Por ejemplo, en los sistemas electromec´anicos los actuadores utilizados son motores el´ectricos que son equipos capaces de transformar una se˜ nal el´ectrica en la fuerza o el par que necesita el mecanismo para realizar el

504

9 Control de velocidad de un motor de CD

movimiento deseado. La se˜ nal de control es una se˜ nal el´ectrica d´ebil entregada por el controlador (computadora, microcontrolador o circuitos electr´onicos anal´ogicos) mientras que un motor el´ectrico necesita una se˜ nal de gran potencia para producir la fuerza requerida. As´ı, el amplificador de potencia utilizado se debe colocar entre la se˜ nal entregada por el controlador y la se˜ nal aplicada al motor el´ectrico. De acuerdo a esto, un amplificador de potencia se puede modelar como una ganancia Ap que relaciona al voltaje recibido en su entrada ui (se˜ nal de control) con el voltaje entregado en su salida u (en las terminales de armadura del motor): u = Ap ui

9.3.

(9.13)

Control de corriente

Una t´ecnica de control para motores el´ectricos que es muy usada en la industria [5], p´ag. 76, [6], [7], consiste en colocar un lazo interno de corriente. En su forma m´as sencilla este lazo consiste en un controlador proporcional de corriente. Esto significa que la se˜ nal de control se calcula como: ui = K(i∗ − i)

(9.14)

donde K es una constante positiva que representa la ganancia del controlador proporcional de corriente mientras que i∗ representa la consigna de corriente que debe ser obtenida como la salida de otro controlador (lazo externo) que se encarga de controlar la variable deseada, es decir, la velocidad o la posici´on. M´as adelante se explicar´a como se dise˜ na dicho lazo externo de control. Por lo pronto sup´ongase que i∗ es simplemente el valor deseado de corriente que ser´a especificado de alg´ un modo. Usando (9.13) y (9.14) se encuentra que el voltaje aplicado en las terminales de armadura del motor de CD est´a dado como: u = Ap K(i∗ − i)

(9.15)

Aplicando la transformada de Laplace a (9.15) se encuentra: U (s) = Ap K(I ∗ (s) − I(s))

(9.16)

donde I ∗ (s) es la transformada de Laplace de i∗ . Combinando (9.11), (9.12) y (9.16) se obtiene el diagrama de bloques de la figura 9.2(a). Como se muestra en el ejemplo 4.4 de la secci´on 4.1 a partir de la figura 9.2(a) se pueden hacer las simplificaciones mostradas en las figuras 9.2(b) y 9.2(c). Tambi´en se muestra en el ejemplo 4.4 de la secci´on 4.1 que, a partir de la figura 9.2(c), se puede escribir: θ(s) = G1 (s)I ∗ (s) + G2 (s)Tp (s)

(9.17)

9.3 Control de corriente U i ( s) I ã(s)

+

Ap

K

U ( s)

à

+

I(s)

1 Ls+R

nkm

+

T p ( s) à

1 Js 2 +bs

505

ò ( s)

à

nke s

(a) I ã(s) +

+

à

KAp à

I(s)

1 Ls+R

nke KA p

nkm

+

T p ( s) à

1 Js 2 +bs

ò(s)

s

(b) I ã(s) +

KA p Ls+R+KA p

I(s)

+

nkm

à

nke KA p

T p ( s) à

ò(s)

1 Js 2 +bs

s

(c)

I ã(s)

+

T p ( s) à

nkm

1 Js 2 +bs

ò ( s)

(d) Figura 9.2. Diagramas de bloques equivalentes para un motor de CD con un lazo proporcional de corriente y un amplificador de potencia.

donde: G1 (s) = h³

sL+R KAp

G2 (s) = h³

sL+R KAp

nkm i ´ 2k k m e s + 1 (sJ + b) + nKA p ³ ´ − sL+R KAp + 1 i ´ 2k k m e s + 1 (sJ + b) + nKA p

(9.18)

(9.19)

506

9 Control de velocidad de un motor de CD

Si la ganancia K se selecciona suficientemente grande entonces se puede considerar que [5], p´ag. 76: sL + R ≈ 0, KAp

n2 km ke ≈0 KAp

para aproximar (9.18) y (9.19) como: nkm s2 J + sb −1 G2 (s) = 2 s J + bs

G1 (s) =

(9.20) (9.21)

Usando (9.20) y (9.21) en (9.17) se obtiene: θ(s) =

1 [nkm I ∗ (s) − Tp (s)] s2 J + sb

(9.22)

lo cual se representa usando un diagrama de bloques en la figura 9.2(d). N´otese que el objetivo del control de corriente mostrado en (9.15) es hacer despreciable la din´amica el´ectrica del motor de manera que el modelo del motor ahora s´olo est´a representado por la parte mec´anica del mismo. Esto puede apreciarse claramente si se comparan (9.22) y (9.12). Estas dos expresiones indican que ahora puede considerarse que es la corriente la que se utiliza como variable de control y no el voltaje como se indicaba en (9.11). Es claro que el voltaje sigue siendo la variable que se manipula directamente como lo indica (9.15), sin embargo, para prop´ositos de an´alisis y dise˜ no del sistema de control se puede suponer que es la corriente la que se manipula directamente a trav´es de la consigna de corriente i∗ . El prop´osito del control de corriente (9.15) es conseguir que el valor actual de la corriente i siga de cerca a la consigna i∗ para lo cual es muy conveniente usar un valor grande de la ganancia K. N´otese que la expresi´on en (9.22) se puede reescribir como se muestra a continuaci´on: 1 1 [kI ∗ (s) − Tp (s)] s(s + a) J nkm b a= , k= J J

θ(s) =

(9.23)

Finalmente, dado que la velocidad ω y la posici´on θ se relacionan a trav´es de ω = dθ dt , entonces usando la transformada de Laplace con condiciones iniciales cero se tiene que ω(s) = sθ(s). Por tanto, la expresi´on en (9.23) se puede reescribir como: ω(s) = sθ(s) =

1 1 [kI ∗ (s) − Tp (s)] s+a J

(9.24)

En lo que resta de este cap´ıtulo se utilizar´a el modelo dado en (9.24) para dise˜ nar controladores de velocidad. Tambi´en se presentar´an algunos resultados experimentales obtenidos con dichos controladores.

9.4 Identificaci´ on

9.4.

507

Identificaci´ on

En esta secci´on es de inter´es realizar un experimento que permita conocer los valores de las constantes k y a del modelo en (9.24). A continuaci´on se explica la manera de dise˜ nar dicho experimento. Suponga que no hay ninguna perturbaci´on externa aplicada, es decir Tp (s) = 0, por lo que el modelo (9.24) se reduce a: ω(s) =

k I ∗ (s) s+a

(9.25)

Este es un sistema de primer orden como el estudiado en la secci´on 3.1. Por tanto, si se aplica el valor constante i∗ = A, es decir I ∗ (s) = As , entonces la velocidad ω evolucionar´a en el tiempo como se muestra en la figura 9.3, es decir:

!(t) kA a

0:632 kA a

ü

ü

ü

ü

ü

ü

tiempo

ü

Figura 9.3. Evoluci´ on de la velocidad de un motor de CD cuando se aplica un valor constate i∗ = A.

ω(t) =

¢ kA ¡ 1 − e−at a

(9.26)

La constante de tiempo τ se puede medir como se muestra en la figura 9.3 y sabiendo que τ = a1 , se puede calcular el valor del par´ametro a. Por otro

508

9 Control de velocidad de un motor de CD

lado, definiendo el valor final de velocidad como ωf = l´ımt→∞ ω(t) = kA a y aω conociendo el valor de a, se puede calcular k = Af . En la figura 9.4 se presentan los resultados obtenidos al realizar el experimento descrito en el procedimiento anterior. El ruido contenido en la medici´on de velocidad es evidencia de un hecho bien conocido en sistemas de control: la velocidad es una se˜ nal ruidosa. V´ease la secci´on 9.6 para una explicaci´on de porqu´e ω se mide en volts. Se utiliza un valor i∗ = A = 0.3[A] y midiendo directamente en la figura 9.4 se encuentran los valores: τ = 2.7[s],

ωf = 2[V]

(9.27)

Estas mediciones se simplifican y al mismo tiempo se hacen m´as exactas si se utiliza un programa de computadora para realizarlas. Con estos valores se sigue el procedimiento indicado previamente para encontrar que: a = 0.3704,

k = 2.4691

(9.28)

Finalmente, es importante aclarar que no es de inter´es calcular el valor del factor 1/J que aparece como coeficiente de la perturbaci´on Tp (s) en (9.24). La raz´on de esto es que normalmente incluso el valor de Tp no es conocido y a pesar de ello su efecto puede ser compensado.

! [V]

0:632 â 2

ï ü = 2:7

tiempo [s]

Figura 9.4. Identificaci´ on experimental de un motor de CD.

9.5 Control de velocidad

9.5.

509

Control de velocidad

El dise˜ no de un controlador tiene como objetivo asegurar que en lazo cerrado se consigan las caracter´ısticas deseadas de respuesta transitoria y en estado estacionario. Las caracter´ısticas de respuesta transitoria se refieren a la constante de tiempo (rapidez de respuesta) deseada, la cual se asigna mediante la ubicaci´on conveniente de los polos de lazo cerrado. Por otro lado, las caracter´ısticas de respuesta en estado estacionario se consiguen al asegurar que cuando el tiempo crece el valor de la velocidad ω alcanza la velocidad deseada ωd a pesar de la presencia de una perturbaci´on externa Tp (s). El controlador es el dispositivo que se encarga de que se satisfagan las caracter´ısticas de respuesta transitoria y en estado estacionario del sistema en lazo cerrado. Suponga que la velocidad deseada es una constante o un escal´on, es decir ωd es una constante. Dado que la planta en (9.24) no tiene polos en s = 0 entonces es de tipo 0. Esto significa que el uso de un controlador proporcional de velocidad de la forma i∗ = kp (ωd − ω), con kp > 0, no puede conseguir que ω = ωd en estado estacionario incluso si no hay perturbaciones externas de par, es decir, a´ un cuando Tp = 0. La soluci´on a este problema es utilizar un controlador que tenga una acci´on integral, para que el sistema sea de tipo 1, es decir usar un controlador proporcional-integral (PI). Sin embargo, tal como se explica en la secci´on 5.2.4, un controlador PI no puede conseguir simult´aneamente las caracter´ısticas de respuesta transitoria deseadas y un rechazo satisfactorio de las perturbaciones externas Tp (s). Por esta raz´on, a continuaci´on se muestra la manera de construir un controlador PI modificado que puede conseguir simult´aneamente estos requerimientos. 9.5.1.

Un controlador PI modificado

Aplicando la transformada inversa de Laplace a (9.24) se obtiene la siguiente ecuaci´on diferencial: ω˙ + aω = ki∗ −

1 Tp J

A continuaci´on se demuestra que el siguiente controlador: Z t a ∗ i = kp (ωd − ω) + ki (ωd − ω(r))dr + ωd + k1 (ω(0) − ωd ) k 0

(9.29)

(9.30)

donde ω(0) es la velocidad inicial, consigue que ante una velocidad deseada constante ωd la velocidad ω alcance dicho valor deseado en estado estacionario, que responda con una constante de tiempo fijada a voluntad y que el efecto de una perturbaci´on constante Tp desaparezca tan r´apido como se desee. Sustituyendo (9.30) en (9.29) y acomodando t´erminos se encuentra: Z t 1 (ω(r) − ωd )dr = k1 k(ω(0) − ωd ) − Tp ω˙ + (a + kp k)(ω − ωd ) + ki k J 0

510

9 Control de velocidad de un motor de CD

Definiendo: kp = kp′ + k1 se obtiene: ω˙ + (a + kp′ k)(ω − ωd ) + ki k

Z

t

(ω(r) − ωd )dr

0

1 +k1 k[ω − ωd − (ω(0) − ωd )] = − Tp J N´otese que: ω − ωd − (ω(0) − ωd ) =

Z

0

t

(ω(r) ˙ − ω˙ d )dr

y si adem´as de define: ki = ki′ k1 entonces: ω˙ + (a + kp′ k)(ω − ωd ) + k1 k

Z

0

t

[ki′ (ω(r) − ωd ) + (ω(r) ˙ − ω˙ d )] dr

1 = − Tp J

(9.31)

Pero como ωd es una constante, entonces ω˙ d = 0. As´ı que si se define: ki′ = a + kp′ k Z t [ω(r) ˙ + ki′ (ω(r) − ωd )] dr ξ= 0

entonces se puede escribir (9.31) como: 1 ξ˙ + k1 kξ = − Tp J Aplicando la transformada de Laplace con condiciones iniciales cero: ξ(s) =

− J1 Tp (s) s + k1 k

sξ(s) =

− J1 s Tp (s) s + k1 k

o tambi´en:

Si Tp = td es una constante, es decir Tp (s) =

td s

entonces:

(9.32)

9.5 Control de velocidad

sξ(s) =

511

− J1 s td s + k1 k s

Aplicando el teorema del valor final se tiene: ˙ = l´ım s [sξ(s)] l´ım ξ(t) s→0 · ¸ − J1 s td = l´ım s =0 s→0 s + k1 k s

t→∞

˙ = As´ı que si k1 k > 0, el filtro en (9.32) es estable y se asegura que l´ımt→∞ ξ(t) ˙ 0. M´as a´ un, la rapidez con que ξ(t) se aproxima a cero es mayor conforme ˙ = 0 implica que: k1 k > 0 es mayor. N´otese que l´ımt→∞ ξ(t) Z d t [ω(r) ˙ + ki′ (ω(r) − ωd )] dr = ω˙ + ki′ (ω − ωd ) → 0 dt 0 tambi´en tiende a cero. Esto significa que el efecto de la perturbaci´on constante desaparece al crecer el tiempo y s´olo queda la ecuaci´on diferencial ω˙ + ki′ ω = ki′ ωd , la cual es estable si ki′ > 0, tiene constante de tiempo τ = k1′ y tiene i ganancia unitaria en estado estacionario. Todo esto significa que: ˙ = 0 para todo t ≥ 0), la respuesta Si no hay perturbaci´on (Tp = 0 y ξ(t) en velocidad es como la de un sistema de primer orden con constante de tiempo τ = k1′ . La velocidad ω alcanza la velocidad deseada ωd (constante) i en estado estacionario. Si aparece una perturbaci´on constante (Tp = td 6= 0), la desviaci´on producida por la perturbaci´on desaparece al crecer el tiempo. M´as a´ un, si se escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es mayor), entonces la desviaci´on producida por la perturbaci´on desaparece m´as r´apido. Si una vez que la desviaci´on debida a la perturbaci´on es llevada a cero (cuando ω = ωd ) se ordena un cambio en el valor constante de ωd (se ordena un cambio de velocidad deseada ωd estando presente la perturbaci´on Tp ), entonces la velocidad responde como si la mencionada perturbaci´on constante Tp no existiera, es decir, como en el punto anterior: con una constante de tiempo τ = k1′ y la velocidad ω alcanza la velocidad i deseada ωd en estado estacionario. Debido a que en control cl´asico siempre se supone que todas las condiciones iniciales son cero, entonces se puede suponer que ω(0) = 0 y el controlador en (9.30) se escribe como: Z t ´ ³a ∗ (9.33) − k1 ωd (ωd − ω(r))dr + i = kp (ωd − ω) + ki k 0

que constituye un simple controlador PI con un t´ermino constante de prealimentaci´on. Finalmente, la regla de sinton´ıa es resumida por la siguientes expresiones:

512

9 Control de velocidad de un motor de CD

kp = kp′ + k1 ki = ki′ k1

(9.34)

ki′ = a + kp′ k donde: kp′ > 0 se elige de modo que quede fijada la constante de tiempo deseada 1 τ = k1′ = a+k ′ k , la cual siempre es menor que la constante de tiempo de i

p

la planta a controlar a1 , lo cual es muy conveniente. k1 > 0 se elige grande para reducir r´apidamente a cero la desviaci´on debida a la perturbaci´on. Esto puede hacerse al tanteo o puede calcularse recordando que k11k es la constante de tiempo del filtro en (9.32), el cual es el responsable de eliminar la desviaci´on producida por la perturbaci´on. Otra manera (m´as conocida) de dise˜ nar un controlador PI con las mismas ventajas que el que se acaba de presentar es usando el concepto de controladores con dos grados de libertad. Esto es lo que se muestra en la siguiente secci´on. 9.5.2.

Un controlador con dos grados de libertad

Un sistema en lazo cerrado que cuenta con un controlador con dos grados de libertad tiene la estructura mostrada en la figura 9.5. El controlador esta formado por los dos componentes con funciones de transferencia Gc1 (s) y Gc2 (s), mientras que Gp (s) es la planta que se desea controlar. Tambi´en se toma en cuenta la presencia de una perturbaci´on a la entrada de la planta D(s). En el ejemplo 4.5 de la secci´on 4.1 se muestra que la salida del sistema en lazo cerrado se puede calcular como: ω(s) = G1 (s)ωd (s) + G2 (s)D(s) donde: Gc1 (s)Gp (s) 1 + (Gc1 (s) + Gc2 (s))Gp (s) Gp (s) G2 (s) = 1 + (Gc1 (s) + Gc2 (s))Gp (s)

G1 (s) =

(9.35)

son las funciones de transferencia: ω(s) , cuando D(s) = 0 ωd (s) ω(s) G2 (s) = , cuando ωd (s) = 0 D(s) G1 (s) =

La raz´on por la cual este esquema recibe el nombre de controlador de dos grados de libertad es que las dos funciones de transferencia definidas en (9.35)

9.5 Control de velocidad

513

pueden ser sintonizadas independientemente una de la otra utilizando para ello, como variables independientes (o grados de libertad), a las dos partes del controlador Gc1 (s) y Gc2 (s). Dado que la planta que interesa en este cap´ıtulo D(s) +

! d (s) +

I ã(s)

G c1 (s)

+ à

à

+

G p ( s)

!(s)

G c2 (s)

Figura 9.5. Sistema en lazo cerrado usando un controlador con dos grados de libertad.

es un motor de CD, suponga que: Gp (s) =

k s+a

Suponga tambi´en que Gc1 (s) y Gc2 (s) son controladores PI, es decir: kp1 s + ki1 , s

kp2 s + ki2 s kp s + ki , kp = kp1 + kp2 , Gc (s) = Gc1 (s) + Gc2 (s) = s

Gc1 (s) =

Gc2 (s) =

ki = ki1 + ki2

Por tanto, la primera funci´on de transferencia en (9.35) se puede escribir como: k Gc1 (s) s+a ω(s) = k s+k k ωd (s) 1 + p s i s+a

=

s2

skGc1 (s) + (a + kp k)s + ki k

(9.36)

Suponga que se desea que la respuesta en lazo cerrado, ante una referencia deseada, sea la de un primer orden con un polo en s = −p1 , con p1 > 0. Entonces el polinomio caracter´ıstico en la expresi´on anterior debe satisfacer: s2 + (a + kp k)s + ki k = (s + p1 )(s + f ) = s2 + (p1 + f )s + p1 f donde la ra´ız en s = −f , f > 0, se introduce s´olo para conseguir un polinomio de segundo orden en el miembro derecho de esta expresi´on. Igualando coeficientes en ambos miembros se obtiene:

514

9 Control de velocidad de un motor de CD

a + kp k = p1 + f,

ki k = p1 f

de donde se encuentra: kp =

p1 + f − a , k

ki =

p1 f k

Por otro lado, con el fin de que la respuesta ante una referencia deseada sea la de un primer orden con un polo en s = −p1 , la funci´on de transferencia en (9.36) debe tener la forma: ω(s) p1 (s + f ) p1 (s + f ) p1 = 2 = = ωd (s) s + (a + kp k)s + ki k (s + p1 )(s + f ) s + p1

(9.37)

Por tanto, igualando (9.36) y (9.37) se encuentra que: skGc1 (s) = p1 (s + f ) de donde se concluye que Gc1 (s) es un controlador PI: Gc1 (s) =

kp1 s + ki1 , s

kp1 =

p1 , k

ki1 =

p1 f k

Con este resultado se puede calcular Gc2 (s) como: Gc2 (s) = Gc (s) − Gc1 (s) =

kp2 s + ki2 , s

kp2 =

f −a , k

ki2 = 0

Es decir, Gc2 (s) = kp2 es un controlador proporcional. Por otro lado, la segunda funci´on de transferencia en (9.35) toma la forma: ω(s) = D(s) 1+

k s+a kp s+ki k s s+a

ks + (a + kp k)s + ki k ks = (s + p1 )(s + f ) =

s2

(9.38)

Usando esta expresi´on y el teorema del valor final se puede comprobar que td desaparece el efecto de una perturbaci´on externa constante D(s) = − Jks conforme el tiempo crece. M´as a´ un, la rapidez con que esto sucede es mayor conforme f y p1 son mayores. Como p1 est´a fijada por la rapidez de respuesta deseada ante una referencia constante, entonces f es el par´ametro que queda libre. Entonces, f debe escogerse grande. De acuerdo a la figura 9.5, el controlador est´a dado como: I ∗ (s) = Gc1 (s)(ωd (s) − ω(s)) − Gc2 (s)ω(s) (ωd (s) − ω(s)) = kp1 (ωd (s) − ω(s)) + ki1 − kp2 ω(s) s

9.6 Prototipo experimental

515

(ωd (s) − ω(s)) − kp2 ωd (s) s (ωd (s) − ω(s)) − kp2 ωd (s) = kp (ωd (s) − ω(s)) + ki1 s (9.39) = (kp1 + kp2 )(ωd (s) − ω(s)) + ki1

Usando la transformada inversa de Laplace se obtiene finalmente: Z t i∗ = kp (ωd − ω) + ki1 (ωd − ω(r))dr − kp2 ωd

(9.40)

0

N´otese que los controladores en (9.40) y (9.33) son id´enticos si se define: k1 =

f , k

p1 = ki′

Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados en las secciones 9.5.1 o 9.5.2 para obtener este controlador es el que prefiere.

9.6.

Prototipo experimental

A continuaci´on se listan los componentes principales del sistema de control. Microcontrolador PIC16F877A [8]. Convertidor digital/anal´ogico de 8 bits DAC0800LCN. 2 motores de CD con escobillas e im´an permanente. Voltaje nominal de 24[V], corriente nominal de 2.3[A]. Las flechas de los dos motores se unen de modo que uno de los motores se utiliza como generador. El voltaje generado es utilizado como la medici´on de la velocidad del otro motor el cual es controlado de acuerdo a la ley de control en (9.33). En la figura 9.6 se muestra el diagrama el´ectrico utilizado para construir el sistema de control de velocidad. El algoritmo de control en (9.33) se calcula usando el microcontrolador PIC16F877A. Es decir, conocido el valor deseado de velocidad ωd y la medici´on de la velocidad ω, el microcontrolador calcula el valor de la se˜ nal de control i∗ en (9.33). En la secci´on 9.9 se muestra el listado del programa utilizado. A continuaci´on se describe la manera en que el microcontrolador PIC16F87 7A realiza su funci´on de controlador. Antes que nada se debe aclarar que no es el prop´osito presentar toda una exposici´on de como trabaja este microcontrolador. Lo que se presenta es una descripci´on de los recursos de este microcontrolador que se utilizan para construir el controlador bajo prueba. Se usa el canal 0 del convertidor anal´ogico/digital con que cuenta este microcontrolador. S´olo se utilizan los 8 bits m´as significativos de este convertidor el cual tiene un rango anal´ogico de entrada de [0,+5][V]. Por tanto, el dato

516

9 Control de velocidad de un motor de CD

Figura 9.6. Diagrama el´ectrico del sistema de control de velocidad de un motor de CD.

9.6 Prototipo experimental

517

entregado por el convertidor t 0 es sometido a la operaci´on: w=0.0196*t 0 (donde 0.0196=5/255) para obtener en la variable w el voltaje a la entrada del convertidor anal´ogico/digital. Este voltaje es el entregado por el motor que se utiliza como generador y es proporcional a la velocidad del motor que se quiere controlar. Por tanto, se asume que este voltaje representa el valor medido de velocidad. N´otese que antes de entrar al convertidor anal´ogico/digital (por el pin 2 del microcontrolador), el voltaje del generador pasa a trav´es de un divisor de tensi´on que tiene como funci´on adaptar el m´aximo voltage generado (12.3[V] a velocidad m´axima) a un valor de 5[V], es decir dentro del rango del voltaje anal´ogico que maneja el convertidor anal´ogico/digital. El amplificador operacional TL081 es utilizado para proteger al microcontrolador. Tal como se indica en la figura 9.6 el valor de −i∗ debe aparecer a la entrada del amplificador operacional TL081 dentro del recuadro titulado “control de corriente”. Esto se consigue del siguiente modo. Primero, en el programa listado en la secci´on 9.9 se hace iast=-iast, para cambiar el signo de i∗ a −i∗ . El microcontrolador debe entregar un c´odigo digital (iastd) de 8 bits al convertidor digital/anal´ogico de 8 bits DAC0800LCN. Para esto, el microcontrolador realiza la operaci´on: iastd = 36.4286 ∗ iast + 127 la cual obedece a la relaci´on mostrada gr´aficamente en al figura 9.7. Una vez iastd 255

127

à 3:5

3:5

iast

Figura 9.7. Acondicionamiento de la se˜ nal i∗ que debe ser enviada al convertidor digital-anal´ ogico.

calculada “iastd” se entrega al convertidor digital/anal´ogico a trav´es del puerto D (PORTD=iastd). El convertidor digital/anal´ogico trabaja en conjunto con un amplificador operacional TL081. Estos dispositivos est´an conectados de acuerdo a las sugerencias del fabricante [9]. Esto asegura que a la salida del

518

9 Control de velocidad de un motor de CD

amplificador operacional se obtiene un voltaje cuyo valor num´erico corresponde al de −i∗ . Este valor es recibido por otro amplificador operacional TL081 que se encarga de evaluar el lazo de corriente: ui = 100(i∗ − i) La raz´on de que deba aparecer −i∗ en el lugar que se indica en la figura 9.6 tiene que ver con la compatibilidad de signos que deben respetar los amplificadores operacionales colocados en dicha figura. Por otro lado, el amplificador de potencia de ganancia unitaria est´a constituido por un tercer amplificador operacional TL081 junto con dos transistores de potencia TIP141 y TIP145, conectados en simetr´ıa complementaria El Manejador/Receptor MAX232 se encarga de enviar la velocidad medida ω y la se˜ nal de control i∗ hacia una computadora port´atil (a trav´es de un conector USB a serie) cuyo u ´nico prop´osito es el graficado de dichas variables. Esto se hace a trav´es de las variables “cuentaH=0x00” y “cuentaL=t 0” (para enviar la velocidad) o “cuentaH=0x00” y “cuentaL=(iastd) &(0xFF)” (para enviar la se˜ nal de control). Estos datos son enviados a la computadora port´atil mediante las instrucciones: putc(0xAA); putc(cuentaH); putc(cuentaL);. Finalmente, el timer TMR0 es utilizado para establecer un periodo de muestreo T = 0.002[seg] (40 cuentas del timer 0). 9.6.1.

Control de corriente

El lazo de corriente presentado en (9.14) se construye del siguiente modo. Se conecta una resistencia de potencia (de cer´amica) de 1[Ohm] en serie con la armadura del motor de CD. Esto permite que en las terminales de dicha resistencia aparezca un voltaje que num´ericamente es igual a la corriente i que circula por el motor. Entonces, el amplificador operacional mostrado en el bloque “control de corriente” de la figura 9.6 realiza la operaci´on indicada en (9.14) con K = 100. 9.6.2.

Amplificador de potencia

De acuerdo a lo expuesto en la secci´on 8.1.2 el bloque denominado “amplificador de potencia” en la figura 9.6 permite reducir la zona muerta introducida por los transistores de potencia conectados en simetr´ıa complementaria. Adem´as, con los valores ah´ı presentados se consigue Ap = 1 en (9.13) y en (9.15). Esto permite obtener Ap K = 100. Este valor fue elegido porque con ´el se obtuvieron resultados satisfactorios. Es ilustrativo resaltar que en los manejadores comerciales para uso industrial es com´ un encontrar valores tan grandes como Ap K = 700 [7].

9.7 Resultados experimentales

9.7.

519

Resultados experimentales

En la figura 9.8 se muestran los resultados experimentales obtenidos con el controlador en (9.33) (o equivalentemente con el controlador en (9.40)) y con el prototipo experimental descrito en la secci´on previa. Partiendo de una velocidad inicial igual a cero, se ordena la siguiente velocidad deseada que tiene la forma de tres escalones sucesivos:   1.5, 0 ≤ t < 4 (9.41) ωd = 2.5, 4 ≤ t < 12  1.5, t ≥ 12 Tambi´en se aplica, via software, una perturbaci´on constante de valor Tp = 2.5

! [V]

3 2.5 2 1.5

0:632 â 1:5

1 0.5 0

0

ï

2

4

6

8

10

12

14

16

18

2

4

6

8

10

12

14

16

18

20

22

20

22

0:623 iã [A]

3 2 1 0 -1 -2 -3 0

tiempo [s] Figura 9.8. Control de velocidad usando el controlador PI modificado mostrado en (9.33) (o equivalentemente con el controlador en (9.40).

en t = 8[s], la cual desaparece en t = 17[s]. Las ganancias del controlador en (9.33) se calculan de acuerdo a (9.34) junto con los valores num´ericos en (9.28) y: kp′ = 0.5,

k1 = 4.0

lo cual fija la constante de tiempo deseada en τ = 0.6231[s]. En la figura 9.8 se muestra la velocidad medida como resultado del experimento y una linea

520

9 Control de velocidad de un motor de CD

blanca que representa la respuesta, obtenida en simulaci´on, del sistema sin perturbaciones: ω˙ + ki′ ω = ki′ ωd

(9.42)

1 con ki′ = 0.6231 , es decir el valor calculado de acuerdo a (9.34), y con ωd dada en (9.41). N´otese que la respuesta experimental de velocidad sigue exactamente la respuesta te´orica dictada por (9.42) y que esto sigue siendo cierto durante la transici´on de ωd = 2.5 a ωd = 1.5 en t = 12[s] a pesar de que durante dicha transici´on sigue aplicada la perturbaci´on constante Tp = 2.5. Esto comprueba las afirmaciones establecidas justo antes de (9.33). Adem´as, es importante subrayar que se han conseguido exactamente las especificaciones de respuesta transitoria y de estado estacionario y adem´as las desviaciones que aparecen cuando se aplica y desaparece la perturbaci´on externa son llevadas a cero r´apidamente. A continuaci´on se muestran los resultados obtenidos con un controlador PI cl´asico con el fin de comparar con los resultados obtenidos en la figura 9.8. En la figura 9.9 se muestran los resultados obtenidos usando un controlador PI cl´asico cuando se seleccionan las ganancias de acuerdo a:

ki = a, kp

τ=

1 = 0.6231[s] kp k

(9.43)

seg´ un se discute en la secci´on 5.2.4, con τ la constante de tiempo deseada en lazo cerrado. La velocidad deseada ωd es id´entica a la mostrada en (9.41) y se aplica una perturbaci´on id´entica a la usada en la figura 9.8, es decir, se aplica via software una perturbaci´on constante de valor Tp = 2.5 en t = 8[s], la cual desaparece en t = 17[s]. Se observa lo siguiente: La parte transitoria de la respuesta, aunque cercana a la deseada, no es tan exacta como en la figura 9.8 (la l´ınea tenue representa la respuesta transitoria deseada). La velocidad medida en estado estacionario alcanza la velocidad deseada cuando no hay perturbaci´on externa aplicada, es decir, antes de t = 8[s]. La desviaci´on producida por la aparici´on de una perturbaci´on externa es mucho m´as grande que en la figura 9.8 y tarda mucho m´as tiempo en ser compensada. De hecho esta desviaci´on no alcanza a ser compensada antes de que aparezca el nuevo cambio de valor deseado de velocidad en t = 12[s]. Se aprecia lo mismo cuando la perturbaci´on desaparece en t = 17[s]. De acuerdo a la secci´on 5.2.4, esto se debe a que la din´amica de respuesta ante la perturbaci´on tiene una constante de tiempo dominante igual a la constante de tiempo del motor en lazo abierto a1 , la cual es de 2.7[s] como se indica en (9.27). En la figura 9.10 se muestran los resultados obtenidos usando un controlador PI cl´asico cuando se seleccionan las ganancias de acuerdo a:

9.7 Resultados experimentales

! [V]

521

5 4 3 2 1 0

0

ï

2

4

6

8

10

12

14

16

18

20

22

4

6

8

10

12

14

16

18

20

22

0:623 iã [A]

3 2 1 0 -1 -2 -3 0

2

tiempo [s]

Figura 9.9. Control PI cl´ asico de velocidad usando la regla de sinton´ıa en (9.43).

ki l2 l3 = d, d = 1.4 < p1 , kp = kp l1 k l1 = abs(−p1 + d), l2 = abs(−p1 ), l3 = abs(−p1 + a), p1 =

(9.44) 1 = 1.6 0.6231

Este criterio de sinton´ıa es presentado en (5.36) en la secci´on 5.2.4, con τ = 0.6231[s] la constante de tiempo m´as lenta con la que el efecto de la perturbaci´on es rechazada. Esta constante de tiempo se escoge igual a la constante de tiempo deseada en la respuesta ante la referencia de velocidad porque, de acuerdo a (9.38), esta es la constante de tiempo m´as lenta presente en el rechazo a la perturbaci´on en el controlador cuyos resultados experimentales se muestran en la figura 9.8 (f > p1 para los valores num´ericos utilizados). La velocidad deseada ωd es id´entica a la mostrada en (9.41) y se aplica una perturbaci´on id´entica a la usada en la figura 9.8, es decir, se aplica via software una perturbaci´on constante de valor Tp = 2.5 en t = 8[s], la cual desaparece en t = 17[s]. Se observa lo siguiente: La desviaci´on producida por la aparici´on de una perturbaci´on externa es reducida a cero con una rapidez comparable con la mostrada en la figura 9.8. Sin embargo, la parte transitoria de la respuesta ante la referencia deseada, aunque muy r´apida, no corresponde a la respuesta transitoria deseada

522

9 Control de velocidad de un motor de CD

representada por la linea tenue mostrada en la figura 9.10. Tal como se explica en la secci´on 5.2.4, esto se debe el sistema en lazo cerrado tiene dos polos, uno se asigna en s = −p1 pero el otro ocupa un lugar muy a la 1 izquierda de este valor. M´as a´ un, el polo ubicado en s = − 0.6231 = −1.6 = −p1 es muy cercano al cero en s = −d = −1.4 por lo que sus efectos se compensan (se cancelan) considerablemente y s´olo se aprecia la din´amica del polo r´apido colocado muy a la izquierda.

! [V]

3

2.5

2

1.5

1

0.5

0 ï 0 2 0:623

4

6

8

10

12

14

16

18

20

22

tiempo [s]

Figura 9.10. Control PI cl´ asico de velocidad usando la regla de sinton´ıa en (9.44).

En conclusi´on, los resultados experimentales de las figuras 9.9 y 9.10 comprueban las afirmaciones presentadas en la secci´on 5.2.4 sobre el control PI cl´asico de velocidad: no se tiene una regla de sinton´ıa que permita calcular de manera exacta las ganancias proporcional e integral para obtener simult´aneamente las caracter´ısticas deseadas de respuesta transitoria ante una referencia de velocidad deseada y un rechazo de perturbaciones satisfactorio. Esto justifica el inter´es por el uso del controlador PI modificado presentado en (9.33) cuyos resultados experimentales se muestran en la figura 9.8.

9.8.

C´ alculo num´ erico de la integral

Esta operaci´on est´a representada por:

9.9 Programaci´ on del microcontrolador PIC16F877A

y=

Z

523

t

w(s)ds

0

y se puede aproximar num´ericamente mediante: y(k + 1) = y(k) + w(k)∆t

(9.45)

donde y(k) es el valor de la integral calculado en el instante de muestreo presente con y(0) = 0 y y(k + 1) es el valor de la integral en el instante de muestreo pr´oximo inmediato en el futuro. Esto significa que y(k) debe usarse como el valor del t´ermino integral en el instante presente mientras que y(k +1) debe calcularse en el instante presente pero debe ser utilizado como el valor del t´ermino integral s´olo hasta el siguiente instante de muestreo. La expresi´on en (9.45) se obtiene a partir de la interpretaci´on geom´etrica de la integral de w, es decir, el area debajo de la curva definida por w. As´ı, el t´ermino w(k)∆t representa el area que se incrementa en cada instante de muestreo: w(k) y ∆t representan, respectivamente, la altura y la base del rect´angulo que aproxima a dicho incremento de ´area.

9.9.

Programaci´ on del microcontrolador PIC16F877A

Se recomienda consultar la referencia [10] para una explicaci´on precisa de cada una de las instrucciones que aparecen en el siguiente listado. // Programa para comunicacion serial entre PC y proyecto Control // Con el PIC16F877A y el compilador PCWH V3.43 #include<16f877A.h> #include<stdlib.h> #include<math.h> #fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD #use delay(clock=20000000) //Base de tiempo para //retardos(frecuencia del Xtal) //Config.P.Serie #use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N) //direcciones de los puertos y algunos registros #byte OPTION= 0x81 #byte TMR0 = 0x01 #byte PORTA = 0x05 #byte PORTB = 0x06 #byte PORTC = 0x07 #byte PORTD = 0x08 #byte PORTE = 0x09

524

9 Control de velocidad de un motor de CD

#byte ADCON0= 0x1F #byte ADCON1= 0x9F #bit PC0 = 0x07.0 #bit PC1 = 0x07.1 //------------Declaracion de variables------------// int16 inter,cuenta; int8 cuentaH,cuentaL,puerto,AB,AB_1,aux; int8 cont,iastd,cont2,cont3,cont4,t_0; float w,error,iast,wm1,kp,ki,ie,k,a,wd,tiempo,kpp,k3,kib,cte; unsigned int u,i; //------------Rutina de interrupcion------------// #int_rb void rb_isr() { puerto=PORTB; AB=((puerto)&(0x30))>>4; aux=AB^AB_1; if(aux!=0) if(aux!=3) if(((AB_1<<1)^AB)&(0x02)) cuenta--; else cuenta++; AB_1=AB; } //------------Programa principal------------// void main(void) { setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno) set_tris_a(0b11111111); set_tris_b(0b11111111); set_tris_c(0b10000000); //comunicacion serial set_tris_d(0b00000000); set_tris_e(0b11111111); OPTION=0x07; //prescaler timer0, 1:256 PORTC=0; TMR0=0; cuenta=0; AB=0; AB_1=0; enable_interrupts(global); enable_interrupts(int_rb); cont=4; cont2=0; cont3=0; cont4=0; PORTD=127;

9.9 Programaci´ on del microcontrolador PIC16F877A k=2.4691; a=1/2.7; kpp=0.5; k3=4.0; kp=kpp+k3; kib=a+k*kpp; ki=kib*k3; cte=a/k-k3; tiempo=0.0; wm1=0.0; ie=0.0; ADCON1=0x04; ADCON0=0x81; while(cont2<3) { while(cont3<255) { TMR0=0; while(TMR0<255) { } cont3++; } cont2++; } TMR0=0; while(TRUE) { cont++; ADCON0=0x81; //Cambiando a CH0 for(i=0;i<37;i++); //estabilizar capacitor interno t_0=read_adc(); //leer ADC w=0.0196*t_0; if(tiempo<4.0) wd=1.5; else if(tiempo<12.0) wd=2.5; else wd=1.5; // wd=2.5; error=wd-w; /* Controlador */ iast=kp*error+ki*ie+cte*wd; ie=ie+0.002*error; /* ___________________________________________ */ if(iast<-3.3) iast=-3.3; if(iast>3.3)

525

526

9 Control de velocidad de un motor de CD

//

/* //

iast=3.3; iast=0.3; iast=-iast; if(tiempo>8.0) { if(tiempo<17.0) iast=iast+2.5; } iastd=(unsigned int)(36.4286*iast+127); PORTD=iastd; wm1=w; inter=(cuenta)&(0xFF00); cuentaH=0x00; //inter>>8; cuentaL=t_0;//(cuenta)&(0x00FF); putc(0xAA); //reconocimieno al puerto serial putc(cuentaH); //mandando cuenta al puerto serial putc(cuentaL); if(cont==5) { cont=0; cont4++; if(cont4==255) cont4=0; }

*/

//

if(tiempo>8.0) { if(tiempo<17.0) iast=iast-2.5; } iast=-iast; iastd=(unsigned int)(36.4286*iast+127); inter=(cuenta)&(0xFF00); cuentaH=0x00; //inter>>8; cuentaL=(iastd)&(0xFF); putc(0xAA); // reconocimieno al puerto serial putc(cuentaH); //mandando cuenta al puerto serial putc(cuentaL); if(cont==5) { cont=0; cont4++; if(cont4==255) cont4=0; } PC1=1; //inicia espera del timer while(TMR0<40) // 1 cuenta=(4/FXtal)*256 seg, 40=2 ms {

9.11 Preguntas de repaso

} }

9.10.

527

} PC1=0; //termina espera del timer TMR0=0; tiempo=tiempo+0.002; //cierre del while infinito //cierre del main

Resumen del cap´ıtulo

Se ha presentado la manera de controlar la velocidad de un motor de CD. Para esto se ha mostrado la manera de construir de manera pr´actica y experimental dos controladores de velocidad: uno es un PI cl´asico y el otro es un PI modificado. Se ha mencionado cu´ales son los problemas que tiene el controlador PI cl´asico y como resolverlos usando el controlador PI modificado. Tambi´en se ha descrito la manera de construir las interfases necesarias para el correcto funcionamiento del sistema de control y c´omo se puede programar un microcontrolador para realizar la funci´on de un controlador digital. Es importante resaltar el hecho de que en la literatura sobre control de motores el´ectricos es com´ un usar como entrada al par generado por el motor (o bien, la corriente el´ectrica de armadura). Esto se hace a pesar de que es el voltaje aplicado al motor la variable que se puede manipular directamente en el motor mientras que el par es un producto que resulta de la ecuaci´on diferencial que describe al circuito el´ectrico de armadura. En este cap´ıtulo se ha explicado que si se usa un lazo interno de corriente de alta ganancia se puede, efectivamente, usar la corriente de armadura (y, por tanto, el par generado ya que ambas variables son proporcionales) como la variable de entrada. Tambi´en se ha explotado este ejemplo para resaltar el papel que juega un amplificador de potencia en un sistema de control. Un problema importante que se debe resolver antes de dise˜ nar un controlador es el de determinar los valores num´ericos de los par´ametros del modelo de la planta a controlar. En este cap´ıtulo se ha mostrado una manera experimental que es efectiva para resolver este problema en un motor de CD. B´asicamente la idea es explotar el hecho de que el modelo de la planta es de primer orden, modelos cuya respuesta ante una entrada escal´on es bi´en conocida. El m´etodo que se propone es ampliamente recomendable porque con un simple experimento se puede resolver el problema completo.

9.11. 1. 2.

Preguntas de repaso

¿Qu´e es un lazo de corriente y para que se usa? ¿Por qu´e un controlador PI es suficiente para controlar la velocidad de un motor de CD? ¿Por qu´e no usar un controlador PID?

528

3.

4.

5.

6.

7. 8.

9. 10.

9 Control de velocidad de un motor de CD

Se ha dicho que un controlador PI lleva a cero el error en estado estacionario en un sistema de control de velocidad a pesar de la presencia de cualquier perturbaci´on constante ¿Qu´e precauci´on debe tomar en cuenta en la pr´actica para que efectivamente se pueda compensar la presencia de una perturbaci´on constante? ¿Un controlador PI es efectivo para llevar a cero el error en estado estacionario cuando el valor deseado de velocidad no es constante? ¿Y si la perturbaci´on no es constante? Explique. ¿C´omo usar´ıa las ideas expuestas en el presente cap´ıtulo para controlar el voltaje producido por un generador el´ectrico que es impulsado por un motor de CD? ¿C´omo usar´ıa las ideas expuestas en el presente cap´ıtulo para controlar un sistema de control de temperatura y un sistema de control de nivel de l´ıquido? ¿Qu´e controlador usar´ıa para los sistemas de la pregunta anterior? ¿Usar´ıa un controlador PID? ¿Por qu´e? ¿Bajo qu´e condiciones el modelo de velocidad de un motor de CD se convertir´ıa en un integrador? ¿Qu´e controlador usar´ıa bajo estas condiciones para compensar el efecto de una perturbaci´on constante? Justifique su respuesta. Si un controlador PI cl´asico compensa muy lentamente el efecto de una perturaci´on ¿Qu´e ajustes har´ıa en las ganancias del controlador? ¿Cu´ales son los efectos de las ganancias proporcional e integral en un controlador PI cl´asico?

Referencias

1. R. Ortega, A. Lor´ıa, P. J. Nicklasson and H. Sira-Ram´ırez, Passivity-based control of Euler-Lagrange Systems, Springer, London, 1998. 2. V.M Hern´ andez Guzm´ an and R.V. Carrillo Serrano, Global PID position control of PM stepper motors and PM synchronous motors, International Journal of Control, vol. 84, no. 11, pp. 1807-1816, 2011. 3. V.M Hern´ andez Guzm´ an and R. Silva-Ortigoza, PI control plus electric current loops for PM synchronous motors, IEEE Transactions on Control Systems Technology, vol. 19, no. 4, pp. 868-873, 2011. 4. G. Espinosa-P´erez, P. Maya-Ortiz, M. Velasco-Villa and H. Sira-Ram´ırez, Passivity-based control of switched reluctance motors with nonlinear magnetic circuits, IEEE Transactions on Control Systems Technology, Vol. 12, pp. 439–448, 2004. 5. J. Chiasson, Modeling and High-performance control of electric machines, IEEE Press-Wiley Interscience, New Jersey, 2005. 6. Parker Automation, Position systems and Controls, Training and Product Catalog DC-ROM, Compumotor’s Virtual Classroom, 1998. 7. R. Campa, E. Torres, V. Santib´ an ˜ez and R. Vargas, Electromechanical dynamics characterization of a brushless direct-drive servomotor. Proc. VII Mexican Congress on Robotics, COMRob 2005, M´exico, D.F., October 27-28, 2005. 8. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Technology Inc., 2003. 9. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconductor Corporation, 1995. 10. Custom Computer Services Incorporated, CCS C Compiler Reference Manual, 2003.

10 Control de posici´ on de un motor de CD

El problema de control de posici´on tiene muchas e importantes aplicaciones en la industria. Quiz´a una de las aplicaciones m´as claras es la del control de robots manipuladores. En estas tareas, el robot debe ensamblar las piezas que conforman a un componente m´as complejo. Para ello, el robot debe tomar una pieza, llevarla a un lugar especificado y colocarla dentro del espacio correspondiente. Para conseguir esto, se coloca un motor el´ectrico (frecuentemente de CD y con escobillas) en cada una de las partes m´oviles del robot (conocidas como uniones). Entonces se debe controlar la posici´on de cada motor de manera individual para alcanzar un valor de posici´on deseado. La posici´on deseada de cada motor es seleccionada de manera que si cada motor la alcanza, entonces el extremo del robot consigue colocar la pieza por ensamblar en el lugar correcto. Un problema com´ un en esta tarea es la presencia del efecto de la gravedad, la cual aparece como una perturbaci´on de par que debe ser compensada. Una vez que el robot se detiene, esta perturbaci´on de par es constante.

532

10 Control de posici´ on de un motor de CD

Objetivos del cap´ıtulo Construir controladores tipo proporcional-integral-derivativo usando un microcontrolador y una computadora personal. Construir la totalidad de las interfaces electr´ onicas necesarias para el sistema de control completo. Identificar de manera experimental los par´ ametros del modelo de un motor de CD. Identificar las ventajas y las desventajas de los controladores proporcionalintegral-derivativo. Aplicar a una situaci´ on experimental los conceptos de la teor´ıa de control cl´ asico. En este cap´ıtulo se contin´ ua con el control de un motor de CD con escobillas e im´an permanente, pero ahora se considera el control de posici´on. Con este f´ın, se recurre al modelo obtenido en (9.23) despu´es de colocar un amplificador de potencia y un lazo de corriente (v´eanse las secciones 9.2 y 9.3). Este modelo se reescribe a continuaci´on para facilitar su referencia: 1 1 [kI ∗ (s) − Tp (s)] s(s + a) J b nkm a= , k= J J

θ(s) =

(10.1)

donde θ(s) es la posici´on a controlar, I ∗ (s) es la variable de entrada o de control y Tp (s) es una perturbaci´on de par externa.

10.1.

Identificaci´ on

En esta secci´on es de inter´es realizar un experimento que permita conocer los valores de las constantes k y a del modelo en (10.1). A continuaci´on se explica la manera de dise˜ nar dicho experimento. Suponga que no hay ninguna perturbaci´on externa aplicada, es decir Tp (s) = 0, por lo que el modelo (10.1) se reduce a: θ(s) =

k I ∗ (s) s(s + a)

(10.2)

Suponga que i∗ se dise˜ na como un controlador proporcional de posici´on, es decir, de manera que: i∗ = kp (θd − θ)

(10.3)

o, mediante el uso de la transformada de Laplace: I ∗ (s) = kp (θd (s) − θ(s))

(10.4)

10.1 Identificaci´ on

533

donde kp es una constante positiva. El diagrama a bloques que combina las expresiones (10.2) y (10.4) se muestra en la figura 10.1. La funci´on de transferencia de lazo cerrado para este caso es: θ(s) kp k ωn2 = 2 = 2 θd (s) s + as + kp k s + 2ζωn s + ωn2 p a ωn = kp k, ζ = p 2 kp k

òd ( s) +

kp

I ã(s)

k s ( s+a)

(10.5) (10.6)

ò(s)

à

Figura 10.1. Control proporcional de posici´ on.

De acuerdo a (10.5) y lo visto en la secci´on 3.3, si la posici´on deseada θd es un escal´on la respuesta obtenida en el tiempo θ(t) presenta un sobre paso y un tiempo de subida dados como: −√

ζ

π

Mp ( %) = 100 × e 1−ζ2 !# " Ãp 1 − ζ2 1 π − arctan tr = ωd ζ

(10.7) (10.8)

si 0 ≤ ζ < 1, lo cual siempre se puede conseguir usando un valor de kp suficientemente grande. A partir de (10.7) y (10.8) se obtiene: v ³ ´ u u ln2 M p( %) 100 u ³ ´ ζ=t (10.9) p( %) ln2 M100 + π2 !# " Ãp 1 − ζ2 1 (10.10) ωd = π − arctan tr ζ ωd ωn = p (10.11) 1 − ζ2

Esto permite calcular los valores de k y a utilizando el siguiente procedimiento: Construya el controlador proporcional mostrado en (10.4) o en (10.3). Aseg´ urese de que no aparecer´an perturbaciones externas de par sobre el motor. Seleccione un valor conocido y positivo de la ganancia kp . Este

534

10 Control de posici´ on de un motor de CD

valor debe ser suficientemente grande de modo que al aplicar un cambio tipo escal´on en la posici´on deseada θd se obtenga una posici´on del motor θ que presenta un sobre paso claramente apreciable. Grafique respecto al tiempo la posici´on θ que se obtiene como respuesta ante un θd tipo escal´on. Mida los valores obtenidos de Mp ( %) y tr . Utilice las expresiones (10.9)-(10.11) para calcular ζ y ωn . Utilice las expresiones en (10.6) y el valor de kp usado en el experimento para calcular k y a. En la figura 10.2 se presentan los resultados obtenidos al realizar el experimento descrito en el procedimiento anterior. Se utiliza un valor kp = 0.5 y midiendo directamente en la figura 10.2 se encuentran los valores: Mp ( %) = 78.2 %,

tr = 0.09[s]

Estas mediciones se simplifican y al mismo tiempo se hacen m´as exactas si se utiliza un programa de computadora para realizarlas. Con estos valores se sigue el procedimiento indicado previamente para encontrar que: k = 675.4471,

a = 2.8681

(10.12)

Finalmente, es importante aclarar que, al igual que en el modelo de velocidad, no es de inter´es calcular el valor del factor 1/J que aparece como coeficiente de la perturbaci´on Tp (s) en (10.1). La raz´on de esto es que normalmente incluso el valor de Tp no es conocido y a pesar de ello su efecto puede ser compensado.

ò [rad]

M p (%) = 78:2

ï

tr = 0:09

iã [A]

tiempo [s]

Figura 10.2. Identificaci´ on experimental.

10.2 Control sin perturbaciones externas (Tp = 0)

10.2.

535

Control sin perturbaciones externas (Tp = 0)

El dise˜ no de un controlador tiene como objetivo asegurar que en lazo cerrado se consigan las caracter´ısticas deseadas de respuesta transitoria y en estado estacionario. Las caracter´ısticas de respuesta transitoria se refieren al tiempo de subida (rapidez de respuesta) y al sobre paso (amortiguamiento) deseados. Estas caracter´ısticas se satisfacen mediante la ubicaci´on conveniente de los polos de lazo cerrado. Por otro lado, las caracter´ısticas de respuesta en estado estacionario se consiguen al asegurar que cuando el tiempo crece el valor de la posici´on θ alcanza la posici´on deseada θd . El controlador es el dispositivo que se encarga de que se satisfagan las caracter´ısticas de respuesta transitoria y en estado estacionario del sistema en lazo cerrado. Suponga que la posici´on deseada es una constante o un escal´on, es decir θd = A es una constante. Dado que la planta en (10.1) contiene un polo en s = 0 entonces es de tipo 1 lo que asegura que θ = θd = A en estado estacionario, si se usa un controlador proporcional de posici´on y si no hay perturbaciones externas de par, es decir, si Tp = 0. Esto significa que el requisito de alcanzar la posici´on deseada es satisfecho de manera natural por la planta (el motor de CD). Por tanto, el dise˜ no del controlador debe realizarse simplemente buscando que se satisfagan las caracter´ısticas de respuesta transitoria, es decir, colocando adecuadamente los polos de lazo cerrado. As´ı, en el caso de un motor de CD hay dos controladores sencillos que permiten ubicar adecuadamente los polos de lazo cerrado: i) control proporcional con realimentaci´on de velocidad e ii) control con una red de adelanto. 10.2.1.

Control proporcional con realimentaci´ on de velocidad

En este caso, el controlador est´a dado como: i∗ (t) = kp (θd − θ) − kv θ˙

(10.13)

donde kp y kv son constantes positivas. Usando la transformada de Laplace se obtiene: I ∗ (s) = kp (θd (s) − θ(s)) − kv sθ(s)

(10.14)

El diagrama de bloques que resulta de combinar (10.14) y (10.2) es mostrado en la figura 10.3. La funci´on de transferencia de lazo cerrado est´a dada como: kp k ωn2 θ(s) = 2 = 2 θd (s) s + (a + kv k)s + kp k s + 2ζωn s + ωn2 p a + kv k ωn = kp k, ζ = p 2 kp k

(10.15)

Por tanto, siempre se pueden hallar valores positivos de kv y kp que consigan los valores deseados de ζ y ωn . Esto significa que siempre se pueden ubicar

536

10 Control de posici´ on de un motor de CD

òd ( s)

+

kp

I ã(s)

+

k s ( s+a)

ò(s)

à

à

kv s

Figura 10.3. Control proporcional de posici´ on con realimentaci´ on de velocidad.

los polos de lazo cerrado (s + ζωn + jωd )(s + ζωn − jωd ) = s2 + 2ζωn s + ωn2 , en cualquier punto sobre el semiplano complejo izquierdo, mediante una selecci´on adecuada de kp y kv . Por ejemplo, considere los valores en (10.12). Suponga que se desea que la respuesta ante un escal´on tenga el sobre paso y el tiempo de subida que se indican a continuaci´on: Mp ( %) = 20 %,

tr = 0.068[s]

(10.16)

Con estos datos y usando (10.9)-(10.11) se encuentra que los polos de lazo cerrado deseados est´an ubicados en: s = −ζωn ± jωd = −15.4009 ± j30.0623 con ζ = 0.4559 y ωn = 33.7776. Finalmente, usando estos valores, (10.12), (10.15) y (10.16) se encuentra que las siguientes ganancias consiguen el tiempo de subida y el sobre paso deseados: kp = 1.6891,

kv = 0.0414

(10.17)

En la figura 10.4 se muestran los resultados experimentales obtenidos con el controlador (10.13) y las ganancias en (10.17) cuando θd es un escal´on unitario. El sobre paso y el tiempo de subida medidos en dicho experimento son: Mp ( %) = 16 %,

tr = 0.068[s]

los cuales, puede observarse, son cercanos a los valores de dise˜ no especificados en (10.16). Es conveniente decir que el utilizar un sensor especializado para medir velocidad implica una serie de adaptaciones mec´anicas que complican mucho y elevan el costo de la construcci´on del sistema de control. Por esta raz´on, en la pr´actica es com´ un estimar la velocidad a partir de la posici´on medida. En los experimentos de la figura 10.4, la velocidad θ˙ se ha estimado mediante la diferenciaci´on num´erica de la posici´on medida (v´ease la secci´on 10.5). Sin embargo, este proceso tiene el efecto de un filtro pasa altas: las se˜ nales de alta frecuencia (ruido) son amplificadas de manera importante por el controlador

10.2 Control sin perturbaciones externas (Tp = 0)

537

(realimentaci´on de velocidad). La presencia de ruido puede resultar en el deterioro del desempe˜ no del sistema de control pues puede producir vibraciones en el motor a´ un cuando ya se encuentre en reposo. Por tanto, siempre se debe procurar que la ganancia kv utilizada sea peque˜ na. En la siguiente secci´on se utiliza un controlador que no necesita ni la medici´on de la velocidad ni la diferenciaci´on de la salida para conseguir los polos deseados de lazo cerrado.

ò [rad]

Mp (%) = 16

ï

tr = 0:068

iã [A]

tiempo [s] Figura 10.4. Control proporcional de posici´ on con realimentaci´ on de velocidad. Resultados experimentales (θd = 1.5[rad]).

10.2.2.

Control con un compensador de adelanto

En este caso el controlador se especifica mediante su funci´on de transferencia: s+d I ∗ (s) =γ E(s) s+c

(10.18)

donde E(s) es la transformada de Laplace de la diferencia e = θd −θ, mientras que γ, d y c son constantes positivas por calcular que deben satisfacer d < c. A continuaci´on se muestra la manera de obtener una expresi´on que indica como construir el controlador en (10.18). Mediante divisi´on directa de la fracci´on en (10.18) se obtiene:

538

10 Control de posici´ on de un motor de CD

I ∗ (s) = γ [E(s) + V (s)] d−c V (s) = E(s) s+c

(10.19)

Suponiendo condiciones iniciales cero, se utiliza la transformada inversa de Laplace en las dos expresiones dadas en (10.19) para obtener: i∗ = γ[e + v] v˙ = −cv + (d − c)e

(10.20) (10.21)

donde v es la transformada inversa de Laplace de V (s). Entonces, conociendo la posici´on deseada θd y mediante la medici´on de θ se puede calcular la se˜ nal e; utilizando esta se˜ nal como variable conocida se resuelve num´ericamente la ecuaci´on diferencial en (10.21), con v(0) = 0, para calcular v y luego usar (10.20) para calcular i∗ . En la secci´on 10.5 se explica como realizar este procedimiento de manera num´erica. Ahora se considerar´a que el controlador est´a dado como en (10.18). En la figura 10.5 se muestra el diagrama de bloques que resulta de conectar (10.18) y (10.2). N´otese que la funci´on de transferencia de lazo abierto: G(s)H(s) =

γk(s + d) s(s + c)(s + a)

(10.22)

tiene tres polos, por lo que la funci´on de transferencia de lazo cerrado tambi´en tendr´a tres polos adem´as de un cero en s = −d. Se deja como ejercicio que el lector encuentre la funci´on de transferencia de lazo cerrado y que verifique que tiene la siguiente forma: θ(s) γk(s + d) = θd (s) (s − p1 )(s − p2 )(s − p3 )

òd ( s)

+

í s+d s+c

I ã(s)

k s ( s+a)

(10.23)

ò(s)

à

Figura 10.5. Control de posici´ on con un compensador de adelanto.

Por tanto, en este caso, adem´as de ubicar los polos complejos conjugados, p1 y p2 , en los lugares especificados tambi´en se deber´a asegurar que el tercer polo, en p3 , y el cero en s = −d no afectar´an de manera importante la respuesta transitoria. Tal como se muestra en la secci´on 5.2.3, esto se consigue seleccionando:

10.2 Control sin perturbaciones externas (Tp = 0)

d = a,

c = 2ζωn ,

γ=

539

ωn2 k

Usando esta regla de sinton´ıa y los par´ametros en (10.12) se encuentra que el uso de las ganancias: c = 30.8018,

γ = 1.6891,

d = 2.8681

en el controlador dado en (10.18), o equivalentemente en (10.20), (10.21), ubica dos polos de lazo cerrado en: s = −ζωn ± jωd = −15.4009 ± j30.0623 As´ı, se consigue especificar por dise˜ no un tiempo de subida de 0.068[s] y un sobre paso del 20 %. En la figura 10.6 se muestran los resultados experimentales obtenidos cuando θd es un escal´on de 1.5[rad]. Las caracter´ısticas de respuesta transitoria medidas en esta figura son Mp ( %) = 9.6 %, tr = 0.068[s]. N´otese el parecido de estos valores con los valores de dise˜ no: tr = 0.068[s] y Mp ( %) = 20 %. Finalmente, es importante subrayar que el uso de la red de adelanto (figura 10.6) tambi´en resulta en un peque˜ no error de estado estacionario. El lector puede preguntarse ¿Qu´e se debe usar como valor final para calcular el sobre paso? ¿El valor deseado de 1.5[rad] o el valor final de 1.4[rad]? El valor de Mp ( %) = 9.6 % se obtuvo usando 1.5[rad] como valor final. N´otese que el sobre paso puede ser un poco mas cercano al valor deseado del 20 % si se mide usando como valor final 1.4[rad]. Esta decisi´on se deja a criterio del lector. Por otro lado, el tiempo de subida es exactamente el valor deseado si se usa como valor final el valor deseado de 1.5[rad]. Estos problemas son debidos a la existencia de un error en estado estacionario que es mucho m´as apreciable que con el controlador proporcional con realimentaci´on de velocidad. Este error en estado estacionario es debido a la presencia de fricci´on no lineal: est´atica y de Coulomb (v´ease (2.21)).

540

10 Control de posici´ on de un motor de CD

ò [rad]

M p (%) = 9:6

ï

tr = 0:068

iã [A]

tiempo [s] Figura 10.6. Control de posici´ on con un compensador de adelanto. Resultados experimentales (θd = 1.5[rad]).

10.3.

Control bajo el efecto de perturbaciones externas

En esta secci´on se considera la presencia de una perturbaci´on externa constante, es decir: Tp = td ,

Tp (s) =

td s

(10.24)

donde td es una constante diferente de cero. Esto significa que se considera la posibilidad de que alg´ un agente externo al motor aplique un par sobre su flecha. Si se piensa que el motor podr´ıa estar actuando sobre una antena parab´olica, entonces el agente externo que produce la perturbaci´on de par bien podr´ıa ser el viento que golpea a la antena. Por otro lado, se considera que la perturbaci´on es constante porque esto representa el caso extremo en que el viento golpea a la antena de manera agresiva, con su m´axima capacidad de desviaci´on. Adem´as, la presencia de una perturbaci´on aproximadamente constante durante intervalos de tiempo que pueden ser cortos o largos es una situaci´on muy com´ un en mecanismos. Es importante mencionar qu´e es lo que se espera de un buen dise˜ no cuando aparece una perturbaci´on externa: el efecto de la perturbaci´on sobre la salida debe ser llevado a cero tan r´apido como sea posible. En este tipo de aplicaciones es com´ un utilizar un controlador PID debido a que su parte integral puede llevar a cero las desviaciones debidas a las

10.3 Control bajo el efecto de perturbaciones externas

541

perturbaciones constantes. Sin embargo, tal como se menciona en la secci´on 5.2.5, no se cuenta con una regla de sinton´ıa que permita calcular de manea exacta las ganancias de un controlador PID que consigan simult´aneamente las caracter´ısticas deseadas de respuesta transitoria (tiempo de subida y sobre paso) y un rechazo satisfactorio de los efectos de la perturbaci´on externa. Por esta raz´on, en las siguientes dos secciones se presentan dos controladores que son dise˜ nados espec´ıficamente para satisfacer simult´aneamente estas especificaciones. 10.3.1.

Un controlador PID modificado

Primero se usa la transformada inversa de Laplace para obtener, a partir de (10.1), la siguiente ecuaci´on diferencial: 1 θ¨ + aθ˙ = ki∗ − Tp J

(10.25)

A continuaci´on se muestra que el siguiente controlador permite obtener una regla de sinton´ıa para calcular de manera exacta sus ganancias de modo que se consiguen simult´aneamente las caracter´ısticas deseadas de respuesta transitoria (tiempo de subida y sobre paso) y un rechazo satisfactorio de los efectos de la perturbaci´on externa: Z t ˙ (θd − θ(r))dr − k1 (θ˙ − θ(0)) i∗ = κp (θd − θ) − κd θ˙ + k1 κp k 0

−k1 (a + κd k)(θ − θ(0))

(10.26)

donde θd es una constante que representa el valor deseado de posici´on mien˙ tras que θ(0) y θ(0) representan los valores iniciales de posici´on y velocidad, respectivamente. Utilizando el hecho de que: Z t ¨ ˙θ − θ(0) ˙ θ(r)dr = 0 Z t ˙ θ(r)dr θ − θ(0) = 0

el controlador anterior se puede escribir como: Z t Z t ¨ θ(r)dr (θd − θ(r))dr − k1 i∗ = κp (θd − θ) − κd θ˙ + k1 κp k 0 0 Z t ˙ θ(r)dr −k1 (a + κd k) 0

= κp (θd − θ) − κd θ˙ − k1

Z th 0

i ¨ + (a + κd k)θ(r) ˙ θ(r) + κp k(θ(r) − θd ) dr

Sustituyendo esto en (10.25) se obtiene:

542

10 Control de posici´ on de un motor de CD

θ¨ + (a + κd k)θ˙ + κp k(θ − θd ) Z th i 1 ¨ + (a + κd k)θ(r) ˙ θ(r) + κp k(θ(r) − θd ) dr = − Tp +k1 k J 0

Esto se puede escribir como:

1 ξ˙ + k1 kξ = − Tp J si se define: ξ=

Z th 0

(10.27)

i ¨ + (a + κd k)θ(r) ˙ θ(r) + κp k(θ(r) − θd ) dr

Aplicando la transformada de Laplace a (10.27), considerando las condiciones iniciales iguales a cero, se obtiene: ξ(s) =

− J1 Tp (s) s + k1 k

sξ(s) =

− J1 s Tp (s) s + k1 k

o tambi´en:

Si la perturbaci´on es una constante, es decir Tp (s) = usar el teorema del valor final para encontrar:

(10.28) td s ,

entonces se puede

˙ = l´ım s[sξ(s)] l´ım ξ(t)

t→∞

s→0

= l´ım s s→0

− J1 s td =0 s + k1 k s

˙ = As´ı que si k1 k > 0, el filtro en (10.28) es estable y se asegura que l´ımt→∞ ξ(t) ˙ 0. M´as a´ un, la rapidez con que ξ(t) se aproxima a cero es mayor conforme ˙ = 0 implica que: k1 k > 0 es mayor. N´otese que l´ımt→∞ ξ(t) Z th i d ¨ + (a + κd k)θ(r) ˙ θ(r) + κp k(θ(r) − θd ) dr dt 0 = θ¨ + (a + κd k)θ˙ + κp k(θ − θd ) → 0 tambi´en tiende a cero. Esto significa que el efecto de la perturbaci´on constante desaparece al crecer el tiempo y s´olo queda la ecuaci´on diferencial θ¨ + (a + κd k)θ˙ + κp kθ = κp kθd , la cual es estable si κp > 0 y κd > 0, tiene ganancia unitaria en estado estacionario y las ganancias κp y κd pueden ser usadas para asignar arbitrariamente los dos polos de dicho sistema. Todo esto significa que: ˙ = 0 para todo t ≥ 0), la respuesta Si no hay perturbaci´on (Tp = 0 y ξ(t) en posici´on es como la de un sistema de segundo orden con un tiempo de subida y un sobre paso que pueden ser seleccionados a voluntad escogiendo convenientemente los valores de κp y κd . La posici´on θ alcanza la posici´on deseada θd (constante) en estado estacionario.

10.3 Control bajo el efecto de perturbaciones externas

543

Si aparece una perturbaci´on constante (Tp = td 6= 0), la desviaci´on producida por la perturbaci´on desaparece al crecer el tiempo. M´as a´ un, si se escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es mayor), entonces la desviaci´on producida por la perturbaci´on desaparece m´as r´apido. Si una vez que la desviaci´on debida a la perturbaci´on es llevada a cero (cuando θ = θd ) se ordena un cambio en el valor constante de θd (se ordena un cambio de posici´on deseada θd estando presente la perturbaci´on Tp ), entonces la posici´on responde como si la mencionada perturbaci´on constante Tp no existiera, es decir, como en el punto anterior: con el tiempo de subida y el sobre paso deseados y la posici´on θ alcanza la velocidad deseada θd en estado estacionario. Debido a que en control cl´asico siempre se supone que todas las condiciones ˙ iniciales son cero, entonces se puede suponer que θ(0) = 0, θ(0) = 0 y el controlador en (10.26) se escribe como: Z

t

(θd − θ(r))dr − k1 θ˙ − k1 (a + κd k)θ Z t ˙ (θd − θ(r))dr = [κp + k1 (a + κd k)](θd − θ) − (κd + k1 )θ + k1 κp k

i = κp (θd − θ) − κd θ˙ + k1 κp k ∗

0

0

−k1 (a + κd k)θd

= KP (θd − θ) − KD θ˙ + KI KP = κp + k1 (a + κd k),

Z

0

t

(θd − θ(r))dr − k1 (a + kd k)θd

KD = κd + k1 ,

(10.29)

KI = k1 κp k

que constituye un simple controlador PID con un t´ermino constante de prealimentaci´on. N´otese que el t´ermino derivativo no contiene la derivada de la posici´on deseada. Finalmente, la regla de sinton´ıa del controlador en (10.29) puede resumirse del siguiente modo: κp > 0 y κd > 0 se eligen de modo que queden fijados el tiempo de subida y el sobre paso deseados mediante la adecuada ubicaci´on de las ra´ıces del polinomio caracter´ıstico s2 + (a + κd k)s + κp k, es decir: a + κd k = 2ζωn ,

κp k = ωn2

(10.30)

k1 > 0 se elige grande para reducir r´apidamente a cero la desviaci´on debida a la perturbaci´on. Esto puede hacerse al tanteo o puede calcularse recordando que k11k es la constante de tiempo del filtro en (10.28), el cual es el responsable de eliminar la desviaci´on producida por la perturbaci´on. Otra manera (m´as conocida) de dise˜ nar un controlador PID con las mismas ventajas que el que se acaba de presentar es usando el concepto de controladores con dos grados de libertad. Esto es lo que se muestra en la siguiente secci´on.

544

10 Control de posici´ on de un motor de CD

10.3.2.

Un controlador con dos grados de libertad

A continuaci´on se explica la manera de dise˜ nar un controlador de dos grados de libertad para el motor de CD que nos ocupa en este cap´ıtulo. En la figura 10.7 se muestra el diagrama de bloques de un controlador de dos grados de libertad. Gp (s) representa la planta mientras que el controlador est´a compuesto por dos partes: Gc1 (s) y Gc2 (s). En el ejemplo 4.5 de la secci´on 4.1 se muestra que la salida del sistema en lazo cerrado se puede calcular como: θ(s) = G1 (s)θd (s) + G2 (s)D(s) donde: Gc1 (s)Gp (s) 1 + (Gc1 (s) + Gc2 (s))Gp (s) Gp (s) G2 (s) = 1 + (Gc1 (s) + Gc2 (s))Gp (s)

G1 (s) =

(10.31)

son las funciones de transferencia: θ(s) , θd (s) θ(s) G2 (s) = , D(s)

cuando D(s) = 0

G1 (s) =

cuando θd (s) = 0

La raz´on por la cual este esquema recibe el nombre de controlador de dos grados de libertad es que las dos funciones de transferencia definidas en (10.31) pueden ser sintonizadas independientemente una de la otra utilizando para D(s) +

òd ( s) +

G c1 (s) à

I ã(s) + à

+

G p ( s)

ò(s)

G c2 (s)

Figura 10.7. Sistema en lazo cerrado usando un controlador con dos grados de libertad.

ello, como variables independientes (o grados de libertad), a las dos partes del controlador Gc1 (s) y Gc2 (s). Se desea entonces dise˜ nar Gc1 (s) y Gc2 (s) de manera que: i) se puedan especificar a voluntad las caracter´ısticas de respuesta

10.3 Control bajo el efecto de perturbaciones externas

545

transitoria y en estado estacionario ante una referencia deseada, θd (s), e ii) el efecto de una perturbaci´on externa, D(s), sea reducido a cero tan r´apido como se desee. Dado que la planta que interesa en este cap´ıtulo es un motor de CD suponga que: Gp (s) =

k s(s + a)

(10.32)

El dise˜ no del controlador con dos grados de libertad que se presenta aqu´ı se fundamenta en considerar que Gc1 (s) y Gc2 (s) son controladores PID [5], cap. 10, y por tanto que se puede escribir: kd1 s2 + kp1 s + ki1 s kd2 s2 + kp2 s + ki2 Gc2 (s) = s Gc1 (s) =

kd s2 + kp s + ki s kd (s + α)(s + β) kd (s2 + (α + β)s + αβ) = = s s kd = kd1 + kd2 , kp = kp1 + kp2 , ki = ki1 + ki2

Gc (s) = Gc1 (s) + Gc2 (s) =

(10.33)

para algunas constantes α y β. Entonces: θ(s) Gc1 (s)Gp (s) = θd (s) 1 + Gc (s)Gp (s) Sustituyendo (10.32) y (10.33) en la expresi´on anterior se tiene: θ(s) = θd (s) 1+

k Gc1 (s) s(s+a) kd (s2 +(α+β)s+αβ) k s s(s+a)

skGc1 (s) + a) + kd k(s2 + (α + β)s + αβ) skGc1 (s) = 3 s + (a + kd k)s2 + kd k(α + β)s + kd kαβ =

s2 (s

(10.34)

Suponga que se desea que la respuesta transitoria sea la de dos polos complejos conjugados dominantes dados como s = −σ + jωd y s = −σ − jωd , σ > 0, ωd > 0. Entonces el polinomio caracter´ıstico debe satisfacer: s3 + (a + kd k)s2 + kd k(α + β)s + kd kαβ = (s + σ + jωd )(s + σ − jωd )(s + f )

= s3 + (2σ + f )s2 + (σ 2 + ωd2 + 2σf )s + (σ 2 + ωd2 )f

de donde se obtienen las siguientes relaciones:

546

10 Control de posici´ on de un motor de CD

a + kd k = 2σ + f kd k(α + β) = σ 2 + ωd2 + 2σf

(10.35) (10.36)

kd kαβ = (σ 2 + ωd2 )f

(10.37)

Con el fin de que el polo en s = −f , f > 0, no tenga efecto en la respuesta transitoria de (10.34) se propone una funci´on de transferencia como la siguiente: θ(s) ρ(s + f ) = 3 θd (s) s + (2σ + f )s2 + (σ 2 + ωd2 + 2σf )s + (σ 2 + ωd2 )f

(10.38)

donde, con el fin de conseguir una funci´on de transferencia de ganancia unitaria en estado estacionario, se debe cumplir ρf = (σ 2 + ωd2 )f es decir: ρ = σ 2 + ωd2

(10.39)

Por otro lado, con el fin de conseguir que las funciones de transferencia en (10.34) y (10.38) sean iguales se debe imponer la siguiente condici´on: skGc1 (s) = ρ(s + f ) de donde se obtiene: ρs + ρf 1 = kp1 + ki1 sk s (σ 2 + ωd2 ) (σ 2 + ωd2 )f = , ki1 = k k

Gc1 (s) = kp1

(10.40)

Esto significa que Gc1 (s) debe ser un controlador PI. El controlador Gc2 (s) se obtiene despejando de (10.33): Gc2 (s) = Gc (s) − Gc1 (s)

1 (σ 2 + ωd2 ) (σ 2 + ωd2 )f 1 − − s k k s 2σ + f − a 2σf , kd2 = kd = (10.41) = k k

= kd s + kd (α + β) + kd αβ = kd2 s + kp2 ,

kp2

donde se han usado (10.35), (10.36) y (10.37). Esto significa que Gc2 (s) es un controlador PD. Por tanto, de acuerdo a la figura 10.7, el controlador est´a dado como: I ∗ (s) = Gc1 (s)(θd (s) − θ(s)) − Gc2 (s)θ(s) 1 = (kp1 + ki1 )(θd (s) − θ(s)) − (kd2 s + kp2 )θ(s) s 1 = (kp1 + kp2 )(θd (s) − θ(s)) − kd2 sθ(s) + ki1 (θd (s) − θ(s)) − kp2 θd (s) s

10.3 Control bajo el efecto de perturbaciones externas

547

Aplicando la transformada inversa de Laplace se obtiene: Z t ∗ ˙ (θd − θ(r))dr − kp2 θd (10.42) i = (kp1 + kp2 )(θd − θ) − kd2 θ + ki1 0

Tal como se ha hecho hasta ahora, se desea que ante una referencia escal´on haya una respuesta transitoria con 0.068[s] como tiempo de subida y 20 % de sobre paso. En las secciones anteriores se ha visto que los polos de lazo cerrado correspondientes est´an dados como s = −σ ± jωd donde: σ = 15.4009,

ωd = 30.0623

(10.43)

Por otro lado, el valor dado a f no afecta a la parte de la respuesta transitoria ante una referencia deseada porque su efecto es cancelado (v´ease (10.38)). ¿Cual es el efecto de f entonces y como seleccionarla? La clave de esta respuesta est´a centrada en dos partes: Primero se tiene el hecho de que, de acuerdo a (10.35), una vez que se fijan σ (polos deseados) y a, k (modelo de la planta) la ganancia derivativa kd es mayor si f es mayor. De acuerdo a lo mencionado en las secciones precedentes, ganancias derivativas grandes no son deseables por el ruido que eso introduce. As´ı que un criterio es seleccionar f tan peque˜ na como se pueda. Segundo, la funci´on de transferencia ante una perturbaci´on dada en (10.31) se calcula como: ks θ(s) = D(s) (s + σ + jωd )(s + σ − jωd )(s + f ) N´otese que en esta funci´on de transferencia el polo en s = −f no puede ser cancelado de ninguna manera por lo que su efecto ser´a muy importante en la parte transitoria de la respuesta ante una perturbaci´on externa. As´ı que mientras menor sea el valor de f m´as lenta ser´a la rapidez con la que el efecto de la perturbaci´on ser´a eliminado, lo cual puede ser una gran desventaja. En este sentido, n´otese que puede usarse el teorema del valor final para comprobar que el cero que esta funci´on de transferencia tiene en s = 0 asegura que el efecto en estado estacionario de una perturbaci´on constante sera reducido a cero. As´ı que la selecci´on de f debe cumplir un compromiso entre la rapidez con la que las perturbaciones son rechazadas y el ruido que pueda introducirse. Prop´ongase: f = 40 (10.44) Finalmente, usando los par´ametros de la planta: k = 675.4471,

a = 2.8681

as´ı como (10.40), (10.41), (10.43), (10.44) se encuentra:

548

10 Control de posici´ on de un motor de CD

Gc1 (s) = 1.6891 + 67.5659

1 s

Gc2 (s) = 0.1006s + 1.8241

(10.45) (10.46)

De acuerdo a (10.40), (10.41) y (10.42), el controlador est´a dado como: Z t ∗ ˙ (θd − θ(r))dr − 1.8241θd i = 3.5132(θd − θ) − 0.1006θ + 67.5659 0

(10.47)

Finalmente, una u ´ltima observaci´on. El lector puede comprobar que el controlador en (10.42) es id´entico al controlador en (10.29) si se respeta (10.30) y se establece que: k1 =

f , k

σ = ζωn ,

σ 2 + ωd2 = ωn2

Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados en las secciones 10.3.1 o 10.3.2 para obtener este controlador es el que prefiere. En la figura 10.8 se presentan resultados experimentales obtenidos cuando se usa el controlador (10.47). Las caracter´ısticas de respuesta transitoria medidas ante la referencia constante son tr = 0.068[s] y Mp ( %) = 19.3 %, los cuales son casi id´enticos a los deseados (tr = 0.068[s] y Mp ( %) = 20 %). Tambi´en se considera la presencia de una perturbaci´on constante D(s) = −Tp (s)/(Jk) = −0.5/s. Esta perturbaci´on ha sido introducida por software como una se˜ nal que se suma a i∗ , dada en (10.47), a partir de t = 0.7[s]. N´otese que el error en estado estacionario ante una referencia constante es cero, a pesar de la presencia de fricci´on no lineal (est´atica y de Coulomb) que se describi´o en las secciones anteriores. Por otro lado, se puede observar la excelente respuesta del sistema de control ante la perturbaci´on. Tambi´en es interesante observar que esto se consigue gracias a que se usa un valor muy grande de f = 40, lo cual, a su vez, es posible gracias al bajo contenido de ruido en la medici´on de la posici´on θ (se usa un encoder para medir la posici´on). En la figura 10.9 se muestran otros resultados experimentales obtenidos con el controlador (10.47). En este caso se usa la siguiente posici´on deseada que tiene la forma de tres escalones sucesivos:   1.5, 0 ≤ t < 1.5 (10.48) θd = 3, 1.5 ≤ t < 4  1.5, t≥4 Se considera la presencia de la siguiente perturbaci´on externa:  0, 0 ≤ t < 0.7     0.5, 0.7 ≤ t < 2.55    0, 2.55 ≤ t < 3.25 Tp = 0.5, 3.25 ≤ t < 5.1     0, 5.1 ≤ t < 5.8    0.5, t ≥ 5.8

(10.49)

10.3 Control bajo el efecto de perturbaciones externas

549

Aparte de la posici´on medida experimentalmente (l´ınea continua) en la figura 10.9 tambi´en se muestra (linea interrumpida) la respuesta obtenida en simulaci´on con el sistema sin perturbaciones θ¨ + 30.8018θ˙ + 1140.9θ = 1140.9θd el cual responde de acuerdo a las especificaciones de dise˜ no: tr = 0.068[s] y Mp ( %) = 20 %, pues sus polos est´an ubicados en s = −15.4009 ± j30.0623. Se puede apreciar que ambas respuestas son casi id´enticas porque casi no se pueden distinguir en la figura 10.9. Esto es una muestra clara de que se han conseguido las caracter´ısticas deseadas de respuesta transitoria y en estado estacionario ante una referencia deseada. M´as a´ un, n´otese que los cambios de referencia en t = 1.5[s] y t = 4[s] ocurren cuando la perturbaci´on Tp est´a presente y a pesar de ello a´ un se satisfacen las caracter´ısticas de respuesta transitoria deseadas. Adem´as, las desviaciones debidas a la perturbaci´on son llevadas a cero r´apidamente. Todo esto es evidencia experimental de que las observaciones hechas justo antes de (10.29) son correctas.

ò [rad]

M p (%) = 19:3

ï

tr = 0:068

iã [A]

tiempo [s] Figura 10.8. Control de posici´ on usando un controlador con dos grados de libertad. Resultados experimentales (θd = 1.5[rad]).

10.3.3.

Un controlador PID cl´ asico

Con el fin de apreciar mejor las ventajas del controlador dise˜ nado en las secciones 10.3.1 y 10.3.2 a continuaci´on se presentan, en las figuras 10.10 y 10.11, algunos resultados experimentales obtenidos al usar el controlador PID

550

10 Control de posici´ on de un motor de CD

ò [rad]

iã [A]

tiempo [s] Figura 10.9. Control de posici´ on con un controlador con dos grados de libertad. Resultados experimentales.

cl´asico: d i = kp (θd − θ) + kd (θd − θ) + ki dt ∗

Z

t

0

(θd − θ(r))dr

Se usa la misma referencia deseada de posici´on y la misma perturbaci´on usadas en la figura 10.9, es decir, las definidas en (10.48) y (10.49). Aparte de la posici´on medida experimentalmente (l´ınea continua), tambi´en se muestra (linea interrumpida) la respuesta obtenida en simulaci´on con el sistema sin perturbaciones θ¨ + 30.8018θ˙ + 1140.9θ = 1140.9θd el cual responde de acuerdo a las especificaciones de dise˜ no: tr = 0.068[s] y Mp ( %) = 20 %, pues sus polos est´an ubicados en s = −15.4009 ± j30.0623. El dise˜ no del controlador PID cl´asico se realiza de acuerdo a la expuesto en la secci´on 5.2.5, es decir, usando los par´ametros de la planta: k = 675.4471,

a = 2.8681

los polos deseados ubicados en: s = −15.4009 ± j30.0623 para conseguir un tiempo de subida de 0.068[s] y un sobre paso de 20 %, el par´ametro de dise˜ no α = 0.01, y (5.42), (5.44) se obtienen las ganancias:

10.3 Control bajo el efecto de perturbaciones externas

kd = 0.0414,

kp = 1.6896,

551

ki = 0.0169

Es importante subrayar que de acuerdo al m´etodo de dise˜ no presentado en la secci´on 5.2.5, el valor α = 0.01 se elige muy cercano a cero para que la respuesta transitoria ante la referencia de posici´on tenga las caracter´ısticas deseadas lo cual, puede observarse en la figura 10.10, es conseguido para el primer cambio tipo escal´on de la referencia (antes de que aparezca alguna perturbaci´on externa). Sin embargo, los problemas aparecen una vez que se aplica la perturbaci´on externa: El uso de un valor peque˜ no para α resulta en una ganancia integral muy peque˜ na lo cual produce un ajuste integral tan lento que el efecto de la perturbaci´on no es compensando en la figura 10.10. Es m´as, aunque en t ≈ 3[s] y t ≈ 5.5[s] la posici´on medida alcanza a la posici´on deseada, esto es debido a que la perturbaci´on externa desaparece en esos instantes de tiempo. Tal como se explica en la secci´on 5.2.5, se pueden conseguir ganancias integrales m´as grandes si se elige un valor grande para α. Por esta raz´on se propone α = 10, lo cual resulta en las siguientes ganancias: kd = 0.0414,

kp = 2.1027,

ki = 16.8915

En la figura 10.11 se muestran los resultados experimentales correspondientes. N´otese que la desviaci´on debida a la perturbaci´on es compensada r´apidamente. Sin embargo, esto es conseguido al precio de producir una respuesta ante la referencia deseada con caracter´ısticas muy diferentes a las dise˜ nadas. Esta es la principal desventaja del control PID cl´asico: no se pueden calcular de manera exacta las ganancias que permitan conseguir simult´aneamente las caracter´ısticas deseadas de respuesta transitoria ante una referencia de entrada y un rechazo satisfactorio de las perturbaciones externas. Por el contrario, este problema es resuelto con el controlador dise˜ nado en las secciones 10.3.1 y 10.3.2 y cuyos resultados experimentales se muestran en la figura 10.9.

552

10 Control de posici´ on de un motor de CD

ò [rad]

iã [A]

tiempo [s] Figura 10.10. Control de posici´ on con un controlador PID cl´ asico (α = 0.01). Resultados experimentales.

ò [rad]

iã [A]

tiempo [s] Figura 10.11. Control de posici´ on con un controlador PID cl´ asico (α = 10). Resultados experimentales.

10.4 Seguimiento de trayectorias

10.4.

553

Seguimiento de trayectorias

En esta secci´on se dise˜ na un controlador que permite que la posici´on del motor alcance una posici´on deseada que es variable en el tiempo, es decir, θd (t) ya no es constante sino que cambia con el tiempo. Se supone que no existe ninguna perturbaci´on externa, es decir que Tp (s) = 0, y que se puede calcular la primera y la segunda derivada de θd (t), es decir θ˙d (t) y θ¨d (t) se conocen y son continuas. Consid´erese el modelo (10.1) una vez que se le aplica la transformada inversa de Laplace, con Tp (s) = 0, es decir: θ¨ + aθ˙ = ki∗

(10.50)

Sea el siguiente controlador, calculado a partir del conocimiento de θd , θ˙d y θ¨d : µ · ¶ ¸ 1 d2 θd (t) dθ(t) dθ(t) dθd (t) ∗ i (t) = − kp (θ(t) − θd (t)) + a − kd − k dt2 dt dt dt (10.51) representa la velocidad medida del motor. Sustituyendo N´otese que dθ(t) dt (10.51) en (10.50) se obtiene: µ ¶ dθ(t) dθd (t) d2 θ(t) d2 θd (t) + kp (θ(t) − θd (t)) = 0 − + kd − dt2 dt2 dt dt (10.52) Def´ınase el error de seguimiento como ε(t) = θ(t) − θd (t) y su transformada de Laplace E(s). Entonces (10.52) se puede escribir como: s2 E(s) − sε(0) −

dε(0) + kd sE(s) − kd ε(0) + kp E(s) = 0 dt

(10.53)

y finalmente: E(s) =

(kd + s)ε(0) + dε(0) dt s2 + kd s + kp

(10.54)

De acuerdo al cap´ıtulo 3 la soluci´on de (10.54) tiene la forma: ε(t) = εn (t) + εf (t) donde la respuesta forzada es cero εf (t) = 0 porque la exitaci´on de la ecuaci´on diferencial en (10.53) es cero. Por tanto, ε(t) = εn (t) lo cual tiende a cero conforme el tiempo crece si las dos ra´ıces del polinomio caracter´ıstico s2 + kd s + kp tienen parte real negativa. Esta situaci´on es la deseable porque si ε(t) tiende a cero entonces θ(t) tiende a θd (t) conforme el tiempo crece. Por otro lado, como el polinomio caracter´ıstico s2 + kd s + kp es de segundo orden

554

10 Control de posici´ on de un motor de CD

entonces, de acuerdo a la secci´on 4.2, sus dos ra´ıces tienen parte real negativa si todos los coeficientes de dicho polinomio tienen el mismo signo, es decir, si kp > 0 y kd > 0. Este es el criterio para la selecci´on de estas ganancias. Sin embargo, debe tenerse presente que desde el punto de vista pr´actico no todas las ganancias as´ı seleccionadas presentar´an desempe˜ nos satisfactorios y deber´an probarse varios valores hasta obtener un buen funcionamiento. En la figura 10.12 se muestran los resultados experimentales obtenidos cuando se usa el motor con k = 25.26 y a = 3.5201 junto con el controlador (10.51), las ganancias: kp = 363.88,

kd = 22

y la trayectoria deseada: θd (t) = 0.8 sin(5t) + 0.5 cos(3t) + 3.0

(10.55)

N´otese que θ alcanza el valor deseado de posici´on θd (t) a pesar de que estas variables tienen valores iniciales diferentes. Es importante mencionar que debido a que se conoce la expresi´on para θd dada en (10.55) entonces se obtienen las expresiones correspondientes para θ˙d y θ¨d mediante diferenciaci´on fuera de linea por lo que no hay problemas de ruido importantes en este caso.

[V]

iã [A]

tiempo [s] Figura 10.12. Controlador para el seguimiento de trayectorias. La posici´ on del motor θ est´ a representada por la l´ınea interrumpida. La l´ınea continua corresponde a θd (t).

10.5 C´ alculo num´erico de los algoritmos de control

10.5.

555

C´ alculo num´ erico de los algoritmos de control

Deriferenciaci´ on num´ erica Esta es la operaci´on que permite obtener un estimado de la velocidad para los controladores en las secciones 10.2.1, 10.3.2 y 10.4. Sea: y=

dw dt

(10.56)

entonces, esta operaci´on se puede aproximar num´ericamente mediante: y≈

w(k) − w(k − 1) ∆t

(10.57)

donde w(k) representa el valor de w medido en el instante de muestreo presente, w(k − 1) es el valor de w medido en el instante de muestreo previo y ∆t es el periodo de muestreo utilizado. Para que se obtenga una buena aproximaci´on ∆t debe ser “peque˜ no” comparado con el tiempo de respuesta del motor. Integraci´ on num´ erica Se procede como se indica en la secci´on 9.8 Compensador de adelanto Ahora se explica como se calcula la expresi´on en (10.21) involucrada en el compensador de adelanto presentado en la secci´on 10.2.2. De acuerdo a (10.56) y (10.57) se puede hacer un corrimiento en el tiempo para redefinir: w(k + 1) − w(k) dw ≈ dt ∆t

(10.58)

Esto se puede usar para aproximar: v(k + 1) − v(k) ∆t

(10.59)

v(k + 1) = [−cv(k) + (d − c)e(k)]∆t + v(k)

(10.60)

v˙ = −cv(k) + (d − c)e(k) ≈ y, por tanto:

Entonces, a partir de la medici´on de e(k) = θd (k) − θ(k) se puede calcular iterativamente v(k + 1) partiendo del valor inicial v(0) = 0. La forma en que (10.60) est´a expresada es muy conveniente pues permite que el primer valor utilizado de v(k) sea cero en k = 0. Recu´erdese que v(k + 1) se calcula en el instante de muestreo presente pero s´olo ser´a utilizado hasta el instante de muestreo pr´oximo inmediato en el futuro.

556

10 Control de posici´ on de un motor de CD

10.6.

Construcci´ on del sistema de control

En la figura 10.13 se muestra el diagrama el´ectrico del sistema de control completo. A continuaci´on se listan los componentes utilizados: Motor de CD con escobillas e im´an permanente. Voltaje nominal 20[V], corriente nominal 3[A]. Cuenta con un encoder de 400 pulsos/vuelta, el cual se alimenta con +5[V] de CD. Una computadora port´atil Laptop con puerto USB. Conector de USB a serie. Microcontrolador PIC16F877A de Microchip. Convertidor digital/anal´ogico DAC0800LCN. Amplificador operacional cuadruple TL084. Amplificadores operacionales TL081. Manejador/Receptor MAX232. Transistores TIP141 y TIP145. Funcionamiento El microcontrolador PIC16F877A tiene la tarea principal de ejecutar el algoritmo de control correspondiente. Es decir, conocido el valor deseado de posici´on θd y la medici´on de la posici´on actual θ, el microcontrolador calcula el valor de la se˜ nal de control i∗ . Tal como se indica en la figura 10.13, el valor de −i∗ debe aparecer a la entrada del amplificador operacional TL081 dentro del recuadro titulado “control de corriente”. Esto se consigue del siguiente modo. Primero, en el programa listado en la secci´on 10.7 se hace iast=-iast, para cambiar el signo de i∗ a −i∗ . El microcontrolador debe entregar un c´odigo digital (iastd) de 8 bits al convertidor digital/anal´ogico de 8 bits DAC0800LCN. Para esto, el microcontrolador realiza la operaci´on: iastd = 36.4286 ∗ iast + 127 la cual obedece a la relaci´on mostrada gr´aficamente en al figura 10.14. El convertidor digital/anal´ogico trabaja en conjunto con un amplificador operacional TL081. Estos dispositivos est´an conectados de acuerdo a las sugerencias del fabricante [1]. Esto asegura que a la salida del amplificador operacional se obtiene un voltaje cuyo valor num´erico corresponde al de −i∗ . Este valor es recibido por un amplificador operacional TL081 que se encarga de evaluar el lazo de corriente: ui = 100(i∗ − i) Finalmente, el amplificador de potencia de ganancia unitaria est´a constituido por un tercer amplificador operacional TL081 junto con dos transistores de potencia TIP141 y TIP145, conectados en simetr´ıa complementaria.

10.6 Construcci´ on del sistema de control

557

Figura 10.13. Diagrama el´ectrico del sistema de control de posici´ on basado en el microcontrolador PIC16F877A.

558

10 Control de posici´ on de un motor de CD iastd 255

127

à 3:5

3:5

iast

Figura 10.14. Acondicionamiento de la se˜ nal i∗ que debe ser enviada al convertidor digital/anal´ ogico.

El Manejador/Receptor MAX232 se encarga de enviar la posici´on medida θ y la se˜ nal de control i∗ hacia una computadora port´atil (a trav´es de un conector USB a serie) cuyo u ´nico prop´osito es el graficado de dichas variables. A continuaci´on se describe la manera en que el microcontrolador PIC16F87 7A realiza la funci´on de controlador. Antes que nada se debe aclarar que no es el prop´osito presentar toda una exposici´on de como trabaja este microcontrolador. Lo que se presenta es una descripci´on de los recursos de este microcontrolador que se utilizan para construir los controladores bajo prueba. En la siguiente secci´on se presenta un listado del programa utilizado. El microcontrolador PIC16F877A [2] es de tecnolog´ıa EEPROM, tiene una velocidad de operaci´on m´axima de 20 MHz y cuenta con 5 puertos de entradasalida configurables y 3 temporizadores. El timer TMR0 es utilizado en este cap´ıtulo para establecer el periodo de muestreo: T = 0.001[seg] (20 cuentas del timer 0) para los experimentos en las secciones 10.1, 10.2.1 y 10.2.2, mientras que T = 0.002[seg] (40 cuentas del timer 0) para el experimento en la secci´on 10.3.2. La posici´on θ se mide desde el encoder usando una subrutina y se almacena en la variable “cuenta2” de 16 bits. La posici´on en radianes se obtiene mediante la operaci´on pos=cuenta2*0.0039 donde 0.0039=3.1416 rad/(2*400 cuentas). Esto es debido a que trat´andose de un encoder de 400 pulsos por vuelta, en realidad se obtienen 4×400 cuentas por vuelta (por cada 2π radianes), es decir 2×400 cuentas por cada π radianes. Una vez calculada la se˜ nal de control “iast” se entrega al convertidor digital/anal´ogico a trav´es del puerto D (PORTD=iastd). Finalmente, la posici´on (a trav´es de la variable “cuenta”) o la se˜ nal de control (a trav´es de la variable “iastd”) son enviados a la computadora port´atil mediante las instrucciones: putc(0xAA); putc(cuentaH); putc(cuentaL);

10.7 Programaci´ on del microcontrolador PIC16F877A

559

Control de corriente Esta parte es id´entica a lo descrito en la secci´on 9.6.1. Amplificador de potencia Esta parte es id´entica a lo descrito en la secci´on 9.6.2.

10.7.

Programaci´ on del microcontrolador PIC16F877A

Se recomienda consultar la referencia [3] para una explicaci´on precisa de cada una de las instrucciones que aparecen en el siguiente listado. // Programa para comunicacin serial entre PC y proyecto Control // Con el PIC16F877A y el compilador PCWH V3.43 #include<16f877A.h> #device adc=10 //manejar adc de 10 bits #include<stdlib.h> #include<math.h> #fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD #usedelay(clock=20000000) //Base de tiempo (frecuencia // del Xtal) #use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)//Config. //P. Serie //direcciones de los puertos y algunos registros #byte OPTION= 0x81 #byte TMR0 = 0x01 #byte PORTA = 0x05 #byte PORTB = 0x06 #byte PORTC = 0x07 #byte PORTD = 0x08 #byte PORTE = 0x09 #bit PC0 = 0x07.0 #bit PC1 = 0x07.1 //------------Declaracion de variables------------// int16 inter,cuenta; int8 cuentaH,cuentaL,puerto,AB,AB_1,aux,cont,iastd,cont2,cont3,cont4; float pos,error,iast,cuenta2,posm1,kp,kv,c,delta,v,kp1,ki1,kp2,kd2,ie; unsigned int u; //int1 ban; //------------Rutina de interrupcion (lee encoder)------------// #int_rb void rb_isr() { puerto=PORTB; AB=((puerto)&(0x30))>>4;

560

10 Control de posici´ on de un motor de CD aux=AB^AB_1; if(aux!=0) if(aux!=3) if(((AB_1<<1)^AB)&(0x02)) cuenta--; else cuenta++; AB_1=AB; } //------------Programa principal------------// void main(void) { setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno) set_tris_a(0b11111111); set_tris_b(0b11111111); set_tris_c(0b10000000); //comunicacion serial set_tris_d(0b00000000); set_tris_e(0b11111111); OPTION=0x07; //prescaler timer0, 1:256 PORTC=0; TMR0=0; cuenta=0; AB=0; AB_1=0; enable_interrupts(global); enable_interrupts(int_rb); cont=4; cont2=0; cont3=0; cont4=0; PORTD=127; // se envia iast=0 al circuito de control kp=1.6891; kv=0.0414; c=30.8018; delta=1.6891; v=0.0; kp1=1.6891; ki1=67.5659; kp2=1.8241; kd2=0.1006; posm1=0.0; ie=0.0; while(cont2<3) // se introduce una espera de aprox 10 segundos { while(cont3<255) { TMR0=0; while(TMR0<255) { }

10.7 Programaci´ on del microcontrolador PIC16F877A cont3++; } cont2++; } TMR0=0; while(TRUE) // ciclo de control { cont++; cuenta2=(signed int16)cuenta; pos=cuenta2*0.0039; // 3.1416 rad/(2*400 cuentas) error=1.5-pos; /* Identificacion */ // iast=0.5*error; /* ___________________________________________ */ /* Control proporcional con retro de velocidad */ // iast=kp*error-kv*(pos-posm1)/0.001; /* ___________________________________________ */ /* Red de adelanto */ // iast=delta*(error+v); // v=(-c*v+(2.8-c)*error)*0.001+v; /* ___________________________________________ */ /* Dos grados de libertad */ iast=kp1*error+ki1*ie-kp2*pos-kd2*(pos-posm1)/0.002; ie=ie+0.002*error; /* ___________________________________________ */ if(iast<-3.3) // iast se restringe a [-3.3,+3.3] Amperes iast=-3.3; // (DAC entrega en el rango [-3.5,+3.5]) if(iast>3.3) iast=3.3; iast=-iast; //-i*, TL081 en ‘‘control de corriente’’ if(cont4>70) //tiempo>0.7 seg, perturbacion (-0.5) entrada iast=iast+0.5; iastd=(unsigned int)(36.4286*iast+127); PORTD=iastd; posm1=pos; /* // descomentar si se desea enviar la posicion a la computadora portatil (cada 10 mseg) if(cont==5) { cont=0; inter=(cuenta)&(0xFF00); cuentaH=inter>>8; cuentaL=(cuenta)&(0x00FF); putc(0xAA); //reconocimieno al puerto serial putc(cuentaH); //mandando cuenta al puerto serial

561

562

10 Control de posici´ on de un motor de CD putc(cuentaL); cont4++; if(cont4==255) cont4=0; } */ /*

// descomentar si se desea enviar la senal de control a //la computadora portatil (cada 10 mseg) iast=-iast; // graficar +i* if(cont4>70) // senal control graficar sin perturbacion iast=iast+0.5; iastd=(unsigned int)(36.4286*iast+127); if(cont==5) { cont=0; inter=(cuenta)&(0xFF00); cuentaH=0x00; //inter>>8; cuentaL=(iastd)&(0xFF); putc(0xAA); //reconocimieno puerto serial putc(cuentaH); //cuenta al puerto serial putc(cuentaL); cont4++; if(cont4==255) cont4=0; }

*/

} }

10.8.

PC1=1; //inicia espera del timer while(TMR0<40) //cada cuenta=(4/FXtal)*256 seg, // (40=2 ms, periodo muestreo) { } PC1=0; //termina espera del timer TMR0=0; //cierre del while infinito //cierre del main

Control basado en una computadora personal

El controlador presentado en la secci´on 10.4 para el seguimiento de trayectorias fue probado experimentalmente usando una computadora personal y una tarjeta adquisitora de datos. Esto debido a que el c´alculo de las funciones trigonom´etricas seno y coseno que se requieren consumen mucho tiempo en el microcontrolador PIC16F877A. Este problema desaparece cuando se usa una computadora personal. A continuaci´on se listan los componentes principales del sistema de control. Computadora personal de escritorio Pentium II a 233 MHz.

10.8 Control basado en una computadora personal

563

Tarjeta adquisitora de datos PCL-812PG de Advantech [4]. Cuenta con 15 canales de entrada anal´ogico/digital manejados por un solo convertidor AD de aproximaciones sucesivas de 12 bits, con entrada anal´ogica en el rango de -5[V] a +5[V]. Dos canales de salida digital/anal´ogico, cada uno cuenta con un convertidor DA de 12 bits, con salida anal´ogica en el rango de 0[V] a +5[V]. Tambi´en se cuenta con dos contadores que son programados para establecer el periodo de muestreo en un amplio rango de valores. En el experimento de la figura 10.12 se uso un periodo de muestreo de 0.005[s]. Motor de CD con escobillas e im´an permanente. Voltaje nominal de 24[V], corriente nominal de 2.3[A]. Sensor de posici´on. Potenci´ometro de precisi´on de 1[KOhm], diez vueltas, con tope. En la figura 10.15 se presenta el diagrama de bloques del sistema de control completo. Acoplamiento mec´ anico del sensor de posici´ on Dado que la medici´on de la posici´on del motor se realiza con un potenci´ometro con tope, es importante preveer la posibilidad de que dicho tope sea alcanzado pues esto puede da˜ nar al potenci´ometro dado el gran par que puede desarrollar el motor. Por esta raz´on se utiliza un acoplamiento mec´anico que consta de un anillo de goma que se une firmemente a la flecha del motor. El di´ametro de este anillo es tal que el extremo m´ovil del potenci´ometro puede entrar en ´el de manera mas o menos ajustada. De esta manera, si se alcanza el tope del potenci´ometro, la flexibilidad del anillo de goma permite que la flecha del motor siga girando sin da˜ nar la parte m´ovil del potenci´ometro que permanecer´a en reposo. Interfaz de entrada El potenci´ometro usado como sensor de posici´on (figura 10.15) entrega a su salida un voltaje θ en el rango de 0[V] a +5[V]. Esto es muy conveniente porque el convertidor de entrada anal´ogico/digital recibe voltajes en el rango de -5[V] a +5[V]. Ante el voltaje recibido desde el potenci´ometro, el convertidor anal´ogico/digital entrega un c´odigo, “codigoi ”, en el rango de 0 a 2n = 4096 porque dicho convertidor es de 12 bits. A partir de este c´odigo debe recuperarse una variable ua que num´ericamente sea igual al voltaje entregado por el potenci´ometro θ. De acuerdo a la figura 10.16 esto puede realizarse mediante la operaci´on: ua =

10.0 codigoi − 5.0 4096.0

la cual debe ser efectuada por el programa de computadora.

(10.61)

CP

PCL 812 PG

5:6k ud [0; 5 ] V +

à

TL081

6:72k

5V

5:5k

3:3k

Interfaz de salida

33k

33k +

à TL081

1M

1k

ui +

i

à

TL081

à 15V

15V

Q

Q

TIP 145

TIP 141

Amplificador de potencia

Realimentaciòn de corriente Realimentaciòn de posiciòn

à iã [à 3; 3 ] A

+

à

TL081

3:3k

Control de corriente

u

1Ò 5W

ò

MOTOR

1k

5V Sensor de posición

564 10 Control de posici´ on de un motor de CD

Figura 10.15. Diagrama de bloques e interfaces del sistema de control de posici´ on basado en una computadora personal.

10.8 Control basado en una computadora personal

565

ua

5

4096

código i

à5

Figura 10.16. Acondicionamiento de la se˜ nal de posici´ on entregada por el convertidor anal´ ogico/digital.

Interfaz de salida De acuerdo a (10.1) la se˜ nal de control es la orden de corriente −i∗ la cual, de acuerdo a las especificaciones del motor, bien puede tomar valores en el rango de -3[A] a +3[A]. Esta se˜ nal es calculada por la computadora, la cual env´ıa el dato a la tarjeta adquisitora de datos quien debe entregar el valor de −i∗ como una se˜ nal de voltaje anal´ogico. Una vez que el programa de computadora calcula −i∗ , mediante el uso del algoritmo de control correspondiente, se utiliza un conjunto de instrucciones que independientemente del valor de −i∗ ´este se restringe al rango [-3,+3][V]. Despu´es, sabiendo que el convertidor digital/anal´ogico es de 12 bits, se construye el esquema mostrado en la figura 10.17 para encontrar que el valor de −i∗ debe enviarse al convertidor digital/anal´ogico mediante un c´odigo calculado como (esto se realiza en el programa de computadora): codigoo =

4096 (−i∗ ) + 2048 6

(10.62)

Como resultado de esta orden el convertidor digital/anal´ogico entregar´a un voltaje anal´ogico ud en el rango de 0[V] a +5[V]. As´ı que se debe utilizar un circuito anal´ogico de interfase que adapte este voltaje en el rango 0[V] a +5[V] al rango de -3[V] a +3[V] que son los valores que tomar´a −i∗ . De acuerdo a la figura 10.18 esto se consigue con un circuito anal´ogico, basado en amplificadores operacionales, que realice la siguiente operaci´on: −i∗ =

6 ud − 3 5

(10.63)

566

10 Control de posici´ on de un motor de CD

Esta es la funci´on que realiza el bloque “interfaz de salida” de la figura 10.15 1 . La raz´on de que deba aparecer −i∗ como resultado de todas las operaciones descritas tiene que ver con la compatibilidad de signos que deben respetar los circuitos que en la figura 10.15 se colocan a continuaci´on del punto se˜ nalado con −i∗ . código 0 4096

2048

à3

(à iã)

3

Figura 10.17. Acondicionamiento de la se˜ nal −i∗ que debe ser enviada al convertidor digital/anal´ ogico.

(à iã) 3

5

ud

à3

Figura 10.18. Dise˜ no de la interfaz anal´ ogica que debe ser colocada a la salida del convertidor digital/anal´ ogico.

1

Todos los amplificadores operacionales usados en la figura 10.15 son TL081. Los tres primeros tienen la terminal “+” conectada a tierra mientras que el conectado a las bases de los transistores tiene la terminal “+” conectada a ui .

10.8 Control basado en una computadora personal

567

Control de corriente El amplificador operacional mostrado en el bloque “control de corriente” de la figura 10.15 realiza la operaci´on indicada en (9.14) con K = 30. Amplificador de potencia Esta parte es id´entica a lo expuesto en la secci´on 9.6.2. Programa de computadora Todos los algoritmos de control fueron programados en Borland C++. A continuaci´on se lista el c´odigo utilizado. #include <stdio.h> #include #include <math.h> #include <stdlib.h> #include <string.h> #include int alto,bajo,dato,salida,i; volatile float Ts=0.005;//Periodo de muestreo /*------------------variables para encoder----------*/ //volatile int alto_dig=0,bajo_dig=0,dato_dig=0; volatile float y,ir,ym1,v,dv,nv,e,ninte; volatile float inte,gc1,gc2,tiempo,perturbacion; /*--------------------------------------------------*/ volatile float r_des=1.0,Kp=1.9434,Kv=0.1777; //volatile float gama=2.3853,c=12.2734,b=4.8935; volatile float gama=2.0465,c=10.3672,b=3.8935; volatile float kp1=1.9434,ki1=9.7170; volatile float kp2=1.3878,kd2=0.3195; volatile long double y0; /*-Direccion base y periodo de muestreo para la tarjeta--*/ int base=0x210;//Direccion base de la tarjeta int lsb1=0x00;//Periodo de muestreo int msb1=0x01;//Periodo de muestreo

568

10 Control de posici´ on de un motor de CD

int lsb2=0x00;//Periodo de muestreo int msb2=0x01;//Periodo de muestreo volatile float yy[3000]; volatile float uu[3000]; volatile float ref[3000]; FILE *fp; char Direccion[30]; void Inicializa(void); void EscribeArchivo(float datos1,floatdatos2,float datos3); void Cierra(void); void main() { clrscr(); /*---------Se programa la tarjeta adquisitora--------*/ /*---Vease manual PCL 812-PG de Advantech------*/ outportb(base+11,6); //CAD iniciada con reloj y transferencia dato por software outportb(base+9,0);// ganancia 1 outportb(base+10,15);// Canal AD No. 15 outportb(base+3,0x77);//Programacion periodo de muestreo outportb(base+1,lsb1);//Programacion periodo de muestreo outportb(base+1,msb1);//Programacion periodo de muestreo outportb(base+3,0xb7);//Programacion periodo de muestreo outportb(base+2,lsb2);//Programacion periodo de muestreo outportb(base+2,msb2);//Programacion periodo de muestreo i=1; do // inicia ciclo de control { /*-------------Conversion AD----------------------------*/ do { } while (inportb(base+5)>15); alto=inportb(base+5); bajo=inportb(base+4); dato=256*alto+bajo; y=(10.0/4096.0)*dato-5.0;//Posicion theta tiempo=(i-1)*Ts; /*--------Inicia lectura de encoder---------------------*/

10.8 Control basado en una computadora personal // /*

para

569

la configuracion de entradas digitales

alto_dig=inport(base+7); alto_dig+=0xff+1; bajo_dig=inport(base+6); bajo_dig=(bajo_dig)&(0x00ff); dato_dig=256*alto_dig+bajo_dig; po_rad=((6.283185307*dato_dig)/1600); // 1600 es el numero de cuentas por revolucion. // gotoxy(10,10); printf("Posicion en radianes: %f",po_rad); y=po_rad; */ /*-------Termina lectura encoder------------------------*/ if(i==1) { //condiciones iniciales y0=y; ym1=0.0; v=0.0; inte=0.0; } y=y-y0;//Salida fijada a cero e=r_des-y; /*------ Control proporcional + retro de velocidad------*/ /* ir=Kp*(r_des-y)-Kv*(y-ym1)/Ts; */ /*----------- Control con red de adelanto --------------*/ /* dv=(-c*v+(b-c)*e )*Ts; nv=v+dv; ir=gama*(e+v); */ /*---------- Control dos grados de libertad ------------*/ gc1=kp1*e+inte; gc2=kp2*y+kd2*(y-ym1)/Ts; ir=gc1-gc2; ninte=inte+ki1*e*Ts; perturbacion=0.0; if(tiempo>1.5) {perturbacion=0.5;} ir=-ir+perturbacion; // Saturacion de ir [-3,3][A] if(ir>2.9 ) { ir=2.9; } if(ir<-2.9) {ir=-2.9;} salida=floor(682.66*ir+2048.0); bajo=salida & 0xff; alto=salida & 0x0f00;

570

10 Control de posici´ on de un motor de CD alto=floor(alto/256.0); outportb(base+4,bajo); //Manda codigo_o al CDA outportb(base+5,alto); yy[i]=y; uu[i]=ir-perturbacion; ref[i]=r_des; ym1=y; v=nv; inte=ninte; i++; }while (!kbhit());// Termina ciclo de control // while (i<=3000); ir=0.0;// Se ordena detener el motor salida=floor(682.66*ir+2048.0); bajo=salida & 0xff; alto=salida & 0x0f00; alto=floor(alto/256.0); outportb(base+4,bajo); outportb(base+5,alto); // Guarda datos en un archivo en el disco duro cout<<<endl; Inicializa(); i-=1; for(int jj=1;jj
10.10 Preguntas de repaso

10.9.

571

Resumen del cap´ıtulo

Se ha mostrado c´omo controlar la posici´on de un motor de CD bajo el efecto de una perturbaci´on externa de par. Para esto se han construido dos controladores: uno es un controlador PID cl´asico y el otro es un controlador PID modificado. Aunque ambos controladores resuelven el problema, el controlador PID modificado presenta un mejor desempe˜ no. Como este controlador necesita el valor num´erico de los par´ametros del motor, se explica como identificar de manera experimental tales par´ametros. En este cap´ıtulo se ha mostrado c´omo sintonizar el controlador PID cl´asico usando el valor num´erico de los par´ametros del motor. Sin embargo, la principal ventaja de este controlador es que puede ser sintonizado a prueba y error sin necesidad de conocer tales valores num´ericos (v´ease la secci´on 5.3 del cap´ıtulo 5). Por u ´ltimo, se ha construido un controlador PD para el seguimiento de trayectorias. Esta es una tarea compleja que necesita del conocimiento de los par´ametros del motor. Se ha explicado de manera detallada como construir estos controladores usando un microcontrolador y una computadora personal. La raz´on de usar una computadora personal es la construci´on del controlador PD para el seguimiento de trayectorias ya que se requiere del c´alculo de funciones sinusoidales del tiempo lo cual consume demasiado tiempo si se utiliza un microcontrolador. Cuando se construye un sistema de control en la pr´actica, es muy importante que el procesamiento de las se˜ nales que realiza el software y el hardware utilizados corresponda fielmente a las operaciones matem´aticas que indica el controlador. El sistema de control que se ha construido ha sido elaborado teniendo muy en cuenta este aspecto y la cuidadosa descripci´on del mismo lo demuestra. Los autores pensamos que, desafortunadamente, en el medio acad´emico con mucha frecuencia se construyen sistemas de control de manera un tanto descuidada. Es decir, cuando se controla la posici´on de un motor de CD con frecuencia a la gente s´olo le interesa que el motor se mueva hacia donde se desea y poca antenci´on se presta a verificar que la respuesta transitoria es la esperada. Normalmente la parte transitoria de la repuesta es la m´as afectada por las inconsistencias introducidas en el software y el hardware a la hora de procesar las se˜ nales correspondientes.

10.10. 1. 2.

3.

Preguntas de repaso

Considere el control PID de posici´on de un motor de CD ¿Qu´e pasar´ıa si la perturbaci´on y/o la posici´on deseada no fueran constantes? En robots industriales se usan controladores PID para el seguimiento de trayectorias en lugar de controladores PD ¿C´omo cree que se pueda conseguir esto? ¿Qu´e ventajas cree que tenga el uso de controladores PID en lugar de controladores PD? ¿C´omo afectan las ganancias de un controlador PID cl´asico a la respuesta de un sistema de control de posici´on? Si el efecto de la perturbaci´on

572

4.

5. 6.

7. 8. 9. 10.

10 Control de posici´ on de un motor de CD

externa es compensada lentamente ¿Qu´e ajustar´ıa en las ganancias del controlador PID para acelerar este proceso? En el cap´ıtulo 9 se ha visto que un controlador PI es adecuado para compensar el efecto de perturbaciones externas de par en sistemas de control de velocidad ¿Por qu´e cree que en sistemas de control de posici´on se deba usar un controlador PID en lugar de un controlador PI? Mencione algunas ventajas y desventajas de usar microcontroladores y computadoras personales para construir controladores digitales. Un motor de CD tambi´en se puede controlar sin usar un lazo de corriente si se supone que la inductancia de armadura es despreciable (sobre todo en motores peque˜ nos) ¿Qu´e cambios tendr´ıa que hacer a los circuitos de las figuras 10.13 y 10.15 para trabajar sin lazo de corriente? Describa el procedimiento presentado en este cap´ıtulo para la identificaci´on experimental de los par´ametros de un motor de CD. ¿Qu´e es un compensador de adelanto? ¿Cu´ales son las ventajas y las desventajas de usar compensadores de adelanto como controladores de posici´on? En teor´ıa, la respuesta de un sistema de control de posici´on se puede hacer tan r´apida y tan amortiguada como se desee usando un controlador PID ¿Qu´e problemas pueden presentarse en la pr´actica si las ganancias de un controlador PID son muy grandes?

Referencias

1. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconductor Corporation, 1995. 2. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Technology Inc., 2003. 3. Custom Computer Services Incorporated, CCS C Compiler Reference Manual, 2003. 4. PCL-812PG User’s Manual, Advantech, Taiwan, 1996. 5. K. Ogata, Ingenier´ıa de Control Moderna, 4a. edici´ on, Pearson Prentice-Hall, Madrid, 2003. 6. N.S. Nise, Sistemas de control para ingenier´ıa, 1a. edici´ on en espa˜ nol, 1a. Reimpresi´ on, CECSA, M´exico, 2004. 7. J. Chiasson, Modeling and High-performance control of electric machines, IEEE Press-Wiley Interscience, New Jersey, 2005. 8. Parker Automation, Position systems and Controls, Training and Product Catalog DC-ROM, Compumotor’s Virtual Classroom, 1998.

11 Control de un sistema de levitaci´ on magn´ etica

Los sistemas de levitaci´on magn´etica son equipos que permiten que un cuerpo hecho de material ferromagn´etico “flote” o “levite” en el espacio sin tener contacto alguno con los otros cuerpos que lo rodean. El secreto es el uso de una fuerza magn´etica producida por un poderoso electroim´an. La principal raz´on para producir tal fen´omeno es el hecho de que, al no haber contacto mec´anico, el cuerpo que levita puede moverse sin que exista fricci´on y, por tanto, desgaste. Este fen´omeno es utilizado actualmente en m´ ultiples aplicaciones, quiz´a la m´as conocida es la de algunos trenes de alta velocidad.

576

11 Levitaci´ on magn´etica

Objetivos del cap´ıtulo Construir la totalidad de las partes que componen a un sistema de levitaci´ on magn´etica. Construir un controlador PID usando electr´ onica anal´ ogica. Aplicar los conceptos de control cl´ asico a una planta que es inestable por naturaleza. Identificar de manera experimental los par´ ametros de un sistema relativamente complejo. Actualmente los sistemas de levitaci´on magn´etica son muy importantes debido a la gran cantidad de aplicaciones que tienen. A estos equipos tambi´en se les conoce como MagLev, por la abreviaci´on del t´ermino ingl´es “Magnetic Levitation System”. Una de las principales razones para el uso de sistemas de levitaci´on magn´etica es su capacidad para eliminar la fricci´on entre las partes mec´anicas que lo forman. Algunos ejemplos de aplicaci´on son los trenes de alta velocidad que viajan flotando sobre un riel con el cual no tienen contacto [1], los rodamientos magn´eticos [2] que pueden eliminar la fricci´on y el consecuente desgaste de las piezas mec´anicas involucradas y la construcci´on de sistemas de posicionamiento de gran exactitud [3] gracias a que se elimina la fricci´on no lineal. Dada la importancia pr´actica de estos mecanismos, con frecuencia son utilizados como sistemas experimentales para probar el desempe˜ no de t´ecnicas de control cl´asicas y avanzadas [4], [5], [6], [7], [8], [9]. En este cap´ıtulo se dise˜ na un sistema de levitaci´on magn´etica sencillo que puede ser visto como al principio de funcionamiento de las aplicaciones mencionadas previamente. En la figura 11.1 se muestra el sistema de levitaci´on magn´etica de inter´es. Este sistema consiste de una esfera de material ferromagn´etico que es atra´ıda hacia arriba por la fuerza magn´etica debida a un electroim´an. Esta esfera met´alica tambi´en recibe el efecto de la fuerza debida a la gravedad dirigida hacia abajo. Se desea suspender o levitar a la esfera a una distancia del im´an que pueda ser fijada a voluntad. Sin embargo, el principal problema para conseguirlo es que este sistema es claramente inestable como se explica a continuaci´on. Suponga que el electroim´an ejerce sobre la esfera met´alica una fuerza hacia arriba de magnitud constante e igual a la que ejerce la gravedad hacia abajo. Entonces las fuerzas se cancelan exactamente y la esfera met´alica permanecer´a suspendida en el espacio. La experiencia indica que la fuerza del electroim´an es mayor conforme se est´a m´as cerca de ´el, mientras que la fuerza de la gravedad es siempre la misma. Suponga ahora que, por alguna raz´on, la esfera se desplaza un poco hacia arriba respecto de la posici´on en donde se encontraba flotando. Esto hace que la fuerza del electroim´an sea mayor que la fuerza de gravedad, por lo que la esfera ser´a atra´ıda hacia el electroim´an hasta quedar pegada al mismo. Por otro lado, si la esfera se desplaza ligeramente hacia abajo respecto de la posici´on en donde se encontraba flotando, entonces ahora es la fuerza de la gravedad la que vence y la esfera caer´a hasta el suelo. Una situaci´on como la reci´en descrita es muestra

11 Levitaci´ on magn´etica

577

de la inestabilidad de un sistema: cuando se perturba ligeramente a un sistema inestable, las variables del mismo se alejar´an del lugar en que inicialmente estaban. electroimán

i

õ

u

y

F

y=0

m esfera

mg

Figura 11.1. Sistema de levitaci´ on magn´etica.

Las variables y par´ametros involucrados son los siguientes: u es el voltaje aplicado en las terminales del electroim´an. i es la corriente el´ectrica a trav´es del devanado del electroim´an. y es la posici´on de la esfera medida entre la superficie inferior del electroim´an y la parte superior de la esfera. Esta distancia es cero cuando la esfera toca al electroim´an y crece (positiva) conforme la esfera se mueve hacia abajo alej´andose del electroim´an. F es la fuerza magn´etica ejercida por el electroim´an sobre la esfera. Su sentido se define en el mismo sentido en el que y crece. M´as adelante se mostrar´a que F es negativa por lo que representa correctamente una fuerza de atracci´on. m es la masa de la esfera. L representa la inductancia del devanado del electroim´an. La inductancia cambia con la posici´on de la esfera y se acostumbra usar la notaci´on L(y) para subrayar este hecho. R es la resistencia del cobre con el que est´a construido el devanado del electroim´an. λ es el flujo magn´etico concatenado por el devanado del electroim´an y est´a dado como λ = L(y) i.

578

11.1.

11 Levitaci´ on magn´etica

Modelo matem´ atico no lineal

Modelo del subsistema el´ ectrico N´otese que el circuito el´ectrico del electroim´an esta formado u ´nicamente por un circuito RL serie en el que aparecen el voltaje aplicado u, la inductancia y la resistencia del devanado del electroim´an (v´ease la figura 11.1). Aplicando la Ley de Kirchhoff de voltajes se tiene: X voltaje aplicado = ca´ıdas de voltaje en la malla u = ca´ıda en la inductancia + ca´ıda en la resistencia dλ u= +Ri (11.1) dt

donde se ha usado la Ley de Faraday para expresar que la ca´ıda en la inductancia est´a dada por la variaci´on respecto al tiempo del flujo concatenado dλ dt . El flujo concatenado se relaciona con la corriente el´ectrica a trav´es de la inductancia del siguiente modo λ = L(y) i, donde la inductancia L(y) no es constante sino que es una funci´on de la posici´on de la esfera y. Como se ver´a m´as adelante, es importante saber como depende la inductancia de la posici´on de la esfera. En [7], [8] pp.245, [10] pp. 31, se sugiere que la inductancia est´a dada como: L(y) = k0 +

k 1+

y a

(11.2)

donde a, k0 y k son constantes positivas. Es interesante darse cuenta de que k0 y k0 + k representan, respectivamente, los valores de la inductancia cuando la esfera no est´a presente (y → ∞) y cuando la esfera est´a pegada al electroim´an (y = 0). Por tanto, conforme la esfera se aleja del electroim´an la inductancia L(y) variar´a como se muestra en la figura 11.2. El par´ametro a representa la rapidez con que la inductancia var´ıa entre k0 + k y k0 conforme crece y. Es importante mencionar que la expresi´on (11.2) es propuesta de manera emp´ırica para ajustarse al comportamiento mostrado en la figura 11.2 y, por tanto, no es la u ´nica manera de representar a L(y). Otra funci´on que tambi´en se propone con frecuencia es [11], [12]: y

L(y) = k0 + ke− a

(11.3)

Puede elegirse cualquiera de las funciones en (11.2) o (11.3) para representar a L(y) siempre que se obtenga el mejor ajuste a los datos experimentales. En la secci´on 11.4.2 se explica como realizar un experimento para identificar los par´ametros de la inductancia. En este trabajo se continuar´a usando el s´ımbolo general L(y) para representar la inductancia con el fin de que el lector tenga la posibilidad de utilizar los resultados aqu´ı expuestos para

11.1 Modelo matem´ atico no lineal

579

L (y)

k0 + k

k0

y

Figura 11.2. La inductancia del electroim´ an como funci´ on de la posici´ on de la esfera.

cualquiera de los casos en (11.2) y en (11.3). Solamente en la parte final del dise˜ no, cuando se necesiten calcular valores num´ericos muy espec´ıficos, se proceder´a utilizar (11.2) porque con esta expresi´on se obtuvo el mejor ajuste a los datos experimentales (v´ease la secci´on 11.4.2). Modelo del subsistema mec´ anico Un paso importante para obtener el modelo del subsistema mec´anico es la determinaci´on de la fuerza magn´etica, F , ejercida por el electroim´an sobre la esfera. Esta fuerza, dirigida en el sentido en el que y crece, est´a dada por (2.46). Esta expresi´on se reescribe a continuaci´on para facilidad de referencia y, dicho sea de paso, tambi´en puede ser consultada en los trabajos previos [7], [10] pp. 31, [11], [12]: ∂E(i, y) , ∂y 1 E(i, y) = L(y) i2 2 F =

(11.4) (11.5)

donde E(i, y) es la energ´ıa magn´etica almacenada en el sistema magn´etico completo (electroim´an y esfera). Aplicando la Segunda Ley de Newton a la esfera se obtiene el modelo del subsistema mec´anico (v´ease la figura 11.1):

580

11 Levitaci´ on magn´etica

masa × aceleraci´on =

X

fuerzas sobre la esfera

d2 y = fuerza del electroim´an + peso de la esfera dt2 d2 y m 2 = F (i, y) + mg dt 1 ∂L(y) 2 d2 y i + mg (11.6) m 2 = dt 2 ∂y m

donde se han usado (11.4) y (11.5) para escribir: F (i, y) =

1 ∂L(y) 2 i 2 ∂y

El lector puede usar cualquiera de las expresiones en (11.2) y (11.3) para verificar la siguiente propiedad: ∂L(y) <0 ∂y

(11.7)

para todo valor positivo de y, es decir, para cualquier posici´on de la esfera que pueda ser alcanzada en la pr´actica. N´otese que el peso mg favorece el incremento de y por lo que debe aparecer con signo positivo en (11.6). Por otro lado, la fuerza F (i, y) tambi´en aparece afectada con un signo positivo porque se define en la direcci´on en la que y crece. Sin embargo, su valor negativo debido a (11.7) implica que su efecto es en contra del incremento de y, es decir, en direcci´on opuesta al peso de la esfera. Por tanto, la propiedad en (11.7) es indispensable para que la esfera pueda levitar venciendo el efecto de la gravedad. Por otro lado, se debe considerar el uso de un amplificador de potencia a la entrada del electroim´an (v´ease la secci´on 9.2) y un lazo de corriente, es decir u = Ap γ(i∗ − i) donde Ap es la ganancia del amplificador de potencia, γ es la ganancia proporcional del lazo de corriente e i∗ es la corriente que se desea circule a trav´es del electroim´an. El prop´osito de usar un lazo de corriente puede explicarse sustituyendo u = Ap γ(i∗ − i) en (11.1): Ap γ(i∗ − i) =

dλ +Ri dt

(11.8)

Si se elige un valor grande de γ entonces: µ ¶ 1 dλ i∗ − i = +Ri ≈0 Ap γ dt por lo que se puede considerar que i = i∗ , es decir, que la corriente en el electroim´an es igual a la corriente que se ha ordenado. La ventaja de esto es que ahora el sistema de control es robusto contra cambios de par´ametros en la din´amica el´ectrica dada en (11.1). Por ejemplo, la resistencia del devanado

11.2 Modelo lineal aproximado

581

puede tener variaciones (incrementos) importantes debidas al calor producido por la gran corriente el´ectrica que normalmente se necesita para hacer levitar la esfera. Si la resistencia crece, entonces la corriente (y por tanto, la fuerza del electroim´an sobre la esfera) disminuye. Esto requiere aumentar el voltaje aplicado para incrementar la fuerza del im´an sobre la bola. Como consecuencia, se incrementa el valor de la corriente, aumentando el calor disipado y, por tanto, la resistencia vuelve a crecer. Finalmente el voltaje aplicado ser´a tan grande que alcanzar´a el valor de saturaci´on del amplificador de potencia y, entonces, la esfera ya no podr´a levitar. Al usar el lazo de corriente se consigue que la corriente sea igual a la corriente deseada u ordenada, i = i∗ , independientemente de los cambios en la resistencia o alg´ un otro par´ametro en (11.1). Sustituyendo λ = L(y)i en (11.8) se obtiene: L(y)

di ∂L(y) = Ap γi∗ − r i − y˙ i dt ∂y

(11.9)

donde se ha definido r = R+Ap γ. Entonces, el modelo del sistema de levitaci´on magn´etica completo est´a dado por: di ∂L(y) = Ap γi∗ − r i − y˙ i dt ∂y 1 ∂L(y) 2 d2 y i + mg m 2 = dt 2 ∂y

L(y)

(11.10) (11.11)

El modelo matem´atico en (11.10), (11.11), es no lineal porque incluye funciones inversas de y y funciones cuadr´aticas de i. Estas caracter´ısticas no permiten el uso de la transformada de Laplace para dise˜ nar el controlador. Una manera de resolver este problema es encontrando un modelo lineal que represente, al menos de manera aproximada, al modelo no lineal en (11.10), (11.11). Sin embargo, este modelo aproximado y el controlador obtenido a partir de ´el s´olo ser´an de utilidad en una regi´on de tama˜ no reducido.

11.2.

Modelo lineal aproximado

11.2.1.

Obtenci´ on de un modelo en variables de estado

De acuerdo a lo expuesto en la secci´on 7.1, dado un conjunto de ecuaciones diferenciales como (11.10), (11.11), se puede encontrar una representaci´on en variables de estado definiendo las componentes del vector de estado x como las variables inc´ognita de dichas ecuaciones diferenciales y sus primeras q − 1 derivadas, donde q es el orden de la ecuaci´on diferencial correspondiente. La inc´ognita en (11.10) es i y la ecuaci´on es de primer orden, por tanto, s´olo i califica como componente del vector de estado. Por otro lado, la inc´ognita en (11.11) es y y la ecuaci´on es de segundo orden, por tanto y y y˙ califican

582

11 Levitaci´ on magn´etica

como componentes del vector de estado. De acuerdo a lo anterior, se propone el siguiente vector de estado:     i x1 x =  x2  =  y  (11.12) x3 y˙

Es importante aclarar que i∗ no es una variable de estado sino la variable de control, es decir, ahora es la entrada del sistema de levitaci´on magn´etica. Sustituyendo en (11.10), (11.11), las variables definidas en (11.12) se puede escribir: µ ¶ ∂L(x2 ) 1 ∗ Ap γi − r x1 − x3 x1 x˙ 1 = L(x2 ) ∂x2 x˙ 2 = x3 1 ∂L(x2 ) 2 x1 x˙ 3 = g + 2m ∂x2 Usando notaci´on vectorial se obtiene: x˙ = f (x, i∗ ) (11.13) ´ ³    ∂L(x ) 1 2 ∗ Ap γi − r x1 − ∂x2 x3 x1 f1 (x, i∗ )  L(x2 )  ∗ ∗   f (x, i ) = f2 (x, i ) =  (11.14) x3 1 ∂L(x2 ) 2 f3 (x, i∗ ) x1 g+ 2m

∂x2

De acuerdo a la secci´on 7.2.2, los puntos de operaci´on son las parejas (x∗ , i∗o ) que satisfacen: ³ ´    ∂L(x∗ ) 1 Ap γi∗o − r x∗1 − ∂x22 x∗3 x∗1 0 ) L(x∗ 2     f (x∗ , i∗o ) =  (11.15) = 0 x∗3 ∗ 1 ∂L(x2 ) ∗ 2 0 g + 2m ∂x2 x1 ∂L(x∗ )

donde L(x∗2 ) y ∂x22 indican que dichas funciones est´an evaluadas en x2 = x∗2 . Entonces se obtiene: x∗3 = 0 s x∗1 =

(11.16) 2mg ∂L(x∗ )

− ∂x22 r ∗ x i∗o = Ap γ 1

∂L(x∗ )

(11.17) (11.18)

Recu´erdese que − ∂x22 > 0, debido a (11.7). El valor de x∗2 = yd se propone ya que representa la posici´on en la que se desea hacer levitar a la esfera.

11.2 Modelo lineal aproximado

11.2.2.

583

Aproximaci´ on lineal

De acuerdo a (7.29), (7.30), (7.31) en la secci´on 7.2.2, el modelo no lineal dado en (11.13), (11.14) puede ser aproximado por el siguiente modelo lineal: z˙ = Az + Bv  ∂f1 (x,i∗ )

 A=



 B=

∂f1 (x,i∗ ) ∂f1 (x,i∗ ) ∂x1 ∗ ∂x2 ∂x3 ∂f2 (x,i ) ∂f2 (x,i∗ ) ∂f2 (x,i∗ ) ∂x1 ∂x2 ∂x3 ∂f3 (x,i∗ ) ∂f3 (x,i∗ ) ∂f3 (x,i∗ ) ∂x1 ∂x2 ∂x3 ∂f1 (x,i∗ ) ∂i∗ ∂f2 (x,i∗ ) ∂i∗ ∂f3 (x,i∗ ) ∂i∗



(11.19)

  

x=x∗ ,i∗ =i∗ o

 

x=x∗ ,i∗ =i∗ o

donde z = x − x∗ y v = i∗ − i∗o . Usando (11.14) se obtiene:  a11 0 a13 A =  0 0 1 , a31 a32 0 



B=

Ap γ L(x∗ 2)

0 0



,

(11.20)

1 ∂L(x∗2 ) ∗ r , a13 = − x ∗ L(x2 ) L(x∗2 ) ∂x2 1 1 ∂ 2 L(x∗2 ) ∗2 1 ∂L(x∗2 ) ∗ x1 x1 , a32 = = m ∂x2 2m ∂x22

a11 = − a31

Recu´erdese que el punto de operaci´on x∗ = [x∗1 x∗2 x∗3 ]T , i∗o , representa cuatro valores escalares constantes. Usando la transformada de Laplace en cada rengl´on de (11.19) junto con los valores dados en (11.20) se obtiene: 1 Ap γ a31 [a13 Z3 (s) + V (s)], Z2 (s) = 2 Z1 (s), s − a11 L(x∗2 ) s − a32 sZ2 (s) = Z3 (s) (11.21) Z1 (s) =

donde Z1 (s), Z2 (s), Z3 (s), V (s) representan las transformadas de Laplace de las funciones del tiempo z1 = x1 − x∗1 , z2 = x2 − x∗2 , z3 = x3 − x∗3 y v = i∗ − i∗o , respectivamente. Combinando las expresiones en (11.21) se obtiene: a31 Ap γ

Z2 (s) L(x∗ 2) = 3 2 V (s) s − a11 s − (a32 + a31 a13 )s + a11 a32

(11.22)

La funci´on de transferencia en (11.22) representa el modelo lineal aproximado que ser´a utilizado para estudiar y dise˜ nar un controlador que permita levitar la esfera. Recu´erdese que, de acuerdo a la secci´on 7.2, todo lo que se obtenga a partir del uso de (11.22) s´olo ser´a v´alido si x e i∗ permanecen cerca del punto de operaci´on (x∗ , i∗o ).

584

11 Levitaci´ on magn´etica

11.3.

Construcci´ on del prototipo

A continuaci´on se describe la manera en que fueron construidas las partes principales del sistema de levitaci´on magn´etica. 11.3.1.

Esfera

La esfera debe ser de material ferromagn´etico y, a la vez, debe ser suficientemente ligera. Por otro lado, con el fin de facilitar la medici´on de su posici´on, la esfera no debe ser demasiado peque˜ na. Estos requerimientos fueron satisfechos seleccionando una esfera de unisel de tama˜ no adecuado (aproximadamente 0.03[m] de di´ametro), de acuerdo al sensor de posici´on que ser´a construido, y se procedi´o a cubrir toda su superficie con material ferromagn´etico. Esto u ´ltimo se consigui´o insertando peque˜ nas tachuelas de acero sobre la superficie de la esfera. Aunque no se consigui´o una superficie esf´erica perfectamente lisa (quedan espacios no ferromagn´eticos entre las tachuelas), sin embargo, los resultados muestran que lo obtenido es suficiente. Con el fin de evitar el desprendimiento de las tachuelas ´estas se insertaron agregando pegamento. 11.3.2.

Electroim´ an

Se utiliz´o un transformador al cual se le realizaron las siguientes modificaciones. Como la mayor´ıa de los transformadores, el transformador original constaba de un n´ ucleo formado por l´aminas en forma de E las cuales estaban colocadas en forma encontrada. Esto permite formar un circuito magn´etico con dos ramas con una dispersi´on despreciable de las l´ıneas de campo magn´etico. Se procedi´o a desmontar el n´ ucleo para colocar todas las l´aminas en forma de E en una sola direcci´on como se muestra en la figura 11.1. Esto permite que la esfera al levitar cierre convenientemente el circuito magn´etico del electroim´an gener´andose de esta manera una fuerza magn´etica de atracci´on del electroim´an sobre la esfera. El devanado del electroim´an se construy´o enrollando alambre magneto del n´ umero 19. Esto debe hacerse de manera que las espiras queden perfectamente acomodadas una a lado de la otra, sin que quede una sobre la otra, y formando tantas capas como lo permita el espacio libre que hay en las l´aminas en forma de E. Las dimensiones del transformador utilizado fueron seleccionadas mediante experimentaci´on: una vez que se ha seleccionado la esfera a levitar se verifica si, con las fuentes de alimentaci´on de las que se dispone, el transformador es capaz de generar una suficiente fuerza de atracci´on sobre la esfera. Tambi´en debe verificarse que el calentamiento del electroim´an obtenido no sea exagerado. 11.3.3.

Sensor de posici´ on

El componente principal es una simple fotorresistencia que se conecta en serie con una resistencia fija para formar un divisor de tensi´on (v´ease la figura

yv

à

1k

V P1

A

+

TL081

à

10k

sensor posición 15V y

10k 10k

y ãv

1k

à 15V

C1

R1

10k

47000pF

12:5V

+

+

1k ã

i

Figura 11.3. Diagrama el´ectrico del sistema de control completo. d

à Ao

10k

à 15V

v Ad

10k

àë= à

TL082

à

2:2pF

R2 C2

à

B

1N4001

TL081

à

10k

t

1N5404

à

T1

+

TL082

2:2pF

47k

TIP141

i ã = v + i ão

10k

12:5V

u L(y)

Vt

à

+

TL082

2:2pF

10k

1Ò 5W

i

6:8k

1k

1k

15V

100k

à

+

TL082

10k

1N4001

2:2pF

à

+

à

+

LM339

11.3 Construcci´ on del prototipo 585

586

11 Levitaci´ on magn´etica

11.3). La fotorresistencia se coloca dentro de una pelota de Ping-Pong para aprovechar la dispersi´on de luz que su superficie consigue. De esta manera, aunque la fotorresistencia es relativamente peque˜ na, sin embargo se obtiene una variaci´on uniforme de la luz que incide sobre ella en un amplio rango de posiciones de la esfera. En este sentido, el di´ametro de la esfera de unisel utilizada para construir la esfera en la secci´on 11.3.1 es igual al di´ametro de la pelota de Ping-Pong. El conjunto se coloca en un extremo de un tubo met´alico de 0.10[m] de longitud cuyo di´ametro se ajusta perfectamente a la pelota de Ping-Pong. Las paredes interiores del tubo se cubren con cartulina negra. La parte de la pelota de Ping-Pong que queda fuera del tubo se pinta de negro. Todo esto permite disminuir la posibilidad de interferencias luminosas. Frente al otro extremo del tubo se coloca una l´ampara de luz visible. El conjunto se coloca del siguiente modo. Cuando la esfera toca al electroim´an la luz de la l´ampara es completamente obstruida y la fotorresistencia no recibe luz, por lo que su resistencia es muy grande. Conforme la esfera se aleja (hacia abajo) del electroim´an la cantidad de luz que llega desde la l´ampara hasta la fotorresistencia aumenta, por lo que su resistencia disminuye cada vez ´ m´as. Esto permite que el voltaje en el punto yv de la figura 11.3 aumente al aumentar la posici´on de la esfera (crece al alejarse la esfera del electroim´an). Es interesante darse cuenta que no es necesario un sistema ´optico basado en alg´ un tipo de luz no visible (infrarroja) si se asegura que se ha reducido considerablemente la posibilidad de interferencias luminosas. El voltaje yv representa la medici´on en volts de la posici´on y en metros (recu´erdese que y = x2 ). El valor deseado de posici´on se fija con el voltaje yv∗ en la figura 11.3 mediante el uso de un potenci´ometro. Las dos resistencias entre los puntos yv y yv∗ de la figura 11.3 permiten que el voltaje VP 1 en la misma figura sea igual a 12 z2v , donde z2v = yv − yv∗ es el error de posici´on medido en volts (v´ease el ejercicio 5 en el cap´ıtulo 2). Para obtener estos resultados es recomendable que cada una de estas resistencias (de 10[KOhm]) sean varias veces m´as grandes que las resistencias que est´an en serie con la fotorresistencia y con el potenci´ometro que fija a yv∗ . Por otro lado, las dos resistencias de 10[KOhm] deben ser al menos seis veces m´as chicas que el valor de R1 . La relaci´on entre z2v y el error de posici´on medido en metros z2 = x2 − x∗2 est´a dada por la ganancia del sensor ´optico As , es decir: z2v = As z2 11.3.4.

(11.23)

Controlador

De acuerdo a lo visto en la secci´on 8.2, el amplificador operacional colocado entre los puntos A y B de la figura 11.3 constituye un controlador PID que, adem´as, introduce un cambio de signo. M´as adelante, en este cap´ıtulo, se explica como seleccionar los valores de R1 , R2 , C1 y C2 .

11.4 Identificaci´ on experimental de los par´ ametros del modelo

11.3.5.

587

Lazo de corriente

Los dos amplificadores operacionales que siguen a T 1, en la figura 11.3, son utilizados para construir el lazo de corriente que efect´ ua la operaci´on γ(i∗ −i), valor que es entregado al amplificador de potencia justo en el diodo rectificador colocado a la entrada del comparador LM339. Este diodo y la resistencia de 10[KOhm] sirven para evitar que sean aplicados voltajes negativos a la entrada del comparador, los cuales pueden aparecer debido al ruido presente en el circuito y a la alta ganancia del lazo de corriente γ = 100. 11.3.6.

Amplificador de potencia

Como amplificador de potencia se utiliza un modulador por ancho de pulso (PWM). Este amplificador consta de un circuito que genera una se˜ nal triangular cuyo voltaje Vt var´ıa entre 0[V] y 12.5[V] (parte superior de la figura 11.3). La frecuencia de esta se˜ nal determina la frecuencia base del PWM y se seleccion´o de 1.53[KHz]. Como se explica en la secci´on 11.5, este valor de frecuencia satisface los requerimientos de dise˜ no. La se˜ nal triangular se compara (LM339, en la figura 11.3) con la se˜ nal de γ(i∗ − i) entregada por el lazo de corriente para generar la se˜ nal modulada por ancho de pulso, la cual se aplica a la base de un transistor NPN TIP141 que se encarga de conectar y desconectar un voltaje de potencia de Vs =12.5[V] (v´ease la figura 11.3). Este amplificador de potencia se modela como una ganancia de valor dado como: Ap =

Vs 12.5 = =1 voltaje pico a pico de Vt 12.5

(11.24)

11.4. Identificaci´ on experimental de los par´ ametros del modelo 11.4.1.

Resistencia del electroim´ an, R

Se aplica sucesivamente un conjunto de voltajes de CD en las terminales del eletroim´an y se mide la corriente el´ectrica resultante. Estas parejas de valores se grafican en la figura 11.4 con el s´ımbolo “+” y se les ajusta una linea recta. La pendiente de esta linea recta corresponde al valor de la resistencia R. As´ı, se encuentra que R = 2.72[Ohm]. 11.4.2.

Inductancia del eletroim´ an, L(y)

Se coloca la esfera en diferentes posiciones, y, medidas desde la parte inferior del electroim´an hasta la parte superior de la esfera. Para cada una de estas posiciones se mide, usando un puente RLC, la inductancia en las terminales del electroim´an, L(y). Dado que la frecuencia de operaci´on del electroim´an

588

11 Levitaci´ on magn´etica

u [V]

i [A] Figura 11.4. Medici´ on experimental de R.

ser´a de 1.53[KHz], debido a la frecuencia del amplificador de potencia tipo PWM, estas mediciones de inductancia fueron realizadas usando una frecuencia de 1[KHz] en el puente RLC. Esta es la frecuencia m´as cercana a 1.53[KHz] que permite seleccionar el puente RLC utilizado. En la figura 11.5 se muestran graficados con el s´ımbolo “+” los datos experimentales encontrados. A continuaci´on se proponen diferentes conjuntos de valores para los par´ametros k0 , k, a y con cada uno de ellos se calcula la funci´on L(y) dada en (11.2) para los valores de y utilizados en el experimento. En la figura 11.5 se muestran con l´ınea continua los valores de L(y) que mejor se ajustaron a los datos experimentales. Los par´ametros utilizados para conseguir este ajuste son: k0 = 36.3 × 10−3 [H],

11.4.3.

k = 3.5 × 10−3 [H],

a = 5.2 × 10−3 [m] (11.25)

Ganancia del sensor de posici´ on, As

Se coloca la esfera a diferentes distancias, y, respecto de la superficie inferior del electroim´an. Para cada una de estas posiciones se mide el voltaje yv de la figura 11.3. En la figura 11.6 se grafican con el s´ımbolo “+” los datos experimentales obtenidos. A estos puntos se les ajusta una l´ınea recta que resulta tener una pendiente de 100[V/m]. Esto significa que la ganancia del sensor es:

11.4 Identificaci´ on experimental de los par´ ametros del modelo

589

L(y) [H]

y [m] Figura 11.5. Identificaci´ on experimental de los par´ ametros k, k0 y a que definen a L(y) en (11.2).

As =

z2v yv = = 100[V/m] y z2

(11.26)

N´otese que la ganancia del sensor tambi´en relaciona a z2v y z2 si se selecciona yv∗ = 100x∗2 (recu´erdese que y = x2 y que x∗2 = yd ). Se puede apreciar que el comportamiento lineal del sensor ocurre para valores mayores a y = 0.005 [m]. 11.4.4.

Masa de la esfera, m

Usando una balanza digital se encontr´o que m = 0.018[Kg].

590

11 Levitaci´ on magn´etica

yv [V]

y [m] Figura 11.6. Identificaci´ on experimental de As .

11.5.

Dise˜ no del controlador

Primero se debe calcular el punto de operaci´on deseado. Esto se consigue proponiendo el valor deseado de posici´on x∗2 = yd = 0.01[m] y usando (11.16), (11.17), (11.18) para encontrar x∗1 = 2.1174[A], x∗3 = 0[m/s], i∗o = 2.1749[A]. Por otro lado, el amplificador operacional marcado con T 1 realiza la openal entregada por el controlador. Este raci´on i∗ = v + i∗o , donde v es la se˜ amplificador operacional introduce una ganancia adicional de valor Ad = 4.7, la cual debe considerarse como una ganancia en cascada con el controlador. Usando los valores num´ericos mostrados en la secci´on 11.4, en (11.24), as´ı como γ = 100, se puede hacer uso de las expresiones en (11.20) para encontrar que la funci´on de transferencia en (11.22) est´a dada como: Z2 (s) −24710 = 3 V (s) s + 2739s2 − 1250s − 3.536 × 106

(11.27)

Def´ınase la siguiente variable: α(s) =

1 V (s) Ad

(11.28)

Entonces usando (11.27), (11.28) y Ad = 4.7 se puede escribir: −24710 × 4.7 Z2 (s) = 3 α(s) s + 2739s2 − 1250s − 3.536 × 106

(11.29)

11.5 Dise˜ no del controlador

591

Los polos correspondientes est´an ubicados en: s1 = 35.9,

s2 = −2739.4,

s3 = −35.9

(11.30)

lo cual implica que el sistema de levitaci´on magn´etica es inestable en lazo abierto, tal como se hab´ıa pronosticado al principio del presente cap´ıtulo. Por esta raz´on, el principal prop´osito de dise˜ nar un controlador consiste en conseguir que el sistema de control completo sea estable en lazo cerrado. El polo en s2 = −2739.4 corresponde a la parte el´ectrica del sistema de levitaci´on magn´etica y es muy grande comparado con los otros dos polos (correspondientes a la parte mec´anica) debido a que se est´a usando un lazo de corriente de alta ganancia (γ = 100). Sin embargo, con el fin de seleccionar la frecuencia correcta para el amplificador de potencia por modulaci´on de ancho de pulso se debe obtener el polo correspondiente a la din´amica el´ectrica antes de aplicar el lazo de corriente. Regresando a (11.1) y usando λ = L(y)i, se encuentra: L(y)

di ∂L(y) =u−Ri− y˙ i dt ∂y

Dado que se trata de una ecuaci´on diferencial de primer orden en la variable i, a partir de esta expresi´on se concluye que la constante de tiempo de la din´amiL(x∗ ) ca el´ectrica en lazo abierto (en el punto de operaci´on) est´a dada por R2 . Por tanto, el polo de lazo abierto (antes de aplicar el lazo de corriente) de la R din´amica el´ectrica est´a en s = − L(x ∗ ) = −72.5384. Esto significa que el ancho 2 de banda de la planta a controlar es 72.5384[rad/s] ya que los otros dos polos, correspondientes a la parte mec´anica, son mas cercanos al origen en el plano s. Es importante asegurar que la planta s´olo responder´a al valor medio de la se˜ nal modulada por ancho de pulso entregada por el amplificador de potencia. Esto se consigue si la frecuencia del amplificador de potencia 1.53[KHz], cuando se expresa en radianes por segundo, es muy grande comparada con 72.5384[rad/s] lo cual es cierto porque: 72.5384[rad/s] ≪ 1.53 × 103 × 2π = 9613[rad/s] Finalmente, una caracter´ıstica importante de la funci´on de transferencia en (11.29) es que tiene ganancia negativa. Esto se debe a que incrementos en la variable de entrada producen decrementos en la variable de salida y viceversa, como se explica a continuaci´on. Si la corriente ordenada i∗ aumenta, es decir si v = i∗ − i∗o crece, entonces aumenta la fuerza del electroim´an sobre la esfera por lo que ´esta sube y su posici´on z2 = x2 − x∗2 disminuye. En la figura 11.7(a) se muestra el diagrama de bloques propuesto del sistema de control completo. N´otese que se est´a utilizando realimentaci´on positiva de la salida. La raz´on por la que se propone este diagrama de bloques ser´a comprendida conforme se realice el an´alisis que sigue a continuaci´on. N´otese que se pueden combinar (11.23) y (11.29) para obtener: −24710 × 4.7As Z2v (s) = 3 α(s) s + 2739s2 − 1250s − 3.536 × 106

592

11 Levitaci´ on magn´etica Controlador

yãv

à +

z2v = yv à

yãv

ë = Avd

Ganancia del sumador

+

Ad

G c(s)

ã

i +

í

Amp: potencia u Ap

à

+ ã

i

io

Ad

Electroiman

ï

y

1Ò Sensor optico yv

Esfera

As

(a) Controlador

G c(s)

ë (s) = VA( sd )

Sistema de levitacion Z2v (s) = Yv (s) à Yv ã (s) à G(s)

(b) Sistema de levitacion

Controlador 0

+ à

Z2v (s) = Yv (s) à Yv ã (s)

G c(s)

ë(s)

G ( s)

à Z2v (s)

(c) Figura 11.7. Diagramas de bloques equivalentes del sistema de control.

donde Z2v (s) es la transformada de Laplace de z2v . Finalmente, usando As = 100 dado en (11.26) se encuentra: Z2v (s) = −G(s) α(s) G(s) =

s3

+

2739s2

(11.31) 11613700 − 1250s − 3.536 × 106

Usando esta funci´on de transferencia, el diagrama de bloques de la figura 11.7(a) puede representarse como en la figura 11.7(b) el cual, a su vez, puede representarse como en la figura 11.7(c). Este u ´ltimo diagrama de bloques es importante porque tiene la forma de un sistema en lazo cerrado con realimentaci´on negativa para el cual existen muchas herramientas de an´alisis y dise˜ no de controladores como el lugar de las ra´ıces y las t´ecnicas de respuesta

11.5 Dise˜ no del controlador

593

en frecuencia. N´otese que este diagrama implica que se est´a usando una referencia deseada de valor cero para la variable de salida z2v . Aunque parezca extra˜ no, ´esto tiene una raz´on muy importante: si z2v = 0 entonces, de acuerdo a (11.23), z2 = x2 − x∗2 = 0, lo que implica que x2 = x∗2 , es decir, que la esfera alcanza la posici´on deseada. N´otese tambi´en que para obtener el diagrama de bloques de la figura 11.7(c) es fundamental utilizar realimentaci´on positiva as´ı como la estructura del diagrama de bloques que se muestra en la figura 11.7(a), lo que justifica su uso. Otra manera de explicar el uso de dicha realimentaci´on positiva es la necesidad de compensar la ganancia negativa que 2v (s) tiene la funci´on de transferencia del sistema de levitaci´on magn´etica Zα(s) dada en (11.31). La funci´on de transferencia de lazo abierto en la figura 11.7(c) es: Gc (s)G(s)

(11.32)

α(s) Z2v (s)

es la funci´on de transferencia del

con G(s) dada en (11.31) y Gc (s) = controlador que se dise˜ nar´a. 11.5.1.

Un controlador proporcional

Sup´ongase primero que se usar´a un controlador proporcional, es decir que Gc (s) = kp donde kp es una constante positiva. La funci´on de transferencia de lazo abierto es: kp

s3

+

2739s2

11613700 − 1250s − 3.536 × 106

(11.33)

mientras que la funci´on de transferencia de lazo cerrado est´a dada como: kp s3 +2739s211613700 −1250s−3.536×106

1+ =

11613700 kp s3 +2739s2 −1250s−3.536×106

11613700 kp s3 + 2739s2 − 1250s − 3.536 × 106 + 11613700 kp

(11.34)

N´otese que sin importar el valor que tome kp no se puede afectar el signo del t´ermino −1250s en el denominador de esta funci´on de transferencia. Esto implica que siempre hay al menos un coeficiente del polinomio caracter´ıstico de dicha funci´on de transferencia que tiene signo contrario a los otros coeficientes lo cual, de acuerdo a la secci´on 4.2 significa que hay al menos un polo de lazo cerrado en el semiplano complejo derecho, es decir, el sistema en lazo cerrado es inestable. En un caso como ´este es necesario un controlador que contribuya con un cero a la funci´on de lazo abierto. Esto sugiere el uso de un controlador proporcional-derivativo (PD). Sin embargo, es importante subrayar lo siguiente. De acuerdo a (11.17) y (11.18), el valor de i∗o es utilizado para compensar

594

11 Levitaci´ on magn´etica

de manera exacta el efecto de la gravedad y as´ı conseguir que el error en estado estacionario sea cero, es decir que y = yd cuando el tiempo sea suficientemente ∂L(x∗ ) grande. Por tanto, cualquier incertidumbre en los valores de mg, de ∂x22 o de la ganancia Ad resultar´a en un error de estado estacionario diferente de cero. Una manera eficiente de resolver este problema es usando un controlador que incluya una acci´on integral sobre el error de posici´on. Por esta raz´on, a continuaci´on se dise˜ na un controlador PID. 11.5.2.

Un controlador proporcional-integral-derivativo (PID)

El controlador propuesto tiene la siguiente forma: Ã ! k s2 + kdp s + kkdi Gc (s) = kd s

(11.35)

En la secci´on 5.2.7 se ha encontrado el lugar de las ra´ıces correspondiente a la funci´on de transferencia de lazo abierto Gc (s)G(s) con G(s) dada en (11.31) y Gc (s) dada en (11.35) cuando se elige: kp = 31.24, kd

ki 31.24 = kd 0.8

(11.36)

De acuerdo a lo encontrado en la secci´on 5.2.7, todos los polos de lazo cerrado tienen parte real negativa para valores de kd que satisfacen kd > 0.01. En la tabla 11.1 se muestran los valores seleccionados de kd y las correspondientes ganancias del controlador PID obtenidas usando (11.36). El controlador PID se construye usando el amplificador operacional colocado entre los puntos A y B de la figura 11.3. De acuerdo a la secci´on 8.2, las ganancias de este controlador est´an dadas como: κp =

C1 R2 + , R1 C2

κd = R2 C1 ,

κi =

1 R1 C2

(11.37)

Por otro lado, en la secci´on 11.3.3 se indic´o que las dos resistencias de 10[KOhm] conectadas al punto VP 1 introducen una ganancia igual a 1/2. Como esta ganancia debe ser considerada como parte del controlador en (11.35) se concluye que: κp κd κi kp = , kd = , ki = (11.38) 2 2 2 Usando (11.37) y (11.38) se calculan los valores de R1 , R2 , C1 y C2 mostrados en la tabla 11.1. En esa misma tabla se muestran los valores que se usaron experimentalmente para estos elementos de circuito. Estos valores se consiguieron combinando resistencias y capacitores de los siguientes valores comerciales: 330[KOhm] y 330[KOhm] (en paralelo), 22[KOhm] y 47[KOhm] (en serie), 47[KOhm] y 33[KOhm] (en serie), 470[KOhm] y 330[KOhm] (en serie), varios capacitores de 0.1[µF] en paralelo, un capacitor de 1[µF] y dos capacitores de 1[µF] en serie.

11.6 Resultados experimentales

595

Tabla 11.1. Valores num´ericos probados experimentalmente. kd 0.0396

0.0792

0.1188

0.1584

0.1980

11.6.

Ganancias PID Valores calculados Valores experimentales R1 = 323.34[KΩ] R1 = 330[KΩ] kd = 0.0396 R2 = 766.59[KΩ] R2 = 800[KΩ] kp = 1.2371 C1 = 0.10331[µF] C1 = 0.1[µF] ki = 1.5464 C2 = 1[µF] C2 = 1[µF] R1 = 161.67[KΩ] R1 = 165[KΩ] kd = 0.0792 R2 = 766.59[KΩ] R2 = 800[KΩ] kp = 2.4742 C1 = 0.20663[µF] C1 = 0.2[µF] ki = 3.0928 C2 = 1[µF] C2 = 1[µF] R1 = 107.78[KΩ] R1 = 100[KΩ] kd = 0.1188 R2 = 766.59[KΩ] R2 = 800[KΩ] kp = 3.7113 C1 = 0.30994[µF] C1 = 0.3[µF] ki = 4.6391 C2 = 1[µF] C2 = 1[µF] R1 = 80.834[KΩ] R1 = 80[KΩ] kd = 0.1584 R2 = 766.59[KΩ] R2 = 800[KΩ] kp = 4.9484 C1 = 0.41326[µF] C1 = 0.4[µF] ki = 6.1855 C2 = 1[µF] C2 = 1[µF] R1 = 64.667[KΩ] R1 = 69[KΩ] kd = 0.1980 R2 = 766.59[KΩ] R2 = 800[KΩ] kp = 6.1855 C1 = 0.51657[µF] C1 = 0.5[µF] ki = 7.7319 C2 = 1[µF] C2 = 1[µF]

Resultados experimentales

En la figura 11.8 se muestran los resultados obtenidos experimentalmente cuando se usan las ganancias correspondientes a kd = 0.0792. El experimento realizado consiste en hacer levitar la esfera y una vez que alcanza el reposo se le aplica un peque˜ no golpe hacia arriba a manera de perturbaci´on. N´otese que como respuesta a esta perturbaci´on la variable z2v = yv − yv∗ disminuye inicialmente, lo que significa que la esfera se mueve hacia arriba para despu´es de algunas oscilaciones regresar a su posici´on inicial. N´otese tambi´en que cuando la esfera se mueve hacia arriba la corriente ordenada i∗ disminuye ya que es esta acci´on la que permite a la esfera regresar hacia abajo. Tambi´en se puede observar en la figura 11.8 que 12 z2v es igual a cero en estado estacionario, es decir que y = yd . Esto significa que, en efecto, la parte integral del controlador cumple su funci´on. Por otro lado, la corriente el´ectrica medida en estado estacionario a trav´es del electroim´an es de 1.7[A]. Comp´arese con x∗1 =2.1174[A] calculada al principio de la secci´on 11.5. Es conveniente advertir que las variables z2v e i∗ mostradas en la figura 11.8 fueron obtenidas mediante el filtrado de las se˜ nales medidas debido a que ´estas conten´ıan cantidades importantes de ruido. N´otese que a pesar de este hecho el sistema construido consigue su objetivo principal: usar un controlador para hacer estable en lazo cerrado a una planta que en lazo abierto es inestable.

596

11 Levitaci´ on magn´etica

Es conveniente aclarar que el objetivo principal del sistema de levitaci´on magn´etica construido es conseguir hacer levitar la esfera de una manera estable. Aunque el conseguir experimentalmente las caracter´ısticas de respuesta transitoria y de estado estacionario dise˜ nadas es un aspecto importante de un controlador, sin embargo, no es el aspecto que se quiere resaltar en el prototipo construido. Recu´erdese que se trata de una planta altamente no lineal a la cual se le ha dise˜ nado un controlador a partir de una aproximaci´on lineal que es v´alida en una regi´on de trabajo reducida cuyos l´ımites no est´an definidos expl´ıcitamente. Es por esto que las ganancias del controlador PID se han seleccionado s´olo para asegurar estabilidad pero no se ha hecho nada por dise˜ nar caracter´ısticas de respuesta transitoria espec´ıficas. Una muestra de como las no linealidades del sistema afectan la respuesta del sistema de control completo es presentada a continaci´on. En la tabla 11.2 se presentan los polos de lazo cerrado conseguidos con cada uno de los valores de kd mostrados en la tabla 11.1. N´otese que en todos los casos, todos los polos de lazo cerrado tienen parte real negativa. A pesar de esto, en la tabla 11.2 se muestra que para algunos valores de kd se observ´o inestabilidad de manera experimental. Esto significa que la esfera no pudo permanecer levitando cuando se probaron las ganancias correspondientes en el prototipo construido. De manera m´as espec´ıfica, se encontr´o que para valores grandes de las ganancias PID la esfera empieza a oscilar r´apidamente hasta caer al suelo. Estos resultados experimentales sugieren que no deben utilizarse ganancias PID muy grandes a pesar de que el an´alisis te´orico asegure estabilidad. Otro aspecto interesante se observa cuando se var´ıa el valor de yd . Utilizando las ganancias correspondientes a kd = 0.0792 y partiendo de yd = 0.01[m], se redujo yd poco a poco, es decir la esfera se acerc´o m´as y m´as al electroim´an. Conforme esto sucede la esfera empieza a vibrar y llega un momento en que la esfera permanece levitando pero no en un valor constante de y sino describiendo un movimiento oscilatorio claramente apreciable como se muestra en la figura 11.9. Si disminuye yd a´ un m´as, entonces la oscilaci´on es muy r´apida y de amplitud muy grande de modo que escapa y cae al suelo. Esto sugiere que se espera que haya menos problemas para hacer levitar la esfera si la posici´on deseada que se propone yd es mayor, es decir si se ordena que la esfera levite m´as alejada del im´an. Esta conjetura es a´ un m´as respaldada por el hecho de que al usar kd = 0.1584 (que produce inestabilidad experimentalmente para yd = 0.01[m]) se consigue estabilidad, es decir que la esfera levita, cuando se usa un valor de yd mayor de que 0.01[m]. Sin embargo, esto tambi´en tiene un l´ımite ya que la fuerza del electroim´an disminuye al alejarse la esfera. Finalmente, en la figura 11.10 se muestra una fotograf´ıa del sistema de levitaci´on magn´etica funcionando donde se alcanza a apreciar el electroim´an y el sistema ´optico usado para la medici´on de la posici´on de la esfera.

11.6 Resultados experimentales

597

Tabla 11.2. Polos de lazo cerrado para los valores de kd usados cuando yd = 0.01[m]. kd

0.0396

0.0792

0.1188

0.1584

0.1980

Polos de Comportamiento lazo cerrado experimental −2562.0 −149.4 estabilidad −26.2 −1.8 −2353.6 −355.8 estabilidad −28.4 −1.5 −2088.3 −620.6 estabilidad −29.0 −1.4 −1635.3 −1073.5 inestabilidad −29.3 −1.4 −1354.3 + j617.1 −1354.3 − j617.1 inestabilidad −29.4 −1.4

Figura 11.8. Resultados experimentales con el sistema de levitaci´ on magn´etica cuando yd = 0.01[m]. Trazo superior: 21 z2v . Trazo inferior: i∗ , corriente ordenada.

598

11 Levitaci´ on magn´etica

Figura 11.9. Resultados experimentales con el sistema de levitaci´ on magn´etica cuando se usa un valor deseado de posici´ on menor que 0.01[m]. Trazo superior: 1 z . Trazo inferior: i∗ , corriente ordenada. 2 2v

Figura 11.10. El sistema de levitaci´ on magn´etica funcionando.

11.8 Preguntas de repaso

11.7.

599

Resumen del cap´ıtulo

En este cap´ıtulo se ha construido un sistema de control de levitaci´on magn´etica usando exclusivamente electr´onica anal´ogica. El controlador utilizado es un PID y se ha construido usando amplificadores operacionales de acuerdo a lo expuesto en la secci´on 8.2 del cap´ıtulo 8. Como el sistema es no lineal por naturaleza, es necesario obtener un modelo lineal aproximado que s´olo ser´a u ´til de manera local, es decir, el sistema de control funcionar´a correctamente s´olo si el cuerpo a levitar se coloca inicialmente cerca de donde se desea que permanezca. Para encontrar esta aproximaci´on lineal, es de mucha utilidad el modelado usando las variables de estado visto en el cap´ıtulo 7. Una vez que se cuenta con un modelo lineal, se procede a dise˜ nar el controlador PID. Esto requiere del conocimiento de los valores num´ericos de los par´ametros del modelo lineal del sistema de levitaci´on. Por esta raz´on, tambi´en se explica de manera detallada como identificar estos par´ametros experimentalmente. Dado que la planta es inestable y no lineal, este es un problema cuya puesta a apunto en la pr´actica es un tanto compleja. Esto significa que se debe poner mucha atenci´on en considerar todas las ganancias introducidas por cada uno de los elementos del circuito de control cuando se haga el modelado y el dise˜ no del controlador. Errores en este aspecto frecuentemente resultan en un mal funcionamiento del sistema de control. Es muy importante resaltar que la construcci´on del prototipo que se ha presentado no requiere de sensores sofisticados y que tampoco es necesaria una inversi´on econ´omica importante.

11.8. 1. 2.

3.

4. 5. 6. 7. 8.

Preguntas de repaso

¿Por qu´e es recomendable usar un n´ ucleo con forma de E para el electroim´an? ¿Por qu´e no usar un simple n´ ucleo recto? Con el fin de simplificar el problema, en algunos trabajos existentes sobre el tema se supone que la inductancia del electroim´an es constante ¿Cree que esto sea correcto? En un sistema de levitaci´on magn´etica el uso de un lazo de corriente tiene ventajas importantes en el funcionamiento del sistema de control ¿Cu´ales son estas ventajas? ¿Cu´al es la ventaja de usar un controlador PID en lugar de un controlador PD en este problema? ¿Qu´e problemas cree que puedan aparecer si se usan capacitores polarizados en el circuito de control? ¿Qu´e debe hacer si desea incrementar la ganancia del amplificador de potencia basado en modulaci´on por ancho de pulso? ¿Qu´e debe hacer para incrementar la frecuencia del modulador por ancho de pulso? ¿Para qu´e sirve el diodo que se coloca en paralelo con el electroim´an?

600

9. 10.

11 Levitaci´ on magn´etica

¿Qu´e es el punto de operaci´on en un sistema de levitaci´on magn´etica y qu´e lo determina? ¿A qu´e atribuye que el modelo en (11.31) tenga ganancia negativa? ¿Y por qu´e el polinomio en el denominador tiene algunos coeficientes con signo negativo?

Referencias

1. J.D. Kraus, Electromagnetics, McGraw-Hill, Singapore, 1992. 2. Autores varios, Special issue on magnetic bearing control, IEEE Transactions on Control Systems Technology, Vol.4, No. 5, 1996. 3. M.Y. Chen, C.F. Tsai, H.H. Huang, and L.C. Fu, Integrated design for a planar MagLev for micro positioning, in Proc. American Control Conference, pp. 30663071, Portland, 2005. 4. J. L´evine, J. Lottin, J.C. Ponsart, A nonlinear approach to the control of magnetic bearings, IEEE Transactions on Control Systems Technology, vol. 4, no. 5, pp. 524-544, 1996. 5. M.G. Feemster, Y. Fang and D. Dawson, Disturbance rejection for a magnetic levitation system, IEEE Transactions on Mechatronics, vol. 11, no. 6, pp. 709717, 2006. 6. J.-C. Shen H∞ control and sliding mode control of magnetic levitation system, Asian Journal of Control, vol. 4, no. 3, pp. 333-340, 2002. 7. R. Ortega, A. van der Schaft, I. Mareels and B. Maschke, Putting energy back in control, IEEE Control Systems Magazine, pp. 18-33, April 2001. 8. R. Ortega, A. Lor´ıa, P. J. Nicklasson and H. Sira-Ram´ırez, Passivity-based control of Euler-Lagrange Systems, Springer, London, 1998. 9. M.S. de Queiroz, and D. Dawson, Nonlinear control of active magnetic bearings: a backstepping approach, IEEE Transactions on Control Systems Technology, vol. 4, no. 5, pp. 545-552, 1996. 10. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River, 2002. 11. W. Hurley, M. Hynes and W. Wolfle, PWM Control of a magnetic suspension system, IEEE Transactions on Education, vol. 47, no. 2, pp. 165-173, 2004. 12. W. Hurley, W. Wolfle, Electromagnetic design of a magnetic suspension system, IEEE Transactions on Education, vol. 40, no. 2, pp. 124-130, 1997.

12 Control de un sistema Ball and Beam

x

balín

R varilla

r

F = mgsenò

ò

mg

ò

Figura 12.1. Sistema ball and beam.

El sistema ball and beam es un prototipo did´actico muy popular en sistemas de control. Si se considera el modelo completo del mecanismo se encuentra que es no lineal y que es dif´ıcil de controlar debido al efecto centr´ıfugo que sufre el bal´ın como resultado del giro de la varilla. Sin embargo, este fen´omeno es importante s´olo cuando la velocidad de la varilla es muy grande. Si se supone que la varilla y el bal´ın se mueven a bajas velocidades y si la varilla s´olo describe ´angulos cercanos a la horizontal entonces el modelo es lineal y resulta ser un buen banco de pruebas para las t´ecnicas de control cl´asico.

604

12 Control de un sistema Ball and Beam

Objetivos del cap´ıtulo Construir la totalidad de las partes que componen a un sistema ball and beam y, en particular, el sensor de la posici´ on del bal´ın. Usar un microcontrolador y una computadora personal para construir un controlador multilazo que emplea un compensador de adelanto. Aplicar los conceptos de control cl´ asico a una planta que es inestable por naturaleza. Identificar de manera experimental los par´ ametros del mecanismo. Considere la situaci´on representada en la figura 12.1. Se trata de una varilla que cuenta con un canal dentro del cual rueda un bal´ın. La inclinaci´on de la varilla puede ser modificada usando un motor de corriente directa y esta inclinaci´on genera el movimiento del bal´ın por efecto de la gravedad. El objetivo de control en este mecanismo es conseguir que el bal´ın alcance el reposo en una posici´on especificada de antemano a lo largo de la varilla. Este mecanismo es conocido en la literatura en ingl´es bajo el t´ermino “ball and beam” y es un prototipo muy utilizado para probar experimentalmente diversos controladores dise˜ nados usando t´ecnicas cl´asicas y avanzadas [1], [2]. Como se muestra en este cap´ıtulo, este mecanismo es inestable y los m´etodos cl´asicos de dise˜ no introducen el uso de un lazo interno de control. Estas son las razones por las que se desea presentar el problema de control de este mecanismo en el presente cap´ıtulo La nomenclatura utilizada es la siguiente: u es el voltaje aplicado en las terminales de armadura del motor. x es la posici´on del bal´ın medida desde el extremo izquierdo de la varilla. θ es la inclinaci´on de la varilla respecto de la horizontal. m es la masa del bal´ın. R y r representan, respectivamente, el radio del bal´ın (esf´erico) y el radio de giro del bal´ın sobre los bordes del canal. i es la corriente el´ectrica de armadura. L es la inductancia de armadura. Ra es la resistencia de armadura. ke es la constante de fuerza contraeletromotriz. km es la constante de par. Jm es la inercia del rotor del motor. bm es la constante de fricci´on viscosa del motor. JL es la inercia de la varilla. bL es la constante de fricci´on viscosa de la varilla. n1 y n2 representan el n´ umero de dientes del engrane del eje del motor y del eje de la varilla, respectivamente, y n = nn21 .

12.1 Modelo matem´ atico

12.1.

605

Modelo matem´ atico

El modelo matem´atico que interesa es aquel que indica c´omo se ve afectada la posici´on del bal´ın, a lo largo de la varilla, bajo el efecto de un voltaje aplicado en las terminales de armadura del motor. Es importante observar que conforme el bal´ın se desplaza sobre la varilla el peso del primero ejerce un par de giro sobre la varilla el cual depende de la posici´on del bal´ın sobre la varilla. Por otro lado, un fen´omeno interesante que puede ocurrir si la varilla se mueve r´apidamente es el siguiente. Suponga que el bal´ın trata de escapar, es decir x aumenta, y se cambia r´apidamente la inclinaci´on de la varilla con el fin de hacerlo regresar. Sin embargo, debido al efecto de la fuerza centr´ıfuga el bal´ın continuar´a escapando en lugar de regresar. Con el fin de que no aparezcan los efectos descritos en el p´arrafo anterior se supondr´a que: El par ejercido por el peso del bal´ın sobre la varilla es despreciable, lo cual es muy cercano a la realidad si el motor act´ ua sobre la varilla a trav´es de una caja de engranes con tasa de reducci´on elevada. La varilla se mover´a con velocidades θ˙ peque˜ nas y la inclinaci´on θ s´olo tomar´a valores peque˜ nos alrededor de cero. Modelo del motor el´ ectrico y la varilla El motor de CD y la varilla se pueden modelar como se hizo en la secci´on 9.1 considerando que la carga est´a representada por la varilla, es decir: L

di = u − Ra i − n ke θ˙ dt J θ¨ = −b θ˙ + n km i J = n2 Jm + JL , b = n2 bm + bL

(12.1) (12.2)

Procediendo como en las secciones 9.1, 9.2 y 9.3 se puede usar el lazo de corriente: ui = K(i∗ − i) as´ı como el amplificador de potencia: u = Ap ui para encontrar que el modelo del motor de CD y la varilla est´a dado como: k I ∗ (s) (12.3) s(s + a) nkm b a= , k= J J donde se ha supuesto que no est´a presente ninguna perturbaci´on externa, es decir Tp = 0. θ(s) =

606

12 Control de un sistema Ball and Beam

Modelo del movimiento del bal´ın Considere la situaci´on mostrada en la figura 12.1. Se supone que cualquier desplazamiento x del bal´ın es producido por la inclinaci´on θ de la varilla. El modelo matem´atico buscado se obtiene usando la Segunda Ley de Newton para describir el movimiento traslacional del bal´ın, el cual tiene dos componentes: 1) el movimiento traslacional de una part´ıcula de masa m y 2) el movimiento giratorio sobre su propio eje de una esfera de masa m. balín

! ~

v~

ï



r~

bordes del canal

Figura 12.2. Estudio del movimiento giratorio del bal´ın.

Sup´ongase primero que el bal´ın est´a fijo en el espacio y que es el canal el que se mueve de modo que, por efecto de la fricci´on, hace que el bal´ın gire (sin cambiar su posici´on en el espacio). En la figura 12.2 se muestra tal situaci´on (suponiendo que x˙ = 0). N´otese que r 6= R debido a la separaci´on entre los bordes del canal. Si ω es la velocidad angular con que gira el bal´ın y v es la velocidad con que se desliza el canal hacia la izquierda, entonces: ω×r=v

(12.4)

donde “×” representa el producto cruz de dos vectores y las flechas sobre las letras indican que las variables son vectores. Aprovechando que la velocidad angular y el radio son perpendiculares, se puede escribir la expresi´on anterior en t´erminos de los m´odulos de los vectores involucrados como: ωr = v v˙ ω˙ = r

(12.5) (12.6)

12.1 Modelo matem´ atico

607

Sea f la fuerza que ejerce el canal sobre el bal´ın y que hace que ´este gire. N´otese que dicha fuerza se aplica a una distancia r del centro del bal´ın. Entonces rf es el par que ejerce el canal sobre el bal´ın. Aplicando la Segunda Ley de Newton a esta situaci´on se encuentra: Jb ω˙ = f r R2 2 f = mv˙ 2 5 r

(12.7) (12.8)

donde se ha usado (12.6) y Jb = 52 mR2 es la inercia de una esfera s´olida de masa m y radio R que gira sobre su propio eje (bal´ın) [3], [4], p´ag. 271. Ahora consid´erese la situaci´on real: el canal permanece en reposo y es el bal´ın el que rueda con lo que su posici´on x ahora cambia y la velocidad y la aceleraci´on del bal´ın est´an dadas como (se supone que el bal´ın rueda sobre los bordes del canal sin patinar): x˙ = −v,

x ¨ = −v˙

(12.9)

Entonces, f es la fuerza equivalente que el movimiento giratorio del bal´ın ejerce sobre s´ı mismo y que contribuye al desplazamiento del bal´ın a lo largo del canal. Con este antecedente, se puede aplicar la Segunda Ley de Newton al movimiento traslacional del bal´ın considerando que, adem´as del efecto de la gravedad, existe una fuerza f que el giro del bal´ın ejerce sobre s´ı mismo (v´ease la figura 12.1): m¨ x = f + mg sin θ

(12.10)

Usando (12.8), (12.9) se tiene: 2 R2 m¨ x = − m¨ x 2 + mg sin θ r¶ µ 5 2 R2 1+ x ¨ = g sin θ 5 r2

(12.11) (12.12)

N´otese que la fuerza f , debida a la inercia del giro del bal´ın, representa una fuerza de oposici´on al movimiento traslacional de bal´ın: de acuerdo a la Primera Ley de Newton la inercia representa la oposici´on que un cuerpo presenta hacia cambios en su situaci´on actual de movimiento. Con el fin de representar correctamente la oposici´on de f a la traslaci´on del bal´ın, f (que incluye un signo negativo) debe aparecer sumando (y no restando) en (12.10). Como se ha dicho previamente, se considera que θ siempre es muy peque˜ na (θ ≈ 0) por lo que se puede escribir: sin θ ≈ θ

(12.13)

Es importante mencionar que esta aproximaci´on require que el ´angulo θ est´e dado en radianes [4], p´ag. 942. Entonces (12.12) se convierte en:

608

12 Control de un sistema Ball and Beam

µ

1+

2 R2 5 r2



x ¨ = gθ

(12.14)

´o, usando la transformada de Laplace con condiciones iniciales cero: X(s) ρ = 2 θ(s) s ρ=

(12.15) g

1+

2 R2 5 r2

lo cual representa el modelo del movimiento del bal´ın. Finalmente, el modelo del sistema ball and beam est´a dado por la combinaci´on de (12.3) y (12.15), es decir: X(s) ρ = 2, θ(s) s

12.2.

θ(s) =

k I ∗ (s) s(s + a)

(12.16)

Construcci´ on del prototipo

En esta parte se describe la manera en que ha sido construido el prototipo usado. A continuaci´on se listan los componentes principales del sistema de control. Computadora personal de escritorio Pentium II a 233 MHz. Tarjeta de adquisici´on de datos PCL-812PG de Advantech [5]. Cuenta con 15 canales de entrada anal´ogico-digital manejados por un solo convertidor AD de aproximaciones sucesivas de 12 bits, con entrada anal´ogica en el rango de -5[V] a +5[V]. Dos canales de salida digital-anal´ogico, cada uno cuenta con un convertidor DA de 12 bits, con salida anal´ogica en el rango de 0[V] a +5[V]. Motor de CD con escobillas e im´an permanente. Voltaje nominal de 24[V], corriente nominal de 2.3[A]. Varilla del sistema ball and beam. Compuesta por: i) una varilla de madera de secci´on circular (riel n´ umero uno), ii) una varilla de aluminio de secci´on circular (riel n´ umero dos), iii) una l´amina de madera que sirve de soporte para las dos varillas anteriores. Sensor de posici´on para la inclinaci´on de la varilla. Potenci´ometro de precisi´on de 5[KOhm], una vuelta, sin tope. Sistema de medici´on de la posici´on del bal´ın. Se describe a continuaci´on. En la figura 12.3 se presenta el diagrama de bloques del sistema de control completo.

12.2 Construcci´ on del prototipo PCL 812 PG CP

INTERFACES Y MECANISMO BALL AND BEAM

609

x ò SISTEMA DE MEDICIÓN DE ò

òý

SISTEMA DE MEDICIÓN DE x



Figura 12.3. El bloque interfaces y mecanismo ball and beam se muestra en la figura 12.7. El sistema de medici´ on de θ se muestra en la figura 12.6. El sistema de medici´ on de x se muestra en la figura 12.4.

12.2.1.

Medici´ on de la posici´ on x del bal´ın

Una parte importante e interesante del prototipo es el sistema de medici´on de la posici´on del bal´ın. De hecho, generalmente esta es la parte que mayores dificultades presenta a la hora de construir el sistema de control. La manera m´as com´ un de hacer esta medici´on es utilizando una resistencia que se encuentra distribuida a lo largo de uno de los rieles que conforman el canal de la varilla. El otro riel es un conductor cuya resistencia puede considerarse igual a cero. As´ı, conforme el bal´ın (hecho de material conductor de la electricidad) rueda haciendo contacto el´ectrico con ambos rieles, el segundo conductor tiene un voltaje que es igual al voltaje que tiene el primer riel justo en el punto donde el bal´ın hace contacto con ´el. De esta manera, los rieles forman en conjunto un potenci´ometro y el bal´ın constituye el contacto m´ovil del mismo. Debido a que el material necesario para distribuir la resistencia a lo largo del primer riel puede ser dif´ıcil de conseguir en ocasiones, en esta obra se construye un sistema de medici´on diferente, el cual puede ser construido f´acilmente y sus componentes son f´aciles de conseguir. El riel que se denominar´a como n´ umero uno esta constituido por una varilla de madera de secci´on circular de aproximadamente 0.01[m] de di´ametro y 0.65[m] de longitud. Sobre esta varilla de madera se devana cuidadosamente alambre magneto de manera que las espiras queden ajustadas, una junto a la otra, sin dejar espacio entre ellas y, a la vez, sin que una se encime a la otra. De este modo se consigue construir una bobina cil´ındrica de 0.65[m] de longitud y 0.01[m] de di´ametro cuya superficie externa es suficientemente lisa como para permitir que el bal´ın ruede sobre ella suavemente. La raz´on de usar una varilla de madera para construir este riel es evitar la posibilidad de que las espiras queden en corto circuito si el barniz del alambre magneto llegara a da˜ narse. El riel n´ umero dos es una varilla cil´ındrica de aluminio de 0.65[m] de longitud y 0.01[m] de di´ametro. Ambos rieles se colocan uno frente al otro, paralelos y a una distancia de 0.017[m], entre los puntos m´as cercanos de los rieles, sobre un soporte de madera (v´ease la figura 12.4). As´ı, se forma un

10kÒ

1nF

riel número uno

10kÒ

x

1nF

25kÒ

10kÒ

TL081

10kÒ

balín

-

+

0:017 [m]

riel número dos

0:65 [m]

4:7V

Zeners

1kÒ

canal

Figura 12.4. Sistema de medici´ on de x. à 15V

TIP42

TIP41

+ 15V

1öF

1N4002

soporte de madera

3:3kÒ

6:8kÒ

xv

610 12 Control de un sistema Ball and Beam

12.2 Construcci´ on del prototipo

611

canal de 0.65[m] de longitud y 0.017[m] de ancho. Los extremos de este canal se obstruyen utilizando material suave como la espuma utilizada para empacar equipo delicado para evitar que el bal´ın escape. Este conjunto constituye la varilla del mecanismo ball and beam. El bal´ın se selecciona de manera que sus dimensiones le permitan rodar dentro del canal haciendo contacto con ambos rieles y, al mismo tiempo, que el mismo canal evite que el bal´ın lo abandone. Este aspecto es importante, sobre todo en la etapa en la que se hacen los primeros ajustes experimentales pues la varilla suele presentar movimientos bruscos que pueden hacer que el bal´ın salte y abandone el canal. Finalmente, se identifica la zona donde el bal´ın hace contacto con el riel n´ umero uno y se raspa esa estrecha franja de la bobina de este riel a lo largo toda la longitud. Esto permitir´a el contacto el´ectrico, atrav´es del bal´ın y conforme ´este rueda, entre ambos rieles. El bal´ın utilizado tiene las siguientes dimensiones (v´ease la figura 12.5): 2R = 0.0238[m],

2z = 0.01895[m],

r = 0.0072[m]

(12.17)

0:0238 [m ]

balín

z

R

r

riel número dos

riel número uno

0:01895 [m ]

Figura 12.5. El bal´ın rodando entre los dos rieles.

Los extremos de la bobina del riel n´ umero uno se conectan a una fuente de voltaje alterno (v´ease la secci´on 8.3.1) con forma de onda seno de 10[V] de pico y de 16[KHz]. El uso de una frecuencia elevada ayuda a limitar la corriente que demanda la bobina y, al mismo tiempo, reduce el voltaje de rizo que se produce en el proceso que se describe a continuaci´on. El riel n´ umero dos se conecta a un circuito rectificador de media onda que a su vez alimenta

612

12 Control de un sistema Ball and Beam

a un circuito RC en paralelo que sirve de filtro para reducir el voltaje de rizo del voltaje de CD que se obtiene. As´ı, conforme el bal´ın rueda en el canal, la magnitud de este voltaje de CD, xv , es representativa de la posici´on x del bal´ın a lo largo del canal. Finalmente, se usa una caja de engranes para unir el motor de CD con la varilla con el fin de aumentar el par aplicado sobre ´esta. De acuerdo a lo expuesto la secci´on 12.3, no es necesario conocer la tasa de reducci´on de la caja de engranes. 12.2.2.

Medici´ on de la inclinaci´ on θ de la varilla

El ´angulo de inclinaci´on θ de la varilla se mide utilizando un potenci´ometro. Para esto, la terminal m´ovil del potenci´ometro se conecta mec´anicamente a la varilla mediante dos brazos de aluminio (v´ease la figura 12.6). As´ı, cualquier desplazamiento angular de la varilla produce un desplazamiento ´angular de la terminal m´ovil del potenci´ometro y, por tanto, un voltaje, θv , que es representativo de la inclinaci´on θ de la varilla. motor de CD

balín

varilla

terminal móvil

+ 5V BASE brazos potenciómetro

òý Figura 12.6. Sistema de medici´ on de θ.

12.2.3.

Interfaces y amplificador de potencia

Como puede verse en (12.16) la se˜ nal de control es la orden de corriente −i∗ , la cual se restringe por software a que tome valores en el rango de -3[A] y +3[A]. N´otese que esta caracter´ıstica y el uso de una PC junto con la tarjeta de adquisici´on de datos PCL-812PG hacen que la interfaz de salida que se utilizar´a para el sistema ball and beam sea id´entica a la que se dise˜ na en la secci´on 10.8. Por razones similares, la interfaz de entrada que se utilizar´a con

12.2 Construcci´ on del prototipo

613

Realimentación de corriente

à 15V 1k

à

+

TL081

ui à TL081

i

+

1M

5:5k

3:3k

[0; 5 ] V

+

PCL 812 PG

5:6k

à

TL081

5V

à iã [à 3; 3 ] A

33k

33k +

à

TL081

3:3k

6:72k

control de corriente Acondicionamiento de señal

Realimentación para reducir zona muerta de transistores

TIP 145 Q

TIP 141 Q

15V

Amplificador de potencia

u

MOTOR

1Ò 5W

SISTEMA BALL AND BEAM

ò

x

el sistema ball and beam es igual a la dise˜ nada en la secci´on 10.8. Finalmente, el amplificador de potencia y el lazo de corriente que se utilizan (v´ease la figura 12.7 1 ) son muy parecidos a los dise˜ nados en las secciones 9.6.2 y 9.6.1, respectivamente.

Figura 12.7. Bloque de interfaces y mecanismo ball and beam. 1

Todos los amplificadores operacionales usados en la figura 12.7 son TL081. Los tres primeros tienen la terminal “+” conectada a tierra mientras que el conectado a las bases de los transistores tiene la terminal “+” conectada a ui .

614

12 Control de un sistema Ball and Beam

12.3.

Identificaci´ on

12.3.1.

Sistema de medici´ on de la inclinaci´ on θ de la varilla

Se encontr´o que cuando la varilla se coloca en posici´on perfectamente horizontal (θ = 0[rad]) el potenci´ometro entrega 1.45[V] y cuando la varilla se inclina 10 grados (θ = 0.174[rad]) el potenci´ometro entrega 1.7[V]. Se verific´o que el sistema de medici´on es lineal, es decir, que entrega incrementos de voltaje que son proporcionales a los incrementos de ´angulo θ. Por tanto, la ganancia del sistema de medici´on est´a dada como: Aθ =

θv (1.7 − 1.45)[V] = = 1.43[V/rad] θ 0.174[rad]

(12.18)

donde θv es la se˜ nal de voltaje entregada por el sistema de medici´on. 12.3.2.

Sistema de medici´ on de la posici´ on x del bal´ın

Cuando el bal´ın se coloca en el extremo izquierdo del canal (x = 0[m]) el sistema de medici´on entrega 0.03[V] y cuando el bal´ın se coloca en el extremo derecho del canal (x = 0.65[m]) el sistema de medici´on entrega 3.7[V]. Se verific´o que el sistema de medici´on es lineal, es decir, que entrega incrementos de voltaje que son proporcionales a los incrementos de la posici´on del bal´ın x. Por tanto, la ganancia del sistema de medici´on est´a dada como: Ax =

(3.7 − 0.03)[V] xv = = 5.64[V/m] x 0.65[m]

(12.19)

donde xv es la se˜ nal de voltaje entregada por el sistema de medici´on. Por otro lado, la identificaci´on experimental de los par´ametros que aparecen en el modelo (12.16) puede realizarse estudiando la din´amica del motor y la varilla (12.3) y la din´amica del bal´ın (12.15) por separado. Los procedimientos utilizados se describen a continuaci´on. 12.3.3.

Subsistema motor-varilla

El procedimiento utilizado en esta parte en similar al utilizado en la secci´on 10.1. Se utiliza el siguiente control proporcional de posici´on: I ∗ (s) = kp Aθ (θd (s) − θ(s))

(12.20)

donde se usa Aθ porque θv (s) = Aθ θ(s) representa la variable que entrega el sistema de medici´on de la inclinaci´on de la varilla y es la variable que realmente maneja la computadora utilizada como controlador en el experimento. Esto significa que el sistema en lazo cerrado (12.3), (12.20) queda representado como en la figura 12.8. La funci´on de transferencia correspondiente es:

12.3 Identificaci´ on

θv (s) Aθ kp k ωn2 = 2 = 2 θvd s s + as + Aθ kp k s + 2ζωn s + ωn2 p ωn = Aθ kp k, a = 2ζωn

615

(12.21) (12.22)

donde θvd (s) = Aθ θd (s) es la inclinaci´on deseada en t´erminos del voltaje ò d (s )



Iã (s )

ò ý d (s )

kp

+

k s ( s+ a )

ò ý (s )

ò (s ) Aò

à

Figura 12.8. Control proporcional de la posici´ on de la varilla.

entregado por el sistema de medici´on de la inclinaci´on de la varilla. En la figura 12.9 se presentan los resultados experimentales obtenidos cuando kp = 4. Este experimento se realiza sin colocar el bal´ın sobre los rieles. Midiendo directamente en la figura 12.9 se encuentra que tr = 0.18[s] y Mp ( %) = 60.8. Estos datos se utilizan en las expresiones: v ³ ´ u u ln2 M p( %) 100 u ³ ´ (12.23) ζ=t 2 M p( %) ln + π2 100 !# " Ãp 1 − ζ2 1 (12.24) ωd = π − atan tr ζ ωd ωn = p (12.25) 1 − ζ2

para obtener ζ = 0.15 y ωn = 9.71[rad/s]. Finalmente, utilizando las expresiones en (12.22) con kp = 4 se encuentra: k = 16.5134,

12.3.4.

a = 3.04

(12.26)

Din´ amica del bal´ın

Aplicando la transformada inversa de Laplace a (12.15) y considerando todas las condiciones iniciales iguales a cero se obtiene: x ¨ = ρ θ(t)

(12.27)

Suponga que θ(t) = θ0 donde θ0 es una constante. Integrando dos veces (12.27):

616

12 Control de un sistema Ball and Beam

òv [V]

M p (%) = 60:8

ò vd ï

ï

tr = 0:18

iã [A]

tiempo [s] Figura 12.9. Resultados experimentales usando kp = 4 y el diagrama de bloques de la figura 12.8.

x(t) =

1 ρ θ 0 t2 2

(12.28)

A continuaci´on se presenta un procedimiento que permite estimar de manera experimental el valor del par´ametro ρ. Fije firmemente la varilla de manera que su inclinaci´on defina un ´angulo de valor θ = θ0 , donde θ0 es un valor positivo peque˜ no. Un buen valor es θ0 = 0.174[rad] (el equivalente a 10 grados) porque sin(0.174) = 0.173, es decir sin(θ0 ) ≈ θ0 . Coloque el bal´ın en el extremo superior de la varilla (x = 0) y d´ejelo rodar libremente hasta alcanzar el extremo inferior de la varilla (la varilla no debe moverse durante este paso). Mida la posici´on que describe el bal´ın conforme rueda entre los extremos de la varilla. Esta tarea es facilitada si se utiliza una PC. Grafique contra el tiempo la posici´on del bal´ın obtenida en el paso anterior. Usando el valor de θ0 utilizado en el primer paso del experimento, proponga un valor arbitrario de ρ para graficar la funci´on 21 ρ θ0 t2 sobre los mismos ejes utilizados en el paso anterior. Proponga diferentes valores de ρ. El valor correcto de ρ es aquel que permite que la gr´afica de los datos experimentales y la gr´afica de la funci´on

12.4 Dise˜ no del controlador

617

1 2ρ

θ0 t2 coincidan durante todo el tiempo en el que se realiz´o el experimento. En la figura 12.10 se muestran las gr´aficas mencionadas en el procedimiento anterior. Se utiliza θ0 = 0.174[rad] y se encuentra que: ρ=5

(12.29)

Es importante tener el cuidado de que el valor experimental de x que se grafica est´e expresado en unidades de longitud (metros). Esto puede conseguirse usando x = xv /Ax . Finalmente, es interesante mencionar que la validez de este valor num´erico se ha verificado mediante el uso de (12.15), (12.17) y g = 9.81[m/s2 ], pues se obtiene un valor igual a 4.687 para ρ.

[m] 1 úò 0t 2 2

x (experimental)

tiempo [s] Figura 12.10. Identificaci´ on experimental del par´ ametro ρ.

12.4.

Dise˜ no del controlador

N´otese que el modelo de la planta (12.16) tiene tres polos en s = 0 por lo que es inestable en lazo abierto. As´ı, un objetivo importante del dise˜ no del sistema de control en lazo cerrado es conseguir su estabilidad. En la figura 12.11(a) se presenta un diagrama de bloques del sistema de control que se dise˜ na. Este diagrama de bloques se puede representar como en la figura

618

12 Control de un sistema Ball and Beam

12.11(b). El lector puede revisar lo expuesto en la secci´on 6.8.2 para entender por qu´e se usa este diagrama de bloques. En este problema de dise˜ no se debe conseguir que l´ımt→∞ x(t) = xd donde xd es una constante que representa la posici´on que se desea alcance el bal´ın sobre el canal. Xd (s)

Ax

E (s )

Xvd (s) +

b í s+ s+ c

à

+

V1 (s )

Iã (s )

+

ë à

k s ( s+ a )

ú s2

X(s)

à

ò ý (s ) Aò

ký s

ò ý (s ) Xv (s)



Ax

(a) E (s )

Xd (s) +

Ax

b í s+ s+ c

à

+

V1 (s )

ë

Iã (s )

+

à

k s ( s+ a )

ú s2

X(s)

à

ò ý (s ) ký s

ò ý (s )





(b) Figura 12.11. Diagramas de bloques equivalentes del sistema de control a dise˜ nar.

N´otese que la funci´on de transferencia de lazo abierto del sistema mostrado en la figura 12.11(b) tiene dos polos en s = 0 por lo que es de tipo 2. Entonces, como xd es constante, se asegura que l´ımt→∞ x(t) = xd si la funci´on de transferencia de lazo cerrado X(s)/Xd (s) es estable (v´eanse las secciones 3.8 y 4.4). Por tanto, el u ´nico problema que resta es encontrar los valores de las constantes α, kv , γ, b y c de manera que la funci´on de transferencia X(s)/Xd (s) sea estable. A continuaci´on se explica como se consigue esto. La funci´on de transferencia de lazo abierto del sistema mostrado en la figura 12.11(b) est´a dada como: G(s)H(s) =

αkAθ 1 Ax ρ γb s + b c (12.30) cAθ b s + c s2 + (a + kv kAθ )s + αkAθ s2

donde c > b > 0. En la figura 12.12 se muestran las gr´aficas de Bode de G(s)H(s) y de cada una de las funciones de transferencia que la forman. N´otese que si la constante αkAθ es suficientemente grande, es decir si αkAθ ≫ s2 + (a + kv kAθ )s, entonces: s2

αkAθ ≈1 + (a + kv kAθ )s + αkAθ

(12.31)

12.4 Dise˜ no del controlador

619

dB

ii) 0

b v)

1

c

iv)

p

i)

ëkA ò

!

iii) vi)

fase [grados] + 90 0 à 90 à 180

v) b

c

iv)

p

ëkA ò iii)

!

ii)

à 270

vi)

à 360

Figura 12.12. Gr´ aficas de Bode de G(s)H(s) en (12.30).

Esto tambi´en puede interpretarse pensando que la funci´on de transferencia en (12.31) tiene una magnitud de 0[dB] y una fase de 0 grados. Es interesante observar que esta situaci´on tambi´en se puede apreciar en la figura 12.12: cuando αkAθ es suficientemente grande, es decir cuando la frecuencia de corte de la funci´on de transferencia en (12.31) est´a colocada muy a la derecha, este factor de segundo orden no tiene ning´ un efecto sobre la respuesta en frecuencia en lazo abierto y, entonces, puede ser despreciado. Por tanto, si αkAθ es grande el problema se reduce a conseguir estabilidad en lazo cerrado de un sistema cuya funci´on de transferencia de lazo abierto est´a dada como: Ax ρ γb s + b c 1 cAθ b s + c s2

(12.32)

Esta es una simplificaci´on importante porque se elimina el atraso de fase debido a la funci´on de transferencia en (12.31), el cual puede tomar valores entre 0 y −180 grados (en el caso de que dicha funci´on de transferencia no fuera cercana a la unidad). Esto significa que estabilizar a (12.32) requiere menos adelanto de fase que el requerido para estabilizar a (12.30). Debe tenerse presente que introducir mayor adelanto de fase hace m´as exigente la tarea de

620

12 Control de un sistema Ball and Beam

s+b dise˜ nar el controlador porque normalmente requiere de un compensador γ s+c que es m´as sensible al ruido introducido por los sensores de posici´on. N´otese que se puede conseguir un valor grande de αkAθ aumentando el valor de α pues los valores de k y Aθ son fijos una vez que se ha construido el prototipo. Sin embargo, un valor grande de αkAθ tiene el efecto de deteriorar el desempe˜ no del sistema de control. De hecho, durante las pruebas experimentales que se realizaron para poner a punto el prototipo se utilizaron valores grandes de αkAθ y se observ´o que se incrementa el efecto nocivo del ruido introducido por los sensores: el mecanismo vibra exageradamente y el sistema de control no funciona adecuadamente. Por tanto, el valor de α queda limitado por el m´aximo valor permitido por el prototipo experimental a´ un cuando no se consiga cumplir la condici´on (12.31). Por otro lado, si kv = √ 0 entonces el sistema en (12.31) estar´a mal amorno. Esto produce un pico de tiguado porque ζ = a/(2 αkAθ ) ser´a peque˜ resonancia en la gr´afica de Bode de (12.30). El problema del pico de resonancia es que incrementa el efecto de las altas frecuencias produciendo vibraciones no deseadas en el mecanismo. Una soluci´on que ha dado buenos resultados en el prototipo construido es el uso de un valor k√v > 0 porque esto aumenta el factor de amortiguamiento ζ = (a + kv kAθ )/(2 αkAθ ) del sistema en (12.31) y, por tanto, se reduce el pico de resonancia en la gr´afica de Bode de (12.30). En base a estos razonamientos y despu´es de varias pruebas experimentales se encontr´o que los siguientes valores producen resultados satisfactorios:

α = 4,

kv = 0.2

(12.33)

N´otese que el sistema de la figura 12.11(b), junto con los valores num´ericos en (12.18), (12.19), (12.26), (12.29), (12.33) conforman un problema id´entico al resuelto en la secci´on 6.8.2 donde se encontr´o que la soluci´on est´a dada por el siguiente compensador: Gc (s) = γ

12.5.

s+b , s+c

b = 1.84,

c = 13.2,

γ = 2.6

Construcci´ on del controlador

De acuerdo a la figura 12.11(a), el controlador que se debe construir est´a dado como: i∗ = α[v1 − θv ] − kv θ˙v

(12.34)

donde θv y θ˙v representan la se˜ nal entregada por el sensor de inclinaci´on de la varilla y su derivada, respectivamente. Por otro lado, V1 (s) = L{v1 } est´a definida como: s+b E(s) s+c E(s) = Xvd (s) − Xv (s)

V1 (s) = γ

(12.35)

12.6 Resultados experimentales

621

donde Xv (s) y Xvd (s) son las transformadas de Laplace de la posici´on del bal´ın medida xv (obtenida a la salida del sistema de medici´on correspondiente) y de su valor deseado xvd , respectivamente. Procediendo como en las secciones 10.2.2 y 10.5 se encuentra que la funci´on del tiempo v1 se puede calcular en tiempo discreto como: v1 (k) = γ[e(k) + v(k)] v(k + 1) = [−cv(k) + (b − c)e(k)]∆t + v(k) donde e(k) y v1 (k) son los valores actuales en tiempo discreto de las funciones L{e} = E(s) y L{v1 } = V1 (s) definidas en (12.35) (es decir e(k) = xvd (k) − xv (k)) y ∆t = 0.005[s] es el periodo de muestreo. As´ı, se puede calcular iterativamente el valor v(k + 1) que representa el valor de v que ser´a utilizado en el proximo instante de muestreo. Esto se hace partiendo del valor inicial v(0) = 0. N´otese que v(k + 1) se calcula en el instante de muestreo presente pero s´olo ser´a utilizado hasta el instante de muestreo proximo inmediato en el futuro. Finalmente, la se˜ nal θ˙v se calcula a partir de la medici´on de θv del siguiente modo: θv (k) − θv (k − 1) θ˙v ≈ ∆t

(12.36)

El controlador se programa en Borland C++ y se utiliza una computadora personal y una tarjeta adquisitora de datos PCL-812PG de Advantech. Al final de la secci´on 12.6 se presenta el c´odigo utilizado. Se debe subrayar que el experimento debe empezar colocando la varilla en una inclinaci´on tal que θ = 0, con el fin de que el programa de computadora reconozca el valor (diferente de cero) entregado por el sistema de medici´on de θ cuando θ = 0.

12.6.

Resultados experimentales

En la figura 12.13 se presentan los resultados experimentales obtenidos. Se utiliza una posici´on deseada xvd = 1[V] que corresponde a xd = 0.177[m]. Es importante mencionar que con el fin de obtener mejores desempe˜ nos se ajustaron un poco las ganancias del compensador: Gc (s) = γ

s+b s+c

(12.37)

de modo que b = 2.5, c = 17.7 y γ = 0.854. Durante estos ajustes se mantuvo constante el factor ξ = 0.14 dise˜ nado en la secci´on 6.8.2 de manera que b/c = 2.5/17.7 = 1.84/13.2 = 0.14. Al usar b = 2.5 en lugar del valor 1.84 se consigue reducir un poco el efecto del ruido, el cual ha mostrado ser importante en el prototipo construido y puede ser apreciado en la figura 12.13. Dicho sea de paso, mucho del ruido presente es debido al voltaje de rizo en el sistema de

622

12 Control de un sistema Ball and Beam

medici´on de x y al contacto intermitente del bal´ın, mientras rueda, con las espiras del sensor correspondiente (n´otese que en la figura 12.13(a) el ruido disminuye cuando el bal´ın se detiene). Por otro lado, el valor de γ = 0.854 utilizado es tres veces menor que el valor de 2.6 dise˜ nado. Esto se hizo porque se encontr´o que un valor grande de γ produce vibraciones del mecanismo (efecto del ruido). En la figura 12.14 se muestran las gr´aficas de Bode de la funci´on de transferencia de lazo abierto en (12.30) cuando se usa b = 2.5, c = 17.7 y γ = 0.854. El margen de fase obtenido es de alrededor de 20 grados, es decir aproximadamente el mismo margen de fase dise˜ nado originalmente. Este peque˜ no margen de fase explica el gran sobre paso observado en la figura 12.13. Finalmente, un aspecto que vale la pena mencionar es el efecto de las conexiones a tierra y de las interferencias electromagn´eticas que ellas producen, pues fueron varios los problemas observados (mediciones dif´ıciles de entender) por causa de este aspecto. Se recurri´o a bibliograf´ıa especializada en este tema [6] y se corrigieron las conexiones a tierra en base a las sugerencias ah´ı expuestas. De este modo se eliminaron los problemas observados. La raz´on por la cual los efectos de las tierras e interferencias electromagn´eticas se presentaron en este prototipo y no en los otros prototipos que se exponen en esta obra es la longitud de los conductores utilizados para conectar el sistema de medici´on de x. Sin embargo, no fue necesario reducir dicha longitud, simplemente se eliminaron lazos de tierras que eran innecesarios. En la figura 12.15 se presentan los resultados obtenidos en simulaci´on del diagrama de bloques en 12.11(a) cuando se usan los valores num´ericos en (12.18), (12.19), (12.26), (12.29), (12.33), b = 2.5, c = 17.7 y γ = 0.854. N´otese el parecido existente entre los resultados de las figuras 12.13 y 12.15 a pesar de la presencia importante de ruido tanto en la posici´on medida xv como en la se˜ nal de control i∗ . Finalmente, se concluye que el sistema de control cumple con su prop´osito: estabilizar la posici´on del bal´ın xv en un valor muy cercano al valor deseado xvd = 1[V]. Finalmente, en la figura 12.16 se muestra una fotograf´ıa del prototipo de sistema ball and beam construido cuando esta funcionando.

12.6 Resultados experimentales

623

xv [V]

òv [V]

tiempo [s] (a)

iã [A]

tiempo [s] (b) Figura 12.13. Resultados experimentales obtenidos en el sistema ball and beam construido.

624

12 Control de un sistema Ball and Beam Bode Diagram 20

Magnitude (dB)

0 System: ghctrl Frequency (rad/sec): 1.72 Magnitude (dB): −0.0122

−20

−40

−60

−80

−100 −135

System: ghctrl Frequency (rad/sec): 1.72 Phase (deg): −159

Phase (deg)

−180

−225

−270

−315

−360 0

10

1

10 Frequency (rad/sec)

2

10

Figura 12.14. Gr´ aficas de Bode de G(s)H(s) en (12.30) cuando se usa b = 2.5, c = 17.7 y γ = 0.854.

12.6 Resultados experimentales

625

xv [V]

òv [V]

tiempo [s] (a)

iã [A]

tiempo [s] (b) Figura 12.15. Resultados en simulaci´ on obtenidos con el modelo te´ orico del sistema ball and beam construido.

626

12 Control de un sistema Ball and Beam

Figura 12.16. El prototipo ball and beam construido, funcionando.

12.6 Resultados experimentales

C´ odigo usado para programar el algoritmo de control #include <stdio.h> #include #include <math.h> #include<stdlib.h> #include <string.h> #include #include <dos.h> int alto,bajo,dato,salida,i; volatile float Ts=0.005; //Periodo de muestreo volatile float ir,v,dv,nv,e; volatile float x,theta,theta0,thetam1; /*------------------------------------------------------*/ volatile float r_des=0.09,Kp=3.0,Kv=0.2,xd=1.0; volatile float c=17.663,b=2.50989,gama=0.854; volatile long double y0; /*-Direccion base y periodo de muestreo para la tarjeta-*/ int int int int

base=0x210; lsb1=0x00; msb1=0x01; lsb2=0x00;

int msb2=0x01; volatile float yy[3000]; //seal de salida volatile float uu[3000]; //seal de control volatile float ref[3000];//seal de referencia FILE *fp; char Direccion[30]; void Inicializa(void); void EscribeArchivo(float datos1,float datos2,float datos3); void Cierra(void); void main() {

627

628

12 Control de un sistema Ball and Beam clrscr(); /*----Se programa la tarjeta adquisitora----*/ /*---Vease manual PCL 812-PG de Advantech------*/ outportb(base+11,1); //converc. AD iniciada con reloj // y transferencia dato por software outportb(base+9,0);// ganancia 1 outportb(base+3,0x77);//Control del contador outportb(base+1,lsb1); outportb(base+1,msb1); outportb(base+3,0xb7); outportb(base+2,lsb2); outportb(base+2,msb2); i=1; do /*----Inicia ciclo de control----*/ { outportb(base+10,14); outportb(base+12,0); do { } while (inportb(base+5)>15); alto=inportb(base+5); bajo=inportb(base+4); dato=256*alto+bajo; theta=(10.0/4096.0)*dato-5.0; //theta por canal AD 14 outportb(base+10,15); outportb(base+12,0); do { } while (inportb(base+5)>15); alto=inportb(base+5); bajo=inportb(base+4); dato=256*alto+bajo; x=(10.0/4096.0)*dato-5.0; //x por canal AD 15 if(i==1) { //condiciones iniciales v=0.0; theta0=theta; thetam1=0.0; } theta=theta-theta0; /* Control proporcional Varilla*/ // ir=Kp*(r_des-theta);//-Kv*(y-ym1)/Ts;

12.6 Resultados experimentales /* Control con red de adelanto */ e=xd-x; dv=( -c*v+(b-c)*e )*Ts; nv=v+dv; ir=(gama*(e+v)-theta)*4.0-Kv*(theta-thetam1)/Ts; /*-----Se mantiene a theta cercana a cero----*/ if( (theta>(0.5) )&&(ir>=0.0) ) { ir=0.0; } if( (theta<(-0.5) )&&(ir<=0.0) ) { ir=0.0; } ir=-ir; //condicion de saturacion de seal de if(ir>2.9 ) { ir=2.9; } if(ir<-2.9) {ir=-2.9;} salida=floor(682.66*ir+2048.0); bajo=salida & 0xff; alto=salida & 0x0f00; alto=floor(alto/256.0); outportb(base+4,bajo); outportb(base+5,alto); yy[i]=x; uu[i]=ir; ref[i]=theta; v=nv; thetam1=theta; i++; delay(5); if (i>3000) i=3000; }while ( (!kbhit() ) && ( i<=3000 ) ); // while (i<=3000); ir=0.0; // detiene el motor salida=floor(682.66*ir+2048.0); bajo=salida & 0xff; alto=salida & 0x0f00; alto=floor(alto/256.0); outportb(base+4,bajo); outportb(base+5,alto); // Guarda datos en un archivo en el disco duro cout<<<endl; Inicializa(); i-=1; for(int jj=1;jj
629

630

12 Control de un sistema Ball and Beam { EscribeArchivo(yy[jj],uu[jj],ref[jj]); } Cierra(); } void Inicializa(void) { strcpy(Direccion,"c:\\ballbeam\\datos4s8.txt"); if( (fp=fopen(Direccion,"w+")) == NULL) { cout<<"No se puede crear el archivo ni modo"; exit(1); } } void EscribeArchivo(float datos1,float datos2,float datos3) { fprintf(fp,"%f %f %f \n",datos1,datos2,datos3); } void Cierra(void) { fclose(fp); }

12.7. Control basado en el microcontrolador PIC16F877A 12.7.1.

Construcci´ on del sistema de control

En esta parte se utiliza un microcontrolador PIC16F877A [7] para controlar al sistema ball and beam. Se debe aclarar que la parte mec´anica del prototipo tambi´en sufri´o algunos cambios ligeros los cuales ser´an descritos en lo que sigue. A continuaci´on se listan u ´nicamente los componentes nuevos que fueron introducidos. Una computadora port´atil Laptop con puerto USB. Conector de USB a serie. Microcontrolador PIC16F877A de Microchip. Convertidor digital/anal´ogico DAC0800LCN. Amplificadores operacionales TL081. Manejador/Receptor MAX232. En la figura 12.17 se muestra un diagrama de bloques del sistema de control que se construy´o. El sistema de medici´on de x es id´entico al mostrado en la figura 12.4. Sin embargo, la ganancia que se midi´o para este sensor (siguiendo un procedimiento id´entico al descrito en la secci´on 12.3.2) es: Ax = 5.3750[V/m]

(12.38)

12.7 Control basado en el microcontrolador PIC16F877A

INTERFACES Y MECANISMO BALL AND BEAM

PIC16F877A

631

x ò SISTEMA DE MEDICIÓN DE ò

òý

SISTEMA DE MEDICIÓN DE x



Figura 12.17. El bloque interfaces y mecanismo ball and beam se muestra en la figura 12.18. El sistema de medici´ on de θ consta de un potenci´ ometro que se fija directamente a la flecha del motor. El sistema de medici´ on de x se muestra en la figura 12.4.

La peque˜ na diferencia existente con respecto al valor de Ax = 5.64[V/m] mostrado en (12.19) se atribuye a un peque˜ no ajuste en el potenci´ometro de 25[KOhm] que se encuentra en el circuito oscilador de la figura 12.4, ya que dicho potenci´ometro afecta la amplitud de las se˜ nal de corriente alterna que se aplica al sistema de medici´on de x. Por otro lado, el sistema de medici´on de θ con que ahora se cuenta es un poco diferente al mostrado en la figura 12.6 porque ahora el potenci´ometro est´a colocado directamente sobre el eje de giro de la varilla y ya no se usan los brazos mostrados en la figura 12.6 para transmitir el movimiento de la varilla al potenci´ometro. Como consecuencia de esto, el valor obtenido para la ganancia del sistema de medici´on de θ es: Aθ = 0.9167[V/rad]

(12.39)

el cual es diferente a Aθ = 1.43[V/rad] obtenido en (12.18). Los valores: k = 16.6035,

a = 3.3132,

ρ=5

(12.40)

fueron obtenidos usando procedimientos id´enticos a los descritos en las secciones 12.3.3 y 12.3.4. N´otese que estos valores son casi id´enticos a los mostrados en (12.26) y (12.29) porque estos componentes permanecieron sin cambio. Finalmente, en la figura 12.18 se muestra el diagrama de el´ectrico del sistema de control basado en el microcontrolador PIC16F877A mientras que en la secci´on 12.7.4 se muestra el listado usado para programar dicho microcontrolador. Para una explicaci´on detallada de la figura 12.18 y el programa en la secci´on 12.7.4 se recomienda consultar las secciones 9.6 y 10.6 correspondientes al control de velocidad y de posici´on de un motor de CD. Se desea subrayar que en este caso se usan dos canales del convertidor anal´ogico/digital con que cuenta el microcontrolador PIC16F877A: uno para medir la posici´on del bal´ın y otro para medir la inclinaci´on de la varilla. Tambi´en se aclara que la computadora port´atil s´olo se usa para el graficado de las se˜ nales medidas y no participa en el c´alculo del algoritmo de control.

632

12 Control de un sistema Ball and Beam

Figura 12.18. Diagrama el´ectrico del sistema de control del sistema ball and beam basado en el microcontrolador PIC16F877A.

12.7 Control basado en el microcontrolador

12.7.2.

PIC16F877A

633

Dise˜ no del controlador

Se propone utilizar un esquema de control id´entico al presentado en la secci´on 12.4, por lo que el diagrama de bloques del sistema de control en lazo cerrado es id´entico al mostrado en la figura 12.11. Los valores de ganancias: α = 12,

kv = 0.2

(12.41)

fueron seleccionadas experimentalmente de modo que usando un valor constante de v1 (t) (v´ease la figura 12.11), es decir sin realimentar el error de posici´on del bal´ın y sin usar la red de adelanto colocada antes de V1 (s), se obtuviera una respuesta de θ que fuera r´apida y con poca oscilaci´on. N´otese que el valor de α = 12 mostrado en (12.41) es diferente de α = 4 obtenido en (12.33). Esto se debe a un mayor efecto de la fricci´on sobre la flecha del motor en el prototipo remodelado, es decir en el usado en esta secci´on, lo cual resulta en una mayor zona muerta que es compensada usando un valor mayor de la ganancia proporcional α. Usando los valores en (12.38), (12.39), (12.40), (12.41) y la funci´on de transferencia de lazo abierto en (12.30) se procede a usar el lugar de las ra´ıces para determinar que el uso de las siguientes ganancias asegura estabilidad en lazo cerrado: γ = 1.2,

c = 20,

b = 2.5

(12.42)

En la secci´on 5.2.8 se explica a detalle el procedimiento seguido para obtener estas ganancias. 12.7.3.

Resultados experimentales

La construcci´on, utilizando herramientas de software, del controlador dise˜ nado en la secci´on anterior se realiza como se explica en la secci´on 12.5 y en la secci´on 12.7.4 se muestra el listado de como se consigue usando un microcontrolador PIC16F877A [8]. Tambi´en se usa el diagrama el´ectrico de la figura 12.18. En la figura 12.19 se muestran los resultados experimentales obtenidos al usar dicho controlador, es decir, con las ganancias mostradas en (12.41) y (12.42). Se puede observar que el bal´ın alcanza el reposo en una posici´on xv muy cercana a 1[V], la cual es muy cercana al valor deseado xvd = 1[V]. La peque˜ na diferencia que se puede apreciar es debida a la zona muerta producida por la fricci´on sobre la flecha del motor. En la figura 12.20 se muestran los resultados obtenidos en simulaci´on con el mismo controlador, el diagrama de bloques en la figura 12.11 y los valores num´ericos mostrados en (12.38), (12.39), (12.40), (12.41), (12.42). N´otese el parecido entre las respuestas en las figuras 12.19 y 12.20 a pesar de la presencia importante de ruido en el prototipo experimental. Finalmente, en la figura 12.21 se muestran otros resultados experimentales en los que se aprecia como el sistema de control logra estabilizar la posici´on del bal´ın xv muy cerca del valor deseado xvd = 1[V] a pesar de que el bal´ın es desviado varias veces de su posici´on deseada por

634

12 Control de un sistema Ball and Beam xv [V]

òv [V]

tiempo [s]

Figura 12.19. Resultados experimentales usando el microcontrolador PIC16F877A.

un agente externo (el bal´ın es empujado intencionalmente con el dedo). Estos resultados muestran que se ha conseguido satisfactoriamente el prop´osito del sistema de control: estabilizar el bal´ın muy cerca de su posici´on deseada. Finalmente, en la figura 12.22 es muestra una fotograf´ıa del prototipo usado en estos experimentos. xv [V]

òv [V]

tiempo [s]

Figura 12.20. Resultados en simulaci´ on.

12.7 Control basado en el microcontrolador

PIC16F877A

635

xv [V]

òv [V]

tiempo [s]

Figura 12.21. Resultados experimentales usando el microcontrolador PIC16F877A. Aparecen desviaciones producidas por un agente externo.

Figura 12.22. El sistema ball and beam construido.

12.7.4.

Programa utilizado en el microcontrolador PIC16F877A

// Programa para comunicacion serial entre PC y proyecto Control // Con el PIC16F877A y el compilador PCWH V3.43 #include<16f877A.h>

636

12 Control de un sistema Ball and Beam //#device adc=10 #include<stdlib.h> #include<math.h>

//manejar adc de 10 bits

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD #use delay(clock=20000000) //Base de tiempo para retardos //(frecuencia del Xtal) //Config. //P. Serie #use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N) //direcciones de los puertos y algunos registros #byte OPTION= 0x81 #byte TMR0 = 0x01 #byte PORTA = 0x05 #byte PORTB = 0x06 #byte PORTC = 0x07 #byte PORTD = 0x08 #byte PORTE = 0x09 #byte ADCON0= 0x1F #byte ADCON1= 0x9F #bit PC0 = 0x07.0 #bit PC1 = 0x07.1 //------------Declaracion de variables------------// int16 inter,cuenta; int8 cuentaH,cuentaL,puerto,AB,AB_1,aux; int8 cont,iastd,cont2,cont3,cont4,t_0,t_1; float x,xd,teta,error,iast,tiempo,c,b; float gamma,alfa,kv,v,v1,tetam1; unsigned int u,i; //int1 ban; //------------Rutina de interrupcion------------// #int_rb void rb_isr() { puerto=PORTB; AB=((puerto)&(0x30))>>4; aux=AB^AB_1; if(aux!=0) if(aux!=3) if(((AB_1<<1)^AB)&(0x02)) cuenta--; else cuenta++; AB_1=AB;

12.7 Control basado en el microcontrolador

PIC16F877A

} //------------Programa principal------------// void main(void) { setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno) set_tris_a(0b11111111); set_tris_b(0b11111111); set_tris_c(0b10000000); //comunicacion serial set_tris_d(0b00000000); set_tris_e(0b11111111); OPTION=0x07; //prescaler timer0, 1:256 PORTC=0; TMR0=0; cuenta=0; AB=0; AB_1=0; enable_interrupts(global); enable_interrupts(int_rb); cont=0; cont2=0; cont3=0; cont4=0; PORTD=127; xd=1.0; tiempo=0.0; gamma=1.2; c=20.0; b=2.5; alfa=12.0; kv=0.2; tetam1=0.0; v=0.0; ADCON1=0x04; ADCON0=0x81; while(cont2<3) { while(cont3<255) { TMR0=0; while(TMR0<255) { } cont3++; } cont2++; } TMR0=0; while(TRUE) { ADCON0=0x81; //Cambiando a CH0

637

638

12 Control de un sistema Ball and Beam for(i=0;i<37;i++); t_0=read_adc(); x=0.0196*t_0;

/estabilizar capacitor interno //leer ADC

ADCON0=0x89; //cambiando a CH1 for(i=0;i<37;i++); //estabilizar capacitor interno t_1=read_adc(); //leer ADC teta=0.0196*t_1-2.81;//2.81; error=xd-x; /* Controlador */ v1=gamma*(error+v); v=(-c*v+(b-c)*error)*0.002+v; iast=alfa*(v1-teta)-kv*(teta-tetam1)/0.002; /* ___________________________________________ */ if(iast<-3.3) iast=-3.3; if(iast>3.3) iast=3.3; iast=-iast; iastd=(unsigned int)(36.4286*iast+127); PORTD=iastd; tetam1=teta; cuentaH=t_1; cuentaL=t_0; putc(0xAA); putc(cuentaH); putc(cuentaL);

//reconocimieno puerto serial //cuenta al puerto serial

/* iast=-iast; iastd=(unsigned int)(36.4286*iast+127); cuentaH=0x00; cuentaL=(iastd)&(0xFF); putc(0xAA); //reconocimienopuerto serial putc(cuentaH); //cuenta puerto serial putc(cuentaL); */

} }

PC1=1; //inicia espera del timer while(TMR0<40) //1 cuenta=(4/FXtal)*256 seg, 20=1 ms { } PC1=0; //termina espera del timer TMR0=0; tiempo=tiempo+0.002; //cierre del while infinito //cierre del main

12.8 Sistema de medici´ on mejorado

639

12.8. Un sistema de medici´ on mejorado para la posici´ on del bal´ın Durante las pruebas experimentales presentadas en las secciones 12.6 y 12.7.3, se observ´o que el sistema de medici´on mostrado en la figura 12.4 puede llegar a producir vibraciones r´apidas de la varilla por lo que el bal´ın puede salir despedido. Se lleg´o a la conclusi´on de que este comportamiento es producido por el uso de una se˜ nal de corriente alterna de alta frecuencia como parte fundamental del sistema de medici´on mostrado en la figura 12.4. En la figura 12.23 se muestra el diagrama el´ectrico de un nuevo sistema de medici´on que elimina el problema arriba mencionado. Como se puede observar en esta figura, se contin´ ua utilizando el soporte de madera y los rieles n´ umero uno (alambre magneto arrollado sobre un n´ ucleo cil´ındrico de madera) y n´ umero dos (varilla cil´ındrica de aluminio) que ya se hab´ıan utilizado en la figura 12.4. La modificaci´on consiste en que el riel n´ umero uno, el cual se utilizaba como un inductor en la figura 12.4, ahora se utiliza como una simple resistencia (resistencia del cobre) en la figura 12.23. Esto significa que los dos rieles funcionan en conjunto como un simple potenci´ometro que en el punto xv entrega un voltaje de CD que es proporcional a la posici´on x del bal´ın. El valor de xv se mide utilizando uno de los convertidores anal´ogico-digital del microcontrolador PIC16F877A conectando la terminal etiquetada como AN1 al pin n´ umero 3 de dicho microcontrolador. Es importante mencionar que, previamente, xv se hace pasar a trav´es de un filtro pasa bajas con frecuencia de corte de 14.6148 [Hz] (R = 33[KOhm], C = 0.33[µF]). Adem´as, con el fin de disminuir las posibles variaciones de xv debidas al calentamiento del riel n´ umero uno, el voltaje presente en la terminal etiquetada como AN3 (que se conecta al pin 5 del microcontrolador) se utiliza como el voltaje de referencia para el convertidor anal´ogico-digital encargado de medir xv . Tambi´en es importante decir que, previamente, la se˜ nal entregada en AN3 se hace pasar a trav´es de un filtro pasa bajas con frecuencia de corte de 4.8229 [Hz] (R = 100[KOhm], C = 0.33[µF]). A continuaci´on se muestra el c´odigo utilizado para programar el microcontrolador PIC16F877A a f´ın de realizar la tarea de leer la posici´on x del bal´ın: #device adc=10 //manejar adc de 10 bits setup_adc(ADC_CLOCK_INTERNAL); //ADC (reloj interno) setup_adc_ports(ANALOG_RA3_REF);//RA3(AN3)= referencia set_adc_channel(1);

ADC

conv=read_adc(); x=0.65*(conv-511)/1023; // posicion del balin en metros

La expresi´on x=0.65*(conv-511)/1023 se obtiene del siguiente modo. La variable “conv” var´ıa en el rango [0,210 -1]=[0,1023] porque el convertidor anal´ogico-digital est´a programado para trabajar con 10 bits. Sin embargo, la

640

12 Control de un sistema Ball and Beam

Figura 12.23. Un sistema de medici´ on mejorado para la posici´ on del bal´ın.

12.10 Preguntas de repaso

641

operaci´on “conv-511” hace que (conv-511) tome valores en el rango [-511,512], lo cual corresponde a valores de x en el rango de [-0.65/2,0.65/2][m] (en la secci´on 12.2.1 se especifica que ambos rieles tienen una longitud de 0.65[m]). Entonces se debe cumplir la siguiente regla: 511 → 0.65/2 [m] (conv-511) → x[m] De aqu´ı se obtiene la expresi´on x=0.65*(conv-511)/1023. Por otro lado, una mejora adicional que tambi´en puede contribuir a reducir el problema citado al principio de la presente secci´on es el uso de un encoder, en lugar de un potenci´ometro, para medir el ´angulo de inclinaci´on de la varilla θ. En la secci´on 10.7 se indica como programar el microcontrolador PIC16F877A para leer un encoder.

12.9.

Resumen del cap´ıtulo

En este cap´ıtulo se ha construido un sistema ball and beam y todas las interfases necesarias para su control en lazo cerrado. El esquema de control utilizado cuenta con dos lazos. El lazo interno sirve para controlar (control proporcional con realimentaci´on de velocidad) el ´angulo de inclinaci´on de la varilla mientras que el lazo externo controla la posici´on del bal´ın (compensador de adelanto). Un aspecto interesante del prototipo construido es el que se refiere al sensor de la posici´on del bal´ın. La idea es construir un canal formado por dos rieles que, juntos, funcionan de manera similar a un potenci´ometro. As´ı, el voltaje entregado por los rieles es proporcional a la posici´on del bal´ın sobre la varilla. Se ha mostrado que el controlador puede ser dise˜ nado utilizando las dos t´ecnicas fundamentales del control cl´asico: la respuesta en el tiempo (el lugar de las ra´ıces) y la respuesta en frecuencia (criterio de de estabilidad de Nyquist y m´argenes de fase y de ganancia). Desde el punto de vista de la pr´actica en la construcci´on de sistemas de control, se ha visto que el efecto del ruido y las correctas conexiones a tierra son muy importantes en este prototipo. Tambi´en se han presentado algunos m´etodos experimentales interesantes para identificar los par´ametros del bal´ın y del conjunto motor-varilla. Adem´as, se ha mostrado como deben ser tomadas en consideraci´on las ganancias debidas a los sensores, aspecto que generalmente es evitado durante los cursos sobre control autom´atico en las instituciones educativas.

12.10. 1. 2.

Preguntas de repaso

¿Por qu´e se dice que el sistema ball and beam es inestable en lazo abierto? ¿C´omo funciona el sistema de medici´on de la posici´on del bal´ın?

642

3. 4. 5.

6.

7. 8. 9.

10.

12 Control de un sistema Ball and Beam

D´e una explicaci´on descriptiva (no anal´ıtica) de por qu´e se necesita controlar la inclinaci´on de la varilla adem´as de la posici´on del bal´ın. ¿Por qu´e la masa equivalente del bal´ın depende de los radios R y r de acuerdo a (12.12)? ¿Qu´e pasar´ıa si r = 0 y qu´e significa esto? Describa el procedimiento experimental descrito en la secci´on 12.3.4 para identificar el u ´nico par´ametro de la din´amica del bal´ın ¿Qu´e otro procedimiento puede usar para esto? El sistema de navegaci´on autom´atica de un barco es muy similar a un sistema ball and beam, donde papel de la varilla es sustituido por un tim´on. En base a esto intente resolver el problema de control autom´atico de la direcci´on de un barco. Describa el funcionamiento del amplificador de potencia utilizado ¿Por qu´e se dice que un compensador de adelanto introduce menos ruido que un controlador PD? ¿Por qu´e cree que para controlar la inclinaci´on de la varilla sea preferible el uso de un controlador proporcional con realimentaci´on de velocidad en lugar de un controlador PD? En los resultados experimentales obtenidos se alcanza a observar un peque˜ no error en estado estacionario. Sin embargo, el sistema de control es tipo 2 y la posici´on deseada del bal´ın es constante por lo que el error en estado estacionario deber´ıa ser igual a cero ¿C´omo explica esto?

Referencias

1. Quanser Inc. 119 Spy Court Markham, Ontario L3R 5H6, Canada. Available at: http://www.quanser.com 2. P.V. Kokotovic, The joy of feedback: nonlinear and adaptive (1991 Bode Prize Lecture), IEEE Control Systems Magazine, pp. 7-17, June 1992. 3. Hibbeler R. C., 2004, Mec´ anica vectorial para ingenieros. Dinamica, (10a. edici´ on), Pearson Educaci´ on, M´exico. 4. M. Alonso and E.J. Finn, F´ısica, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1995. 5. PCL-812PG User’s Manual, Advantech, Taiwan, 1996. 6. J. Balcells, F. Daura, R. Esparza y R. Pall´ as, Interferencias electromagn´eticas en sistemas electr´ onicos, Alfaomega-Marcombo, Serie Mundo Electr´ onico, M´exico, 1992. 7. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Technology Inc., 2003. 8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual, 2003.

13 Control de un p´ endulo de Furuta

El p´endulo de Furuta es otro prototipo did´actico bien conocido en la literatura de control autom´atico. En este mecanismo se deben controlar simult´aneamente las posiciones de dos cuerpos, por lo que la soluci´on a este problema de control es m´as natural usando el enfoque de las variables de estado que el de la funci´on de transferencia. La aplicaci´on experimental de las t´ecnicas de control moderno es la principal raz´on para incluir el problema de controlar este mecanismo.

646

13 Control de un p´endulo de Furuta

Objetivos del cap´ıtulo Construir un p´endulo de Furuta. Construir las interfaces necesarias para el funcionamiento del sistema de control. Usar un microcontrolador para construir un controlador por realimentaci´ on del estado. Aplicar los conceptos de control moderno a una planta que es inestable por naturaleza. Identificar de manera experimental los par´ ametros del mecanismo. En este cap´ıtulo se presenta el control de un sistema conocido como el p´endulo de Furuta. En la figura 13.1 se muestra un dibujo del p´endulo de Furuta. Este problema puede ser descrito de una manera muy ilustrativa haciendo referencia al bien conocido truco de mantener en equilibrio a una escoba invertida colocada sobre la palma de la mano. En un p´endulo de Furuta la mano es sustituida por una varilla (conocida t´ecnicamente como brazo) que en un extremo tiene colocado un motor el´ectrico del cual recibe un par que hace posible su movimiento. As´ı, el brazo s´olo puede moverse sobre un plano horizontal de modo que su extremo opuesto a donde se encuentra el motor describe una circunferencia. En este extremo se coloca otra varilla (conocida t´ecnicamente como p´endulo) de la cual uno de sus extremos se une al extremo libre del brazo mediante un rodamiento o alg´ un otro dispositivo mec´anico que permite el movimiento libre del p´endulo respecto del brazo. Esto significa que no existe ning´ un motor colocado en esta uni´on mec´anica. Sin embargo, el rodamiento ah´ı colocado restringe el p´endulo a movimientos giratorios sobre un plano perpendicular al brazo. Esto significa que el extremo libre del p´endulo s´olo puede describir una circunferencia cuyo centro est´a en el punto donde se unen el brazo y el p´endulo. Una de las caracter´ısticas que hacen interesante al p´endulo de Furuta desde el punto de vista de control es que es inherentemente inestable. Esto puede verse f´acilmente recordando el problema de equilibrar la escoba: ´esta siempre tiende a abandonar su posici´on invertida para caer al suelo. Por tanto, la sintonizaci´on del controlador requerido no es una tarea trivial y requiere de un conocimiento adecuado de las t´ecnicas de la Teor´ıa de Control. Las variables y par´ametros involucrados en el p´endulo de Furuta de la figura 13.1 son los siguientes: θ0 es la posici´on angular (en radianes) del brazo medida respecto a una posici´on de referencia arbitraria. θ1 es la posici´on angular (en radianes) del p´endulo medida respecto a su posici´on vertical invertida. τ es el par generado por el motor el´ectrico y que es aplicado sobre el brazo. I0 es la inercia del brazo cuando gira alrededor de uno de sus extremos m´as la inercia del motor.

13.1 Modelo matem´ atico

647

péndulo

z

ò1 m1 l1

J1 y

I 0; L 0

brazo

ò0

x

ü motor

Figura 13.1. El p´endulo de Furuta.

L0 es la longitud del brazo. m1 , l1 y J1 representan, respectivamente, la masa, la ubicaci´on del centro de masa y la inercia del p´endulo. J1 se calcula suponiendo que el p´endulo gira alrededor de su centro de masa. N´otese que el p´endulo esta constituido por una varilla de masa no despreciable. g = 9.81[m/s2 ] representa la aceleraci´on de la gravedad.

13.1.

Modelo matem´ atico

De acuerdo a lo descrito previamente, el p´endulo de Furuta consta de dos cuerpos que interact´ uan. El modelo matem´atico de este tipo de mecanismos normalmente se encuentra usando las ecuaciones de Euler-Lagrange [1]. En el caso del p´endulo de Furuta las ecuaciones de Euler-Lagrange se reducen a: d ∂L ∂L − =τ dt ∂ θ˙0 ∂θ0 d ∂L ∂L − =0 dt ∂ θ˙1 ∂θ1

(13.1)

El cero en el lado derecho de la u ´ltima expresi´on se refiere a que no hay ning´ un motor que aplique un par externo en el lugar donde se unen el brazo y el p´endulo. El lagrangiano L est´a dado como:

648

13 Control de un p´endulo de Furuta

L = K −P K = K0 + K1

(13.2)

donde K0 es la energ´ıa cin´etica del brazo, K1 es la energ´ıa cin´etica del p´endulo y P es la energ´ıa potencial del p´endulo. No se considera la energ´ıa potencial del brazo porque, al moverse sobre un plano horizontal, su energ´ıa potencial es constante y puede ser considerada igual a cero. El c´alculo de la energ´ıa cin´etica de un cuerpo cuya masa est´a distribuida en todo su volumen puede simplificarse si se descompone en dos partes: una parte debida al movimiento traslacional de su centro de masa (considerado como una part´ıcula) y otra parte debida al movimiento giratorio del cuerpo suponiendo que rota alrededor de su centro de masa. Sin embargo, si el movimiento del cuerpo puede ser descrito de manera sencilla entonces no es necesaria esta descomposici´on. Por ejemplo, el movimiento del brazo es descrito f´acilmente como el movimiento giratorio de una varilla alrededor de uno de sus extremos y el giro del rotor del motor alrededor del mismo eje. Por tanto, no es dif´ıcil encontrar que: K0 =

1 ˙2 I0 θ 2 0

(13.3)

Por otro lado, el movimiento del p´endulo es m´as complejo pues depende de los movimientos combinados del brazo y del p´endulo. En este caso es m´as conveniente descomponer el movimiento del p´endulo en dos partes como se mencion´o anteriormente: El movimiento del p´endulo se descompone en el movimiento traslacional de una part´ıcula de masa m1 colocada en su centro de masa y el movimiento rotativo de una varilla que gira sobre un eje que pasa por el centro de masa del p´endulo. Por tanto: K1 =

1 ˙2 1 J1 θ1 + m1 v1T v1 2 2

(13.4)

donde v1 es un vector que representa la velocidad traslacional del centro de masa del p´endulo, es decir:    dXx  Xx dt y  (13.5) , X =  Xy  v1 =  dX dt dXz X z dt

donde Xx , Xy y Xz son las coordenadas cartesianas del centro de masa del p´endulo. Esto significa que X es el vector posici´on del centro de masa del p´endulo. De acuerdo a las figuras 13.2(a) y 13.2(b) se encuentra que:    L0 cos(θ0 ) − l1 sin(θ1 ) sin(θ0 ) Xx X =  Xy  =  L0 sin(θ0 ) + l1 sin(θ1 ) cos(θ0 )  l1 cos(θ1 ) Xz 

(13.6)

13.1 Modelo matem´ atico y

péndulo centro de masa

l 1s

ò0

Xy l 1senò 1cosò 0

en ò1 L0

L 0senò 0 brazo

ò0 Xx

ü

x

L 0cosò 0 l 1senò 1senò 0 L 0cosò 0 à l 1senò 1senò 0

(a) Vista superior. péndulo

l 1senò 1

h

P=0 centro de masa

Xz

l 1cosò 1

ò1 l1

brazo

(b) Vista del plano perpendicular al brazo. Figura 13.2. Relaciones geom´etricas en el p´endulo de Furuta.

649

650

13 Control de un p´endulo de Furuta

Usando (13.4), (13.5), (13.6) y despu´es de reducir t´erminos se encuentra: i h 1 1 K1 = J1 θ˙12 + m1 (L0 θ˙0 )2 + (l1 θ˙0 )2 sin2 (θ1 ) + (l1 θ˙1 )2 + 2θ˙0 θ˙1 L0 l1 cos(θ1 ) 2 2 (13.7) Finalmente, para calcular la energ´ıa potencial del p´endulo se usa como punto de referencia (donde P = 0) al punto donde θ1 = 0. Entonces, recordando que la energ´ıa potencial es el producto escalar del vector fuerza aplicada, es decir el peso del p´endulo m1 g, y el vector distancia que va desde el centro de gravedad del p´endulo hasta el punto donde P = 0, se tiene que: P = −hm1 g,

h = l1 − l1 cos(θ1 )

donde el signo “−” se debe a que los vectores mencionados forman m´as de 90◦ . Entonces: P = m1 gl1 (cos(θ1 ) − 1)

(13.8)

Usando (13.3), (13.7), (13.8) se forma el Lagrangiano, L, de acuerdo a (13.2), para despu´es sustituir en las ecuaciones de Euler-Lagrange dadas en (13.1). Realizando las operaciones correspondientes y acomodando convenientemente los t´erminos resultantes se obtiene: M (q)¨ q + C(q, q) ˙ q˙ + g(q) = F (13.9) ¸ · 2 2 2 I + m1 (L0 + l1 sin (θ1 )) m1 l1 L0 cos(θ1 ) M (q) = 0 m1 l1 L0 cos(θ1 ) J1 + m1 l12 · 1 ¸ m1 l12 θ˙1 sin(2θ1 ) −m1 l1 L0 θ˙1 sin(θ1 ) + 12 m1 l12 θ˙0 sin(2θ1 ) 2 C(q, q) ˙ = − 1 m1 l12 θ˙0 sin(2θ1 ) 0 · ¸ ¸ · ¸ · 2 θ τ 0 , q= 0 , F = g(q) = θ1 0 −m1 l1 g sin(θ1 ) La expresi´on (13.9) constituye el modelo del p´endulo de Furuta, el cual es no lineal porque incluye funciones trigonom´etricas de θ1 as´ı como diferentes productos entre las velocidades θ˙0 y θ˙1 .

13.2.

Modelo lineal aproximado

En esta obra es de inter´es la aplicaci´on de t´ecnicas de control lineal, las cuales no pueden aplicarse directamente cuando el modelo de la planta a controlar es no lineal como el mostrado en (13.9). Sin embargo, existe una manera de resolver este problema. La idea fundamental es encontrar un modelo lineal aproximado que represente con suficiente exactitud al modelo (13.9) para despu´es usar dicho modelo lineal aproximado en el dise˜ no de un controlador para el p´endulo de Furuta. Sin embargo, tal como se indica en la secci´on 7.2.2,

13.2 Modelo lineal aproximado

651

el controlador dise˜ nado de este modo s´olo ser´a de utilidad para equilibrar el p´endulo en su posici´on invertida θ1 = 0 bajo la condici´on de que el p´endulo se encuentre inicialmente cerca de dicha configuraci´on, es decir, siempre se deber´a cumplir que θ1 ≈ 0. El primer paso consiste en escribir (13.9) en t´erminos de variables de estado. De acuerdo a lo expuesto en la secci´on 7.1, dado un conjunto de ecuaciones diferenciales como (13.9), se puede encontrar una representaci´on en variables de estado definiendo las componentes del vector de estado x como las variables inc´ognita de dichas ecuaciones diferenciales y sus primeras r − 1 derivadas, donde r es el orden de la ecuaci´on diferencial correspondiente. N´otese que (13.9) est´a constituida por dos ecuaciones diferenciales, cada una de segundo orden. Las inc´ognitas en dichas ecuaciones son θ0 y θ1 . Por tanto, el vector de estado puede ser seleccionado como:     θ0 x1  x2   θ˙0     x=  x3  =  θ1  x4 θ˙1 Desp´ejese q¨ de (13.9) y def´ınase: ¸ · w1 (x1 , x2 , x3 , x4 , τ ) q¨ = w2 (x1 , x2 , x3 , x4 , τ )

= M −1 (x1 , x3 )[−C(x1 , x2 , x3 , x4 )[x2 , x4 ]T − g(x1 , x3 ) + F ]

(13.10)

Una propiedad importante de la matriz M (q) = M (x1 , x3 ) es que siempre es no singular, es decir, la matriz M −1 (x1 , x3 ) que aparece en la expresi´on anterior siempre existe [2]. Entonces, la ecuaci´on de estado correspondiente se puede escribir como: x˙ = f (x, u)     x2 f1 (x, u)  f2 (x, u)   w1 (x1 , x2 , x3 , x4 , u)  ,   f (x, u) =    f3 (x, u)  =  x4 w2 (x1 , x2 , x3 , x4 , u) f4 (x, u)

(13.11) u=τ

Usando las ideas de la secci´on 7.2.2, ahora se obtiene un modelo lineal aproximado que es v´alido alrededor de un punto de operaci´on de inter´es. Los puntos de operaci´on son las parejas (x∗ , u∗ ) que satisfacen:   0 0 ∗ ∗  f (x , u ) =  0 0

652

13 Control de un p´endulo de Furuta

es decir, de acuerdo a (13.11), (13.10): ·

x∗2 = θ˙0∗ = 0, x∗4 = θ˙1∗ = 0, ¸ w1 (x∗1 , 0, x∗3 , 0, u∗ ) = M −1 (x∗1 , x∗3 ) w2 (x∗1 , 0, x∗3 , 0, u∗ ) ½ · ¸ · ∗ ¸¾ 0 u × −C(x∗1 , 0, x∗3 , 0) − g(x∗1 , x∗3 ) + 0 0 · ¸ 0 = 0

Del segundo rengl´on de estas condiciones se obtiene: · ¸ · ∗¸ 0 u = g(x∗1 , x∗3 ) = 0 −m1 l1 g sin(θ1∗ ) es decir: u∗ = 0,

x∗3 = θ1∗ = ±nπ

donde n puede ser cero o cualquier n´ umero entero. N´otese que no existe ninguna condici´on que deba cumplir x∗1 = θ0∗ lo cual significa que esta variable puede elegirse de manera totalmente arbitraria. Debido a que se desea estabilizar (o “equilibrar”) el p´endulo en su posici´on vertical invertida (n = 0) se selecciona el siguiente punto de operaci´on:  ∗   0 x1  x∗2   0  ∗ ∗    (13.12) x =  x∗3  =  0  , u = 0 0 x∗4 De acuerdo a (7.29), (7.30), (7.31) el modelo no lineal dado en (13.10), (13.11) puede ser aproximado por el siguiente modelo lineal: z˙ = Az + Bv  ∂f1 (x,u)

  A= 

∂f1 (x,u) ∂x1 ∂x2 ∂f2 (x,u) ∂f2 (x,u) ∂x1 ∂x2 ∂f3 (x,u) ∂f3 (x,u) ∂x1 ∂x2 ∂f4 (x,u) ∂f4 (x,u) ∂x1 ∂x2

 ∂f

1 (x,u)



 ∂f2∂u (x,u)    B =  ∂f3∂u (x,u)   ∂u  ∂f4 (x,u) ∂u

∂f1 (x,u) ∂x3 ∂f2 (x,u) ∂x3 ∂f3 (x,u) ∂x3 ∂f4 (x,u) ∂x3

∂f1 (x,u) ∂x4 ∂f2 (x,u) ∂x4 ∂f3 (x,u) ∂x4 ∂f4 (x,u) ∂x4



(13.13)

   

x=x∗ ,u=u∗

x=x∗ ,u=u∗

donde z = x − x∗ y v = u − u∗ . El uso de (13.9), (13.10), (13.11), (13.12), (13.13) define un procedimiento matem´atico (que a pesar de ser un poco largo

13.3 Construcci´ on del p´endulo de Furuta

653

s´olo involucra operaciones matem´aticas sencillas) al final del cual se obtiene lo siguiente: 

0 0  A= 0 0

1 0 0 0

0 −gm21 l12 L0 I0 (J1 +m1 l12 )+J1 m1 L20

0 (I0 +m1 L20 )m1 l1 g I0 (J1 +m1 l12 )+J1 m1 L20

  0 0 J1 +m1 l12  0 2 2    , B =  I0 (J1 +m1 l1 )+J1 m1 L0 1  0 −m1 l1 L0 0 I0 (J1 +m1 l12 )+J1 m1 L20



  (13.14) 

La expresi´on (13.13) junto con (13.14) constituyen el modelo lineal aproximado que se buscaba. Como se mencion´o anteriormente, usando (13.13) y (13.14) se puede dise˜ nar un controlador por realimentaci´on lineal del estado el cual, sin embargo, asegura buenos resultados si se restringe que el estado y la entrada s´olo evolucionen alrededor del punto de operaci´on (13.12). Esto tambi´en suele indicarse diciendo que z ≈ 0 y v ≈ 0. Esto significa que una tarea que jam´as podr´a resolver el controlador que se dise˜ na en este cap´ıtulo es el llevar el p´endulo desde su posici´on vertical hacia abajo (θ1 = ±π[rad]) hasta su posici´on vertical invertida (θ1 = 0). Si el lector est´a interesado en resolver dicho problema, se recomienda que consulte las referencias [2] y [3].

13.3. Construcci´ on del p´ endulo de Furuta e indentificaci´ on de sus par´ ametros En la figura 13.3 se presenta un dibujo detallado que muestra las partes mec´anicas utilizadas para construir el p´endulo de Furuta. Algunas de estas partes se introducen con el fin de acoplar mec´anicamente el motor con el brazo y ´este con el p´endulo. Adem´as, se acoplan dos potenci´ometros, uno directamente a la flecha del motor (P2 ) y otro entre el brazo y el p´endulo (P1 ), para medir θ0 y θ1 , respectivamente. Todas estas partes tienen masas e inercias que deben ser consideradas dentro del modelo del p´endulo de Furuta. Para calcular los momentos de inercia del sistema se recurre a expresiones bien conocidas en los libros de texto sobre mec´anica cl´asica para el momento de inercia de determinados cuerpos geom´etricos tales como varillas, cilindros y prismas rectangulares. Debe tenerse presente que la manera que a continuaci´on se describe para calcular los par´ametos del p´endulo de Furuta puede admitir algunas variantes. De hecho, estos par´ametros deben ser considerados como meras aproximaciones cuya exactitud se ve respaldada por el hecho de que los valores obtenidos permiten calcular, m´as adelante, las ganancias del controlador que, en efecto, permiten resolver el problema de control que interesa, es decir, estabilizar o “equilibrar” el p´endulo en su posici´on vertical invertida. Para calcular la inercia I0 se suma la inercia Ibrazo de la varilla que forma al brazo, la inercia Icubo del prisma rectangular C1 (usado para acoplar la flecha del motor al brazo) y la inercia del motor Irotor . Los valores num´ericos

654

13 Control de un p´endulo de Furuta

de estas inercias se calculan como se indica a continuaci´on. Se mide la longitud total del brazo, L0 = 0.235[m], desde el centro del potenci´ometro P1 hasta el centro del prisma rectangular C1 , es decir, hasta la flecha del motor. La masa total del brazo mbrazo es la suma de i) la masa de la varilla que forma al brazo, m0 , ii) la masa de la abrazadera ab1 (que une el brazo con el potenci´ometro P1 el cual representa el acoplamiento mec´anico entre el brazo y el p´endulo pues el p´endulo se une firmemente a la otra parte m´ovil del potenci´ometro P1 ) e iii) la mitad de la masa del potenci´ometro P1 . El momento de inercia de una varilla que gira respecto de un eje perpendicular a la misma y que pasa por uno de sus extremos se calcula por medio de la expresi´on [4]: Ibrazo =

1 2 mbrazo L20 = 0.96644 × 10−3 [kgm ] 3

Para calcular la inercia Icubo del prisma rectangular C1 se utiliza la siguiente expresi´on que relaciona su momento de inercia con respecto a un eje de giro que pasa por su centro [4], [5], p´ag. 271: Icubo =

mcubo 2 2 (b + c2 ) = 1.9333 × 10−6 [kgm ] 12

donde b y c son las longitudes de los lados de la cara superior del prisma C1 mientras que mcubo es su masa. Por u ´ltimo se calcula la inercia del rotor del motor. La masa del rotor, mr , se estima como la mitad de la masa del motor completo m´as la masa de la abrazadera ab2 (la cual une al potenci´ometro P2 con la flecha del rotor) m´as la mitad de la masa del potenci´ometro P2 . La otra mitad de la masa de P2 permanece siempre en reposo pues est´a fija al soporte del mecanismo. Como el motor es cil´ındrico, se supone que el rotor tambi´en lo es y se estima su radio, R, como la mitad del radio de la carcasa del motor. Esto permite estimar la inercia del rotor, sin necesidad de desarmar el motor, del siguiente modo: la inercia de un cuerpo cil´ındrico de radio R y masa mr que gira respecto a su eje longitudinal est´a dada como [4], [5], p´ag. 271: Irotor =

1 2 mr R2 = 0.16931 × 10−3 [kgm ] 2

Por tanto, el momento de inercia I0 es: 2

I0 = Ibrazo + Icubo + Irotor = 1.137 × 10−3 [kgm ] Para calcular el momento de inercia J1 del p´endulo se considera que su masa m1 est´a formada por la suma de 1) la masa del p´endulo, 2) la masa del acoplamiento entre el p´endulo y el potenci´ometro P1 (placa rectangular de aluminio que se observa en la figura 13.3) y 3) la mitad de la masa del potenci´ometro P1 . Esto debido a que la otra mitad de la masa del potenci´ometro P1 pertenece a la masa total del brazo. Para calcular el momento de inercia de una varilla que gira sobre un eje perpendicular a la misma y que pasa a trav´es de su centro de masa se utiliza la expresi´on [4], [5], p´ag. 271:

13.3 Construcci´ on del p´endulo de Furuta

J1 =

655

1 2 m1 (2l1 )2 = 0.38672 × 10−3 [kgm ] 12

donde l1 = 0.1875[m] es la distancia desde el centro del potenci´ometro P1 hasta el centro de gravedad del p´endulo (ubicado en el centro del p´endulo) y la masa del p´endulo es m1 = 0.033[kg]. El modelo (13.13), (13.14) supone que la se˜ nal de control v = u (porque u∗ = 0) es un par. Sin embargo, en la pr´actica la se˜ nal de control es un voltaje que se aplica al motor el cual se encarga de generar el par u. Para resolver este problema se procede del siguiente modo. Suponga que en el modelo (9.9), (9.10) de la secci´on 9.1 la din´amica el´ectrica es muy r´apida, es decir, que L = 0 y ke = 0. Entonces se encuentra que el par generado por el motor est´a dado aproximadamente por: τ =u=

km Ea ra

(13.15)

donde ra es la resistencia de armadura del motor, Ea es el voltaje aplicado en sus terminales y km es la constante de par del motor. Con el fin de poder usar el voltaje de armadura como se˜ nal de control se debe determinar el valor de la constante km /ra . Esto se consigue mediante el siguiente experimento. El eje del motor se coloca en posici´on horizontal con el brazo y el p´endulo montados en sus posiciones. Se aplica cuidadosamente un voltaje en las terminales de la armadura, de manera que se consiga el equilibrio (reposo) cuando el brazo quede colocado horizontalmente (el p´endulo queda colocado verticalmente). Esto significa que se ha conseguido un equilibrio entre el par generado por el motor y el par producido, sobre el eje del rotor, por el peso del brazo y el peso del p´endulo. Una vez conseguido esto se mide el voltaje aplicado a la armadura Ea y se calcula el par τ debido al peso del brazo y al peso del p´endulo. Con estos datos se usa (13.15) para calcular la constante: km = 0.0215[Nm/V] ra Finalmente, usando (13.13), (13.14), (13.15) y τ = v junto con los valores num´ericos calculados en esta secci´on se encuentra el siguiente modelo el cual ser´a usado para dise˜ nar el controlador: z˙ = Az + BEa  01 0  0 0 −35.81 A= 0 0 0 0 0 72.90



0 0 , 1 0





0  13.4684  km  = B=B   0 ra −12.6603

(13.16)

N´otese que el voltaje de armadura Ea es ahora la se˜ nal de control y que, de acuerdo a (13.15), el valor de esta variable en el punto de operaci´on dado en (13.12) es Ea∗ = 0 .

656

13 Control de un p´endulo de Furuta

Figura 13.3. Componentes del p´endulo de Furuta construido.

13.4.

Dise˜ no del controlador

A continuaci´on se dise˜ na un controlador por realimentaci´on lineal del estado que permita estabilizar al sistema dado en (13.16) en z = 0, es decir en x = x∗ con x∗ dado en (13.12). El controlador debe tener la siguiente forma: Ea = −Kz £ ¤ K = k1 k2 k3 k4 ,

(13.17) £

z = x − x = θ0 θ˙0 θ1 θ˙1 ∗

¤T

donde k1 , k2 , k3 y k4 son cuatro ganancias constantes que deben determinarse de manera que se asegure que z tiende a cero (que x tiende a x∗ ) conforme el tiempo crece. El c´alculo de estas ganancias constituye el dise˜ no del controlador. N´otese que el uso de (13.17) en (13.16) permite escribir: z˙ = (A − BK)z De acuerdo a lo expuesto en la secci´on 7.5 si todos los eigenvalores de la matriz: A − BK

(13.18)

tienen parte real estrictamente negativa entonces se asegura que z tiende a cero conforme el tiempo crece o, equivalentemente, que ambas θ0 y θ1 tienden a cero conforme el tiempo crece, lo cual significa que se consigue estabilizar o “equilibrar” al p´endulo de Furuta en su posici´on vertical invertida. El primer

13.5 Construcci´ on del controlador

657

paso para dise˜ nar el controlador (13.17) consiste en verificar la controlabilidad de la planta dada en (13.16). De acuerdo a lo expuesto en la secci´on 7.9, esto se cumple si la siguiente matriz de 4 × 4 tiene rango 4: £ ¤ B AB A2 B A3 B

Esto es verificado f´acilmente calculando num´ericamente el determinante que resulta ser diferente de cero. Se concluye entonces que (13.16) es controlable. Esta propiedad asegura que siempre es posible encontrar un vector de ganancias K (definido en (13.17)) que consigue asignar a los eigenvalores de la matriz en (13.18) cualquier valor que se desee. Como se mencion´o anteriormente, la selecci´on obvia y deseable es que todos estos eigenvalores tengan parte real negativa. En base a lo anterior, el dise˜ no del controlador se realiza del siguiente modo. Se propone el siguiente conjunto de eigenvalores para la matriz en (13.18): ¯ 1 = −94, λ

¯ 2 = −18, λ

¯ 3 = −0.5, λ

¯ 4 = −1 λ

Usando el procedimiento presentado en los ejemplos 7.6 y 7.7 del cap´ıtulo 7 se encuentra que el correspondiente vector de ganancias es: £ ¤ K = −1.5215 −4.6690 −152.0048 −13.8931 (13.19) Esto significa que el controlador en (13.17) se escribe finalmente como: Ea = 1.5215θ0 + 4.6690θ˙0 + 152.0048θ1 + 13.8931θ˙1

(13.20)

Es importante decir que aunque existen muchos vectores de ganancias K que desde el punto de vista te´orico resuelven el problema de control, sin embargo, desde el punto de vista pr´actico, no todas las ganancias K as´ı calculadas permiten obtener resultados experimentales satisfactorios. As´ı que las ganancias en (13.19) fueron seleccionadas despu´es de verificar experimentalmente que producen buenos resultados.

13.5.

Construcci´ on del controlador

El controlador (13.20) se construye usando el microcontrolador PIC16F877 A de Microchip. A continuaci´on se explica como se ha hecho esto. Antes que nada se debe aclarar que no es el prop´osito presentar toda una exposici´on de como trabaja este microcontrolador. Lo que se presenta es una descripci´on de los recursos de este microcontrolador que se utilizan para construir el controlador (13.20). Al final de este cap´ıtulo se presenta un listado del programa utilizado. El microcontrolador PIC16F877A [6] es de tecnolog´ıa EEPROM, tiene una velocidad de operaci´on m´axima de 20[MHz]. Cuenta con 5 puertos de entrada-salida configurables, 3 temporizadores (el timer TMR0 es utilizado

658

13 Control de un p´endulo de Furuta

en este cap´ıtulo para establecer el periodo de muestreo: T = 0.0256[seg]), 8 canales Anal´ogico-Digital los cuales se basan en un CAD (convertidor Anal´ogicoDigital) de 10 bits (de los cuales s´olo se usan los 8 bits m´as significativos en este cap´ıtulo). Tambi´en cuenta con 2 m´odulos PWM de los cuales en este cap´ıtulo se usa el CCP1 para entregar el voltaje de control a la planta. Este PWM se programa para trabajar a una frecuencia de 4.9[KHz] con una resoluci´on de 28 − 1 = 255 cuentas. Las posiciones θ0 y θ1 se miden usando los potenci´ometros de precisi´on de una vuelta P2 y P1 , respectivamente (ver figura 13.3). Las variaciones de voltaje de estos potenci´ometros son le´ıdas usando los canales 0 y 1 del CAD, respectivamente. Se considera que una vuelta completa de cada potenci´ometro equivale exactamente a 2π radianes y que el rango del CAD (s´olo se usan los 8 bits m´as significativos) equivale a tal variaci´on angular. M´as a´ un, el centro de las variaciones de cada potenci´ometro es la posici´on correspondiente al punto de operaci´on dado en (13.12), es decir x∗1 = θ0∗ = 0 y x∗3 = θ1∗ = 0. Con esto en mente se hacen las siguientes operaciones: 2π (CAD0 − 127) 255 2π (CAD1 − 127) theta1 = 255

theta0 =

(13.21) (13.22)

donde CAD0 y CAD1 representan las lecturas entregadas por los canales 0 y 1 del CAD, respectivamente, mientras que theta0 y theta1 representan las mediciones de θ0 y θ1 , respectivamente, en radianes. Las velocidades θ˙0 y θ˙1 se estiman a partir de las posiciones medidas usando diferenciaci´on num´erica: theta0 (k) − theta0 (k − 1) T theta1 (k) − theta1 (k − 1) dtheta1 = T dtheta0 =

(13.23) (13.24)

donde k representa el tiempo discreto, dtheta0 y dtheta1 representan los estimados de las velocidades θ˙0 y θ˙1 , respectivamente, en radianes por segundo mientras que T = 0.0256[seg] es el periodo de muestreo utilizado. De este modo theta0 (k) indica el valor de theta0 que se mide en el instante de muestreo actual y theta0 (k − 1) indica el valor de theta0 que se midi´o en el instante de muestreo previo. theta1 (k) y theta1 (k − 1) se definen de manera similar. Con esta informaci´on se calcula: da = 1.5215 theta0 + 4.6690 dtheta0 + 152.0048 theta1 + 13.8931 dtheta1 y se env´ıa da al PWM del microcontrolador como se describe a continuaci´on. Se supone que da s´olo tomar´a valores en el rango de -5 a +5 volts, por lo que su valor se satura por software para restringirlo a ese rango de valores utilizando instrucciones como las siguientes:

13.5 Construcci´ on del controlador

659

if da > 5 then da = 5 if da < −5 then da = −5 Como la resoluci´on del PWM es de 28 − 1 = 255 cuentas, entonces la siguiente cuenta debe ser enviada al PWM del microcontrolador para entregar correctamente el valor de da al amplificador de potencia de la planta: cuenta =

255 abs(da ) 5

(13.25)

donde abs(da ) representa el valor absoluto de da . El signo de da es almacenado en dos bits de control. La se˜ nal del PWM se entrega a un puente H (L293D de Texas Instruments) que se encarga de amplificar convenientemente la potencia de la se˜ nal del PWM. Este puente H est´a alimentado con una fuente de potencia de 7[V]. Sin embargo, de acuerdo a la hoja de datos de este dispositivo [7] las caidas de voltaje en el mismo determinan que en las terminales del motor s´olo sean aplicados ±5[V]. Este dispositivo tiene dos bits a trav´es de los cuales se le indica el signo del voltaje que debe entregar. Para ello, el signo de da se env´ıa al puente H a trav´es de los bits 0 y 1 del canal D. Esto significa que el voltaje promedio que el puente H entrega a las terminales del motor s´olo var´ıa en el rango de -5 a +5 volts. As´ı, se asegura que en las terminales del motor de CD se aplica un voltaje Ea cuyo promedio es num´ericamente igual a da . Esto es importante porque asegura que la construcci´on pr´actica del controlador respeta el dise˜ no indicado en (13.20). En la figura 13.4 se muestra el diagrama el´ectrico usado para construir el controlador (13.20) en base al microcontrolador PIC16F877A. Resulta interesante observar la sencillez del hardware utilizado.

660

13 Control de un p´endulo de Furuta

Figura 13.4. Diagrama el´ectrico del sistema de control del p´endulo de Furuta.

13.6 Resultados experimentales

13.6.

661

Resultados experimentales

En la figura 13.5 se muestran los resultados experimentales obtenidos. N´otese que aunque la posici´on del brazo θ0 no consigue estabilizarse en cero, sin embargo la posici´on del p´endulo θ1 permanece en cero, es decir, en la configuraci´on vertical invertida. N´otese tambi´en la presencia importante de ruido, el cual es debido a los potenci´ometros usados para medir la posici´on del brazo y del p´endulo. Es importante subrayar que, a pesar de ´esto, los resultados experimentales muestran que se ha conseguido el principal objetivo de control: mantener el p´endulo “equilibrado” alrededor de su posici´on vertical invertida. En la figura 13.6 se muestra una fotograf´ıa donde se observa el sistema de control funcionando. ò1 [rad]

ò0 [rad]

tiempo [s]

Figura 13.5. Resultados experimentales.

662

13 Control de un p´endulo de Furuta

Figura 13.6. El sistema de control completo funcionando.

Programaci´ on del microcontrolador PIC16F877A Se recomienda consultar la referencia [8] para una explicaci´on precisa de cada una de las instrucciones que aparecen en el siguiente listado. /*PROGRAMA PARA EL COMPILADOR DE C PCWH VERSION 3.203*/ /*PROGRAMA PARA CONTROLAR UN PENDULO DE FURUTA EN LA POSICION VERTICAL INESTABLE CON UN MICROCONTROLADOR (PIC16F877A) Y UN PUENTE H (L293D) MEDIANTE UNA RETROALIMENTACION DE ESTADO (u=-K*x) */ #include<16F877A.h> #include <stdlib.h> #include <math.h> #fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD #use delay(clock=20000000) //Frecuencia del cristal Hz /*Direcciones de los registros a utilizar*/ #byte TMR0 = 0x01 #byte OPTION= 0x81 #byte TRISA = 0x85 #byte TRISB = 0x86 #byte TRISC = 0x87 #byte TRISD = 0x88 #byte ADCON0= 0x1F #byte ADCON1= 0x9F #byte PORTB = 0x06

13.6 Resultados experimentales

663

/*Direcciones de los pines a utilizar*/ #bit RC2 = 0x07.2//Pin para mandar senal PWM al puente H (L293D) #bit RD0 = 0x08.0//Pin para pilotear sentido de movimiento #bit RD1 = 0x08.1//Pin para pilotear sentido de movimiento /*RUTINA PRINCIPAL*/ void main(void) { /*DECLARACION DE VARIABLES LOCALES*/ unsigned int i,t_0,t_1,pwm; float teta_0,teta_0_1,teta_0p,teta_1,teta_1_1,teta_1p,u; /*Configuracion de la tasa de conteo del timer 0*/ OPTION=0x87;//pull up’s deshabilitados, prescaler 1:256 para TMR0 /*Configuracion PWM*/ setup_ccp1(CCP_PWM); //configurando ccp1 como PWM setup_timer_2(T2_DIV_BY_4,255,1); //configurandotimer2,(1/20000000)*4*4*256=2048us /*Configuracion de entradas y salidas de los puertos*/ TRISA=0x0F;//configurando parte alta del puerto A como salidas y //parte baja como entradas TRISB=0x00;//configurando puerto B como //salidas TRISC=0x00;//configurando puerto C como salidas TRISD=0x00;//configurando puerto D como salidas /*Configuracion ADC*/ ADCON1=0x04; ADCON0=0x81; /*Inicializando variables*/ TMR0=0; teta_0=0; teta_1=0; while(1) { teta_0_1=teta_0; teta_1_1=teta_1;

//posicion anterior brazo //posicion anterior Pendulo

664

13 Control de un p´endulo de Furuta ADCON0=0x81; //Cambiando a CH0 for(i=0;i<37;i++); //estabilizar capacitor interno t_0=read_adc(); //leer ADC teta_0=t_0-127.0; //compensando offset potenciometro teta_0=0.02464*teta_0; //convirtiendo a radianes ADCON0=0x89; //cambiando a CH1 for(i=0;i<37;i++); //estabilizar capacitor interno t_1=read_adc(); //leer ADC teta_1=t_1-127.0; //compensando offset potenciometro teta_1=0.02464*teta_1; //convirtiendo a radianes /*Calculo de derivadas*/ teta_0p=(teta_0-teta_0_1)/0.0256; teta_1p=(teta_1-teta_1_1)/0.0256; /*Calculando el control u=-K*x*/ u=1.5215*teta_0+4.6690*teta_0p+152.0048*teta_1+13.8931*teta_1p; u=51.0*u; //escalamiento a volts de salida /*Control de saturacion de la senal de control para el PWM*/ if(u>254.0) u=255.0; if(u<-254.0) u=-255.0; /*Piloteando sentido de movimiento del motor (pines al puente H)*/ if(u<0) { RD0=1; RD1=0; } else { RD0=0; RD1=1; } pwm=(unsigned int)abs(u); PORTB=pwm; //valor del pwm por el puerto B set_pwm1_duty(pwm); //actualizando el valor del PWM /*Ajuste del periodo de control Ts=0.0256 seg*/ while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg) TMR0=0; while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg) TMR0=0; } }

13.8 Preguntas de repaso

13.7.

665

Resumen del cap´ıtulo

En este cap´ıtulo se ha construido un p´endulo de Furuta y todas las interfaces necesarias para su control en lazo cerrado. El esquema de control utilizado es conocido como realimentaci´on lineal del estado. Consiste en la medici´on de las posiciones y las velocidades de los dos cuerpos que componen al mecanismo y, multiplic´andolas por constantes, sumarlas para obtener el par que debe ser generado por el motor de CD usado como actuador. Dado que se trata de un sistema inestable y no lineal, la soluci´on de este problema de control, as´ı como la construcci´on experimental del mismo, es de gran inter´es. Otra caracter´ıstica importante del presente cap´ıtulo es el hecho de mostrar una manera diferente de modelar sistemas mec´anicos usando las ecuaciones de Euler-Lagrange. Este enfoque es particularmente u ´til cuando se modelan sistemas mec´anicos compuestos por varios cuerpos que se mueven independientemente (grados de libertad). De particular inter´es resulta la identificaci´on del valor num´erico de los par´ametros del prototipo. En la literatura de control se habla de masas, centros de masa e inercias sin entrar en m´as detalles. Sin embargo, en la pr´actica, los cuerpos que componen al mecanismo a su vez est´an compuestos por tornillos, acoplamientos, piezas con diferentes formas geom´etricas y masas, varillas, etc. Esto significa que se debe encontrar la masa, el centro de masa y la inercia equivalente de todas esas piezas que conforman a cada cuerpo del mecanismo. En el presente cap´ıtulo se ha mostrado una forma de hacer esto utilizando f´ormulas de la mec´anica cl´asica. Tambi´en se ha mostrado la manera de obtener un modelo lineal, que representa una aproximaci´on del modelo no lineal m´as exacto, el cual se emplea para dise˜ nar el controlador. Esto resulta en un sistema de control que s´olo funcionar´a correctamente si la configuraci´on inicial del mecanismo es cercana a la que se desea.

13.8. 1. 2. 3. 4. 5. 6. 7. 8.

Preguntas de repaso

¿Por qu´e se dice que el p´endulo de Furuta es inestable en lazo abierto? D´e una explicaci´on descriptiva (no anal´ıtica) de porqu´e se necesita controlar simult´aneamente la posici´on del brazo y la posici´on del p´endulo. Describa el procedimiento para identificar los diferentes par´ametros del mecanismo completo. ¿C´omo se identifican los par´ametros del motor? Describa el funcionamiento del amplificador de potencia utilizado. Explique que representan todos los posibles puntos de operaci´on del p´endulo de Furuta. ¿Por qu´e la energ´ıa potencial del mecanismo s´olo considera la energ´ıa potencial del p´endulo? ¿Qu´e representa la aproximaci´on lineal de un modelo no lineal?

666

9. 10.

13 Control de un p´endulo de Furuta

¿Cu´al es la condici´on que debe cumplir el controlador por realimentaci´on lineal del estado para que el p´endulo de Furuta funcione adecuadamente? ¿Por qu´e es importante que el modelo del p´endulo de Furuta sea controlable? ¿Qu´e se puede hacer si no es controlable?

Referencias

1. H. Goldstein, C. Poole and J. Safko, Cassical Mechanics, Cap´ıtulo 1, 3rd edition, Addison Wesley, New York, 2000. 2. I. Fantoni and R. Lozano, Non-linear control for underactuated mechanichal systems, Springer, London, 2002. 3. H.I. Torres Rodr´ıguez, Control de sistemas no linealizables en forma exacta, Tesis de Mestr´ıa en Ciencias, CINVESTAV, Departamento de Ingenier´ıa El´ectica, M´exico D. F., 2002. 4. R. C. Hibbeler, Mec´ anica vectorial para ingenieros. Dinamica, (10a. edici´ on), Pearson Educaci´ on, M´exico, 2004. 5. M. Alonso and E.J. Finn, F´ısica, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1995. 6. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Technology Inc., 2003. 7. L293D Qudruple half-H drivers, Data sheet, Texas Instruments, 2004. 8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual, 2003.

14 Control de un p´ endulo con rueda inercial

El p´endulo de con rueda inercial es un mecanismo en el que se debe controlar simult´aneamente la posici´on del p´endulo y la velocidad de la rueda. Por esta raz´on, es natural analizarlo y dise˜ narle un controlador usando la t´ecnica de las variables de estado. Por otro lado, este mecanismo es, de los prototipos did´acticos subactuados y no lineales, el m´as sencillo. Por ello, es ideal para introducir al lector en los conceptos de control de sistemas no lineales. Esta es la principal raz´on para incluir el problema de controlar este mecanismo.

670

14 Control de un p´endulo con rueda inercial

Objetivos del cap´ıtulo Modelar el p´endulo con rueda inercial usando las ecuaciones de EulerLagrange. Dise˜ nar un controlador que levante el p´endulo con rueda inercial de su posici´ on vertical no invertida a su posici´ on vertical invertida. Dise˜ nar un controlador que atrape el p´endulo con rueda inercial en su posici´ on vertical invertida. Construir un p´endulo con rueda inercial. Identificar los par´ ametros del p´endulo con rueda inercial. Construir los controladores para levantar y atrapar el p´endulo con rueda inercial. Obtener resultados experimentales en el p´endulo con rueda inercial construido.

14.1.

P´ endulo con rueda inercial

En este cap´ıtulo se dise˜ na una estrategia de control para un mecanismo conocido como el p´endulo con rueda inercial (IWP). En la figura 14.1 puede apreciarse el P´endulo con rueda inercial en la posici´on vertical no invertida, mientras que en la figura 14.2 se muestra un esquema de este mecanismo. Se trata de un p´endulo que en su extremo tiene fijo un motor de CD el cual mueve a una rueda. En el punto de donde se suspende el p´endulo no se aplica ning´ un par externo. Se dice entonces que este punto no est´a actuado mientras que la rueda est´a actuada porque recibe el par generado por el motor de CD. Como el p´endulo y la rueda definen dos grados de libertad [1] y s´olo existe un actuador (en la rueda) se dice que este mecanismo es un sistema subactuado [2]. El p´endulo con rueda inercial (IWP) fue presentado por Spong et al. [2], el cual adem´as de usarse com´ unmente con fines acad´emicos ha tenido fuertes aplicaciones en la investigaci´on como prototipo de referencia para la prueba de algoritmos no lineales de control [2]-[11]. La nomenclatura utilizada es la siguiente: q1 es la posici´on angular del p´endulo. q2 es la posici´on angular de la rueda. m1 es la masa del p´endulo. m2 es la masa de la rueda. τ es el par aplicado a la rueda. lc1 es la distancia al centro de masa del p´endulo. l1 es la longitud del p´endulo. I1 es la inercia del p´endulo cuando gira alrededor de su centro de masa. I2 es la inercia de la rueda (m´as la inercia del rotor del motor de CD). g es la aceleraci´on de la gravedad.

14.1 P´endulo con rueda inercial

671

Figura 14.1. P´endulo con rueda inercial en posici´ on vertical no invertida.

Figura 14.2. El p´endulo con rueda inercial.

R es la resistencia de armadura del motor de CD. L es la inductancia de armadura del motor de CD. kb y km son las constantes de fuerza contraelectromotriz y de par, respectivamente, del motor de CD. u e i representan, respectivamente, el voltaje en las terminales de armadura y la corriente el´ectrica a trav´es de la armadura del motor de CD. De acuerdo a la descripci´on previa del p´endulo con rueda inercial, es claro que no es posible aplicar un par suficientemente grande como para llevar al p´endulo, de un solo golpe, desde la configuraci´on en la que q1 = 0 y su

672

14 Control de un p´endulo con rueda inercial

velocidad es cero q˙1 = 0 hasta la configuraci´on en la que q1 = +π ´o q1 = −π y q˙1 = 0. M´as a´ un, esta u ´ltima configuraci´on es inestable y se le denomina “la configuraci´on invertida inestable”. Por estas razones resulta de mucho inter´es dise˜ nar una estrategia de control: i) que lleve al p´endulo desde los alrededores de la configuraci´on q1 = 0 y q˙1 = 0 hasta la configuraci´on invertida inestable e ii) que lo mantenga ah´ı. A la primera parte de esta tarea se le denomina “levantar el p´endulo” y la segunda parte se denomina “balancear el p´endulo” o “atrapar el p´endulo”. Como se muestra en este cap´ıtulo, la tarea de levantar el p´endulo requiere de t´ecnicas de control no lineal pues las t´ecnicas de control lineal no tienen la capacidad para resolver este problema ya que el modelo del p´endulo con rueda inercial es no lineal. Sin embargo, aunque no lineal, el modelo de este mecanismo es suficientemente sencillo de modo que esta estrategia puede ser dise˜ nada usando ideas conceptuales sencillas. Por tanto, el objetivo de presentar este problema de control en este cap´ıtulo es introducir al lector, mediante un ejemplo sencillo, a los m´etodos de dise˜ no de control no lineal.

14.2.

Modelo matem´ atico

Dado que el p´endulo es un mecanismo compuesto por dos cuerpos que interact´ uan, su modelo matem´atico se obtiene utilizando las ecuaciones de Euler-Lagrange, es decir: d ∂L ∂L − =0 dt ∂ q˙1 ∂q1 ∂L d ∂L − =τ dt ∂ q˙2 ∂q2

(14.1)

El cero en el lado derecho de la primera expresi´on indica que no hay ning´ un par externo aplicado en el punto de donde se suspende el p´endulo. El lagrangiano est´a dado como: L = K −P

K = K1 + K2 ,

(14.2) P = P1 + P2

donde K1 y K2 representan, respectivamente, las energ´ıas cin´eticas del p´endulo y de la rueda, mientras que P1 y P2 representan, respectivamente, las energ´ıas potenciales del p´endulo y de la rueda. Como el p´endulo es un cuerpo cuya masa est´a distribuida a lo largo de una varilla, su energ´ıa cin´etica se calcula como la suma de la energ´ıa cin´etica de una part´ıcula de masa m1 que se mueve sobre una circunferencia de radio lc1 m´as la energ´ıa cin´etica de una varilla que gira alrededor de su centro de masa, es decir: K1 =

1 1 2 2 m1 lc1 q˙1 + I1 q˙12 2 2

(14.3)

14.2 Modelo matem´ atico

673

La energ´ıa cin´etica de la rueda se obtiene de manera similar. Sin embargo, se debe tomar en cuenta que la velocidad con la que gira la rueda, medida por un observador fijo en el laboratorio, es q˙1 + q˙2 . Entonces, se encuentra que: K2 =

1 1 m2 l12 q˙12 + I2 (q˙1 + q˙2 )2 2 2

(14.4)

Para calcular la energ´ıa potencial se utiliza como referencia (donde P1 y P2 son iguales a cero) la configuraci´on en la que q1 = 0. Recu´erdese que la energ´ıa potencial del p´endulo es el producto de la fuerza aplicada sobre el p´endulo (peso del p´endulo) y la distancia, en la direcci´on del peso, que separa al centro de masa del p´endulo en la posici´on actual q1 respecto de la posici´on en la que la energ´ıa potencial es cero, es decir cuando q1 = 0. Entonces: P1 = gm1 lc1 (1 − cos(q1 ))

(14.5)

Procediendo similarmente se encuentra la energ´ıa potencial de la rueda: P2 = gm2 l1 (1 − cos(q1 ))

(14.6)

Por tanto, de acuerdo a (14.2): L=

1 1 1 1 2 2 m1 lc1 q˙1 + I1 q˙12 + m2 l12 q˙12 + I2 (q˙1 + q˙2 )2 − gm(1 − cos(q1 )) 2 2 2 2

donde m = m1 lc1 + m2 l1 . Sustituyendo L en las ecuaciones de Euler-Lagrange presentadas en (14.1) y despu´es de agrupar convenientemente los t´erminos resultantes se obtiene: ¸ · ¸ · ¸ · 0 q¨ mg sin (q1 ) , (14.7) = D 1 + τ q¨2 0 · ¸ · ¸ 2 d d m1 lc1 + m2 l12 + I1 + I2 I2 D = 11 12 = d21 d22 I2 I2 Es muy sencillo mostrar que el determinante de la matriz D es positivo, es decir: det(D) = d11 d22 − d12 d21 > 0

(14.8)

El modelo en (14.7) es el modelo m´as exacto del p´endulo con rueda inercial y en la siguiente secci´on ser´a utilizado para dise˜ nar la estrategia de control que lo levantar´a hasta su configuraci´on invertida inestable. Finalmente, una aclaraci´on acerca de la se˜ nal de control utilizada. El voltaje aplicado al motor de CD que act´ ua sobre la rueda es la se˜ nal que verdaderamente se puede manipular directamente, mientras que el par es una variable que resulta como efecto de aplicar dicho voltaje. Sin embargo, en la pr´actica es posible suponer que el par es la se˜ nal de control si se considera que la inductancia de armadura es muy peque˜ na. La siguiente ecuaci´on es el

674

14 Control de un p´endulo con rueda inercial

modelo matem´atico del circuito de armadura del motor de CD con escobillas equipado con im´an permanente que act´ ua sobre la rueda: L

di + Ri + kb q˙2 = u dt

(14.9)

Si L y kb se suponen iguales a cero, entonces: τ = km i =

km u R

(14.10)

Esto significa que el voltaje aplicado tiene una acci´on directa sobre el par generado y por eso es v´alido suponer que el par es la se˜ nal de control. El hecho de suponer kb igual a cero se justifica del siguiente modo. Como puede apreciarse en (14.9) este par´ametro introduce fricci´on viscosa adicional al mecanismo. Como esto normalmente mejora la estabilidad de un sistema de control, entonces suponer que kb = 0 s´olo hace m´as interesante el problema de control en el sentido de que el dise˜ no se har´a bajo la suposici´on de que ning´ un efecto estabilizante esta presente de manera natural en el mecanismo.

14.3.

Controlador no lineal para levantar el p´ endulo

El objetivo en esta seccci´on es dise˜ nar un controlador que levante al p´endulo con rueda inercial hasta su configuraci´on invertida inestable, es decir, hasta alguno de los puntos (q1 , q˙1 ) = (+π, 0) o (q1 , q˙1 ) = (−π, 0). M´as adelante se explicar´a por qu´e no es importante el valor que tengan la posici´on y la velocidad de la rueda durante el intervalo de tiempo en el que se realiza esta tarea. Despejando q¨2 del primer rengl´on en (14.7), sustituyendo este valor en el segundo rengl´on de (14.7) y usando (14.10) as´ı como d12 = d22 se obtiene: J q¨1 + mgl sin(q1 ) = τ1 J=

d22 d11 − d21 d12 , d12

mgl = mg,

τ1 = −

(14.11) km u R

N´otese que J > 0 debido a (14.8). Por tanto, el modelo en (14.11) corresponde a un p´endulo simple donde J, m, l y g representan, respectivamente, su inercia, su masa y su longitud equivalentes as´ı como la aceleraci´on de la gravedad. La energ´ıa de este p´endulo se obtiene como la suma de su energ´ıa cin´etica y potencial, es decir: V (q1 , q˙1 ) =

1 2 J q˙ + mgl(1 − cos(q1 )) 2 1

(14.12)

En la figura 14.3 se muestran las superficies de nivel de V . Esto significa que cada curva en dicha figura representa el conjunto de puntos (q1 , q˙1 ) que corresponden un valor constante de V (q1 , q˙1 ). El lector puede darse cuenta de

14.3 Controlador no lineal para levantar el p´endulo

675

V > V0 V = V0

0 < V < V0

qç1

[rad=s]

V = V0

ï V=0

q1 [rad]

Figura 14.3. Superficies de nivel de V en (14.12).

que las curvas m´as externas corresponden a valores de V cada vez mayores (positivos) y que la curva cerrada m´as interna corresponde a un s´olo punto, (q1 , q) ˙ = (0, 0), donde V tiene su valor m´ınimo e igual a cero. Calc´ ulese la derivada respecto al tiempo de V (q1 , q˙1 ), dada en (14.12), para encontrar: dV (q1 , q˙1 ) = q˙1 J q¨1 + mglq˙1 sin(q1 ) dt

(14.13)

Si se sustituye el valor de J q¨1 obtenido a partir de (14.11) se obtiene: dV (q1 , q˙1 ) = q˙1 τ1 dt

(14.14)

Lo que se acaba de calcular se conoce como “la derivada de V a lo largo de las trayectorias de (14.11)” [12]. Esto quiere decir que (14.14) representa d los valores que toma dt V conforme el p´endulo en (14.11) se mueve bajo el efecto del par externo τ1 . Por ejemplo, si τ1 = 0 entonces, de (14.14) se d V = 0. Esto significa que conforme el p´endulo se mueve su energ´ıa obtiene dt V permanece constante. Esto provee mucha informaci´on como se explica a continuaci´on. Conociendo el valor inicial de posici´on y velocidad (q1 (0), q˙1 (0)) se puede saber el valor inicial de la energ´ıa V (q1 (0), q˙1 (0)). Como se sabe

676

14 Control de un p´endulo con rueda inercial

d que dt V = 0 porque τ1 = 0 entonces, conforme el tiempo crece, el p´endulo deber´a moverse u ´nicamente sobre los puntos que representan a la superficie de nivel en la cual V (q1 (t), q˙1 (t)) = V (q1 (0), q˙1 (0)), las cuales se muestran en la figura 14.3. Las flechas que se dibujan sobre las superficies de nivel representan el sentido en el cual estas son recorridas conforme el p´endulo se mueve. Estos sentidos son f´aciles de determinar como se explica a continuaci´on. El estado del p´endulo simple se define como y = [q1 , q] ˙ T . La variable y˙ = [q˙1 , q¨]T es un vector cuya direcci´on indica hacia d´onde se est´a moviendo el estado y. N´otese que la componente horizontal de y, ˙ es decir q˙1 , apunta hacia la derecha siempre que la velocidad del p´endulo q˙1 sea positiva. Esto es suficiente para determinar el sentido de las flechas dibujadas sobre las superficies de nivel de V . De acuerdo a lo expuesto en el p´arrafo anterior, para levantar al p´endulo hasta su configuraci´on invertida inestable s´olo se necesita conseguir que la energ´ıa del p´endulo alcance el valor:

V (q1 , q˙1 )|q

´o

q1 =−π 1 =+π q˙1 =0

=

1 J(0)2 + mgl(1 − cos(±π)) = 2mgl = V0 2

y si tal energ´ıa se alcanza en un punto donde (q1 , q˙1 ) 6= (+π, 0) ´o (q1 , q˙1 ) 6= d (−π, 0) entonces aplicar un par τ1 que asegure que dt V = 0 a partir de ese instante. N´otese que, de acuerdo a la figura 14.3, si V se mantiene constante una vez que V = V0 entonces el p´endulo se seguir´a moviendo hasta llegar a uno de los puntos (q1 , q˙1 ) = (+π, 0) ´o (q1 , q˙1 ) = (−π, 0). A continuaci´on se muestra que todo este mecanismo se asegura si se usa: τ1 = −kd sat(q˙1 ) signo(V − V0 ) (14.15)    +1, V > V0  ε0 , q˙1 > ε0 sat(q˙1 ) = −ε0 , q˙1 < −ε0 , signo(V − V0 ) = −1, V < V0 (14.16)   0, V = V0 q˙1 , |q˙1 | ≤ ε0

donde ε0 y kd son constantes positivas arbitrarias. Sustituyendo (14.15) en (14.14): dV (q1 , q˙1 ) = −kd q˙1 sat(q˙1 ) signo(V − V0 ) dt

(14.17)

A partir de (14.16) es f´acil darse cuenta de que el producto q˙1 sat(q˙1 ) siempre es positivo y es cero s´olo cuando q˙1 = 0. As´ı que mientras q˙1 6= 0 se cumple lo siguiente: d Si V < V0 entonces dt V > 0, por lo que la energ´ıa V aumenta. d Si V > V0 entonces dt V < 0, por lo que la energ´ıa V disminuye. d Si V = V0 entonces dt V = 0, por lo que la energ´ıa V permanece en el valor V0 .

Entonces, se asegura que la energ´ıa del p´endulo V alcanza el valor necesario para llegar a uno de los puntos (q1 , q˙1 ) = (+π, 0) ´o (q1 , q˙1 ) = (−π, 0). M´as

14.3 Controlador no lineal para levantar el p´endulo

677

a´ un, la energ´ıa se mantiene en ese valor hasta que uno de dichos puntos es alcanzado. Lo u ´nico que falta es analizar que sucede si q˙1 = 0. N´otese que bajo esa condici´on el p´endulo est´a en reposo. Sin embargo, la u ´nica manera de que q˙1 = 0 se mantenga para siempre es que q1 = 0 porque s´olo ah´ı el p´endulo puede permanecer en reposo. As´ı que ser´a necesario aplicar al p´endulo un peque˜ no golpe para que abandone la configuraci´on (q1 , q˙1 ) = (0, 0). Todo el an´alisis previo asegura que el p´endulo alcanzar´a la configuraci´on invertida inestable si, partiendo de la configuraci´on estable, se le aplica un peque˜ no golpe que simplemente lo saque del reposo. El lector puede darse cuenta que todo lo anterior se mantiene sin cambio si en el controlador (14.15) se usa sat(V −V0 ) en lugar de signo(V −V0 ). Dicho sea de paso, el controlador en (14.15), (14.16) tiene sus or´ıgenes en las ideas propuestas en [13]. Por otro lado, es importante darse cuenta de que una vez alcanzada la configuraci´on invertida inestable, el controlador (14.15) no asegura que el p´endulo vaya a permanecer en dicha configuraci´on. Para esto es necesario dise˜ nar otro controlador, el cual debe ser puesto en marcha cuando el p´endulo est´e muy cerca de la configuraci´on invertida inestable. Esto significa que el controlador en (14.15) debe ser desconectado a partir de ese momento. En la siguiente secci´on se presenta la manera de dise˜ nar el controlador que resuelve la segunda parte del problema de control: balancear o atrapar el p´endulo en la configuraci´on invertida inestable. Finalmente, n´otese que nada se ha dicho acerca de lo que sucede con la posici´on y la velocidad de la rueda durante el tiempo en el cual el p´endulo es llevado hasta su configuraci´on invertida inestable. Dado que la rueda es sim´etrica y se supone que est´a balanceada, entonces la posici´on de la rueda no importa. Por otro lado, aunque la velocidad de la rueda crece de manera desconocida durante el tiempo mencionado, sin embargo el valor de esta velocidad en el momento en que el p´endulo llega a su configuraci´on invertida inestable siempre es es finito y, por lo tanto, todo es cuesti´on de que el controlador que atrapa al p´endulo en dicha configuraci´on inestable se encargue de regular la velocidad de la rueda en el valor que esta variable tiene en el momento en que dicho controlador entra en operaci´on. Ejemplo 14.1 Sea el controlador alternativo: R τ1 τ1 = −kd (V − V0 ) sat(q˙1 ), u = − km   d, q˙1 > d umax km sat(q˙1 ) = −d, q˙1 < −d , d =  kd RV0 q˙1 , |q˙1 | ≤ d

(14.19)

dV (q1 , q˙1 ) = −kd (V − V0 ) q˙1 sat(q˙1 ) dt

(14.20)

(14.18)

donde d, umax y kd son constantes positivas arbitrarias. Sustituyendo (14.18) en (14.14):

678

14 Control de un p´endulo con rueda inercial

A partir de (14.19) es f´ acil darse cuenta de que el producto q˙1 sat(q˙1 ) siempre es positivo y es cero s´ olo cuando q˙1 = 0. As´ı que mientras q˙1 6= 0 se cumple de nuevo lo siguiente: d Si V < V0 entonces dt V > 0, por lo que la energ´ıa V aumenta. d Si V > V0 entonces dt V < 0, por lo que la energ´ıa V disminuye. d Si V = V0 entonces dt V = 0, por lo que la energ´ıa V permanece en el valor V0 .

Entonces, se asegura nuevamente que la energ´ıa del p´endulo V alcanza el valor necesario para llegar a uno de los puntos (q1 , q˙1 ) = (+π, 0) o ´ (q1 , q˙1 ) = (−π, 0).

14.4.

Controlador para atrapar el p´ endulo

La estrategia que se utiliza para atrapar al p´endulo en la configuraci´on invertida inestable es un controlador lineal que es dise˜ nado usando un modelo lineal aproximado de (14.7). A continuaci´on se muestra como obtener dicha aproximaci´on lineal. N´otese que el modelo en (14.7) no depende de la posici´on de la rueda q2 . Tomando esto en consideraci´on se puede definir el estado como:     q1 x1 (14.21) x =  x2  =  q˙1  , q˙2 x3

De (14.7) se puede escribir: ¸ · ¸¾ ½ · · ¸ mg sin (q1 ) 0 q¨1 −1 + − =D 0 τ q¨2 ¸ · ¸ · 1 d22 −d12 d11 d12 −1 = D = d21 d22 d11 d22 − d12 d21 −d21 d11

(14.22) (14.23)

N´otese que det(D−1 ) 6= 0 porque se trata de la inversa de una matriz no singular. Usando (14.21) y (14.22) el modelo en (14.7) se puede escribir como:   x2 (14.24) x˙ = f (x, τ ) =  −d11 mg sin (x1 ) + d12 τ  −d21 mg sin (x1 ) + d22 τ

De acuerdo a la secci´on 7.2.2, los puntos de operaci´on (x∗ , τ ∗ ) de (14.24) se encuentran a partir de la condici´on f (x∗ , τ ∗ ) = 0, es decir:     x∗2 0  −d11 mg sin (x∗1 ) + d12 τ ∗  =  0  . (14.25) 0 −d21 mg sin (x∗1 ) + d22 τ ∗

14.4 Controlador para atrapar el p´endulo

679

Es claro que: x∗2 = 0

(14.26)

Por otro lado, del segundo y tercer renglones de (14.25) se obtiene: d11 mg sin (x∗1 ) d12 d21 mg sin (x∗1 ) τ∗ = d22 τ∗ =

(14.27)

Igualando estas expresiones: ¤ mg £ d11 d22 − d21 d12 sin (x∗1 ) = 0 d12 d22

(14.28)

Debido a que det(D−1 ) = d11 d22 −d21 d12 6= 0, entonces (14.28) s´olo se cumple si: x∗1 = ±nπ, n = 0, 1, 2, 3, . . . (14.29)

Sustituyendo esta condici´on en cualquiera de las expresiones en (14.27) se obtiene: τ∗ = 0 (14.30) Finalmente, como no existe ninguna restricci´on sobre x∗3 se concluye: x∗3 = c.

(14.31)

donde c es cualquier n´ umero real. De acuerdo a la secci´on 7.2.2, la aproximaci´on lineal del sistema en (14.24) en el punto de operaci´on (14.26), (14.29), (14.30), (14.31), con n = ±1, est´a dada como: z˙ = Az + Bw,



¯ ∂f (x, τ ) ¯¯  A= = ∂x ¯τx∗∗

 ∂f1 ¯ ∂τ ∂f (x, τ ) ¯¯  ∂f2 B= = ∗ ∂τ ∂τ ¯x∗ τ

donde:

∂f1 ∂x1 ∂f2 ∂x1 ∂f3 ∂x1

∂f3 ∂τ

∂f1 ∂x2 ∂f2 ∂x2 ∂f3 ∂x2

¯ ¯ ¯ ¯ ¯ ¯x∗

τ∗

¯   ¯ 0 10 ¯ ¯ ¯ =  d11 mg 0 0  , ¯ d21 mg 0 0 ¯x∗∗ τ   0 =  d12  d22

(14.32)

∂f1 ∂x3 ∂f2 ∂x3 ∂f3 ∂x3

z = x − x∗ , ∗

w = τ −τ .

(14.33) (14.34)

son cantidades peque˜ nas, es decir z ≈ 0, w ≈ 0. Por otro lado, recu´erdese que τ ∗ = 0 y, por tanto, w = τ . entonces se puede usar (14.10) para encontrar la siguiente versi´on modificada de (14.32):

680

14 Control de un p´endulo con rueda inercial

z˙ = Az + Bu   0 km B =  d12  R d22

(14.35)

Este es el modelo lineal aproximado que ser´a utilizado para dise˜ nar el controlador que atrapa o balancea al p´endulo en su configuraci´on invertida inestable. Primero se verifica si el par (A, B) es controlable. Para esto, se calcula el determinante de la matriz de controlabilidad C = [B|AB|A2 B] y se encuentra que est´a dado como: det(C) =

3 mgkm 2 d12 (d11 d22 − d12 d21 ) 6= 0, 3 R

(14.36)

Por tanto, se concluye que el par el par (A, B) es controlable. Esto significa que siempre es posible encontrar un vector de ganancias K tal que todos los eigenvalores de la matriz de lazo cerrado (A − BK) queden ubicados en donde se desee. Esto se consigue usando el controlador: u = −Kz

(14.37)

El valor de K se calcula una vez que se conocen los valores num´ericos de los par´ametros involucrados en las matrices A y B. Con el controlador (14.37) se consigue atrapar el p´endulo con rueda inercial en la configuraci´on invertida inestable definida por el punto de operaci´on (14.26), (14.29), (14.30), (14.31), con n = ±1. Es importante subrayar que para esto es indispensable que el estado x del mecanismo se encuentre suficientemente cerca de dicha configuraci´on inestable en el momento en que el controlador en (14.37) empiece a operar. Finalmente, es conveniente aclarar que la constante c introducida en (14.31) toma el valor que la velocidad de la rueda tiene en el instante en el cual el controlador (14.37) empieza operar. Como esta velocidad puede tener cualquier valor, entonces es muy adecuado el hecho de que c pueda ser cualquier constante real.

14.5. Construcci´ on del p´ endulo con rueda inercial e identificaci´ on de sus par´ ametros En la figura 14.4 se presenta un dibujo detallado que muestra las partes mec´anicas utilizadas para construir el p´endulo con rueda inercial. Algunas de estas partes son introducidas con el fin de realizar el acoplamiento mec´anico entre las piezas que componen al mecanismo. Tambi´en se incluye un encoder incremental y un tac´ometro para medir, respectivamente, la posici´on del p´endulo q1 y la velocidad de la rueda q˙2 . En la tabla 14.1 se muestran los

14.5 Construcci´ on del p´endulo con rueda inercial

681

Soporte del mecanismo

Dado

Encoder

Tornillos Base

Solera (pendulo)

Manguera de boligrafo

Motor CD Rueda

Tacometro

Soporte del tacometro Figura 14.4. Partes que componen al p´endulo con rueda inercial construido. Tabla 14.1. Par´ ametros simples. S´ımbolo: l1 asol msol mcar msop mrot rrot mrue rrue R L kb km

Descripci´ on: longitud de la solera ancho de la solera masa de la solera masa de la carcasa del actuador masa del soporte del tac´ ometro masa del rotor del actuador radio del rotor del actuador masa de la rueda radio de la rueda resistencia de armadura inductancia de armadura constante de fuerza contra electromotriz constante de par

Valor: Unidades: 0.117 m 0.0254 m 0.016 Kg 0.03 Kg 0.01375 Kg 0.02 Kg 0.00915 m 0.038 Kg 0.0189 m 4.172 Ohm 0.0009 H 0.00775 Vs/rad 0.00775 Nm/A

682

14 Control de un p´endulo con rueda inercial

par´ametros medidos de las piezas que componen al p´endulo con rueda inercial as´ı como del motor de CD utilizado como actuador. La masa equivalente del primer grado de libertad m1 se define como: m1 = msol + mcar + msop = 0.05975 [Kg].

(14.38)

Para calcular el centro de masa del primer grado de libertad con todos sus componentes, se aplica el principio de la balanza (la suma de pares en el punto de apoyo debe de ser igual a cero), por tanto al aplicar un peso equivalente a una distancia lc1 en el extremo opuesto de la solera, el arreglo de la figura 14.5 debe quedar balanceado. Usando (14.38) y los datos de la tabla 14.1 se tiene que: msol l21 + mcar l1 + msop l1 lc1 = = 0.10133 [m]. (14.39) m1

Figura 14.5. Esquema para calcular lc1 .

El momento de inercia de una placa rectangular de masa m, ancho b y largo d con eje de rotaci´on x colocado sobre una direcci´on perpendicular al plano de lados b y d y que pasa por su centro est´a dado como [14], [15], p´ag. 271: 1 Ix = m(b2 + d2 ) (14.40) 12 Usando (14.40) y los datos de la tabla 14.1 se obtiene el momento de inercia I ∗ como: 1 I∗ = msol (a2sol + l12 ) = 0.0000191122 [Kg m2 ] (14.41) 12 Sin embargo, el momento de inercia I1 est´a definido alrededor de un eje que pasa por el centro de masa del p´endulo ubicado a una distancia lc1 − l1 /2 del centro de la cara de lados b y d. De acuerdo al teorema del eje paralelo o de Steiner [14], [15], p´ag. 272: ¶2 µ l1 = 0.000048463 [Kg m2 ] I1 = I ∗ + msol lc1 − 2 Por otro lado, el momento de inercia de un disco de masa m y radio r con un eje de rotaci´on x colocado a trav´es de su centro y que es perpendicular al disco est´a dado como [14], [15], p´ag. 271:

14.5 Construcci´ on del p´endulo con rueda inercial

Ix =

1 2 mr 2

683

(14.42)

Con los datos de la tabla 14.1 y la expresi´on (14.42) se tiene que el momento de inercia de la rueda Irue est´a dado como: Irue =

1 2 mrue rrue = 0.000006787 [Kg m2 ] 2

(14.43)

El momento de inercia de un cilindro de masa m, radio a y altura l con un eje de rotaci´on x colocado a trav´es de su eje longitudinal est´a dado como [14], [15], p´ag. 271: 1 Ix = ma2 . (14.44) 2 Usando la expresi´on (14.44) y los datos de la tabla 14.1 se tiene que el momento de inercia del rotor del actuador Irot est´a dado como: Irot =

1 2 mrot rrot = 0.000000837225 [Kg m2 ] 2

(14.45)

La masa equivalente del segundo grado de libertad m2 se define como: m2 = mrot + mrue = 0.058 [Kg]

(14.46)

Usando (14.43) y (14.45) se tiene que el momento de inercia del segundo grado de libertad I2 est´a dado como: I2 = Irue + Irot = 0.0000076242 [Kg m2 ]

(14.47)

Finalmente con los datos de la tabla 14.1, los par´ametros en (14.41), (14.38), (14.39), (14.46), (14.47) y g = 9.81[m/s2 ], se tiene que los valores num´ericos de los par´ametros del modelo (14.7) son: d11 = 0.0014636,

d12 = 0.0000076,

(14.48)

d21 = 0.0000076, mg = 0.12597

d22 = 0.0000076,

(14.49) (14.50)

Es importante mencionar que la masa del tac´ometro se considera dentro de la masa del soporte del tac´ometro, adem´as de que el efecto del rotor del tac´ometro se considera despreciable en el c´alculo de la inercia I2 . Esto debido a que tiene una masa menor a los 0.0001[Kg] y un radio menor a los 0.001 [m]. Por otro lado, los tornillos de sujeci´on del dado, el dado (de pl´astico) y el eje del encoder incremental se desprecian para el c´alculo de la inercia I1 . Esto debido a que la suma de las masas de estos componentes es menor a los 0.008[Kg] y, lo m´as importante, est´an directamente en el eje de giro del p´endulo por lo que los radios inerciales son muy peque˜ nos y el efecto inercial producido es despreciable. Finalmente, la masa de los dos alambres conductores (tanto del actuador como del tac´ometro), as´ı como la masa de la manguera de bol´ıgrafo (de pl´astico) usada para acoplar el tac´ometro a la rueda, no fueron consideradas en el modelado del prototipo experimental.

684

14 Control de un p´endulo con rueda inercial

Ejemplo 14.2 A continuaci´ on se presenta la simulaci´ on, usando SIMULINK, del p´endulo con rueda inercial con los controladores (14.18) y (14.37). Primeramente se muestra el programa de matlab que se encarga de cargar los valores num´ericos de las constantes que usar´ a la simulaci´ on: clc,clear all; % Constantes del Motor R=4.172; km=0.00775; Umax=13; % Modelo del IWP g=9.81; mgl=0.12597; mbg=mgl d11=0.0014636; d12=0.0000076; d21=d12; d22=d21; J= (d11*d22-d12*d21)/d12; D=[d11 d12;d21 d22]; Di=inv(D); di11=Di(1,1) di12=Di(1,2) di21=Di(2,1) di22=Di(2,2) %Matrices del IWP linealizado en el punto de operacion A=[0 1 0;di11*mbg 0 0;di21*mbg 0 0] B=[0;di12*km/R;di22*km/R] %Determinar la Controlabilidad disp(’El sistema es controlable?’); Pc=ctrb(A,B); if rank(Pc) == size(Pc) disp(’Si.’); else disp(’No.’); end %Controlador No-Lineal Kd=20; V0=2*mbg d=(Umax*km)/(R*Kd*V0) %Control por retroalimentacion de estado en punto de operacion n=1 c=-570 xd=[n*pi 0 c] %valores propios deseados en lazo cerrado lambda1= -9.27 + 20.6i; lambda2= -9.27 - 20.6i; lambda3= -0.719; Vp=[lambda1 lambda2 lambda3] K = place(A,B,Vp)

14.5 Construcci´ on del p´endulo con rueda inercial

685

%Verificar los valores propios de lazo cerrado Vp_=eig(A-B*K)

Una vez que se ha ejecutado el programa anterior, ya es posible ejecutar la simulaci´ on. En la figura 14.6 se muestra el diagrama de SIMULINK con las conexiones necesarias para simular el p´endulo con rueda inercial con el controlador no lineal (14.18) y con el controlador lineal (14.37).

Figura 14.6. Diagrama para simular el IWP en SIMULINK.

En la parte central de la figura 14.6 est´ a armado el p´endulo con rueda inercial partiendo de la ecuaci´ on de estado no lineal (14.24) con τ = kRm u. En la parte superior de la figura 14.6 est´ a armado el controlador no lineal (14.18), mientras que en la parte inferior de la misma figura se encuentra armado el controlador lineal (14.37). Para que la simulaci´ on no se quede atascada en el reposo de la posici´ on vertical no invertida, se le puso al segundo integrador una condici´ on inicial de 0.00001[rad/s]. En la figura 14.7 se muestra la evoluci´ on en el tiempo de cada uno de los elementos del estado x, as´ı como el voltaje u aplicado al motor del IWP. Finalmente en la figura 14.8 se observa el valor de la energ´ıa deseada V0 , y la evoluci´ on tanto de de la energ´ıa V como de la diferencia (V − V0 ).

686

14 Control de un p´endulo con rueda inercial

Figura 14.7. Visualizaci´ on de la simulaci´ on en osciloscopio 1.

Figura 14.8. Visualizaci´ on de la simulaci´ on en osciloscopio 2.

14.6 Construcci´ on del controlador

14.6.

687

Construcci´ on del controlador

Usando los valores num´ericos de la secci´on 14.5, considerando kd = 1 y de acuerdo a (14.11), (14.15) se obtiene el controlador que levanta el p´endulo hasta su configuraci´on invertida inestable: V = C1 q˙12 + mg(1 − cos(q1 )), u = C2 sat(q˙1 ) signo(V − V0 ),

1 J, V0 = 2mg, 2 umax km Rkd , ε0 = , (14.51) C2 = km kd R

C1 =

donde umax = 13[V], mientras que las constantes C1 y C2 se calculan una sola vez en la inicializaci´on del programa del controlador, para reducir el n´ umero de multiplicaciones necesarias en la implementaci´on. Por otro lado, de acuerdo a las secciones 7.13.1 y 7.13.2, en el cap´ıtulo 7, se encuentra que el uso del controlador lineal (14.37) junto con el vector de ganancias K = [k1 , k2 , k3 ] = [−340, −11, −0.0085] ubica los eigenvalores ¯ 1 = −5.8535 + 17.7192j, de la matriz (A − BK) en los siguientes valores: λ ¯ 2 = −5.8535 − 17.7192j y λ ¯ 3 = −0.5268. Por tanto, el controlador (14.37) λ queda expresado como: u = −k1 (q1 − q1d ) − k2 q˙1 − k3 (q˙2 − q˙2d )

(14.52)

donde se usa cualquiera de los valores q1d = +π ´o q1d = −π, dependiendo de a cu´al valor se acerca primero q1 . Recu´erdese que q˙2d = c es el valor que tiene la velocidad de la rueda en el momento en que el controlador en (14.52) empieza a operar. Def´ınase la condici´on: (q1 − q1d )2 + q˙12 < δ

(14.53)

para alguna constante δ > 0 suficientemente peque˜ na y q1d = +π ´o q1d = −π. Esta condici´on significa que el p´endulo se encuentra muy cerca de uno de los puntos (q1 , q˙1 ) = (+π, 0) ´o (q1 , q˙1 ) = (−π, 0). Esta cercan´ıa se puede ajustar proponiendo δ (en esta implementaci´on se manej´o δ = 0.3). La estrategia de control para levantar y atrapar el p´endulo con rueda inercial consiste en utilizar (14.51) hasta que se cumpla (14.53) y a partir de ese momento desconectar (14.51) y empezar a utilizar (14.52). Para realizar esta tarea se utiliza el microcontrolador PIC18F4431 de Microchip. A continuaci´on se explica como se hace esto. Antes que nada se debe aclarar que no es el prop´osito presentar toda una exposici´on de como trabaja este microcontrolador. Lo que se presenta es una descripci´on de los recursos de este microcontrolador que se utilizan para construir la estrategia de control (14.51), (14.52), (14.53). Al final de este cap´ıtulo se presenta un listado del programa utilizado. El microcontrolador PIC18F4431 [16] es de tecnolog´ıa flash, tiene una velocidad de operaci´on m´axima de 40 MHz (en este cap´ıtulo se usa un cristal de 11

688

14 Control de un p´endulo con rueda inercial

MHz ya que el circuito esta armado en tarjeta de pruebas). Cuenta con cinco puertos de entrada-salida configurables, tres temporizadores de 16 bits y uno de 8 bits (el temporizador de 8 bits es utilizado para establecer el periodo de muestreo: Ts = 0.01 s), nueve canales Anal´ogico-Digital de 10 bits (por el canal cero se recibe la se˜ nal del tac´ometro). Tambi´en cuenta con ocho canales PWM (modulaci´on de ancho de pulso) de 14 bits de los cuales en este cap´ıtulo se usa el CCP1 configurado para trabajar en 8 bits para entregar el voltaje de control a la planta. La posici´on q1 se mide usando un codificador incremental ´optico modelo CP-360-S de Computer Optical Products Inc. [17]. Este dispositivo ya conectado al microcontrolador tiene una resoluci´on de 1440 cuentas por revoluci´on. El codificador incremental es le´ıdo a trav´es de los pines 5 y 6 del canal A (v´ease la figura 14.9). Las cuentas del codificador incremental son recibidas en dos bytes (de 8 bits cada uno) llamados POSCNTH, el m´as significativo, y POSCNTL, el menos significativo. El valor real de la cuenta se puede calcular como: pos = 256 ∗ P OSCN T H + P OSCN T L lo cual es equivalente a hacer 8 corrimientos de POSCNTH hacia la izquierda para luego sumar POSCNTL. La instrucci´on “q1=(signed long)pos” asigna a la variable q1 el valor num´erico de la cuenta que incluye el signo correspondiente, es decir positivo si el movimiento es como el mostrado en la figura 14.2 o negativo en caso contrario. Finalmente, la posici´on q1 es obtenida en radianes mediante la operaci´on: q1 =

2π q1, 1440

2π = 0.004363 1440

Es importante mencionar que con el fin de obtener una lectura correcta de q1 , que represente fielmente la convenci´on descrita en la figura 14.2 para la medici´on de q1 , es necesario energizar el sistema de control cuando el p´endulo est´e en la configuraci´on de reposo que de acuerdo a la figura 14.2 corresponde a q1 = 0. Lo anterior es para que los registros de posici´on queden inicializados en cero cuando el sistema se encuentre en dicha posici´on. La velocidad del p´endulo q˙1 se calcula a partir de la medici´on de q1 , usando diferenciaci´on num´erica, es decir: q˙1 =

q1 (k) − q1 (k − 1) T

(14.54)

donde k representa el tiempo discreto, q˙1 representa el estimado de la velocidad del p´endulo en radianes por segundo mientras que Ts = 0.01 s[seg] es el periodo de muestreo utilizado. De este modo q1 (k) indica el valor de q1 que se mide en el instante de muestreo actual y q1 (k − 1) indica el valor de q1 que se midi´o en el instante de muestreo previo. La velocidad de la rueda q˙2 se mide usando un tac´ometro modelo 34PC. Se trata de un motor de CD tipo miniatura de los utilizados en los tel´efonos

14.6 Construcci´ on del controlador

689

celulares como vibrador. El voltaje que entrega el tac´ometro se filtra utilizando el circuito RC que se muestra en la figura 14.9. Se encontr´o que el tac´ometro utilizado entrega 0.58[V] cuando la velocidad es m´axima e igual a 1634 radianes por segundo. Se supuso que cualquier valor intermedio var´ıa de manera proporcional. Con el fin de mejorar la resoluci´on con que se mide esta velocidad se us´o el divisor de tensi´on que se conecta al pin 4 (ver figura 14.9) para fijar en 3.8372[V] el valor m´ınimo del rango anal´ogico del canal 0 del convertidor anal´ogico-digital (el valor m´aximo esta fijo en 5[V]). Por otro lado, el tac´ometro se conect´o en serie a otro divisor de tensi´on de manera que cuando el tac´ometro est´a en reposo (cuando q˙2 = 0) el voltaje leido por el canal 0 del convertidor anal´ogico-digital es de (5-3.8372)/2+3.8372=4.4186[V]. N´otese que de esta manera se permiten variaciones de aproximadamente 0.58[V] (es decir 1634 radianes por segundo) hacia arriba y hacia abajo del punto medio del rango anal´ogico del convertidor anal´ogico-digital. As´ı que cuando q˙2 = 1634[rad/s] el convertidor anal´ogico-digital entrega la cuenta 1023 = 210 − 1 (el convertidor AD es de 10 bits) y cuando q˙2 = 0[rad/s] el convertidor anal´ogico-digital entrega la cuenta 1023/2 = 511. Cuentas menores a 511 representan valores negativos de q˙2 . De acuerdo a esta informaci´on, la velocidad de la rueda se calcula del siguiente manera. La instrucci´on “vel=read-adc()-511” asigna a la variable “vel” el c´odigo correspondiente a la velocidad de la rueda mientras que las instrucciones “q2 p=(signed long)vel” y “q2 p=3.2039*q2 p” consiguen asignar a la variable “q2 p” un valor que es num´ericamente igual a la velocidad de la rueda q˙2 en radianes por segundo (incluyendo su signo). N´otese que la constante 3.2039=1634/510[(rad/s)/cuenta] representa la ganancia del sistema de medici´on. Con esta informaci´on se calcula cualquiera de las expresiones en (14.51) o (14.52), seg´ un sea el caso. El valor de la variable u as´ı obtenida se env´ıa al PWM del microcontrolador como se describe a continuaci´on. Una manera equivalente de implementar la funci´on saturaci´on en (14.51) con un menor numero de operaciones se realiza sabiendo que u s´olo tomar´a valores en el rango de -13 a +13 volts, por lo que su valor se satura por software para restringirlo a ese rango de valores utilizando instrucciones como las siguientes: if u > 13 then u = 13 if u < −13 then u = −13 Como la resoluci´on del PWM es de 28 − 1 = 255 cuentas, entonces la siguiente cuenta debe ser enviada al PWM del microcontrolador para entregar correctamente el valor de u al amplificador de potencia de la planta: cuenta =

255 abs(u) 13

donde abs(u) representa el valor absoluto de u. El signo de u es almacenado en dos bits de control. La se˜ nal del PWM se entrega a un puente H (L293B

690

14 Control de un p´endulo con rueda inercial

Figura 14.9. Diagrama el´ectrico del sistema de control.

de SGS-Thomson Microelectronics) que se encarga de amplificar convenientemente la potencia de la se˜ nal del PWM. Este puente H est´a alimentado con una fuente de potencia de 15.3[V]. Sin embargo, de acuerdo a la hoja de datos de este dispositivo [18] las ca´ıdas de voltaje en el mismo determinan que en las terminales del motor s´olo sean aplicados ±13[V]. Este dispositivo tiene dos bits a trav´es de los cuales se le indica el signo del voltaje que debe entregar. Para ello, el signo de u se env´ıa al puente H a trav´es de los bits 0 y 1 del canal D. Esto significa que el voltaje promedio que el puente H entrega

14.7 Resultados experimentales

691

a las terminales del motor s´olo var´ıa en el rango de -13 a +13 volts. As´ı, se asegura que en las terminales del motor de CD se aplica un voltaje u cuyo promedio es num´ericamente igual al valor de u calculado con cualquiera de las expresiones en (14.51) o (14.52). Esto es importante porque asegura que la construcci´on pr´actica del controlador respeta el dise˜ no indicado por los controladores correspondientes. En la figura 14.9 se muestra el diagrama el´ectrico usado para construir la estrategia de control (14.51), (14.52), (14.53) en base al microcontrolador PIC18F4431. Resulta interesante observar la sencillez del hardware utilizado.

14.7.

Resultados experimentales

En las figuras 14.10, 14.11, 14.12, 14.13 y 14.14 se muestran los resultados experimentales obtenidos. Es importante recordar que es necesario aplicar al principio un peque˜ no golpe sobre el p´endulo de manera que se abandone el punto (q1 , q˙1 ) = (0, 0). Aunque esto se puede evitar si se env´ıa al principio, a trav´es del programa, un peque˜ no pulso de voltaje al motor, sin embargo no se program´o la tarea de esta manera. En la figura 14.10 se muestra como oscila el p´endulo, con amplitudes cada vez mayores, hasta alcanzar la posici´on q1 = −π con velocidad cero en t ≈ 14[s] y que permanece en esa posici´on para todo tiempo futuro. En la figura 14.11 se observa que la velocidad de la rueda permanece constante en un valor de 380[rad/s] a partir de t ≈ 17[s]. Aqu´ı es interesante aclarar que la velocidad de la rueda es regulada en un valor c ≈ 150[rad/s] que es el valor de la rueda en t ≈ 14[s], instante en el que el controlador (14.52) empieza a funcionar. La diferencia entre c y la velocidad final de la rueda 380[rad/s] se debe a la fricci´on existente en la rueda y que no ha sido considerada en el dise˜ no realizado en este cap´ıtulo. En la figura 14.12 se muestra la se˜ nal de control u. N´otese que esta variable se satura la mayor parte del tiempo durante la etapa en la cual el p´endulo es levantado (t < 14[s]). Esta es la raz´on por la cual se usan funciones saturaci´on y signo en el controlador (14.51). De hecho el valor de ε0 = 0.024 se selecciona 4.172 , el valor de u se sature en de manera que con este valor y el factor 0.00775 ±13[V]. En la figura 14.13 se muestra como se mueve el p´endulo en el mismo plano que se defini´o en la figura 14.3 de la secci´on 14.3. Es claro que, comparando ambas figuras, el p´endulo se mueve de manera que su energ´ıa V crece al pasar el tiempo (tambi´en v´ease la figura 14.14) hasta que V = V0 = 0.2519. N´otese que V alcanza dicho valor desde t ≈ 11[s] y sin embargo el p´endulo es atrapado o balanceado hasta t ≈ 14[s]. Esta es una prueba de que la energ´ıa es regulada en V = V0 hasta que se alcanza el punto (q1 , q˙1 ) = (−π, 0). Es claro que el p´endulo tambi´en pasa cerca del punto (q1 , q˙1 ) = (+π, 0) en t ≈ 13[s] pero no es atrapado, seguramente porque la condici´on en (14.53) no fue satisfecha en

692

14 Control de un p´endulo con rueda inercial

q1 [rad]

tiempo [s] Figura 14.10. Posici´ on del p´endulo conforme se alcanza la configuraci´ on invertida inestable.

qç 2 [rad=s]

tiempo [s] Figura 14.11. Velocidad de la rueda.

14.7 Resultados experimentales

u [V]

tiempo [s] Figura 14.12. Voltaje aplicado al motor.

qç 1 [rad=s]

q 1 [rad] Figura 14.13. Evoluci´ on del p´endulo en el plano q˙1 − q1 (plano de fase).

693

694

14 Control de un p´endulo con rueda inercial

V [J]

tiempo [s] Figura 14.14. Variaci´ on de la energ´ıa conforme se alcanza la configuraci´ on invertida inestable.

ese momento, es decir, el p´endulo no pas´o suficientemente cerca como para ser atrapado. Finalmente, en la figura 14.15 se muestra una fotograf´ıa donde se observa al p´endulo controlado en la configuraci´on invertida inestable.

Figura 14.15. El p´endulo con rueda inercial controlado en su configurac´ıon invertida inestable.

14.7 Resultados experimentales

695

Programaci´ on del microcontrolador PIC18F4431 Se recomienda consultar la referencia [19] para una explicaci´on precisa de cada una de las instrucciones que aparecen en el siguiente listado. //Programa controlar pendulo con rueda inercial para PCW V3.203 #include<18f4431.h> #device adc=10 //manejar adc de 10 bits #include<stdlib.h> #include<math.h> #fuses HS,NOWDT,NOPROTECT,PUT,NOLVP,NOBROWNOUT,NOWRTC,MCLR,SSP_RC #define pi_ 3.14159 //ganancia del controlador no lineal #define kd 1.0 //ganancias del controlador lineal #define k1 340 #define k2 11 #define k3 0.0085 //parametros #define mbg 0.12597 #define R 4.172 #define #define #define #define #define

L 0.0009 Kb 0.00775 Km 0.00775 d11 0.0014636 d12 0.0000076

#define d21 0.0000076 #define d22 0.0000076 #define delta 0.3 #define ts 0.01 //con timer=108, cada cuenta vale (4/FXtal)*256 seg /*DIRECCIONES DE REGISTROS DE INTERES*/ #use delay(clock=11000000) //Base de tiempo para retardos (11 MHz) #byte porta = 0xf80 //direcciones de los puertos #byte portb = 0xf81 #byte portc = 0xf82 #byte portd = 0xf83 #byte portd = 0xf84 #byte TMR0H = 0xfd7 #byte TMR0L = 0xfd6

696

14 Control de un p´endulo con rueda inercial #byte T0CON = 0xfd5 #byte INTCON= 0xff2 #byte TMR5H=0xf88 //Conteo de Encoder Parte alta #byte TMR5L=0xf87

//Conteo de Encoder Parte Baja

#byte QEICON=0xfB6 //Cuadratura

//Registro de Configuracion de Modulo de

#byte T5CON=0xfB7

//Registro de configuracion de TIMER 5

#byte POSCNTL=0xF66 //CAP2BUFL (registro de cuentas parte baja) #byte POSCNTH=0xF67 //CAP2BUFH (registro de cuentas parte alta) #byte CAP1CON=0xF63 //Registro configuracion para reset de base de //tiempo de captura #byte PIE3=0xFA3 /*DIRECCIONES DE BITS DE INTERES*/ #bit VCFG1=0xfc1.7

//Bit de configuracion del ADC

#bit PD0=0x0f83.0 //control CCW de puente H #bit PD1=0x0f83.1 //control CW de puente H #bit PD2=0x0f83.2 //led en protoboard #bit PD3=0x0f83.3 //led en protoboard /*DECLARACION DE VARIABLES*/ float u,q1,q1_p,q1_1,q2_p,q1_d,q2_pd,gr,V,S,nf,i_ts,Je2,V0,RKdeKm; long pos,vel,inter; int pwm; signed int n,mod; /*PROGRAMA PRINCIPAL*/ void main(void) { set_tris_a(0b11111111); //Configurando E/S de los puertos set_tris_b(0b00000000); set_tris_c(0b10000000); set_tris_d(0b00000000); portb=0X00; portc=0X00; portd=0X00; //CONFIGURANDO PWM setup_ccp1(CCP_PWM);

14.7 Resultados experimentales setup_ccp2(CCP_PWM); setup_timer_2(T2_DIV_BY_16,255,1); // Configurando lectura del encoder QEICON=QEICON | (0b00010101); QEICON=QEICON & (0b01110101); T5CON=T5CON | (0b00011001); T5CON=T5CON & (0b10011101); CAP1CON=CAP1CON | (0b01001111); setup_timer_1(T1_INTERNAL | T1_DIV_BY_8); TMR5L=0; TMR5H=0; POSCNTL=0; POSCNTH=0; //Configurando el ADC setup_port_a(sAN0); setup_adc(ADC_CLOCK_INTERNAL); set_adc_channel(0); delay_us(50); VCFG1=1; //-Vref=AN2 INTCON=0;//Apagando interrupciones //Configurando el timer 0 TMR0L=0; T0CON=0xC7; //inicializando variables i_ts=1/ts; Je2=(d11*d22-d12*d21)/(2*d12); V0=2*mbg; RKdeKm=R*Kd/Km; q1=0.0; q1_1=0.0; q2_pd=0.0; while (TRUE) { PD3=1; //inician calculos del control q1_1=q1; //actualizando la q1(k-1) pos=POSCNTH;//registros de posicion en una variable pos=pos<<8; pos=pos+POSCNTL; q1=(signed long)pos; q1=0.004363*q1; //posicion del brazo en radianes q1_p=(q1-q1_1)*i_ts; //calculando velocidad del brazo vel=read_adc()-511; //calculando velocidad de la rueda q2_p=(signed long)vel; q2_p=3.2039*q2_p; //velocidad de la rueda en rad/seg //calculo de q1 deseada n=q1/pi_; nf=(float)n; mod=n%2;

697

698

14 Control de un p´endulo con rueda inercial if(nf==0) if(q1>=0) // valor deseado por lado llegada q1_d=pi_; else q1_d=-pi_; if((nf!=0)&&!PD2) { if(q1>=0) // valor deseado por lado llegada { if(mod==0) q1_d=pi_*(nf+1.0); else q1_d=pi_*nf; } else { if(mod==0) q1_d=pi_*(nf-1.0); else q1_d=pi_*nf; } } //fijando zona de operacion de cada controlador if((q1-q1_d)*(q1-q1_d) + q1_p*q1_p < delta) { PD2=1; //calculando control lineal u= k1*(q1-q1_d) + k2*q1_p + k3*(q2_p-q2_pd); } else { PD2=0; //calculando control no lineal V=Je2*q1_p*q1_p+mbg*(1-cos(q1)); V=V-V0; S=0; //funcion signo if(V>0) S=1.0; if(V<0) S=-1.0; u=RKdeKm*q1_p*S; //termina controlador no lineal q2_pd=q2_p; //velocidad deseada de la rueda } //saturacion 13V(15.3 V - 2.3 V de caida en puente H = 13 V) if(u>13) u=13; if(u<-13) u=-13; //escalamiento de salida, pwm de 8 bits a 13 V u=19.6*u; //piloteando sentido de giro del motor

14.9 Preguntas de repaso

699

if(u>=0) { PD0=1; PD1=0; } else { PD0=0; PD1=1; } //actualizando el valor del pwm pwm=(unsigned int)abs(u); set_pwm1_duty(pwm); //actualizando el valor del pwm PD3=0; //terminan calculos del control while(TMR0L<108); //cada cuenta vale (4/FXtal)*256 seg TMR0L=0; T0CON=0xC7; } //cierre del while infinito } //cierre del main

14.8.

Resumen

En este cap´ıtulo se le ha presentado al lector otro sistema no lineal subactuado conocido como el p´endulo con rueda inercial. Se ha mostrado tambi´en el modelo matem´atico del sistema, y en una forma sencilla, se han tratado dos controladores no lineales que son u ´tiles para la tarea de levantar el p´endulo con rueda inercial. Basados en los cap´ıtulos previos del libro, se utiliz´o un controlador por retroalimentaci´on completa del estado para la tarea de atrapar el p´endulo con rueda inercial linealizado en su posici´on vertical invertida. Con la finalidad de clarificar en su mayor´ıa los aspectos involucrados en llevar los conocimientos te´oricos a la pr´actica, se mostr´o la construcci´on e identificaci´on de los par´ametros de un sistema p´endulo con rueda inercial prototipo. Se ha finalizado con la electr´onica y la programaci´on de los dispositivos necesarios para la realizaci´on de experimentos con el prototipo del p´endulo con rueda inercial construido.

14.9. 1. 2. 3.

Preguntas de repaso

Diga qu´e grado de libertad del IWP es no actuado. ¿Por qu´e el IWP tuvo que oscilar varias veces antes de alcanzar la posici´ on vertical invertida? ¿Qu´e hubiera sucedido si el voltaje umax en lugar de ser de 13[V] fuera de 7[V].?

700

4. 5. 6. 7.

14 Control de un p´endulo con rueda inercial

¿Cu´anto vale la frecuencia de corte en [rad/s] y en [Hz] del filtro RC del tac´ometro mostrado en la figura 14.9? ¿Por qu´e mientras el sistema de control est´a levantando el IWP la se˜ nal de voltaje de la figura 14.7 va dismunuyendo su amplitud? ¿Por qu´e mientras el sistema de control est´a levantando el IWP la se˜ nal de voltaje de la figura 14.12 mantiene su amplitud entre 13[V] y -13[V]? Identifique en qu´e l´ınea del programa del microcontrolador se manda apagar el led conectado a la terminal 22 del PIC18F4431.

Referencias

1. R. Kelly, V. Santiba˜ nez, and A. Loria, Control of robot manipulators in joint space, Springer, London, 2005. 2. M. W. Spong, P. Corke, and R. Lozano, Nonlinear control of the reaction wheel pendulum, Automatica, vol. 37, no. 11, pp. 1845-1851, 2001. 3. R. Olfati-Saber, Global stabilization of a flat underactuated system: the inertia wheel pendulum, Proc. of the 40th IEEE Conf. on Decision and Control, Orlando, Florida, pp. 3764-3765, 2001. 4. R. Ortega, M. W. Spong, F. G´ omez-Estern and G. Blankenstein, Stabilization of a class of underactuated mechanical systems via interconnection and damping assignment, IEEE Transactions on Automatic Control, vol. 47, no. 8, pp. 12181233, 2002. 5. S. Afkhami, M. J. Yazdanpanah, and P. J. Maralani, Stabilization of inertia wheel pendulum using output feedback back-stepping, Proc. of IEEE Conf. on Control Applications, vol. 2, pp. 977-982, 2003. 6. D. M. Alonso, F. I. Robbio, E. E. Paolini, and J. L. Moiola, Modelling an inertia wheel pendulum benchmark, Mathematical and Computer Modelling of Dynamical Systems, vol. 11, no. 3, pp. 255-272, 2005. 7. R. Kelly and R. Campa, IDA-PB control of the inertia wheel pendulum: the Lagrangian approach (in Spanish), Revista Iberoamericana de Autom´ atica e Inform´ atica Industrial, vol. 2, no. 1, pp. 36-42, 2005. 8. V. Santiba˜ nez, R. Kelly, and J. Sandoval, Control of the inertia wheel pendulum by bounded torques, Proc. of the 44th IEEE Conf. on Decision and Control, and European Control Conf. CDC-ECC ’05, Seville, Spain, pp. 8266-8270, 2005. 9. M. Abrahantes, J. Mulder, and K. Butter, Modeling, identification and control of an under actuated inertial wheel pendulum, Proc. of the 39th Southeastern Symposium on System Theory, Macon, Georgia, pp.1-5, 2007. 10. N. Qaiser, N. Iqbal, A. Hussain, and N. Qaiser, Exponential stabilization of a class of underactuated mechanical systems using dynamic surface control, International Journal of Control, Automation, and Systems, vol. 5, no. 5, pp. 547-558, 2007. 11. R. V. Carrillo-Serrano and V. M. Hern´ andez-Guzm´ an, Control of the inertia wheel pendulum taking into account the actuator dynamics, International Journal of Innovative Computing, Information and Control, vol. 6, no. 12, pp. 5553-5563, 2010.

702

Referencias

12. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River, 2002. 13. A.L. Fradkov, P.Y. Guzenko, D.J. Hill, and A.Y. Pogromsky, Speed gradient control and passivity of nonlinear oscillators, Proc. 3rd. IFAC Symposium on Nonlinear control systems (NOLCOS’95), vol. 2, pp. 655-659, 1995. 14. Hibbeler R. C., 2004, Mec´ anica vectorial para ingenieros. Dinamica, (10a. edici´ on), Pearson Educaci´ on, M´exico. 15. M. Alonso and E.J. Finn, F´ısica, Addison-Wesley Iberoamericana, Wilmington, Delaware, 1995. 16. PIC18F4431 Enhanced Flash Microcontroller, Data sheet, Microchip Technology Inc., 2007. 17. CP360S Housed Encoder, Computer Optical Products Inc., www.opticalencoder.com. 18. L293B Push-Pull Four channel drivers, Data sheet, SGS-Thomson Microelectronics, 1993. 19. Custom Computer Services Incorporated, CCS C Compiler Reference Manual, 2003.

´Indice alfab´ etico

Adelanto de fase, 314 Ancho de banda, 337 Atraso de fase, 315 Bode gr´ aficas de, 294 Ceros, 145 lazo abierto de, 224 lazo abierto, efecto de, 231, 335 Circuito de se˜ nal peque˜ na, 473 Compensadores de adelanto, 320 Componentes de frecuencia cero, 305 Componentes de frecuencias grandes, 303 Condici´ on ´ angulo de, 224 magnitud de, 224 Conexi´ on en cascada, 179 en lazo cerrado, 181 en paralelo, 180 Constante de tiempo, 103, 337 Control de corriente, 504 Controlabilidad definici´ on, 414 prueba, 414 Criterio de Nyquist caso especial, 332 caso general, 333 D´ecada, 309 Decibeles, 294 Disipador, 27

Ecuaci´ on de Shockley, 475 Ecuaci´ on din´ amica ecuaci´ on de estado, 396 ecuaci´ on de estado no lineal, 399 ecuaci´ on de salida, 396 lineal invariante en el tiempo, 396 soluci´ on, 411 Ecuaciones de Euler-Lagrange, 647, 672 Eigenvalores, 409 Energ´ıa, 17 almacenada en un resorte, 22, 24 cin´etica, 20, 23, 648, 672, 674 de un campo magn´etico, 41 en sistemas de fluidos, 18 en sistemas el´ectricos, 18 en sistemas mec´ anicos rotativos, 18 en sistemas mec´ anicos traslacionales, 18 en un capacitor, 26 en una inductancia, 25 magn´etica, 579 potencial, 650, 673, 674 Entrada, 102, 145 Entrada de prueba escal´ on, 202 par´ abola, 203 rampa, 202 Espectro de frecuencias, 301 Estabilidad, 145, 413 marginal, 145 Estado, 395 estimado del, 431

704

´Indice alfab´etico

Factor de amortiguamiento, 122, 338 Filtro pasa altas, 314 pasa bajas, 294, 315 Fracciones parciales expansi´ on en, 113 ra´ıces complejas conjugadas distintas, 135 ra´ıces complejas conjugadas repetidas, 140 ra´ıces reales distintas, 100, 125 ra´ıces reales repetidas, 110, 130 Frecuencia de cruce de fase, 335 de cruce de ganancia, 334, 338 de esquina, 310, 337 Frecuencia natural amortiguada, 123 Frecuencia natural no amortiguada, 123 Fuerza magn´etica, 579 Funci´ on constitutiva, 20, 22–24, 27 Funci´ on de transferencia, 144 de ganancia unitaria en estado estacionario, 104, 122, 146 estable, 145 fase de una, 308 inestable, 145 lazo abierto de, 223 lazo cerrado de, 222 magnitud de una, 308 marginalmente estable, 145 Inestabilidad, 145 L’Hopital regla de, 131 Ley de Faraday, 25, 39, 578 Ley de Hooke, 22, 24 Ley de Kirchhoff de corrientes, 70 Ley de Kirchhoff de Voltajes, 67, 578 Ley de la Conservaci´ on de la Materia, 105 Ley de Lenz, 39 Ley de Ohm, 30 MagLev, 576 Margen fase de, 334, 338 ganancia de, 335 Matriz no singular, 408 Microcontrolador PIC16F877A, 558, 657

PIC18F4431, 687 Modelo lineal aproximado, 403 Modulador por ancho de pulso, PWM, 587, 591 Objetivo de un sistema de control, 222 Observabilidad definici´ on, 416 prueba, 416 Pico de resonancia, 310, 337 Polares gr´ aficas, 297 Polinomio caracter´ıstico, 102, 145 Polos, 104, 144 de lazo abierto, efecto de, 230, 335 lazo abierto de, 224 lazo cerrado de, 223 Potencia disipada por la fricci´ on viscosa, 28 disipada por un resistencia el´ectrica, 30 instantanea, 17 Principio de superposici´ on, 181 Puerto, 16, 17, 32 Punto de equilibrio, 401 Punto de operaci´ on, 402, 474 Rango de una matriz, 409 Resonancia, 143, 316 Respuesta en estado estacionario, caracter´ısticas de, 222 forzada, 101, 111, 116, 126 natural, 101, 111, 116, 126 transitoria, caracter´ısticas de, 222 Ruido, 305, 315 Salida, 102, 145 Segunda Ley de Newton, 20, 22, 579 Series de Fourier, 301 Sistema de control en lazo cerrado, 181, 201, 222 Sistema inestable, 577 Sobre paso, 118 Teorema valor final del, 99 Tercera Ley de Newton, 43 Tiempo de subida, 118, 337

´Indice alfab´etico Tipo de un sistema, 201 Transformaci´ on lineal, 425 Transformada Laplace de, 98 Fourier de, 301 Trayectoria de Nyquist, 330 modificada, 333 Variables de estado criterio de selecci´ on, 395

705

definici´ on, 395 Variables generalizadas acumulaci´ on de esfuerzo, 19, 21, 23, 25 acumulaci´ on de flujo, 19, 20, 23, 26 esfuerzo, 17 flujo, 17 Vectores linealmente dependientes, 407 linealmente independientes, 407

Control Autom´ atico Teor´ıa de dise˜ no, construcci´ on de prototipos, modelado, identificaci´ on y pruebas experimentales Hecho en M´exico Impreso por: Esteban Becerril Camargo Sim´ on Bol´ıvar No. 118, Col. Centro, Deleg. Cuauht´emoc, M´exico, D.F., C.P. 06080 1,000 Ejemplares, Junio de 2013

Related Documents


More Documents from ""