Controladores con Redes Neuronales en el Control de Trayectoria en Manipuladores Rob´ Roboticos. o´ ticos. ∗
Godoy Mend´ıa ıa Alex Pa´ Paul u´ l ∗
Student Member - IEEE
[email protected]
Abstract—Thi —Thiss docu docume ment nt show showss in summ summar ary y the the works, from its beginnings to present, in control of robot manipulators using controllers with neural networks in their structure. structure. Neural networks networks are useful useful in sorting sorting tasks, tasks, approach, approach, approximat approximation ion of nonlinear nonlinear systems systems which which makes makes intere interesti sting ng their their use in contro controlli lling ng this this type of dynamic systems. This paper analyzes the use of diff differ eren entt type typess of neur neural al netw networ orks ks show shown n in the the contr controll ollers ers to get a better better idea of its advantag advantages es and results obtained.
controlador. Un enfoqu enfoquee un poco poco difere diferente nte al anteri anterior or,, aunque aunque con el mismo prop´osito, osito, se ha estudiad estudiado o los ultimos u´ ltimos anos n˜ os y es el de los los sist sistem emas as de cont contro roll tipo tipo red red neuronal, que consiste en un controlador tradicional y un contro controlad lador or tipo tipo red neuron neuronal al con estruc estructur turaa distribuida en paralelo .
Keywords— Manipuladores, robot, control, feedback, forward, teor´ teor´ ıa de control, redes neuronales. Resumen—Este documento muestra en resumen los trabajos realizados, desde sus inicios hasta la actualidad, en el control control de manipulado manipuladores res rob´ roboticos o´ ticos usando controladore troladoress con redes neuronales neuronales en su estructura. estructura. Las redes redes neuron neuronale aless son utiles uti ´ les en tareas tareas de clasifi clasificac caciion, o´ n, aproximaci´ aproximacion, o´ n, aproximaci´ aproximacion o´ n de sistemas no lineales lo que hace que su uso sea interesante en el control de este tipo de sistemas din amicos. a´ micos. Este paper analiza el uso de diferentes tipos de redes neuronales en los controladores para obtener una mejor idea de sus ventajas y resultados conseguidos.
II.
S ISTEMAS DE CONTROL
De acuerdo con Isasi P. y Galvan a´ n I. [2], se habla de redes redes neuron neuronale aless en sistem sistemas as de contro controll cuando cuando se entiende que la red calcula la acci on o´ n de control del sistema para cumplir con los objetivos de control deseados. La diferencia entre los sistemas de control con redes neuronales consiste en la forma de realizar el entrenamiento, as´ as´ı como la arquitectura de red.
AT X, Palabras Clave— Revista Galileo, plantilla, L E art´ art´ ıculo.
I.
´ I NTRODUCCI ON
El cont contro roll de movi movimi mien ento to,, y de los los site sitema mass din´amic a micos os en gene genera ral, l, ha sido sido estu estudi diad ado o desd desdee la d´ecad e cadaa de los los 70s, 70s, algu alguna nass refe refere renc ncia iass sobr sobree los los primeros estudios en el tema se encuentran en [1]. El enfoque enfoque principal principal para controlar controlar un manipulado manipuladorr rob´otic o tico o es usan usando do un cont contro rola lado dorr tipo tipo feedback combinaci´ aci´on o n con con fee lineal en combin feedforw dforwar ard d no lineal lineal o linealizaci´ (citarr aqui aqui 2) aunq aunque ue un linealizacion ´ feedback feedback (cita prob proble lema ma muy muy cono conoci cido do del del uso uso de este este tipo tipo de contro controlad ladore oress es la no lineal linealida idad d de los par´ametros ametros lo que que prod produc ucee un cost costo o comp comput utac acio iona nall elev elevad ado o para para cont contro roll en tiem tiempo po real real espe especi cial alme ment ntee en mani manipu pula lado dore ress con con m´ultipl ultiples es grados grados de libert libertad, ad, adem´as as este tipo de m´etodos etodos de control se basan en el mode modelo lo din´ din´amic a mico o de los los sist sistem emas as en robo robots ts.. El dise˜no no de un control basado en modelo ( Model-based ) necesita un modelo din´amico amico correcto y preciso, lo que da a entender que cada modelo din´amico amico tiene su nivel de error con el modelo real; en este punto las redes neuronales han sido estudiadas en la ´ultima ultima d´ecada ecada por sus aplica aplicacio ciones nes en la aproxi aproximac maci´ i´on o n de sistemas no lineales, clasificaci on, o´ n, memoria asociativa y estruc estructur turaa distri distribu buida ida en parale paralelo. lo. En teor teor´ıa ı a de control las redes neuronales son usadas en el bucle de retroalimentaci´ retroalimentacion o´ n para mejorar el rendimiento del
Figura 1: Red neuronal como controlador.
Algunos esquemas de sistemas de control basados en redes supervisadas son:
II-A.
Copia de un controlador controlador ya existente
Es uno uno de los m´etod e todos os m´as a s simp simple les. s. En este este esquema el entrenamiento se realiza para que copie el comportamiento de un controlador existente usando como salida deseada la salida del controlador inicial.
II-B.
Esquema de control inverso inverso
Consis Consiste te en aproxima aproximarr con una red la din´amica amica inversa del proceso. Cuando se plantea un esquema de control inverso el entrenamiento se puede realizar de dos formas: Entrenamiento generalizado (Fig.2 ) o entrenamiento especializado (Fig.3 ).
III-A.
Modelo din´ amico basado en torque
Este modelo describe la relaci´on entre el movimiento y la articulaci´o n que ejerce el torque del manipulador, no se toma en cuenta qu e´ genera el torque ni como se lo genera. Este es usado con frecuencia en el dise˜n o y simulaci´on de un manipulador rob´otico. Este modelo se obtiene usando el m´etodo de Lagrange y se describe M (θ)θ¨ + H (θ, θ˙)θ˙ + g (θ ) = τ
Figura 2: Esquema de control inverso con entrenamiento generalizado.
donde: θR n y τ Rn son la variable de la articulaci´on ¨ nxn es la matriz de inercia; y el torque; M (θ )θR ˙ n contiene las fuerzas centrifugas y H (θ, θ˙)θR el efecto Coriolis; y g (θ)Rn describe la fuerza gravitacional.
III-B.
Figura 3: Esquema de control inverso con entrenamiento especializado.
Modelo din´ amico basdo en voltaje
Este modelo sirve en algunos manipuladores rob´oticos en donde el modelo din´amico basado en torque no puede ser usado debido a que el manipulador no fue disen˜ ado en base al control del torque o fuerza, sino se ha dise n˜ ado en base al control de los servo motores. Generalmente, el modelo din a´ mico de un sero motor puede ser dado como Li Ri τ τ i + f vi ˙θi + Di (θ˙i ) = u i ˙ + ai ai
Las l´ıneas entrecortadas muestran el flujo de las se˜nales de ajuste en los sistemas de control. La diferencia entre los entrenamientos consiste en la forma en la que influyen en la se˜nal de entrada del proceso. II-C.
Esquema de control predictivo
Se basan en que la acci´on de control aplicada a un proceso en un instante podr´ıa influir en la evoluci´on futura del proceso. Para predecir el comportamiento futuro del proceso, y calcular la acci´on actual, se utiliza un modelo del proceso. De este modo, la acci´on de control se calcula a partir de la respuesta del proceso en el siguiente instante de instante de tiempo y de su respuesta en un fututo m´as lejano. Este esquema se presenta en la Fig.4.
(1)
(2)
donde: u = diag (u1 , u2 ,...,un describe el voltaje de entrada para el servo motor; L = diag (L1 , L2 , L3 ,...,Ln ), R = diag (R1 , R2 ,...,Rn ) son las matrices de inductancia y resistencia; a = diag (α1 , α2 ,...,αn ) es la matriz con los elementos electromotrices constantes en cada servo motor; f v = diag (f v1 , f v2 ,...,f vn )es la matriz de las constantes de fricci´on por viscosidad, y Di (θ˙i ) es una matriz diagonal cuya diagonal indica las constantes de friccion de Coulomb. IV.
TOPOLOG ´I AS DE SISTEMAS DE
CONTROL
USANDO REDES NEURONALES
La dise˜no de los controladores que usan redes neuronales tienen bastante semejanza a los controladores feedback en los sistemas de control. Las redes neuronales son entrenadas para corregir el error e y as´ı exista una convergencia a cero. Las Fig.1 y Fig.2 [3] muestran algunas estructuras de controladores con diferentes par´ametros de entrada para la red neuronal
Figura 4: Esquema de control predictivo.
III.
´ M ODELOS DIN AMICOS DE ´ ROB OTICOS
MANIPULADORES
En [3] se describe los dos modelos principales resumidos a continuaci o´ n para el control de un manipulador rob´otico.
Figura 5: Estructura con error de trayectoria como entrada.
Figura 6: Estructura con la variable de estado del sistema como entrada.
Si se combina un controlador de red neuronal con un controlador PID en paralelo se obtienen otras dos estructuras para otro tipo de controladores como los de las Fig.3 y Fig.4 [3]
Figura 7: Estructura con PID y error de trayectoria como entrada.
Figura 9: Topolog´ıas de control con redes neuronales. (a)Esquema Indirecto. (b)Esquema directo. (c)Esquema feedback/forward.
En estas topolog´ıas los bucles de flujo de la se˜nal se marcan por las l´ıneas s´olidas, mientras que los bucles de ajuste con las l´ıneas entrecortadas. El reto en usar redes neuronales para el control del error est´a en encontrar una estructura adecuada para el sistema. Los pesos de la red neuronal pueden ser ajustados para garantizar la estabilidad y el rendimiento usando t´ecnicas matem´aticas.
V.
R ED
NEURONAL
El tipo de red neuronal y la arquitectura de red son dos puntos importantes en el dise n˜ o de este tipo de controladores. V-A.
Figura 8: Estructura con PID y la variable de estado del sistema como entrada.
Red neuronal con m´ ultiples capas ocultas
Un controlador de red neuronal se puede realizar basado en las propiedades de aproximaci´on funcional como se muesta en [5]. Ahora basandonos en la Fig.6 [4] , asumimos que la funci´on f(x) es desconocida, y esta dada por la salida de una red neuronal con desconocidos pesos ¨ıdeales”W,V tal que f ˙(x)) = W T σ (V T x)+ con como la aproximacio´ n de error, ´ sigmoide. y σ representa la funcion
En el sistema de control de la Fig.3, el rol de la red neuronal es de un simple controlador dado que la variable de entrada a la red neuronal es el error de trayectoria, mientras que en la Fig.4 la red neuronal tiene la posibilidad de funcionar como controlador o como un compensador din´amico que ayuda a compensar las fuerzas o torques, por gravitaci´on por ejemplo, en las trayectorias din´amicas del manipulador rob´otico. La Fig.1 corresponde a dos tipos de topolog´ıas diferentes en el control del feedback o error ( e), de t´ecnicas directas o t´ecnicas indiferentas. En el control indirecto se tienen dos funciones en dos bloques separados, un bloque es para aprender la din´amica de la planta desconocida, y otro bloque que usa la informaci´ on del bloque anterior para el control de la salida. El control directo es m´as eficiente ajusta directamente los par´ametros del controlador. En la Fig.5 [Lewis and Shuzhi][4] se muestran algunas topolog´ıas de controladores con control del error.
Figura 10: Controlador usando redes neuronales.
V-B.
Red neuronal con una capa oculta
Si la primera capa de pesos V es modificada de tal ˆ T σ (V T x) = W ˆ T φ(x), con manera que f ˙(x)) = W φ(x) como base, entonces se obtiene una ecuaci´on m´as sencilla para los pesos de la capa de salida dada por:
˙
ˆ = F φ(x)rT − kF ||r||W ˆ W
(3)
ESto produce que la red neuronal sea lineal en sus par´ametros y en el reajuste del sistema. Sin embargo, a´un tiene una ventaja ya que caracteriza en general cierta clase de sistemas,y el control adaptativo requiere calcular una matriz de regresi´on que sirve solo para cada sistema en particular. V-C.
Support vector machine (SVM)
En los u´ ltimos a˜nos, Support Vector Machines(SVM) han sido introducidos por Vapnik como una alternativa para el aprendizaje autom´atico (machine ˜ originalmenlearning). Los SVMs fueron disenados te para tareas de clasificaci´on y reconocimiento de patrones [6], imagenolog´ıa biom´edica [7] o compresi´o n de im´agenes [8]. Adem´as, los SVMs muestran un comportamiento interesante cuando se usan para resolver regresiones o en problemas de aproximaci´on, ya que no tienen el problema del sobre-ajuste y tienen una propiedad de generalizaci´on bastante buena [9]. Una comparaci´o n entre dos m´etodos de regresi´on no param´etricos para un modelo de aproximaci´on es propuesto en [10]. Los resultados muestran resultados positivos con un costo computacional bajo. En el trabajo realizado por Cheah[11], proponen un controlador adaptativo Jacobiano para el seguimiento de trayectoria de un robot con din´amica desconocida, basado en esto Abdessemed [9] propone un dise˜no eficiente de un control robusto usando la regresi´on de los SVMs. En la Fig.1 se observa un sistema de control propuesto en [9] que contiene dos controladores o etapas (primario y secundario). El primario es la din a´ mica inversa del manipulador insertada en el trayecto feedforward para compensar los efectos no lineales en el modelo, luego se introduce el controlador secundario que corrige errores no deseados o disturbios del sistema y que el controlador primario no los corige
Figura 12: Controlador primario basado en SVM.
Pero a´u n as´ı es sistema puede llegar a tener algunas p´erdidas por lo que se puede agreagar un pre-compensador en este sistema, en la Fig.9 [9] se observa el controlador con un pre-compensador difuso para compensar los cambios din´amicos y disturbios externos impredecibles, mientras que en la Fig.10 se observa el pre-compensador difuso para el controlador.
Figura 13: Controlador primario basado en SVM con pre-compensador.
Figura 14: Pre-compensador difuso.
VI. Figura 11: Controladores primario y secundario para un robot manipulador usando SVM.
1) Controlador primario: En este controlador se encuentra el control de din´amica inversa, esta t´ecnica se basa en un conocimiento a priori acerca del sistema, descrito por un modelo din´amico. En este controlador se usa SVM (support vector machine) para un aprendizaje tipo feed-forward para mejorar la robustez. Esto tendr´ıa ventajas no solo para funciones del sistema desconocida, sino tambi e´ n para propieda´ En la des del sistema desconocidas como la fricci on. ˜ de este tipo de Fig.8 [9] se puede encontrar un dise no controlador
C ONCLUSIONES
Las redes neuronales tienen una aplicaci´on confirmada en tareas de clasificaci´on, aproximacion ´ de sistemas no lineales y reconocimiento de caracter´ısticas lo que permite su uso en el control manipuladores rob´oticos. Las redes neuronales se aplican en conjunto con un controlador existente, puede ser en una etapa previa a la entrada del controlador o en conjunto para que el controlador tenga una mejor entrada, o si esta en conjunto para compensar el error en la salida del controlador. Otra caracter´ıstica importante de las redes neuronales es su capacidad de aprendizaje lo que permite que el controlador aprenda el comportamiento del sistema y tenga una respuesta mejor con la experiencia.// El uso de redes neuronales se encuentra en estudio en esquemas de controles adaptativos, y ser´ıa interesante probar con otras redes para el esquema.
VII.
R EFERENCIAS
R EFERENCIAS [1]
J. Craig, P. Hsu, and S. S. Sastry, “Adaptive control of mechanical manipulators,” EECS Department, University of California, Berkeley, Tech. Rep. UCB/ERL M86/3, 1986. [Online]. Available: http://www.eecs.berkeley.edu/ Pubs/TechRpts/1986/627.html
[2]
P. Isasi and I. Galv´a n. Madrid, Espa˜na: Pearson Educaci´on, 2004.
[3]
Z.-H. Jiang and T. Ishida, “Trajectory tracking control of industrial robot manipulators using a neural network controller,” in Systems, Man and Cybernetics, 2007. ISIC. IEEE International Conference on, Oct 2007, pp. 2390–2395.
[4]
F. L. Lewis and S. Sam G., “Neural networks in feedback control systems,” in Mechanical Engineer’s Handbook . New York, USA: John Wiley, Oct 2005, pp. 3–24.
[5]
F. Lewis, J. S., and Y. A., in Neural Network Control of Robot Manipulators and Nonlinear Systems. London, England: Taylor and Francis, Oct 1999.
[6]
M. Pontil and A. Verri, “Support vector machines for 3d ob ject recognition,” Pattern Analysis and Machine Intelligence, IEEE Transactions on , vol. 20, no. 6, pp. 637–646, Jun 1998.
[7]
I. El-Naqa, Y. Yang, M. Wernick, N. Galatsanos, and R. Nishikawa, “A support vector machine approach for detection of microcalcifications,” Medical Imaging, IEEE Transactions on, vol. 21, no. 12, pp. 1552–1563, Dec 2002.
[8]
J. Robinson and V. Kecman, “Combining support vector machine learning with the discrete cosine transform in image compression,” Neural Networks, IEEE Transactions on , vol. 14, no. 4, pp. 950–958, July 2003.
[9]
F. Abdessemed, “Svm-based control system for a robot manipulator,” International Journal of Advanced Robotic Systems, INTECH , June 2012.
[10]
D. Nguyen-Tuong, M. Seeger, and J. Peters, “Computed torque control with nonparametric regression models,” in American Control Conference, 2008 , June 2008, pp. 212– 217.
[11]
C. Cheah, C. Liu, and S. J.J.E., “Adaptative tracking control for robots with unknown kinematic and dynamic properties,” International Journal of Advanced Robotic Systems, MIT , December 2005.