Controladores en Redes Neuronales en el Control de Trayectoria de manipuladores robóticos

Controladores con Redes Neuronales en el Control de Trayectoria en Manipuladores Rob´ Roboticos. o´ ticos. ∗

Godoy Mend´ıa ıa Alex Pa´ Paul u´ l ∗

Student Member - IEEE [email protected]

Abstract—Thi —Thiss docu docume ment nt show showss in summ summar ary y the the works, from its beginnings to present, in control of robot manipulators using controllers with neural networks in their structure. structure. Neural networks networks are useful useful in sorting sorting tasks, tasks, approach, approach, approximat approximation ion of nonlinear nonlinear systems systems which which makes makes intere interesti sting ng their their use in contro controlli lling ng this this type of dynamic systems. This paper analyzes the use of diff differ eren entt type typess of neur neural al netw networ orks ks show shown n in the the contr controll ollers ers to get a better better idea of its advantag advantages es and results obtained.

controlador. Un enfoqu enfoquee un poco poco difere diferente nte al anteri anterior or,, aunque aunque con el mismo propósito, osito, se ha estudiad estudiado o los ultimos u´ ltimos anos n˜ os y es el de los los sist sistem emas as de cont contro roll tipo tipo red red neuronal, que consiste en un controlador tradicional y un contro controlad lador or tipo tipo red neuron neuronal al con estruc estructur turaa distribuida en paralelo .

Keywords— Manipuladores, robot, control, feedback, forward, teor´ teor´ ıa de control, redes neuronales. Resumen—Este documento muestra en resumen los trabajos realizados, desde sus inicios hasta la actualidad, en el control control de manipulado manipuladores res rob´ roboticos o´ ticos usando controladore troladoress con redes neuronales neuronales en su estructura. estructura. Las redes redes neuron neuronale aless son utiles uti ´ les en tareas tareas de clasifi clasificac caciion, o´ n, aproximaci´ aproximacion, o´ n, aproximaci´ aproximacion o´ n de sistemas no lineales lo que hace que su uso sea interesante en el control de este tipo de sistemas din amicos. a´ micos. Este paper analiza el uso de diferentes tipos de redes neuronales en los controladores para obtener una mejor idea de sus ventajas y resultados conseguidos.

II.

S ISTEMAS DE CONTROL

De acuerdo con Isasi P. y Galvan a´ n I. [2], se habla de redes redes neuron neuronale aless en sistem sistemas as de contro controll cuando cuando se entiende que la red calcula la acci on o´ n de control del sistema para cumplir con los objetivos de control deseados. La diferencia entre los sistemas de control con redes neuronales consiste en la forma de realizar el entrenamiento, as´ as´ı como la arquitectura de red.

AT X, Palabras Clave— Revista Galileo, plantilla, L E art´ art´ ıculo.

I.

´ I NTRODUCCI ON

El cont contro roll de movi movimi mien ento to,, y de los los site sitema mass dinámic a micos os en gene genera ral, l, ha sido sido estu estudi diad ado o desd desdee la décad e cadaa de los los 70s, 70s, algu alguna nass refe refere renc ncia iass sobr sobree los los primeros estudios en el tema se encuentran en [1]. El enfoque enfoque principal principal para controlar controlar un manipulado manipuladorr robótic o tico o es usan usando do un cont contro rola lado dorr tipo tipo feedback combinaci´ ación o n con con fee lineal en combin feedforw dforwar ard d no lineal lineal o linealizaci´ (citarr aqui aqui 2) aunq aunque ue un linealizacion ´ feedback feedback (cita prob proble lema ma muy muy cono conoci cido do del del uso uso de este este tipo tipo de contro controlad ladore oress es la no lineal linealida idad d de los parámetros ametros lo que que prod produc ucee un cost costo o comp comput utac acio iona nall elev elevad ado o para para cont contro roll en tiem tiempo po real real espe especi cial alme ment ntee en mani manipu pula lado dore ress con con múltipl ultiples es grados grados de libert libertad, ad, además as este tipo de métodos etodos de control se basan en el mode modelo lo din´ dinámic a mico o de los los sist sistem emas as en robo robots ts.. El diseño no de un control basado en modelo ( Model-based ) necesita un modelo dinámico amico correcto y preciso, lo que da a entender que cada modelo dinámico amico tiene su nivel de error con el modelo real; en este punto las redes neuronales han sido estudiadas en la última ultima década ecada por sus aplica aplicacio ciones nes en la aproxi aproximac maci´ ión o n de sistemas no lineales, clasificaci on, o´ n, memoria asociativa y estruc estructur turaa distri distribu buida ida en parale paralelo. lo. En teor teor´ıa ı a de control las redes neuronales son usadas en el bucle de retroalimentaci´ retroalimentacion o´ n para mejorar el rendimiento del

Figura 1: Red neuronal como controlador.

Algunos esquemas de sistemas de control basados en redes supervisadas son:

II-A.

Copia de un controlador controlador ya existente

Es uno uno de los métod e todos os más a s simp simple les. s. En este este esquema el entrenamiento se realiza para que copie el comportamiento de un controlador existente usando como salida deseada la salida del controlador inicial.

II-B.

Esquema de control inverso inverso

Consis Consiste te en aproxima aproximarr con una red la dinámica amica inversa del proceso. Cuando se plantea un esquema de control inverso el entrenamiento se puede realizar de dos formas: Entrenamiento generalizado (Fig.2 ) o entrenamiento especializado (Fig.3 ).

III-A.

Modelo din´ amico basado en torque

Este modelo describe la relación entre el movimiento y la articulació n que ejerce el torque del manipulador, no se toma en cuenta qu e´ genera el torque ni como se lo genera. Este es usado con frecuencia en el diseñ o y simulación de un manipulador robótico. Este modelo se obtiene usando el método de Lagrange y se describe M (θ)θ¨ + H (θ, θ˙)θ˙ + g (θ ) = τ

Figura 2: Esquema de control inverso con entrenamiento generalizado.

donde: θR n y τ Rn son la variable de la articulación ¨ nxn es la matriz de inercia; y el torque; M (θ )θR ˙ n contiene las fuerzas centrifugas y H (θ, θ˙)θR el efecto Coriolis; y g (θ)Rn describe la fuerza gravitacional.

III-B.

Figura 3: Esquema de control inverso con entrenamiento especializado.

Modelo din´ amico basdo en voltaje

Este modelo sirve en algunos manipuladores robóticos en donde el modelo dinámico basado en torque no puede ser usado debido a que el manipulador no fue disen˜ ado en base al control del torque o fuerza, sino se ha dise n˜ ado en base al control de los servo motores. Generalmente, el modelo din a´ mico de un sero motor puede ser dado como Li Ri τ τ i + f vi ˙θi + Di (θ˙i ) = u i ˙ + ai ai

Las l´ıneas entrecortadas muestran el flujo de las señales de ajuste en los sistemas de control. La diferencia entre los entrenamientos consiste en la forma en la que influyen en la señal de entrada del proceso. II-C.

Esquema de control predictivo

Se basan en que la acción de control aplicada a un proceso en un instante podr´ıa influir en la evolución futura del proceso. Para predecir el comportamiento futuro del proceso, y calcular la acción actual, se utiliza un modelo del proceso. De este modo, la acción de control se calcula a partir de la respuesta del proceso en el siguiente instante de instante de tiempo y de su respuesta en un fututo más lejano. Este esquema se presenta en la Fig.4.

(1)

(2)

donde: u = diag (u1 , u2 ,...,un describe el voltaje de entrada para el servo motor; L = diag (L1 , L2 , L3 ,...,Ln ), R = diag (R1 , R2 ,...,Rn ) son las matrices de inductancia y resistencia; a = diag (α1 , α2 ,...,αn ) es la matriz con los elementos electromotrices constantes en cada servo motor; f v = diag (f v1 , f v2 ,...,f vn )es la matriz de las constantes de fricción por viscosidad, y Di (θ˙i ) es una matriz diagonal cuya diagonal indica las constantes de friccion de Coulomb. IV.

TOPOLOG Í AS DE SISTEMAS DE

CONTROL

USANDO REDES NEURONALES

La diseño de los controladores que usan redes neuronales tienen bastante semejanza a los controladores feedback en los sistemas de control. Las redes neuronales son entrenadas para corregir el error e y as´ı exista una convergencia a cero. Las Fig.1 y Fig.2 [3] muestran algunas estructuras de controladores con diferentes parámetros de entrada para la red neuronal

Figura 4: Esquema de control predictivo.

III.

´ M ODELOS DIN AMICOS DE ´ ROB OTICOS

MANIPULADORES

En [3] se describe los dos modelos principales resumidos a continuaci o´ n para el control de un manipulador robótico.

Figura 5: Estructura con error de trayectoria como entrada.

Figura 6: Estructura con la variable de estado del sistema como entrada.

Si se combina un controlador de red neuronal con un controlador PID en paralelo se obtienen otras dos estructuras para otro tipo de controladores como los de las Fig.3 y Fig.4 [3]

Figura 7: Estructura con PID y error de trayectoria como entrada.

Figura 9: Topolog´ıas de control con redes neuronales. (a)Esquema Indirecto. (b)Esquema directo. (c)Esquema feedback/forward.

En estas topolog´ıas los bucles de flujo de la señal se marcan por las l´ıneas sólidas, mientras que los bucles de ajuste con las l´ıneas entrecortadas. El reto en usar redes neuronales para el control del error está en encontrar una estructura adecuada para el sistema. Los pesos de la red neuronal pueden ser ajustados para garantizar la estabilidad y el rendimiento usando técnicas matemáticas.

V.

R ED

NEURONAL

El tipo de red neuronal y la arquitectura de red son dos puntos importantes en el dise n˜ o de este tipo de controladores. V-A.

Figura 8: Estructura con PID y la variable de estado del sistema como entrada.

Red neuronal con m´ ultiples capas ocultas

Un controlador de red neuronal se puede realizar basado en las propiedades de aproximación funcional como se muesta en [5]. Ahora basandonos en la Fig.6 [4] , asumimos que la función f(x) es desconocida, y esta dada por la salida de una red neuronal con desconocidos pesos ¨ıdeales”W,V tal que f ˙(x)) = W T σ (V T x)+  con  como la aproximacio´ n de error, ´ sigmoide. y σ representa la funcion

En el sistema de control de la Fig.3, el rol de la red neuronal es de un simple controlador dado que la variable de entrada a la red neuronal es el error de trayectoria, mientras que en la Fig.4 la red neuronal tiene la posibilidad de funcionar como controlador o como un compensador dinámico que ayuda a compensar las fuerzas o torques, por gravitación por ejemplo, en las trayectorias dinámicas del manipulador robótico. La Fig.1 corresponde a dos tipos de topolog´ıas diferentes en el control del feedback o error ( e), de técnicas directas o técnicas indiferentas. En el control indirecto se tienen dos funciones en dos bloques separados, un bloque es para aprender la dinámica de la planta desconocida, y otro bloque que usa la informaci´ on del bloque anterior para el control de la salida. El control directo es más eficiente ajusta directamente los parámetros del controlador. En la Fig.5 [Lewis and Shuzhi][4] se muestran algunas topolog´ıas de controladores con control del error.

Figura 10: Controlador usando redes neuronales.

V-B.

Red neuronal con una capa oculta

Si la primera capa de pesos V es modificada de tal ˆ T σ (V T x) = W ˆ T φ(x), con manera que f ˙(x)) = W φ(x) como base, entonces se obtiene una ecuación más sencilla para los pesos de la capa de salida dada por:

˙

ˆ = F φ(x)rT − kF ||r||W ˆ W

(3)

ESto produce que la red neuronal sea lineal en sus parámetros y en el reajuste del sistema. Sin embargo, aún tiene una ventaja ya que caracteriza en general cierta clase de sistemas,y el control adaptativo requiere calcular una matriz de regresión que sirve solo para cada sistema en particular. V-C.

Support vector machine (SVM)

En los u´ ltimos años, Support Vector Machines(SVM) han sido introducidos por Vapnik como una alternativa para el aprendizaje automático (machine ˜ originalmenlearning). Los SVMs fueron disenados te para tareas de clasificación y reconocimiento de patrones [6], imagenolog´ıa biomédica [7] o compresió n de imágenes [8]. Además, los SVMs muestran un comportamiento interesante cuando se usan para resolver regresiones o en problemas de aproximación, ya que no tienen el problema del sobre-ajuste y tienen una propiedad de generalización bastante buena [9]. Una comparació n entre dos métodos de regresión no paramétricos para un modelo de aproximación es propuesto en [10]. Los resultados muestran resultados positivos con un costo computacional bajo. En el trabajo realizado por Cheah[11], proponen un controlador adaptativo Jacobiano para el seguimiento de trayectoria de un robot con dinámica desconocida, basado en esto Abdessemed [9] propone un diseño eficiente de un control robusto usando la regresión de los SVMs. En la Fig.1 se observa un sistema de control propuesto en [9] que contiene dos controladores o etapas (primario y secundario). El primario es la din a´ mica inversa del manipulador insertada en el trayecto feedforward para compensar los efectos no lineales en el modelo, luego se introduce el controlador secundario que corrige errores no deseados o disturbios del sistema y que el controlador primario no los corige

Figura 12: Controlador primario basado en SVM.

Pero aú n as´ı es sistema puede llegar a tener algunas pérdidas por lo que se puede agreagar un pre-compensador en este sistema, en la Fig.9 [9] se observa el controlador con un pre-compensador difuso para compensar los cambios dinámicos y disturbios externos impredecibles, mientras que en la Fig.10 se observa el pre-compensador difuso para el controlador.

Figura 13: Controlador primario basado en SVM con pre-compensador.

Figura 14: Pre-compensador difuso.

VI. Figura 11: Controladores primario y secundario para un robot manipulador usando SVM.

1) Controlador primario: En este controlador se encuentra el control de dinámica inversa, esta técnica se basa en un conocimiento a priori acerca del sistema, descrito por un modelo dinámico. En este controlador se usa SVM (support vector machine) para un aprendizaje tipo feed-forward para mejorar la robustez. Esto tendr´ıa ventajas no solo para funciones del sistema desconocida, sino tambi e´ n para propieda´ En la des del sistema desconocidas como la fricci on. ˜ de este tipo de Fig.8 [9] se puede encontrar un dise no controlador

C ONCLUSIONES

Las redes neuronales tienen una aplicación confirmada en tareas de clasificación, aproximacion ´ de sistemas no lineales y reconocimiento de caracter´ısticas lo que permite su uso en el control manipuladores robóticos. Las redes neuronales se aplican en conjunto con un controlador existente, puede ser en una etapa previa a la entrada del controlador o en conjunto para que el controlador tenga una mejor entrada, o si esta en conjunto para compensar el error en la salida del controlador. Otra caracter´ıstica importante de las redes neuronales es su capacidad de aprendizaje lo que permite que el controlador aprenda el comportamiento del sistema y tenga una respuesta mejor con la experiencia.// El uso de redes neuronales se encuentra en estudio en esquemas de controles adaptativos, y ser´ıa interesante probar con otras redes para el esquema.

VII.

R EFERENCIAS

R EFERENCIAS [1]

J. Craig, P. Hsu, and S. S. Sastry, “Adaptive control of mechanical manipulators,” EECS Department, University of California, Berkeley, Tech. Rep. UCB/ERL M86/3, 1986. [Online]. Available: http://www.eecs.berkeley.edu/ Pubs/TechRpts/1986/627.html

[2]

P. Isasi and I. Galvá n. Madrid, España: Pearson Educación, 2004.

[3]

Z.-H. Jiang and T. Ishida, “Trajectory tracking control of industrial robot manipulators using a neural network controller,” in Systems, Man and Cybernetics, 2007. ISIC. IEEE International Conference on, Oct 2007, pp. 2390–2395.

[4]

F. L. Lewis and S. Sam G., “Neural networks in feedback control systems,” in Mechanical Engineer’s Handbook . New York, USA: John Wiley, Oct 2005, pp. 3–24.

[5]

F. Lewis, J. S., and Y. A., in Neural Network Control of Robot Manipulators and Nonlinear Systems. London, England: Taylor and Francis, Oct 1999.

[6]

M. Pontil and A. Verri, “Support vector machines for 3d ob ject recognition,” Pattern Analysis and Machine Intelligence, IEEE Transactions on , vol. 20, no. 6, pp. 637–646, Jun 1998.

[7]

I. El-Naqa, Y. Yang, M. Wernick, N. Galatsanos, and R. Nishikawa, “A support vector machine approach for detection of microcalcifications,” Medical Imaging, IEEE Transactions on, vol. 21, no. 12, pp. 1552–1563, Dec 2002.

[8]

J. Robinson and V. Kecman, “Combining support vector machine learning with the discrete cosine transform in image compression,” Neural Networks, IEEE Transactions on , vol. 14, no. 4, pp. 950–958, July 2003.

[9]

F. Abdessemed, “Svm-based control system for a robot manipulator,” International Journal of Advanced Robotic Systems, INTECH , June 2012.

[10]

D. Nguyen-Tuong, M. Seeger, and J. Peters, “Computed torque control with nonparametric regression models,” in American Control Conference, 2008 , June 2008, pp. 212– 217.

[11]

C. Cheah, C. Liu, and S. J.J.E., “Adaptative tracking control for robots with unknown kinematic and dynamic properties,” International Journal of Advanced Robotic Systems, MIT , December 2005.

Controladores en Redes Neuronales en el Control de Trayectoria de manipuladores robóticos

Recommend Documents