AL
2014
Espacios con Product Producto o Interno
⟨� ̅⟩
Definición de producto interno y sus propiedades elementales
� ̅ ∈ ̅ → ̅ ⟨⟨��̅⟩ ⟨̅�⟩⟩ ⟨� ⟩ ⟨ ⟩ ⟨� �⟩ � ≠ � ⟨� ̅ ⟩ ⟨� ⟩ ⟨̅ 2⟩ ⟨� ⟩ ⟨� ⟩ ℝ 1 1 ∙ 2 2 12 12 11 1 2 1 2 22 ∙∙ 33 33 1131 ∙133 3 232 22∙33 3 113 2233 113 2233 1133 1133 2233 2233
Supóngase que se tiene un espacio vectorial sobre un campo . Se puede definir en una función que a cada par de vectores , le asigna un escalar de , denotado por | . Dicha función se llama producto interno en . Una función : ×
+
|
|
= =
|
> > 0,
es un producto interno o escalar si satisface las siguientes propiedades
|
= =
|
+
|
(Linealidad). (Linealidad).
(Simetría). (Simetría). 0 (Positividad).
La propiedad de linealidad puede expresarse como dos propiedades independientes: + |
EJEMPLO 4.1 .
|
= =
|
+
Verifíquese que el producto punto en (
|
|
es un producto interno. Para ello se tiene que
) (
,
= =
,
) =
+
Linealidad:
[ (
( (
, ) + ( , + , + ) + ( + + +
)] ( ) ( + +
, ,
) = ( ) = ( ) = =
,
) ( + + +
,
) + ( , ) ( , ) + ( ) + + + + +
)
Por lo que la propiedad se cumple. Simetría:
(
1 11∙2 2122 2212 ∙211 1 ) ( , +
,
) = ( =
,
) ( +
,
)
Al aplicar la conmutación en la multiplicación de los números reales, la propiedad se cumple. Positividad: (
1 1 ∙ 1 1 1121 1211 ,
) (
,
) =
=
+ +
Como el cuadrado de un número real siempre es positivo (excepto el cero), entonces la suma de dos cuadrados es positiva; por lo tanto, se cumple la propiedad. Como conclusión, se tiene que el producto punto en el espacio de las parejas ordenadas es un producto interno. 1
Ing. Aldo Jiménez Arteaga
AL
EJEMPLO 4.2 . Sea el espacio vectorial
2014
∈ ℝ =
, , ,
Determínese si la siguiente función es un producto interno
( , ) = tr
Linealidad:
tr(
) =
+
tr
+
tr
Por la propiedades de la traza de una matriz
tr(
tr( tr( tr(
Por lo que la propiedad se cumple.
) = ) = ) =
+ ) + tr( ) + tr( tr(
Simetría:
tr
tr(
) = tr(
+
tr
)
Por propiedades de la traza de matrices, la propiedad se cumple. Positividad:
2 2 2 2 tr( tr(
donde
) > 0
=
+ +
=
Por lo tanto
+ 2
+ +
+
> 0
Se tiene la suma de dos cuadrados y un producto que puede ser positivo o negativo, dependiendo de los valores de ; en general esta condición no se cumple. Por ejemplo, si se tiene la matriz
y al aplicarle la función
=
2
Ing. Aldo Jiménez Arteaga
=
1 2
1 2
2 1
2 1
1 2
2 1
y
AL
se llega a tr =
=
2014
3 4
4 3
6, y la propiedad de positividad no se cumple.
En conclusión la función dada no es un producto interno. No todas las funciones que involucran parejas de vectores pueden llegar a ser un producto interno; sin embargo, existen funciones que con una pequeña variación si lo son. Algo que se debe resaltar, es que un espacio vectorial puede tener una infinidad de productos internos. Así como en el tema anterior se vio que el número de transformaciones lineales no es limitado, en este se puede definir cualquier producto interno en cualquier espacio vectorial, siempre y cuando su cumplan las tres propiedades descritas anteriormente. Al igual que otras funciones, el producto interno cumple con algunas propiedades adicionales a las de la su definición; dichas propiedades extensivas son:
⟨⟨�� ̅⟩̅ ⟩ ⟨�⟨̅ ��⟩ ̅⟩ ⟨⟨�� �⟩̅ ⟩ ⟨��⟨��⟩⇒̅⟩ ∈ ℂ ⟨� �⟩ |
, si los vectores pertenecen a un espacio vectorial sobre los complejos. | . | , si = . = 0| 0. = 0. = | =
| |
|0
0|0
En la primera y tercera propiedades, EJEMPLO 4.3 .
�⟨̅ �⟩ �
y denotan al conjugado del número correspondiente.
|
Demuéstrese las propiedades uno y tres, para el espacio vectorial
ℂ2 ∈ ℂ ⟨� ̅⟩ 1̅2 1�2 ∀� 1 1 ̅ 2 2 ∈ ℂ2 � ̅ ̅ ⟨ ⟩ ⟨ ⟩ � � 1̅2 1�2 �2̅1 2�1 11̅̅22 11��22 �̅22̅̿11 ��22�11 1̅2 1�2 ̅21 �21 ∈ℂ = {( , )| ,
}
Si el producto interno definido es
donde
�
|
=
denota al conjugado de
= (
+
.
La propiedad uno establece que
|
+
= =
|
+
Por propiedades del conjugado de los números complejos + + +
= = =
que satisface correctamente la propiedad.
La segunda propiedad hace uso del escalar 3
Ing. Aldo Jiménez Arteaga
, por lo que
+ + +
,
), = (
,
)
AL
̅ ⟨ ⟩ � ⟨⟨ 1111 2222 ⟩⟩ 11��2̅2 11���22 |
(
(
,
,
= ) = ) = = =
)| ( , )|( , + +
Finalmente, la propiedad es verdadera.
2014
��⟨⟨�1̅⟩1 2 2 ⟩ ��11̅2̅2 �11��22 1�̅2 1��2 |
( (
)|( + + +
,
)
,
)
Definición de norma de un vector y sus propiedades Dentro de las características geométricas de un vector, existe el concepto de magnitud; es decir, el valor escalar que por sí mismo posee un vector; o en otras palabras, la distancia que existe entre el punto donde inicia el vector, y el punto donde termina. En la Física, la magnitud representa el valor que un fenómeno físico tiene. Por ejemplo, la aceleración es una cantidad vectorial, la cual se manipula como una cantidad escalar; ese tipo de manipulación utiliza la magnitud del vector aceleración. Otros ejemplos de este tipo son la fuerza, la velocidad, el campo eléctrico o la corriente eléctrica. La norma de un vector es su magnitud, y ésta puede obtenerse a partir de un producto interno. Como se describió en el inciso anterior, el espacio vectorial puede tener una infinidad de productos internos definidos; por lo tanto, la norma del vector no será la misma para todos los productos internos.
⟨� ̅⟩ ∀� ̅ ∈ ‖̅‖ ⟨̅ ̅⟩ ℝ2 ⟨ 1 1 2 2 ⟩ 12 12 ⟨ 1 1 ̅ 2 2 ⟩ 12 12 12 12 ‖ ‖ ⟨ ⟩ √ ‖ ‖ ⟨ ⟩ √
Sea un espacio vectorial donde se define el producto interno
|
Sean los productos internos en el espacio vectorial (
(
,
)|(
,
,
)|(
) =
,
) =
. La norma de un vector se define como
|
=
EJEMPLO 4.4 .
,
2
definidos como +
2
+ 5
Se desea encontrar las normas del vector = ( 1, 2). Para el caso del producto interno ordinario se tiene ( 1, 2) =
=
( 1, 2)|( 1, 2)
( 1)( 1) + ( 2)( 2)
= 5
Para el segundo producto interno
( 1, 2) =
=
( 1, 2)|( 1, 2)
( 1)( 1)
2( 1)( 2)
2( 2)( 1) + 5( 2)( 2)
= 13
Con lo cual se comprueba que la norma de un mismo vector varía según el producto interno que se utilice. 4
Ing. Aldo Jiménez Arteaga
AL
2014
La norma posee ciertas propiedades que permiten establecer simplificaciones al momento de trabajar con ecuaciones con producto interno. Dichas propiedades son
‖‖̅‖̅ ‖≥ ‖̅‖ ∀ ∈ ‖� ̅‖ ≤ ‖�‖ ‖̅‖ 0 =
+
,
+
La última propiedad es conocida como la desigualdad del triángulo.
Vectores unitarios Los vectores unitarios son una propiedad que involucra al vector y su norma. En forma general, un vector unitario es aquel que cumple con la ecuación
‖̅‖ ̅ ‖̅‖ ‖̅‖ ‖̅‖ ̅ ‖̅‖ ‖̅‖ ̅ ̅ ⟨ ⟩ � ̅ √ √ = 1
̅
Supóngase que se tiene un vector unitario , el cual puede multiplicarse por un escalar dando como resultado un vector ; es decir,
̅
… (1)
=
El vector tiene una norma unitario; es decir, si
. Dicha norma puede igualarse al escalar que se utilizó para multiplicar al vector
… (2)
=
Si (2) se sustituye en (1) se tiene que
=
Por lo que se deduce que cualquier vector puede tener su correspondiente vector unitario. Esto se comprueba al multiplicar la última ecuación por el inverso de la norma . 1
=
̅
Cuando se obtiene un vector unitario a partir de un vector cualquiera, se dice que fue normalizado. EJEMPLO 4.5 .
Sea el espacio vectorial de las matrices reales de orden 2, y el producto interno definido por |
Se desea normalizar los vectores =
2 1
0 y = 1
)
= tr(
3 1
2 . Para ello, se necesita obtener sus respectivas normas y 2
después, dividir cada vector entre la norma respectiva.
2 1
3 1
5
Ing. Aldo Jiménez Arteaga
0 1
2 2
=
6
= 3 2
AL
2014
Finalmente, los vectores unitarios serían:
√ √ =
1
2 1
6
0 , 1
=
1
3 2
3 1
2 2
Se puede verificar fácilmente, que las respectivas normas son iguales a 1.
Desigualdad de Cauchy-Schwarz
Se puede establecer una condición que permita analizar un triángulo formado por vectores. Dicha condición tiene su base en la llamada desigualdad de Cauchy-Schwarz, la cual establece que, en un espacio vectorial donde se define un producto interno, para todo par de vectores , se cumple
� ̅ ∈ 2 ⟨� ̅⟩ ≤ ⟨� �⟩⟨̅ ̅⟩ ℝ3 ⟩22 ≤⟨≤ ⟩⟨ ⟩22 ≤≤ ⟨ ⟩⟨ ≤ |
|
|
|
|
La desigualdad se cumplirá si, y sólo si, los vectores involucrados son linealmente dependientes. Sean los conjuntos de vectores, {( 1,2,0), (2,1,1)} y {(1,2,1), (5,10,5)}. Determínese por la desigualdad de Cauchy-Schwarz y el producto interno ordinario en si son linealmente dependientes. EJEMPLO
4.6 .
⟨ ⟨
( 1,2,0)|(2,1,1) 0
Como existe desigualdad, entonces el primer conjunto es linealmente independiente. (1,2,1)|(5,10,5) (30) 900
⟩ ⟩
( 1,2,0)|( 1,2,0) (2,1,1)|(2,1,1) (5)(6)
(1,2,1)|(1,2,1) (5,10,5)|(5,10,5) (6)(150) 900
Como se tiene una igualdad, el segundo conjunto es linealmente dependiente. Se confirma rápidamente este resultado al ver que el segundo vector se obtiene al multiplicar el primer vector por 5. EJEMPLO 4.7 .
Sea el producto interno definido en el espacio vectorial de las funciones reales de variable real como
0
⟨ ⟩ 2 ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ≤ 2 0 2 ≤0 0 2 0 ≤ 0 0 ≤ 2 ( )| ( ) =
( ) ( )
Determínese si las funciones {sin ,cos } son linealmente independientes. sin | cos
sin | sin
(sin )(cos ) 1 2
cos | cos
(sin )(sin )
1
cos
0
2 1
(
sin cos )
(cos )(cos ) 1 2
( + sin cos )
4
Se puede observar que los vectores son linealmente independientes, ya que no existe la igualdad. 6
Ing. Aldo Jiménez Arteaga
AL
2014
Definición de distancia entre vectores y sus propiedades El producto interno con normas permite establecer el concepto de distancia entre los vectores. La figura 4.1 muestra de manera gráfica la distancia entre vectores.
Figura 4.1. Distancia entre vectores.
�
̅
Puede observarse que la distancia entre vectores se mide desde el punto final de hasta el punto final de . La relación entre los vectores mostrados es
� ̅̅ ̅̅ � ̅ ̅� � ̅̅ ‖‖̅̅ ��‖‖ + = =
� ̅
La distancia entre y se puede calcular como la norma del vector =
.
=
( , ) =
Este número es un real positivo, que establece los principios de métrica en un espacio vectorial. Satisface las siguientes propiedades:
�� ̅̅ ≥ � ̅ �� ̅ ≤ �̅ �̅ ̅ ( , ) 0. ( , ) = 0, si = . ( , ) = ( , ). ( , ) ( , ) + ( ,
).
EJEMPLO 4.8 .
La desigualdad del triángulo es un teorema geométrico muy importante dentro de la Matemática. La figura 4.2 muestra este problema.
+
Figura 4.2. Desigualdad triangular.
7
Ing. Aldo Jiménez Arteaga
AL
2014
Las normas son escalares positivos, por lo cual se puede establecer una relación con las propiedades del valor absoluto. Otro argumento para establecer la demostración es tomando al espacio vectorial de los números reales sobre los números reales. Las propiedades del valor absoluto son:
≤≥
| |
| |
≤≤ ≤ ≤
, si, y sólo si , si, y sólo si,
Si se tiene en principio
.
ó
.
≤≤ ≤≤ ≤ ≤ ≤ ‖� ̅‖ ≤ ‖�‖ ‖̅‖ ⟨ ⟩ 11�11 12�12 21�21 22�22 � � ̇ � ̇ � ̇ √ √ | |
| | … (1)
| |
| | … (2)
al sumar las ecuaciones (1) y (2) se tiene que
| |
| |
| | + | |
+
Al utilizar la primera propiedad del valor absoluto se tiene que | + |
| | + | |
Si se reescribe en términos de normas, se obtiene
+
+
EJEMPLO 4.9 .
Sean el espacio vectorial de las matrices cuadradas de orden dos con elementos complejos, y el producto interno definido por |
Calcúlese la distancia entre los vectores
2 4+
Por lo que
2 4+
2+2 1 6
=
+
2
1+
1
2 . Primero se tiene que 5
5
2
1
2
5
2 5
=
( 2)( 2) + (2 + 2 )(2 + 2 ) + ( 4 + )( 4 + ) + (1
=
4 + (4 + 4) + (16 + 1) + (1 + 36)
Por lo que la distancia entre las matrices es 66 [ ].
8
+
2
2+2 = 1 6 1+
= 66
EJEMPLO 4.10 .
y
+
Con el producto interno definido por
Ing. Aldo Jiménez Arteaga
6 )(1
6)
AL
3 =0
⟨ ⟩ 3 2 2 3 3 2 2 ‖3 ‖ √ √ ( )| ( ) =
Encuéntrese la distancia entre los polinomios ( ) = Se obtiene
Y, finalmente
+
2014
() ()
1 y ( ) =
+
1)
+
3 = (
3 =
( 3)( 3) + ( 1)( 1) + (7)(7) + (27)(27)
+
(
+ 2.
+ 2)
= 788
La distancia entre los polinomios es 788 [ ].
Definición de ángulo entre vectores
El ángulo entre vectores también puede calcularse a partir del producto interno. La figura 4.3 permite establecer ciertas relaciones entre las normas y el ángulo.
Figura 4.3. Ángulo entre vectores.
Por la ley de cosenos se sabe que
̅2 ‖�‖2 ‖̅‖2 ‖�‖‖̅‖ ̅ ‖̅�‖ 2 2 ̅ ̅ ̅ ̅ ⟨ ⟩ ‖ ‖ ‖ ‖ ‖ ‖‖ ‖ � � � � 2 2 ̅ ̅ ̅ ̅ ̅ ⟨ ⟩ ⟨ ⟩ ‖ ‖ ‖ ‖ ‖ ‖‖ ‖ � � � � � ⟨̅ ̅⟩ ⟨‖�̅‖2�⟩⟨ ⟨�� ̅̅⟩⟩ ⟨‖� ̅‖�2⟩ ‖‖��‖‖22 ‖‖̅̅‖‖22 ‖‖��‖‖‖‖̅̅‖‖ ⟨� ̅⟩ ‖�‖‖̅‖ ⟨‖��‖‖̅⟩̅‖ =
Pero además
es la norma de
|
+
2
cos
. Por lo tanto, al desarrollar la expresión se tiene
| |
| |
| 2 |
= = + | = + = 2 | =
+ + + +
2
Finalmente, se obtiene que
|
9
Ing. Aldo Jiménez Arteaga
= cos
2 2 2 2
cos
cos cos cos cos
AL
⟨� ̅⟩ ⟨‖�‖‖� ̅‖̅⟩ ̅ � ℝ4 �∙̅ ‖�‖ √ ‖̅‖ √ √ √ ⟨ ⟩ ∗ ⟨ ⟩ ⟨ ⟩
2014
Y el ángulo entre dos vectores puede obtenerse a partir del producto interno entre sus vectores, y las normas. Hay que destacar que en espacios complejos el producto | puede ser un número complejo, en cuyo caso sólo se tomará en cuenta la parte real; es decir Re |
EJEMPLO 4.11 .
= cos
Sean los vectores = (0, 1, 1, 2) y = (0, 0,1, 1). Calcúlese el ángulo entre ellos, utilizando el producto interno usual en . Se calculan
= (0)(0) + (1)(0) + ( 1)(1) + (2)(1) =1
(0)(0) + (1)(1) + ( 1)( 1) + (2)(2)
=
= 6 =
(0)(0) + (0)(0) + (1)(1) + (1)(1)
= 2
Por lo tanto, el coseno del ángulo entre los vectores es
1
cos =
6 2
Por lo tanto, se obtiene que = 73.22°. EJEMPLO 4.12 .
interno
Calcúlese el ángulo entre los vectores
0
|
Se calcula
|
= tr
2 3
= tr(
2
1
3 12 3+5 =7+7 = tr
|
= tr
2
1 1 = tr 2 1+
10
Ing. Aldo Jiménez Arteaga
1+ 1
0 3 1
4 8 4 4
2 13 2 5
3 2
)
3 2
0 3 1
y
0
4 0
2+
1+2 7+2 1+4
2 3
1 2+5 3
1+ 1
4 0
2+
, si se define el producto
AL
2014
= 17
⟨ ⟩ √ √ |
3 4 2 13 = tr 12 8+3 = 35
2 0
= tr
3 2
12 16 8 4
4 0
2+
8 3 8+4 6
Por lo que el ángulo entre vectores, en este caso, queda definido por = arccos
Obteniéndose que = 73.32°. Vectores ortogonales
Re(7 + 7 ) 17 35
̅ ∈ � ⟨� ̅⟩ � ̅ ̅ � ⟨‖��‖‖̅⟩̅‖ � ̅ �∙̅ ∙
Sea un espacio vectorial con producto interno. Se dice que dos vectores , |
son ortogonales si
= 0
Dicha relación es simétrica: si es ortogonal a , entonces es ortogonal a . Debido a que 0 = cos
entonces,
0=
2
|
Por lo que se llega a la definición de ortogonalidad entre vectores. EJEMPLO 4.13 .
Sean los vectores = (0, 1,1,2) y = (2,1,1,0). Al aplicar el producto escalar ordinario en cuartetos ordenados reales se llega a = (0, 1,1,2) (2,1,1,0) = (0)(2) + ( 1)(1) + (1)(1) + (2)(0) =0
Por lo que los vectores son ortogonales.
Si al concepto de vectores ortogonales se le añade el de vector unitario, se establece la definición de vectores ortonormales. Sean y dos vectores unitarios; si se tiene que
Se dice que los vectores y son ortonormales. 11
Ing. Aldo Jiménez Arteaga
⟨ ⟩ |
= 0
AL
EJEMPLO 4.14.
2 2 2 ⟨ ⟩ =0 2 22 1 0 0 1 2 ∈ ℝ ‖ ‖ √ ‖ ‖ √ ̂ √ 1 3 2 √ 1 3 √ 13 √ 31 4 2 √ 11 4 √ 2 14
Dados los vectores ( ) = + 1 y ( ) = los dos polinomios sean vectores ortonormales, si se define
+
2, encuéntrese los valores
2014
∈ℝ
tales que
( )| ( ) =
Si el espacio vectorial es
= {
+
+
|
,
}.
,
Se sabe que el producto entre los dos vectores debe ser nulo, por lo tanto
0 = ( 1)( ) + (1)(1) + ( 1)( 2)
y se tiene que = 3. Al obtener las respectivas normas de los polinomios se obtiene que
Y los vectores ortonormales son ( ) =
( ) =
3
( ) =
14
y ( ) =
+
+
.
Conjuntos ortogonales y ortonormales La ortogonalidad no es específica de un par de vectores; se pueden tener conjuntos completos de vectores ortogonales a un vector, o incluso conjuntos de vectores ortogonales entre sí. Sea el conjunto
Si se cumple que EJEMPLO 4.15 .
�� ∀ ≠ ̂ ̂ = 0,
El conjunto , ,
�1 �2 �3 � ∙ ∙ ∙ ∙ ∙ ∙ =
,
,
… ,
, entonces se dice que es un conjunto ortogonal.
es ortogonal bajo el producto interno usual en las ternas ordenadas, ya que (1,0,0) (0,0,1) = 0 (1,0,0) (0,1,0) = 0 (0,1,0) (0,0,1) = 0
EJEMPLO 4.16.
∈ℝ
Dado el conjunto de vectores {(2 , 0, 1), ( 1, 10, 2), (2,1, )}, ¿qué valores , conjunto sea ortogonal? Se debe plantear que
(2 , 0, 1) ( 1, 10, 2) = 0 (2,1, ) (2 , 0, 1) = 0
( 1, 10, 2) (2,1, ) = 0 12
Ing. Aldo Jiménez Arteaga
permiten que el
AL
Por lo que surge el sistema de ecuaciones
2014
2 4
2
Finalmente se obtiene que = 1 y = 4.
= = =
2 0 8
Para poder establecer un conjunto ortogonal de vectores es necesario considerar el producto interno definido. Entonces, el conjunto puede determinarse a partir de un vector de un subespacio vectorial o incluso a partir de un espacio.
̅ ⟨ ⟩ � �2
�1 ∈
Sea el subespacio vectorial donde se define un producto interno | . Para obtener un conjunto ortogonal se parte de un vector arbitrario . Para obtener el segundo vector se debe cumplir que
�1�2 �3 ��12��33 �4
= 0, que permitirá plantear una ecuación lineal (1).
El tercer vector
del conjunto ortogonal se obtiene al plantear las condiciones simultáneas
= 0, que plantea nuevamente la ecuación lineal (1). = 0, que añade una nueva ecuación lineal (2)
�3�4
El vector se obtendrá al resolver el sistema de ecuaciones lineales formado por las ecuaciones (1), (2) y una nueva al añadir una ecuación (3), producto de = 0. El proceso se continuará de forma análoga al descrito anteriormente, hasta obtener como vector ortogonal al vector nulo. Cabe destacar que cada uno de los vectores obtenidos debe pertenecer al mismo subespacio vectorial en el cual de define el producto interno. EJEMPLO 4.17 .
Sea el espacio vectorial
2 ∈ ℝ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ =
Con el producto interno definido por =
1 1
|
, , ,
= tr(
). Determínese un conjunto ortogonal a partir del vector
0 . 1
Primero se plantea
|
= 0, donde =
.
|
= tr
0=
+
que arroja la condición = + ; por lo tanto el vector buscado tiene la forma = Dando valores, se obtiene = 13
0 2
Ing. Aldo Jiménez Arteaga
1 . 2
+
.
AL
El siguiente vector ortogonal se obtiene a partir del planteamiento de las ecuaciones =
.
⟨ ⟩ ⟨ ⟩ = 0 y
|
|
= 0, donde
⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ 459 4 12 9 1 454 2 ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ ⟨ ⟩ |
= tr
0=
|
que al darle valores establece que = El siguiente vector =
+
= tr
2 + 2 0 = + 2 + 2
Al sustituir las condiciones obtenidas, =
y =
1 1
2 , en el vector
2
deberá cumplir simultáneamente =
|
= + 2 + 2
= 0,
, =
2
+
=
0
+
=
0
=
0
|
|
=
|
= + 2 + 2
=
=
0=
+
6 + + 2
9 + 2 9 + 2 5 + 4 5 + 4 9 + 2 5 + 4
= tr
|
2 y 0 =
; al dar valores se obtiene
|
Ing. Aldo Jiménez Arteaga
2
2
,
= 0 y
|
= 0.
+
simultáneamente ortogonal a los cuatro anteriores:
Al plantear el sistema de ecuaciones
se llega a =
6 6 + 2 + 2 6 + + 2
= tr
Las condiciones que se deben satisfacer son = ecuaciones se tiene que
=
|
|
0=
Y el vector tiene la forma
2 + 2
6 . 2
|
14
2014
6 + + 2 . Al resolver el sistema
9 5
2 . El siguiente vector que debe ser 4
AL
2014
̅ ∈ ℝ 1 ̅1 ∙̅2 ∙ ̅2 ̅ ̅2̅ 1 ∙3 ̅2 ∙̅3 ∙ ̅3 ̅3 9
+ +2 + 5
6 +2
= = = =
+2 +2 +4
0 0 0 0
Se descubre que solo acepta la solución trivial; por lo tanto el siguiente vector ortogonal es el vector nulo. Si se sigue el procedimiento nuevamente, se obtendrá siempre el vector nulo; por lo que el conjunto ortogonal es 1 1
EJEMPLO 4.18 .
0 0 , 1 2
Para el subespacio = {( , , 2
Se inicia con un vector arbitrario del subespacio
1 , 2
1 1
9 5
6 , 2
}, encuéntrese un conjunto ortogonal.
, )| , ,
= (1,1,1,1):
= (1,1,1,1) ( , , 2 0 = 3 +
El segundo vector es
, 3 ), o bien
= ( , , 2
2 4
, )
= (1,1,1, 3). El tercer vector es = 3 +
= (1,1,1, 3) ( , , 2 0= 3 3
Al sustituir las dos condiciones, se obtiene el vector el conjunto ortogonal es
= (0, ,
, )
, 0), que con valores es
= (0,1, 1, 0). Finalmente,
{(1,1,1,1), (1,1,1, 3), (0,1, 1, 0)}
Como en el ejemplo anterior, al calcular el siguiente vector ortogonal se obtendrá el vector nulo.
Independencia lineal de un conjunto ortogonal de vectores no nulos En los ejemplos anteriores puede observarse que el número de vectores de cada conjunto ortogonal coincide con la dimensión del subespacio. Además, se puede comprobar fácilmente que cada conjunto ortogonal es linealmente independiente; por lo tanto, un conjunto ortogonal con el mismo número de vectores que la dimensión del subespacio al que pertenece es una base. Sea el conjunto ortogonal
�1 �2 �3 � � 1�1 2�2 3�3 ⋯ � � �� 1�1� 2�2� 3�3� ⋯ �� =
,
,
,…,
Si se establece la ecuación de dependencia lineal con los elementos de A se tiene que 0 =
+
+
+
+
Si se toma un elemento del conjunto y se aplica a la ecuación de dependencia el producto interno para el cual ortogonal se obtiene que 0
15
Ing. Aldo Jiménez Arteaga
=
+
+
+
+
es
AL
0=
2014
1�1� 2�2� 3�3� ⋯ �� �� ∀ ≠ �� +
+
Como el conjunto es ortogonal, entonces el producto
+
+
, y la ecuación de dependencia se reduce a
= 0,
0=
De donde se obtiene que = 0. Como se puede realizar este procedimiento con cualquier vector, entonces se concluye que la ecuación de dependencia se cumple solo si todos los escalares son nulos; en consecuencia, el conjunto es linealmente independiente.
∈ ℝ ∈ ℝ
EJEMPLO 4.19.
El conjunto del ejemplo 4.18 puede establecerse como una matriz, y verificar si es una base del }. subespacio = {( , , 2 , )| , , 1 1 0
1 1 1
1 1 1
1 1 ~ 3 0 0 0
1 0 1
1 0 1
1 1 ~ 4 0 0 0
1 1 0
1 1 0
1 1 ~ 0 0 1 0
0 1 0
2 1 0
0 0 1
Se observa que los vectores son linealmente independientes; por lo tanto, el espacio generado es = {( , , 2
}
, )| , ,
que es el mismo subespacio .
A una base de un subespacio que además es ortogonal se le conoce como base ortogonal. El proceso para obtener una base ortogonal a partir de un vector es el mismo que se describió en el apartado de conjunto ortogonal.
Coordenadas de un vector respecto a una base ortogonal
Al introducir el concepto de base ortogonal, se puede establecer también el de coordenadas de un vector en una base ortogonal. Sea un espacio vectorial donde se define la base ortogonal
y sea un vector
�1 �2 �3 � �∈ � � �1�1 2�2 3�3 ⋯ � �� 1�1� 2�2� 3�3� ⋯ �� �� ∀ ≠ �� �� ���� =
,
,
,…,
. Para obtener el vector de coordenadas [ ] se tiene =
Si se aplica el producto interno con un vector =
+
+
+
de la base a ambos lados de la ecuación se llega a +
+
Al igual que en la demostración anterior, se sabe que
= 0,
=
lo cual permite que
=
16
Ing. Aldo Jiménez Arteaga
+
+
+
; por lo tanto, la expresión anterior se reduce a
AL
� � �1���11 �2���22 �3���33 ���� 2 2 2 2 ∈ ℝ 2 ⟨ ⟩ =0 ⟨⟨ ⟩⟩ ⟨⟨ ⟩⟩ ⟨⟨ ⟩⟩ ⇒ ⟨⟨ ⟩⟩ ⇒ 13 23
2014
Entonces, se tiene que el vector de coordenadas de en la base ortogonal está dado por [ ] =
EJEMPLO 4.20 . Sea el
subespacio
= {
,
,
,…,
} y la base ortogonal
+ ( 2 + 3 )| ,
+
= {2
+
1,
+ 2 + 4}
con respecto al producto interno definido por
( )| ( ) =
Calcúlese el vector de coordenadas de ( ) = + 3 en la base ortogonal, utilizando el producto interno. Se sabe que [ ( )] =
Por lo que
| |
=
|
|
Y se obtiene que [ ( )] =
,
| |
,
| |
(0)(2) + (1)(1) + (3)( 1) (2)(2) + (1)(1) + ( 1)( 1)
=
(0)(1) + (1)(2) + (3)(4)
2
(1)(1) + (2)(2) + (4)(4)
3
1 3
.
Proceso de ortogonalización de Gram-Schmidt
Se ha estudiado que a partir de un vector de un subespacio se puede obtener una base ortogonal. Sin embargo, también es posible encontrar una base de este tipo a partir de una base cualquiera del subespacio.
̅1 ̅2 ̅3 ̅1 2 3
̅ ⟨ ⟩ �
Supóngase que = { , , , … , } es una base del espacio vectorial con un producto interno | definido. Para encontrar una base ortogonal = { , , , … , } se debe elegir un primer vector de sobre el cual se operará. En este caso se tiene que 1.
1 2
=
̅1 ̅2 ⟨⟨� ⟩⟩ 1
Para el segundo vector de la base ortogonal se debe hacer una resta del segundo vector de la base original menos su proyección sobre el vector obtenido en el paso anterior; es decir, 2.
=
|
|
Para el tercer vector se realiza la resta del tercer vector de la base original menos la proyección sobre el primer vector menos la proyección sobre el segundo vector de la base ortogonal, ya obtenidos; o sea, 17
Ing. Aldo Jiménez Arteaga
AL
3.
2014
3 ̅3 ⟨⟨� ⟩⟩ 1 ⟨⟨� ⟩⟩ 2 ̅ ⟨⟨� ⟩⟩ 1 ⟨⟨� ⟩⟩ 2 ⟨⟨� ⟩⟩ 3 ⋯ ⟨⟨� ⟩ ⟩ −1 1 ̅1 −1 ⟨̅ ⟩ ̅ =1 ⟨ ⟩ ∀ ≤ ≤ =
|
|
|
|
El proceso se continúa como en los pasos anteriores hasta obtener el vector -ésimo de la base ortogonal n.
=
|
|
|
|
|
|
|
|
En forma compacta, este algoritmo crea una base ortogonal a partir de una base cualquiera de un espacio vectorial, donde =
|
=
2
|
El algoritmo es conocido como el método de ortogonalización de Gram-Schmidt, llamado en honor de sus descubridores, el actuario danés Jørgen Pedersen Gram y el matemático alemán Erhard Schmidt. EJEMPLO 4.21 .
Encuéntrese la base ortogonal generada a partir de la base
⟨ ⟩ 1111 1212 2121 2222 − 1 ̅ =1 ⟨⟨̅ ⟩⟩ 1 2 1 2 21 1 3 12 3 2 21 317 1712 1 0
=
0 0 , 1 2
2 , 1
1 1
1 0
del espacio de las matrices simétricas de orden 2, si el producto interno que se define es |
=
+
+
+
El proceso se comienzo con la elección del primer vector como inicio de la base, y después se aplica la ecuación |
=
Para los vectores siguientes:
|
1 0 0 1 1 0 2 = 2 1 2 2 = 2 =
=
=
Y la base ortogonal obtenida es 18
Ing. Aldo Jiménez Arteaga
1 1
1 0
17 17
1 0
1 2
1 0
0 1
0 1
7
17 2
2
AL
1 12 3 2 21 17317 171217 ℝ4 =
EJEMPLO 4.22 .
2014
1 0
0 , 1 2
2
,
Dada una base de un subespacio de
{(1,1,0,0), (0,1,1,0), (0,0,1,1)}
Encuéntrese una base ortogonal. Por el proceso de Gram-Schmidt se establece que
1 2 ∙∙ 3 ∙∙ = (1,1,0,0)
El segundo vector es
= (0,1,1,0) = (0,1,1,0)
1 1 , ,1,0 2 2
=
El tercer vector es
0
= (0,0,1,1)
2 2
= (0,0,1,1) =
1 3
,
(1,1,0,0) (0,1,1,0) (1,1,0,0) (1,1,0,0) (1,1,0,0) 1 (1,1,0,0) 2
3
1 1 , ,1,0 2 2 1 1 , ,1,0 2 2
(1,1,0,0)
(0,0,1,1)
1 1 , ,1,0 2 2
1 1 , ,1,0 2 2
1 1 , ,1,0 2 2
1 1 , ,1 3 3
Finalmente, la base ortogonal es
(1,1,0,0),
1 1 1 , ,1,0 , , 2 2 3
1 1 , ,1 3 3
Complemento ortogonal Las dos opciones que se tienen al manejar conjuntos de vectores y ortogonalidad son:
Un conjunto cuyos vectores son ortogonales entre sí. Un conjunto cuyos vectores son ortogonales a otro vector fuera del conjunto.
El primero fue tratado en el tema de bases ortogonales; el segundo se conoce como complemento ortogonal, y se define a continuación.
19
Ing. Aldo Jiménez Arteaga
AL
2014
⊥ ̅ ⟨̅ �⟩ �∈ ∈ ℝ
Sea un subespacio de un espacio vectorial con producto interno. Al subespacio de cuyos vectores son ortogonales a los elementos de , se le conoce como complemento ortogonal de , y se denota como = { | |
}
= 0,
Se debe hacer hincapié que los elementos del complemento ortogonal de no necesariamente son ortogonales entre sí. EJEMPLO 4.23.
Sea el subespacio producto escalar ordinario?
}. ¿Cuál es su complemento ortogonal, con respecto al
= {( , , , )| ,
En este problema se debe elegir una base de , la cual planteará la ortogonalidad con otro subespacio de los cuartetos reales ordenados. La base elegida será: {(1,0,0,1), (0,1,1,0)}
Por lo que se tiene que
∙ ∙ ⊥ ∈ ℝ ∙ 2 2 ⟨ ⟩ =0 (1,0,0,1) ( , , , ) = 0 (0, 1,1,0) ( , , , ) = 0
De estas dos operaciones se obtienen las condiciones + = 0 y + = 0 del complemento ortogonal de A: = {(
Si se realiza el producto escalar entre ( , , , ) y ( ( , , , ) (
cuyo resultado es cero. EJEMPLO 4.24 .
,
, , )| ,
,
, , ) se obtiene
,
, , ) =
+
Encuéntrese el complemento ortogonal al polinomio
definido por
}
+
2 + 1 bajo el producto interno
( ) =
( )| ( ) =
Si el espacio vectorial es el de los polinomios de grado menor o igual a dos con elementos reales. Se debe plantear que
⟨⟨22 22 ⟩⟩ ⊥ 2 ∈ ℝ 2 + 1| 2 + 1|
+ +
+ +
= 0 = (1)( ) + ( 2)( ) + (1)( )
Por lo que la condición que debe cumplir el complemento ortogonal es ortogonal del polinomio dado es ( ) = {(2
20
Ing. Aldo Jiménez Arteaga
)
+
+ | ,
2 + = 0. Y se tiene que el complemento
}
AL
ℝ3 ∙
EJEMPLO 4.25.
2014
Una de las aplicaciones directas del complemento ortogonal es el plano en el espacio. Se sabe que un plano que contiene al origen es un subespacio de ; dicho plano puede definirse por la ecuación +
+
= 0
Esa ecuación del plano puede descomponerse como ( , , ) ( , , ) = 0, donde el vector ( , , ) representa a un vector que pertenece al plano, y ( , , ) es un vector perpendicular (conocido en geometría analítica como vector normal) al plano. La figura 4.4 muestra un plano generado por dos vectores, y el vector normal al plano.
Figura 4.4. Plano generado por dos vectores (rojo) que muestra al vector normal (azul).
Π ∈ ℝ ∙ ∙ Π⊥ ∈ ℝ
Si los vectores que forman el plano son ( 2,6,4) y ( 3,3, 3), ¿cuál es una ecuación del plano? El plano es el espacio generado por los vectores dados, es decir = {(
)| ,
, 3 + , 2
}
Para encontrar la ecuación del plano es necesario obtener el vector normal, el cual pertenece al complemento ortogonal del plano. Tomando la base {( 1,3,2), ( 1,1, 1)}, el vector normal se obtiene como ( 1,3,2) ( , , ) = 0
( 1,1, 1) ( , , ) = 0
Que establece las ecuaciones
+ 3 + 2 = 0 y
= 0, de donde se obtiene que
+
5
=
2
,
3 2
,
| ,
Si se toma el vector ( 5, 3,2), que es un vector normal al plano, se obtiene que la ecuación buscada es 5
3 + 2 = 0
Proyección de un vector sobre un subespacio
De acuerdo al ejemplo anterior, es posible establecer relaciones entre un vector y un subespacio (en el caso del ejemplo, representado por un plano). Sin embargo, ese vector no necesariamente es perpendicular al subespacio; es posible que ese vector sea oblicuo, y por lo tanto, permita establecer una ‘sombra’ sobre el subespacio. Este concepto se conoce como proyección de un vector sobre un subespacio; la figura 4.5 establece ese concepto.
21
Ing. Aldo Jiménez Arteaga
AL
2014
Figura 4.5. Proyección de un vector sobre un subespacio (plano).
Para obtener la proyección de un vector sobre un subespacio se debe considerar el producto interno que se utilizará y el subespacio sobre el cual se proyectará. Sea el conjunto
�1 �2 �3 � � � �1���11 �1 �2���22 �2 �3���33 �3 ⋯ ���� � � � ̅ ̅ � � � � ̅ ̅ ̅ ̅ ̅ ̅ ̅ ̅ 1 2 3 � � � � �1�1 1 �2�2 2 �3�3 3 ⋯ �� � � �1̅��11 �1 � 1̅��11 �1 �2̅��22 �2 � 2̅��22 �2 ⋯ �̅�� � � ̅�� � ̅ ̅� � ̅�� � � � � �1̅��11 �1 �2̅��22 �2 �3̅��33 �3 ⋯ �̅�� � ̅ ̅ =1 �̅�� � ,
,
,…,
Una base ortogonal del subespacio H mostrado en la figura 4.5. El vector , puede expresarse como =
+
+
+
… (1)
+
Pero el vector puede expresarse como
… (2)
=
Al sustituir (2) en la parte derecha de (1) se obtiene =
+
+
+
+
Al desarrollar la anterior ecuación con propiedades del producto interno se tiene que =
Debido a que el subespacio consecuencia
+
H es
+
+
el complemento ortogonal del vector , los productos
= 0
Por lo que el vector se expresa como =
+
+
Esta expresión es conocida como la proyección de sobre Proy
22
Ing. Aldo Jiménez Arteaga
=
+
+
, denotada como
son iguales a cero, y en
AL
EJEMPLO 4.26 .
∈ ℝ ⟨ ⟩ 1 2 ⟨⟨ 1 11⟩⟩ 1 ⟨⟨ 2 22⟩⟩ 2 1 0
Obténgase la proyección de la matriz =
0 sobre el subespacio 2
=
Con el producto interno definido por
Una base ortogonal del subespacio es
|
,
).
= tr( 1 0
0 , 1
Proy
=
=
=
que es el vector buscado.
0 1
|
|
3 1 2 0 3 1 = 2 0
1 , por lo tanto, la proyección de sobre será 0 |
+
|
0 0 + 1 2 0 1
=
Proy
2014
0 1
1 0
En la figura 4.5 se presenta un triángulo rectángulo, cuyos lados son los vectores expresarse con la ecuación vectorial
� ̅ ̅ ̅ ,
̅ ̅ � ̅ ̅ ̅ � � ̅ � ̅ ⊥ ̅ � ∀� ∈ ∈ ⊥ 0 0⊥ 0 ∈ℝ ∙∙ ∙∙ 0 ∙∙ 0 ∙ ∈ℝ =
+
̅
y ; la hipotenusa puede
donde es el vector distancia entre y , y es la proyección de en el subespacio ; obsérvese que es el complemento ortogonal de ; en consecuencia, es ortogonal a . Por lo que, un vector cualquiera puede expresarse de la siguiente manera = +
Siendo un subespacio y EJEMPLO 4.27 .
,
su complemento ortogonal.
Exprésese el vector (2, 1,0,1) como la suma de dos vectores. (2, 1,0,1) =
Si
pertenece al subespacio
= {( 0, , , )| , ,
+
}, entonces la proyección se da como
(2, 1,0,1) (0,1,0,0) (2, 1,0,1) (0,0,1,0) (2, 1,0,1) (0,0,0,1) (0,1,0,0) + (0,0,1,0) + (0,0,0,1) (0,1,0,0) (0,1,0,0) (0,0,1,0) (0,0,1,0) (0,0,0,1) (0,0,0,1) = 1(0,1,0,0) + 0(0,0,1,0) + (0,0,0,1) = (0, 1,0,1)
=
Para encontrar el complemento ortogonal de
:
0 = (0, 1,0,1) ( , , , )
+ = 0 y el complemento ortogonal es {( , , , )| , , Por lo tanto, realizar una ecuación sencilla 23
Ing. Aldo Jiménez Arteaga
}. Para terminar el cálculo, se debe
AL
⊥ 0
2014
(2, 1,0,1) = (0, 1,0,1) + ( , , , )
De donde se obtiene que
(2, 1,0,1)
(0, 1, 0,1) = ( , , , ) = (2,0,0,0)
Que son los dos vectores buscados: (2, 1,0,1) = (0, 1,0,1) + (2,0,0,0)
El teorema de proyección
̅ � ̅ �0
̅ ̅ �
En la figura 4.6 puede observarse la proyección de un vector sobre un vector ; además, se dibujan las respectivas distancias entre ( , ) y ( , ). Es evidente que la distancia entre y su proyección es la menor de las dos. ( , )
(
, )
Figura 4.6. Distancia mínima entre vectores.
Esto permite establecer el teorema de proyección, el cual se enuncia a continuación. Para cada vector
̅
̅ ∈
�̅0 ̅ ‖�0‖ ‖�‖
existe uno y sólo un vector
tal que
<
�0
Este teorema se le conoce como teorema de proyección. Puede observarse que la distancia más corta se da entre el vector y su proyección . EJEMPLO 4.28 .
∈ ℝ ⟨ ⟩
Sea el subespacio
=
de las matrices cuadradas de orden dos con elementos
,
2
reales, donde se define el producto interno
|
Obténgase la matriz más cercana a
=
2 1
= tr(
)
1 . 0
Para obtener la proyección, es necesario tener una base ortogonal, la cual es 1 0
y se obtiene la protección de
24
sobre
Ing. Aldo Jiménez Arteaga
, que es
0 , 2
0 1
1 0
AL
2014
2 ∈ ℝ ̅0 �∈ � � ⟨̅ �⟩ 00 11 22 ∀ 0 12 22 20 1 22 ⟨⟨2 22 ⟩⟩ 2 ⟨ ⟨ 2 2 2 ⟩ ⟩ 2 2 2 2 2 2 2 ⇒ 2 ̅0 1511 1116 2 1115 1147 Proy
2 1 5 0 2 1 = 5 0
0 0 + 2 2 0 2
=
0 1
1 0
La matriz más próxima a es
2 1 5 0
EJEMPLO 4.29 .
Dado el subespacio
= {( +
Encuéntrese el vector
� ̅0
|
=
2 + 5|
)
}
+ ( ) + ( + 2 )| ,
más próximo a ( ) = 2 + 5, utilizando el producto interno
+
+ 2
( ) =
+
donde denota al conjugado de ( ) es =
0 2
(
+
. Una base ortogonal de G es = {
+ 2, (5
2)
+
(5 + 2| + 2 5(2) 2 ( 5 ) + 5(1) ( + 2) + [(5 2 ) = 1+4 29 + 25 + 1 3 [(5 2 ) + 5 + 1] = 2 ( + 2) + 11 15 6 15 3 = (2 + 4) + + + 11 11 11 11 =
+
+
+ 5 + 1} y la proyección de
2 + 5|(5 2 ) + 5 + 1 [(5 2 ) + 5 + 1|(5 2 ) + 5 + 1
+ 2) +
Por lo que el vector más cercano buscado es
, ( ) =
+
2)
+ 5 + 1]
+ 5 + 1]
15 16 + 11 11 +
+
+
15 11
+
47 11
.
Mínimos cuadrados Es una técnica de análisis numérico encuadrada dentro de la optimización matemática, en la que, dados un conjunto de pares (o ternas, etc.), se intenta encontrar la función que mejor se aproxime a los datos (un mejor ajuste), de acuerdo con el criterio de mínimo error cuadrático. La figura 4.7 muestra el concepto de mínimos cuadrados.
Figura 4.7. Ajuste, por mínimos cuadrados, de un conjunto de puntos a una función.
25
Ing. Aldo Jiménez Arteaga
AL
2014
̅ � ̅ � 1121 1222 ⋯⋯ 12 12 12 ⋮1 2⋮ ⋯⋱ ⋮ ⋮ ⋮ 211111 221222 ⋮132333 ⋯⋯ 12 ⋯ 1 1 2 2 3 3 112111 122222 132333 ⋯ 12 ⋮11 2⋮ 2 3⋮ 3 ⋮ 1121 1222 1323 12 1 1⋮ 2 2⋮ 3 3⋮ ⋯ ⋮ ̅ ′ ̅ � � ̅ � 2 ̅′ 1
Tomando como base un sistema de ecuaciones lineales y incógnitas = , el vector de términos independientes = es una combinación puede pertenecer al espacio columna de la matriz de coeficientes, dado que el producto lineal de columnas de :
=
+ +
+ +
+ +
+ +
+
+
+
+
+
+
+
+
=
+
+
=
+
+
=
Si la condición expuesta no se cumple, entonces el sistema de ecuaciones no tiene una solución exacta; pero sí es posible obtener una aproximación a ella. Dicha solución, denotada como , es aquélla que minimizará el error = ; en otras palabras, es la distancia mínima entre la solución aproximada y la solución real. La figura 4.8 establece la relación entre las dos soluciones.
( )
(
)
(
Figura 4.8. Reducción del error entre la solución real
̅′
)
y la aproximada
̅ � ̅ ̅̅̅ ��
̅′
de un sistema de ecuaciones.
La figura muestra que la solución aproximada es la proyección del vector de términos independientes sobre el espacio columna de la matriz del sistema; por lo tanto, el vector pertenece al complemento ortogonal de ( ).
∈ ̅ 1 2 3
Supóngase que
donde = ( ,
26
( ). Esto quiere decir, que dicho vector es una combinación lineal de las columnas de ; es decir,
,
,…,
=
). Entonces, se obtiene que
Ing. Aldo Jiménez Arteaga
= 0 =
AL
Utilizando el producto interno usual en
ℝ
,
2014
̅̅̅̅ �� ̅̅ ̅ ̅ �� ̅ ̅� � �
= 0
(
)
= = =
donde, por el concepto de distancia mínima, se puede considerar que = 0 =
Éstas son conocidas como las ecuaciones normales de Gauss, y son la representación matricial del método de mínimos cuadrados. EJEMPLO 4.30 .
Regresión Lineal. Sea un conjunto de puntos obtenidos mediante medición
1 1 2 2 3 3 12 12 3 ⋮ 3 12 12 ⋮3 ⋮ ⋮3 ⎝ ⎠ ⎝4⎠ ̅ � 1 1 1 2 3 ⋯⋯ ⋮23 ⋮ 1 2 3 ⋯⋯ ⋮23 ⎝ ⎠ ⎝ 21 2 ⋯ 2 1 2 ⋯ 11 22 ⋯⋯ ⎠ 1 2 ⋯ ⋯ 1 2 {(
,
), (
), (
,
), … , (
,
)}
,
Se les puede ajustar al comportamiento de una recta, de ecuación =
Para obtener el valor de los coeficientes exacta
+
y , es posible ajustar a un sistema de ecuaciones lineales cuya solución no es
+ + +
= = =
+
=
cuyo arreglo matricial es
1 1 1
=
1
Al aplicar las ecuaciones normales
1
=
1
1
se puede reducir la ecuación:
1
1 1 1
=
1
1
1
1
1
+ +
27
+ +
Ing. Aldo Jiménez Arteaga
+ +
+ + 1+1+
+ +1
=
+ +
+ + + +
AL
2 =1 =1 ⎝=1 ⎠
=
que son las ecuaciones conocidas para aplicar la regresión lineal. EJEMPLO 4.31 .
2014
=1 ⎝ =1 ⎠
Determínese la recta que mejor se ajusta al conjunto de puntos presentados en la tabla 4.1. X Y
1 0.5
2 2.5
3 2.0
4 4.0
5 3.5
6 6.0
7 5.5
Tabla 4.1. Datos del ejemplo 4.31.
Con los datos de la tabla 4.1 se puede construir el siguiente sistema de ecuaciones:
⎛ ⎞ ⇒ ⎜⎝ ⎟⎠ ⎜⎝ ⎟⎠ ̅ � ⎝ ⎠ ⎝⎠ 2 3 4 5 6 7
Utilizando las ecuaciones normales de la recta buscada.
1 1
2 1
3 1
4 1
+ = + = + = + = + = + = + = =
5 6 7 1 1 1
0.5 2.5 2.0 4.0 3.5 6.0 5.5
1 1 1 1 1 1 1
0.5 2.5 2.0 4.0 3.5 6.0 5.5
=
, se pueden obtener los valores de la pendiente y la ordenada al origen
1 2 3 4 5 6 7
140 28
Cuya solución es
1 2 3 4 5 6 7
1 1 1 1 1 1 1
28 7
=
=
1 1
2 1
3 1
4 1
5 1
6 1
7 1
0.5 2.5 2.0 4.0 3.5 6.0 5.5
119.5 24
= 0.8393 y = 0.0714. Por lo tanto, la ecuación de la recta buscada es = 0.8393 + 0.0714
El polinomio de primer grado no es el único lugar geométrico al cual se puede ajustar un conjunto de puntos. Cualquier función lineal se puede ajustar satisfactoriamente por el método de mínimos cuadrados; incluso, con cambios de variable adecuados, se puede encontrar una función no-lineal. EJEMPLO 4.32 .
Encuéntrese la ecuación de segundo grado que mejor se ajusta al conjunto de puntos mostrado en la
tabla 4.2. 28
Ing. Aldo Jiménez Arteaga
AL
- 1.1 6.51
X Y
- 0.4 3.36
0.2 1.44
0.9 0.11
1.8 - 0.16
2.7 1.19
Tabla 4.2. Datos del ejemplo 4.32.
3.0 2.00
2014
3.8 5.04
2
El sistema de ecuaciones se construye con el polinomio de segundo grado = + + . Eso significa que se debe obtener un nuevo conjunto de datos, utilizando el cuadrado de los datos correspondientes a las abscisas; la tabla 4.3 muestra esos datos. - 1.1 1.21 6.51
X 2
X Y
- 0.4 0.16 3.36
0.2 0.04 1.44
0.9 0.81 0.11
1.8 3.24 - 0.16
2.7 7.29 1.19
3.0 9.00 2.00
3.8 14.44 5.04
Tabla 4.3. Datos con la expansión de datos del ejemplo 4.32.
Con estos datos se construye el sistema de ecuaciones lineales
1.21 0.16 0.04 0.81 3.24 7.29 9.00 14.44
1.1 0.4 +0.2 +0.9 +1.8 +2.7 +3.0 +3.8
⇒ ⎛ ⎝ ⎛ ⎞ ⎝ ⎠ + + + + + + + +
= = = = = = = =
6.51 3.36 1.44 0.11 0.16 1.19 2.00 5.04
0.16 0.4 1
0.04 0.2 1
1.1 0.4 0.2 0.9 1.8 2.7 3.0 3.8
3.24 1.8 1
7.29 2.7 1
Que se utiliza en las ecuaciones normales 1.21 1.1 1
=
1.21 0.16 0.04 0.81 3.24 7.29 9.00 14.44
1.1 0.4 0.2 0.9 1.8 2.7 3.0 3.8
0.81 0.9 1 1 1 1 1 1 1 1 1
Al realizar las multiplicaciones se obtiene el sistema de ecuaciones
355.3027 106.7290 36.1900
Cuya solución es = 1, =
29
106.7290 36.1900 10.9000
⎞ ⎛ ⎞ ⎠ ⎝ ⎠ ⎛ ⎞ ⎝ ⎠
1.21 0.16 0.04 0.81 3.24 7.29 9.00 14.44
=
36.1900 10.9000 8.0000
1 1 1 1 1 1 1 1
9.00 3.0 1
=
6.51 3.36 1.44 0.11 0.16 1.19 2.00 5.04
14.44 3.8 1
6.51 3.36 1.44 0.11 0.16 1.19 2.00 5.04
107.4957 = 19.9590 19.4900
3 y = 2. Por lo tanto, el polinomio que mejor se ajusta al conjunto de puntos dado es
Ing. Aldo Jiménez Arteaga
2 =
3 + 2