Producto Interno Matrices

Producto Interno y Ortogonalidad Departamento de Matemáticas, aticas, CSI/ITESM 15 de octubre de 2009

´ Indice 8.1. Contex Contexto to . . . . . . . . . . . . . . . . 8.2. Introd Introducc ucci´ i´ on on . . . . . . . . . . . . . . . 8.3. Un producto producto punto punto mediante mediante la traza traza . 8.4. Propiedades Propiedades del producto producto punto punto . . . . 8.5. La norma norma de de una una matriz matriz . . . . . . . . 8.6. Propiedades Propiedades de la norma norma de matrices matrices . 8.7. Desigualdad Desigualdad de de Schw Schwarz arz . . . . . . . . 8.8. La distancia distancia entre entre dos matrices matrices . . . . ´ 8.9. Angulo entre matrices . . . . . . . . . 8.10. Ortogonalidad Ortogonalidad y espacios espacios generados generados . . 8.11. Bases Ortonormales . . . . . . . . . . 8.12. Existencia Existencia de Bases Ortonormales Ortonormales . . 8.13. Proyecci´ Proyecci´ on on ortogonal ortogonal . . . . . . . . . . 8.14. Descomposici´ on on QR . . . . . . . . . . 8.15. Aplicaci´ on on de la factorizaci´ on on QR . . 8.16. Uso de la TI . . . . . . . . . . . . . . . 8.1. 8.1.

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

1 2 2 3 4 5 6 7 9 10 12 15 16 17 18 19

Cont Context exto o

Hemos mencionado que el problema fundamental del álgebra algebra lineal consiste en resolver un sistema de ecuaciones lineales A x = b y hemos introducido varios conceptos sofisticados para manejar la solución o n y el an´ aalisis. lisis. El concepto de espacio generado resuelve el problema de la consistencia: El sistema es consistente si y sólo olo si b C (A) (el espacio generado por las columnas de A). Otro concepto importante es el concepto de dependencia lineal y resuelve el problema de la unicidad: Si el sistema A x = b es consistente, entonces olo olo si las columnas de A forman un conjunto linealmente dependiente. A x = b tiene infinitas soluciones si y s´ Los conceptos de dimensión on y de base de un espacio lineal permiten tener una idea qué tan grande es el conjunto soluci´ on on y cómo omo generarlo: Si el sistema A x = b es consistente, entonces la f´ ormula de todas las soluciones es ormula on on particular y ns(A) es el espacio nulo de A, es decir, el conjunto de y = yo + ns(A) donde yo es una soluci´ todos los vectores que satisfacen A x = 0. De hech echo, si B = x1 , . . . , xr es una base para ns(A), entonces la soluci´ on on general será

∈

{

}

r

y = yo +

 i=1

ci xi

·

y esta será la soluci´ on general en su forma m´ on as reducida posible. El caso consistente ha dado origen a toda la as teor´ teor´ıa que hemos visto hasta ahora. Pasemos Pasemos ahora a la inconsisten inconsistencia. cia. De alguna forma debemos cambiar la pregunta por que el tema se agotó: o: Si es A x = b inconsistente, entonces no hay soluci´ on. Una forma adecuada on. de reformular la pregunta es: No habiendo soluci´ on on para A x = b, ¿qué es lo más as cerca posible que podemos

estar de una soluci´ on ? Esto involucra dos conceptos hermanados: distancia y perpendicularidad. Y ellos tienen como origen el concepto de producto interno o producto punto que es el tema de esta lectura. 8.2. 8.2.

Intr Introdu oducc cci´ i´ on on

En esta lectura veremos cómo omo definir un producto punto o producto interno en espacios de matrices (pues tenga presente que nos interesa el paso de A x = b a A X = B tambi´ en en en el caso inconsistente). Veremos que aunque en un principio la definición on del producto punto apartir del uso de la traza sea extra˜ na , esta definici´ on on es de lo más as c´ omoda porque hace coincidir el producto punto entre matrices con el producto punto omoda tradicional entre vectores cuando las matrices son vectorizadas. La estructura cl´ asica asica de la construcción on del Algebra Lineal referente al producto interno es: definir un producto interno, probar ciertas propiedades básicas, estas propiedades incluyen en concepto de ortogonalidad, y entonces mostrar que se puede definir una norma a partir del producto interno; para llegar la definir una distancia con la norma se requiere probar la desigualdad de Cauchy-Schwarz. Cuando se dice que se tiene una distancia en el espacio lineal se tiene el concepto de cercan cercan´´ıa y el de error. Las propiedade propiedadess importantes importantes que deben ser deducid deducidas as para que la distancia distancia definida definida sea cabalmente una distancia son de identidad (que si la distancia entre dos objetos es cero, entonces los objetos son id´ enticos), enticos), de simetr´ simetr´ıa (que la distancia distancia medida medida de un objeto a otro es independien independiente te de cual de los dos sea el punto de referencia), la desigualdad del triángulo angulo (la distancia entre dos puntos no excede la suma de las distancias de uno de ellos a otro intermedio mas la distancia de ese intermedio al segundo punto; y habrá igualdad igualdad cuando cuando el punto punto intermedi intermedioo est´ esté en el segmento segmento que une ambos puntos). puntos). El proceso proceso de Gram-Schmidt ser´ a la clave para encontrar una base para C (A) desde donde será f´ acil acil encontrar el punto on posible a A x = b. m´ as as próximo oximo de C (A) a b y all´ al l´ı a la mejor soluci´ 8.3. 8.3.

Un product producto o punto punto medi median ante te la traza traza

El producto punto entre matrices se define apartir del producto, la transpuesta y la traza entre y de matrices. En apariencia complejo, veremos su conveniencia y facilidad posteriormente. Definici´ on on Sean A y B dos matrices m

× n, el producto interno o producto punto de A y B se define como: A • B = tr A · B ′

 

Ejemplifique Ejemplifiquemos mos el c´ alculo de productos punto. alculo Ejemplo 1 Determine A

• B si

  −   −    −   − − − −   − • 3 2 5

−1 0 −2

, B=

3 2 1 0

5 2

1 0 4

A=

Soluci´ on on

A′ B =

·

Por tanto: A

 

B = tr

23 9

−

16 7

1 0 4

1 1 3

(1)

1 1 3

=

23 9

= 23 + 7 = 30

−16

7





Toca el turno al alumno para ejercitar el concepto del producto punto entre matrices de la misma dimensi´ on. on. Ejercicio 1

2

Para Para las matrices matrices siguientes siguientes calcule A B. 1. A = 2. A =

3. A = 8.4. 8.4.

   

•

2 3

−1

2 1

−1

2 3 0

−1

1



yB=

3 0 1 1 1

 





−

yB=

yB=

Propie Propiedad dades es del del producto producto punto punto

1 0 1 0





1 0 0 2

−1

1



  −  1 0 1 0 2 1

El camino tradicional para ver que un producto es efectivamente candidato a producto interno con escalares reales es probar que es: conmutativo, no negativo, y bilineal : Teorema 8.1

Sean A, B y C matrices m n y sea k un escalar. Entonces el producto punto cumple las siguientes propiedades:

×

1. 2. 3. 4. 5.

Simet Si metrr´ıa: ıa : A B = B A No negativida negatividad: d: A A 0, habiendo igualdad ssi A = 0 Proporcionalid Proporcionalidad: ad: (k (k A) B = k (A B) Distributiv Distributividad: idad: (A + B) C = A C + B C 0 A=0

•

•

• ≥ •

•

• •

•

Demostraci´ on on on: on: 1. Directo de la definici´

A

on on anterior: 2. De la secci´

A

Adem´ as, as, A A = 0 ssi

•

•A

•

tr (A′ B) tr (A′ B)′ tr (B′ A)

= = = =

•B

B

  •A

= tr (A′ A) m n 2 = i=1 j=1 j =1 aij

   m

≥0

n

2 aij =0

i=1 j=1 j =1

ssi aij = 0 para todo i = 1 . . . m y j = 1 . . . n ssi A = 0  No sea impaciente; Ud. participar´ a en el fest´ın de mini-demostraciones: Ejercicio 2

Demuestre el punto 3 del teorema anterior: Sean A y B matrices m n y sea k un escalar. Pruebe que:

×

(kA) B = k (A B)

•

•

Sugerencia

Utilice la definici´ on on de , la propiedad de la transpuesta, y la propiedad 1 del Lema 5.1.

•

3

Ejercicio 3

Demuestre el punto 4 del teorema anterior: Sean A, B y C matrices m n. Pruebe que:

×

(A + B) C = A C + B C

•

•

•

Sugerencia

Utilice la definici´ on on de , la propiedad de la transpuesta, y la propiedad 2 del Lema 5.1.

•

Ejercicio 4

Demuestre el punto 5 del teorema anterior: Sea A una matriz m n. Pruebe que:

×

8.5. 8.5.

0

•A=0

La nor norma ma de de una una matr matriz iz

Habiendo probado las propiedades mencionadas del producto interno nuevo, el siguiente paso es definir la norma de una matriz. En el espacio de matrices hay un buen n´ umero de normas igualmente utiles, umero u ´ tiles, la norma que se define aqu´ aqu´ı es la norma-2 de una matriz . Definici´ on on La norma de la matriz A m

× n se define como: √ A2 = A = A • A (2) Observe que por el punto 2 del teorema anterior, A • A ≥ 0; as´ı que la ra´ız ız cuadrada cuad rada entregar entre gar´ a´ un real mayor

o igual a cero. Hagamos un ejemplo del cálculo alculo de la norma de una matriz. Ejemplo 2

Determine la norma de la matriz:

A′ A =

−

3 2 1 0

As´ı A

  √

  −    − −  − 

A=

3 2 5

−1 0 −2

5 2

3 2 5

1 0 2

Soluci´ on on Como



   

−

38 • A = tr −13

13 5

y por tanto, A = 43  Es su turno de practicar el cálculo alculo de la norma de una matriz. Ejercicio 5

4

=

38 13

= 43

−13

5



Para las matrices siguientes calcule su norma. 1. A = 2. A =

3. A =

   

2 3

−1

2 1

−1

2 3 0

−1



1

3 0 1



 

1 1

Un hecho importante sobre la norma de una matriz es:

       m

A = tr

n

1/2

(aij )2

A′ A =

i=1 j=1 j =1

Lo cual hace coincidir la definici´ on tradicional de norma de un vector con la norma de una matriz cuando la on matriz es utilizada para formar un solo vector formado por los renglones de ella. ella. Algo m´ as importante de as observar observ ar es que el produc producto to pun punto to en entre tre matrices usando la traza equivale equivale al produ producto cto pun punto to tradicional aplicado a los vectores obtenidos de vectorizar las matrices. Ejemplo 3

Verifiquemos la afirmaci´ on en el caso de matrices 2 on Comprobaci´ on on

× 2.

Digamos que A=

As´ı ′

A B=

De donde A

8.6. 8.6.





a11 a12 a21 a22

  B=

b11 b12 b21 b22



a11 b11 + a21 b21 a12 b12 + a22 b22



( a11 b11 + a21 b21 ) + (a ( a12 b12 + a22 b22 ) • B = (a

Propie Propiedad dades es de la la norma norma de matric matrices es

Habiendo definido la norma de una matriz, lo siguiente es probar algunas propiedades b´ asicas. asicas. Teorema 8.2

Sea A una matriz m

escalar: × n y k un escalar: 1. A ≥ 0, adem´ as as A = 0 ssi A = 0 2.  − A = A 3. kA = |k| A

Demostraci´ on on 1. De lo visto

A =

√

A

m

•A=

1/2

     n

(aij )2

i=1 j=1 j =1

5

≥0

Y tambi´ en en de lo mismo se deduce que A = 0 ssi A = 0. propiedadess conocidas: conocidas: 3. Por las propiedade

 

kA =



(k A) (kA) =

•

√ 2

k A A= k

•

||

√

A

El segundo punto es el m´ as sencillo y le queda hacerlo como ejercicio as

• A = |k| A 

Ejercicio 6

Demuestre el punto 2. del teorema anterior: Sea A una matriz m n. Pruebe que:

×

 − A = A Sugerencia

Use directamente la definici´ on de la magnitud de una matriz. on 8.7. 8.7.

Desigu Desiguald aldad ad de Schw Schwarz arz

En la l´ınea tradicional, el siguiente paso para ver que nuestro producto punto llega a definir una distancia a través es de la definici´ definici on oń de la norma, es probar que nuestro producto punto y la norma cumplen una relación on de desigualdad llamada la desigualdad de Cauchy-Schwarz. Teorema 8.3

Sean A y B matrices m

× n:

(3)

|A • B| ≤ A · B

Adem´ as, la igualdad se tiene si y sólo as, olo si una matriz es un m´ ultiplo ultiplo de la otra. Demostraci´ on on

En esta demostraci´ on es importante que vigile el rol de los factores en los productos: en los productos los on factores en ambos lados deben ser matrices, mientras en los productos el factor a la izquierda es escalar y el factor a la derecha debe ser una matriz. Para cualesquiera escalares x y y:

•

·

0

(x A = x2 A

· −2 y · B) • (x · A − y · B) 2   − 2xy (A • B) + y2B  0, tomamos x = B y y = (A • B)/B en la fórmula Suponiendo B = ormula anterior y simplificando muchos términos ermi nos obtenem obt enemos: os: 0 ≤ B2 A2 − (A • B)2 ≤

De donde se obtiene: (A B)2

•

≤ B2 A2

√

√

y tomando ra´ ra´ız cuadrada se obtiene o btiene la l a conclusi´ on. Recuerde que un real k , k2 = k y no que k2 = k pues on. para los valores de k negativos el signo se pierde al elevar al cuadrado. Ademas, a´s, si A = k B se tiene que A = k B y as´ı 2 A B = k (B B) = k B = A B

  | | 

| • | || •

| | 

||

·

  

probado que la desigualdad se cumple con igualdad en este caso. caso. Por otro lado, si A B = A

| • |   B definimos

 2 · A − (A • B) · B

C= B

6

se puede confirmar que desarrollando el producto término ermino a término: ermino: C C = 0, implicando que C = 0, de 2 donde B A = (A B) B si suponemos B = 0 deducimos que

 ·

• ·

•



A=

(A B)

• ·B B2

lo que dice que A es un m´ ultiplo ultiplo de B. Si B = 0, claramente B = 0 A y la desigualdad se cumple con igualdad 

·

Ejercicio 7

Sean A y B dos matrices m

× n. Demuestre que A + B ≤ A + B

y que existe igualdad sólo olo cuando una matriz es un m´ ultiplo escalar de la otra. ultiplo Sugerencia

Utilice

A + B2 = (A + B) • (A + B)

Desarrolle tal producto punto. Despu´ es es utilice la desigualdad de Schwarz. Schwarz. Finalmente, tome t ome ra´ ra´ız cuadrada. Para la igualdad se requiere igualdad en la desigualdad de Schwarz.

Lema 8.4

Sean X y Y dos matrices m y sólo olo si

× n. Entonces X y Y son ortogonales, es decir, cumplen X • Y = 0 si X ± Y2 = X2 + Y2

Demostraci´ on on

Tenemos en general que

X ± Y2

= (X Y) (X Y) = X X 2X Y + Y Y = X 2 + Y 2 2X Y

± • ± • ± •    ±

•

•

Por tanto, si X Y = 0 entonces de la fórmula ormula anterior se deduce la igualdad que queremos probar. Por otro lado, si la f´ ormula se cumple nuestra f´ ormula ormula ormula indica que X Y = 0. Es decir X y Y son perpendiculares. 

•

8.8. 8.8.

•

La dista distanci ncia a entre entre dos matric matrices es

Habiendo probado la desigualdad de Cauchy-Schwarz se puede construir una funci´ on on distancia entre el espacio espacio de matrices: matrices: Definici´ on on Sean A y B dos matrices m

× n la distancia entre matrices A y B se define como: δ ( δ (A, B) = A − B

Realicemos un ejemplo simple para ilustrar este concepto. Determine la distancia entre las matrices: A=

 

3 2 5

−1 0 −2

    B=

7

1 0 1

−1 1 −2

 

(4)

Soluci´ on on Si C=A

′

CC=



2 0

As´ı

−B=

2 4 1 0

− √

δ (A, B) = C =

 

 

2 2 4

C•C =

2 2 4

 −     − 0 1 0

0 1 0

−

24 2

=



tr (C′ C) =

−2

1



√ 24 + 1 = 5

⋄

Ejerci Ejercicio cio 8

Determine la distancia entre las matrices: 1. A =

2. A =

  

3 2 5

−1

3 5

−1

1 2

2

  

  −  −  1 1 1 1 1 2

yB=

yB=

1 1 1 2

Ejerci Ejercicio cio 9

Sean A y B dos matrices de iguales dimensiones. Pruebe que: δ (A, B) = δ (B, A) Sugerencia

Use directamente la definición on de distancia dist ancia entre matrice m atrices. s. Utilice Util ice también en la propiedad prop iedad conmutativa co nmutativa del producto punto. Ejercicio 10

Sean A y B dos matrices de iguales dimensiones. Pruebe que: δ (A, B)

≥0

Adem´ as, pruebe que hay igualdad si y sólo as, olo si A = B. Sugerencia

Utilice la definici´ on de distancia entre matrices y la propiedad 1 del teorema 6.2 sobre la norma on para matrices. Ejercicio 11

Sean A, B y C dos matrices de iguales dimensiones. Pruebe que: δ (A, B)

≤ δ (A, C) + δ (C, B) Vea que existe igualdad si s´ olo olo si existe un escalar t (0 ≤ t ≤ 1) tal que C = t A + (1 − t) B. Esta

angulo. desigualdad se llama Desigualdad del tri´ Sugerencia

Utilice como v´ alido el resultado del ejercicio 7 con A como A alido 8

− C y con B como C − B.

Ejercicio 12

Sean A, B y C dos matrices de iguales dimensiones. Pruebe que: δ (A, B) = δ (A + C, B + C) Esta propiedad indica que la distancia entre matrices se preserva ante traslaciones . Sugerencia

Directamen Directamente te de la definici´ definici´ on on de distancia. 8.9.

´ Angulo entre matrices

Definici´ on on Sean A y B dos matrices m

× n, no nulas, el angulo ´ entre matrices A y B, θ, se define como A•B cos(θ cos(θ) = A B Aqu´ı θ debe cumplir: 0 ≤ θ ≤ π.

Ejemplo 4

Determine el ángulo angulo en radianes entre las matrices A= Soluci´ on on Como

 

3 2 5

−1 0 −2

 

, B=

− 

4 0 1

√ • B = −2, A = 43 43,, B = 22 −2 cos(θ cos(θ) = √ √ ≈ −0.065 065,, por tanto θ ≈ 1.63 radianes radianes A

Entonces

 

−1 0 −2 √

⋄

43 22

Ejercicio 13

Determine el ángulo angulo en radianes entre las matrices A=



3 5

−1 −2



, B=

−

4 1

−1 −2



Ejercicio 14

Determine el valor de x para que el ángulo angulo en radianes entre las matrices A=

sea de 0. 0.1.



3 5

−1 −2



, B=

−

4 1

−1 x



Sugerencia

Entréle ele sin miedo: mie do: A B es una expresión on lineal en x. B es una ra´ ra´ız cuadrada de un polinomio cuadr´ atico atico en x. Cuando se iguala:

•

| |

cos cos (0. (0.1rad) =

•B   B A A

despu´ despu´ es es de elevar elevar al cuadrado cuadrado y multiplica multiplicarr por denominado denominadores res queda queda una ecuaci´ ecuaci´ on on cuadrática atica en x. 9

(5)

8.10. 8.10.

Ortogo Ortogonal nalida idad d y espacio espacioss generad generados os

Sean A y B dos matrices matrices m

× n, se dice que son matrices ortogonales si se cumple A•B =0 Un conjunto {A1 , A2 , . . . , Ak } de matrices m × n se dice conjunto ortogonal si Ai • A j = 0 para i = j

conjunto anterior se dice ortonormal si es ortogonal y adem´ as a s cad cadaa matr matriz iz tie tiene ne nor norma ma 1. 1. tiene un conjunto ortogonal de elementos no cero

El Una Una vez vez que que se se

{A1, A2, . . . , Ak } es posible convertirlo a uno ortonormal

{B1, B2, . . . , Bk } definiendo: Bi =

1

Ai Ai

Ejercicio 15

Determine el valor de x para que las matrices sean ortogonales. A=



3 5

−1 −2



, B=

−

4 1

−1 x



Sugerencia Al hacer A B = 0 queda una ecuaci´ on on lineal en x.

•

Ejercicio 16

Determi Dete rmine ne qu´ q ué condi co ndici´ ción on deben cumplir las variables para que A A=



3 5

−1 −2



, B=



x y z w

⊥ B.



Sugerencia Al hacer A B = 0 queda una ecuaci´ on on lineal.

•

Ejercicio 17

Sea A una matriz m

× n muestre que el conjunto A = {X matriz m × n|A ⊥ X} ⊥

es un espacio lineal. Sugerencia Al hacer A X = 0 queda una ecuación on homogénea. enea. Las soluciones soluci ones a los sistemas sistema s homog´ h omogéneos eneos son

•

espacios lineales. Ejercicio 18

10

Determine el espacio perpendicular a la matriz:



−

1 1 1 1



Esc´ Esc´ıbalo como un espacio generado. generad o. Sugerencia

Tome una matriz X 2 2 con inc´ ognitas. ognitas. Al hacer A X = 0 queda una ecuaci´ on on homog´ hom ogénea enea con 4 inc´ ognitas; una de ellas es fija y las otras son libres. Despeje la fija y póngala ognitas; ongala en funci´ on on de las libres. En lugar de la notación on de vector en la soluci´ on general, prefiera la notaci´ on on on de matriz.

×

•

Ejercicio 19

Sea V un subespacio lineal de matrices m V ⊥

× n muestre que el conjunto = {X matriz m × n|Y ⊥ X para toda Y ∈ V }

es un espacio lineal. Sugerencia

Muestre que no es vac´ vac´ıo: la matriz de ceros est´ a (compru´ (co mpruébelo) ebe lo),, es cerrado ba jo la suma (compru´ ebelo), ebelo), y es cerrado bajo el producto por escalares (compruébelo). ebelo). Ejercicio 20

Determine el espacio perpendicular al espacio generado por las matrices matrices: A=



−

1 1 1 1



yB=



1 1

−1

1



Sugerencia

Tome una matriz X 2

ognitas: × 2 de incógnitas:

• X = 0 da una ecuación on en las incógnitas ognitas on on en las inc´ ognitas ognitas B • X = 0 da otra ecuaci´ A

Resuelva Resuelva el sistema homogéneo, eneo, encuentre la soluci´ on on general g eneral y déle ele la notaci´ notacion oń matricial. matricial. Veamos ahora un par de resultados te´ oricos: oricos: Lema 8.5

Un conjunto ortogonal de matrices no nulas es linealmente independiente Demostraci´ on on Si A1 A2 , . . . , Ak es un conjunto ortogonal de matrices no nulas y si se cumple:

{

}

c1 A1 + c2 A2 +

· · · + ck Ak = 0

11

veamos veamos que los coeficientes coeficientes ci son cero. cero. Haciendo Haciendo el producto producto punto punto con Ai : Ai

• (c1A1 + c2A2 + · · · + ck Ak ) = Ai • 0 = 0

Desarrollando el primer miembro:

• (c1A1) + Ai • (c2A2) + · · · + Ai • (ck Ak ) = 0 Como el conjunto es ortogonal entonces Ai • A j = 0 para i = expres esi´ i´ on on anterior anterior queda:  j, la expr ci Ai • Ai = 0 Puesto que ninguna matriz Ai es nula, Ai • Ai = on anterior anterior queda:  0 ,la expresión Ai

ci = 0 As´ As´ı, cada coeficiente en la combinaci´ on lineal es cero. Por tanto, el conjunto de matrices es linealmente on independiente. Cuando se quiere verificar que una matriz es ortogonal al generado por un conjunto de matrices enfrentámos amos un dilema singular, c´ omo hacer pues en el generado resulta en conjuntos infinitos? El siguiente resultado es omo importante porque reduce una verificación on infinita a una verificaci´ on sobre el conjunto generador: on Lema 8.6

Sea A una matriz y V = Gen B1 , . . . , Bk en Mm×n . Entonces: A es ortogonal a todo V si y sólo olo si A es ortogonal a cada Bi .

{

}

Demostraci´ on on

Suficiencia: Si suponemos que A es ortogonal ortogonal a todo V y sabiendo que cada Bi est´ a en V , V , entonces es inmediato que A es ortogonal a Bi . Necesidad: Supongamos ahora que A es ortogonal a todo Bi , es decir que A Bi = 0 para todo i = 1, . . . , k. k. Veamos que entonces es ortogonal a cualquier X de V . V . Tomemos un X cualquiera de V . V . Como V est´ a generado por los Bi , entonces deben existir escalares ci tales que

•

k

X=

 i=1

Por tanto, A

Por tanto, A es ortogonal a X 8.11. 8.11.

•X

ck Bi

·

= A ( ki=1 ck Bi ) k = i=1 A (ck Bi ) k = i=1 ci (A Bi ) k = i=1 ci (0) = 0

  • ··  • •



Bases Bases Ortono Ortonorma rmales les

El siguiente resultado es importante porque permite cambiar la base de un espacio generado por otra que es ortogonal. La misma demostraci´ on del resultado da el algoritmo de conversi´ on on. on. Teorema 8.7

12

Sea un conjunto A1 , A2 , . . . , Ak de matrices matrices m escalares unicos u ´ nicos xi,j (i < j ) tales que:

{

}

× n linealmente independiente. Entonces existen

B1 B2

= A1 = A2 .. .

B j

= A j .. .

− x1,j B1 − x2,j B2 − · · · − x j

Bk

= Ak

− x1,k B1 − x2,k B2 − · · · − xk

− x1,2B1 −1,j

B j −1

−1,k

Bk−1

forman un conjunto ortogonal. Demostraci´ on on

Definimos los valores escalares xi,j como precisamente se requieren: A j Bi

xi, j j =

• Bi • Bi

(6)

Ud. puede recordarlos si ubica que el primer sub´ sub´ındice de xij se relaciona a las matrices por construir Bi y que ésta esta es la que aparece en el denominador con el producto punto con si misma. Un punto importante a observar observar es que los A1 , A2 , . . . , A j son combinaciones lineales de los B1 , B2 , . . . , B j y por consiguiente el conjunto de los Bs es linealmente linealmente independiente independiente.. Para Para verificar verificar que el conjunto conjunto es ahora ortogonal ortogonal hay que realizar realizar los productos punto. Conviene hacer una demostración on inductiva de la afirmaci´ on. on. La afirmaci´ on o n es que el conjunto B1 , . . . , Bk es ortogonal. Esta afirmaci´ on on ser´ ser´ıa la afirmaci´ afirmacion oń ultima u ´ ltima de la cadena de afirmaciones k. La base base induct inductiv iva a para i = 2 se comprueba revisando que B1 y B2 son B1 , . . . , Bi para i = 2, 3, . . . , k. ortogonales:

{

{

{

}

}

{

}

}

• B1 = A2 • B1 − x1,2B1 • B1 = A2 • B1 − AB12 •• BB11 B1 • B1 = 0 Supongamos que {B1 , . . . , Bi } es un conjunto ortogonal para 1 ≤ i ≤ k − 1, veamos {B1 , . . . , Bi , Bi+1 } tambi´ ta mbién en lo ser´ sera. a´. Para ello basta probar que Bi+1 es ortogonal a cada B j para 1 ≤ j ≤ i. Como B2

i

 −  − • −

Bi+1 = Ai+1

xl,i+1 l,i+1 Bl

l=1

As´ı Bi+1

• B j

=

Ai+1

= Ai+1 B j = Ai+1 B j = 0

•

i B j l,i+1 Bl l=1 xl,i+1 i l,i+1 Bl B j l=1 xl,i+1

• − x j,i+1 j,i+1 B j • B j

•

Note que en el penúltimo ultimo paso fue requerida la base inductiva: que B j era ortogonal a sus compa˜ neros neros en B1 , . . . , Bi .

{

Ejemplo 5

}

Aplique el algoritmo anterior al conjunto formado por las matrices: A1 =

  1 0 1 0

, A2 =



1 1

−1

Soluci´ on on B1 = A1

13

0



, A3 =

  1 1 0 2

Figura 1: Captura de la matrices vectorizadas del ejemplo 7.

Figura 2: Obtención on del conjunto ortogonal del ejemplo 7.

• B1 = 2 y A2 • B1 = 2; x12 = 1 0 −1 B2 = A2 − x12 B1 = 0 0

B1



Realizando los c´ alculos: alculos: B2

Obtenemos:



• B2 = 1;1 ; A3 • B1 = 1; A3 • B2 = −1; x13 = 1/2, x23 =

Y as´ı: B3 = A3

−1;



1/2 0 1/2 2

− x13B1 − x23B2 = −



⋄

Estos c´ alculos pueden hacerse en la calculadora TI, para ello habr´ alculos a que vectorizar las matrices y seguir las f´ ormulas: ormulas: en la figura 1 aparecen capturadas las matrices como vectores y en la figura 2 aparecen los c´ alculos alculos del algoritmo de ortogonalizaci´ on. on. Ejemplo 6


  1 0 1 0

, A2 =

  2 0 2 0

, A3 =

  1 1 0 2

Soluci´ on on B1 = A1 B1

• B1 = 2 y A2 • B1 = 4; x12 = 2 0 0 B2 = A2 − x12 B1 = 0 0

 

este c´ alculo alculo indica que vector A2 es combinaci´ on on lineal de los vectores anteriores a él el y por tanto el conjunto original original es linealmen linealmente te dependient dependiente. e. Debemos descartar descartar al vector vector A2 . Real Realiz izan ando do solo solo el c´ alculo: alculo: A3

• B1 = 1; 14

Obtenemos: x13 = 1/2 Y as´ı: B3 = A3



− x13B1 = −

1/2 1 1/2 2



⋄

Ejercicio 21


  1 0 1 1

, A2 =



1 1

−1

1



, A3 =

  1 0 0 2

Sugerencia

Siga el algoritmo; no hay de otra. 8.12. 8.12.

Existe Existenci ncia a de Bases Bases Orto Ortonor normal males es

EL resultado anterior se conoce como el procedimiento de Gram-Schmidt, y permite cambiar una base por una base ortogonal, de donde es fácil acil obtener una base ortonormal: Teorema 8.8

Todo espacio lineal de matrices m

× n posee una base ortonormal

Demostraci´ on on

Sabemos que todo espacio lineal posee una base, digamos A1 , . . . , Ak . Sean lo B j los las matrices matrices obtenidas de aplicar el proceso de Gram-Sch Gram-Schmidt. midt. Los espacios espacios generado por los Bi y los Ai son iguales pues las matrices As´ı, los conjuntos generados son los mismos. Si Bi son combinaciones lineales de los vectores Ai y viceversa. As´ las matrices Ai forman un conjunto linealmente independiente, indep endiente, también en lo debe ser el conjunto formado por los Bi . Por tanto, el conjunto formado por los Bi es también en una base para el espacio generado por p or los Ai .⋄

{

}

Una vent ventaja aja inmedi inmediata ata de una base base ortonor ortonormal mal A1 , A2 , . . . , Ak de las matrices anteriores entonces:

{

A = (A

} es que si

on on lineal A es una combinaci´

• A1) A1 + (A • A2) A2 + · · · + (A • Ak ) Ak

es decir, que no hace falta utilizar el proceso de eliminación on gaussiana para determinar los coeficientes, si no simplemente hacer un producto punto con el vector correspondiente. Una consecuencia tambi´ en en inmediata es que se puede completar un conjunto linealmente independiente y ortogonal a una base ortogonal en un espacio lineal de matrices m n. Una forma conviente es aplicar el proceso de Gram-Schmidt al conjunto li y ortogonal aumentado con una base cualquiera del espacio y detener el proceso hasta obtener el primer vector cero. El resultado esperado debe ser el conjunto inicial adicionado con algunos vectores. Este conjunto debe ser una base para el espacio completo.

×

15

8.13 8.13..

Pro Proyecci´ ecci´ on on ortogonal

Teorema 8.9

Sea Y una matriz m n y un espacio lineal V de dimensi´ dimensi´ on on r, ambos dentro de un espacio lineal U . Enton Entonces ces,, existe existe una unica V . V . Si r = 0 entonces Z = 0, y u ńica matriz Z en V tal que (Y Z) si r > 0 entonces Z se puede expresar como

×

− ⊥

Z = c1 X1 + . . . + cr Xr ,

donde X1 , . . . , Xr forman una base ortonormal de V y ci = Y Xi para i = 1, . . . , r. r. Ademas, a´s, on ortogonal de Y sobre V y cumple olo olo si Y V . V . La ma matr triz iz Z se llamar´ a la proyecci´ Z = Y si y s´ que d(Z, Y ) Y ) d(X, Y ) Y ) para toda X en V y hay igualdad si y sólo olo si Z = X.

{

}

≤

•

∈

Demostraci´ on on

Si r = 0 entonces dim(V dim(V )) = 0, y por tanto V = 0 . Para ara Z = 0 se tiene (Y Z) V . V . Y es clara claramen mente te la unica u ´ nica matriz en V que cumple esto. Si r > 0 sea X1 , . . . , Xr una base ortonormal de V y definamos ci = Y Xi para i = 1, . . . , r y Z = ri=1 ci Xi . Claramente, Z V y

{}

{

− ⊥

}

∈

•

r

   − • ci Xi

Y

X j = Y

i=1

para cada j = 1, . . . , r. r.



• X j − c j = c j − c j = 0

Y por por tan tanto, to, (Y

V . Si ahor ahoraa X ∈ V y cumple (Y − X) ⊥ V entonces: − Z) ⊥ V . (X − Z) • (X − Z) = (X − Y + Y − Z) • (X − Z) = −(Y − X) • (X − Z) + (Y − Z) • (X − Z) = −0 + 0 = 0 Esto debido a que X − Z ∈ V y a que (Y − Z) • (X − Z) = 0. Por tanto, X − Z = 0 y de all´ı que X = Z, haciendo que Z sea el unico u ńico vector en V que cumple (Y − Z) ⊥ V . V . Si X es una matriz en V entonces X − Z tambi´ ta mbién en est´ es tá en V y por tanto X − Z ser´ a ortogonal a Y − Z. De donde deducimos que X − Y2 = X − Z2 + Y − Z2 de donde d(X, Y)2 = d(X, Z)2 + d(Y , Z)2 y por tanto d(Z, Y)

olo si X = Z  ≤ d(X, Y). Y esto se cumple con igualdad si y sólo

Ejercicio 22

Considere el espacio lineal formado por todas las soluciones al sistema homogéneo: eneo: x+y+z w = 0 x y z+w = 0

− −

−

y el vector d =< 1, 3, 2, 1 >. Usando el orden primero x, luego y , luego z , y por ultimo u ´ ltimo w, encuentre una base para el espacio soluci´ on. on. Ortogonolice la base encontrada. 16

Usando la base encontrada, determine la proyección on ortogonal de d sobre tal espacio. Usando el orden primero y, luego w, luego y , y por ultimo último z, encuentre una base para el espacio soluci´ on. on. Ortogonolice la base nueva base. Usando la nueva base encontrada, determine la proyecci´ on on ortogonal de d sobre tal espacio. 8.14. 8.14.

Descom Descomposi posici´ ci´ on o n QR

Sea A una matriz m k de rango columna completo. Esto es, una matriz de rango k. Simbolicemos por k) a1 , a2 , . . . , ak las columnas de la matriz A. Por el resultado anterior, deben existir escalares xi,j (i < j = 1, . . . , k) tales que los vectores columna b1 , . . . , bk definidos en forma recursiva por las igualdades:

×

b1 b2

= a1 = a2 .. .

b j

= a j .. .

− x1,j b1 − · · · − x j

bk

= ak

− x1,k b1 − · · · − xk

a1 a2

= b1 = b2 + x1,2 b1 .. .

a j

= b j + x1,j b1 + .. .

− x1,2b1

o por las igualdades:

· · · + x j

−1,j

b j −1

−1,k

−1,j

bk−1

b j −1

= bk + x1,k b1 + + xk−1,k bk−1 forman un conjunto ortogonal. Sea B la matriz cuya columna i es el vector bi , y sea X la matriz k k triangular superior unitaria cuyo elemento (i, (i, j ) es xi,j entonces:

···

ak

×

A = BX

Si se define la matriz D como D = diag b1 −1 , b2 −1 , . . . , bk E = diag( b1 , b2 , . . . , bk )

y como



−1

         



,

Q = BD y R = EX

entonces A = QR

es una factorizaci´ factorizaci´ on o n de A en dos matrices: la primera formada por columnas que son ortonormales y la segunda segunda triangular triangular superior con elementos elementos de la diagonal diagonal principal positivos. positivos. Esta factorizaci´ factorizaci´ on se conoce como la factorizaci´ e s muy import imp ortante ante en métodos eto dos numéricos eri cos.. on QR de A y es Ejemplo 7

Determine la factorizaci´ on on QR de la matriz:

A=

   

1 1 1 1 1 1

17

1 2 3 4 5 6

   

Soluci´ on on: Trabajemos con las columnas de A:

(1, 1, 1, 1, 1, 1)′ , a2 = (1 ( 1, 2, 3, 4, 5, 6)′ a1 = (1, As´ı: b1 = a1

Calculando: b1

Obtenemos:

• b1 = 6 y a2 • b1 = 21 21 x12 = 7/2

Y as´ı: b2 = a2

Calculando:

′

− x12 b1 = (−5/2, −3/2, −1/2, 1/2, 3/2, 5/2) 35//2 • b2 = 35

b2

Por tanto

      

Q = [b1 , b2 ]D =

Q=

R=

 √

1 1 1 1 1 1

−5/2 −3/2 −1/2 1/2 3/2 5/2

√

6/6 0

√ 6 −1/14√ 70 √ 6 −3/70√ 70 √ 6 −1/70√ 70 √ 6 1/70√ 70 √ 6 3/70√ 70 √ 6 1/14√ 70

1/6 1/6 1/6 1/6 1/6 1/6

6 0 0 1/2 70

   √ 



1 x12 0 1

   

0 70 70//35

√

  √ =

6 0

√ 6 √ 70 1 7 2

2





Ejercicio 23

Determine la factorizaci´ on on QR de la matriz:

A=

8.15 8.15..

  − −

2 1 2 1

1 1 2 0

 

Apli Aplica caci ci´ ´ on de la factorizaci´ on on o n QR

Teorema 8.10

Si A es una matriz cuyas columnas son linealmente independientes y si A = QR es una factorizaci´ on on u ´ nica soluci´ on on x cuadrad os se expresa te´ oricamente oricamente QR de A. Entonces la unica ˜ de Ax = b por m´ınimos cuadrados como x ˜ = R−1 QT b 18

Ejemplo 8

Aplique Aplique la factorizaci´ factorizaci´ on on QR para resolver por m´ınimos cuadrados el sistema: 1 1 1 1 1 1

  

1 2 3 4 5 6

  

x=

1 2 0 1 1 2

  

  

on de la matriz de coeficientes es: on Soluci´ on on Por el ejemplo anterior, la factorizaci´

A = QR =

   

√ 6 −1/14√ 70 √ 6 −3/70√ 70 √ 6 −1/70√ 70 √ 6 1/70√ 70 √ 6 3/70√ 70 √ 6 1/14√ 70

1/6 1/6 1/6 1/6 1/6 1/6

   √  

6 0

√ 6 √ 70 1 7 2

2



Siguiendo la estrategia descrita en el ultimo u ´ltimo resultado la soluci´ on on por el método etodo de m´ınimos cuadrados se calcula por la f´ ormula: ormula: x˜ = R−1 QT b As´ı T

Q =

y



−

√ √ 6 √ 6 1/6√ 6 1 / 6 1 / 6 √ −3/70√ 70 −1/70√ 70 1/70√ 70 √ √ 1/6 6 −1/10√ 70 1 R = 0 1/35 70

1/6 6 1/14 70

−

y por tanto,



√ √

√ √

1/6 6 1/6 6 3/70 70 1/14 70





x ˜ = R−1 QT b =

13 15

  3 35

⋄

Ejercicio 24

Aplique Aplique la factorizaci´ factorizaci´ on on QR para resolver por m´ınimos cuadrados el sistema:

  − −

2 1 2 1

8.16 .16.

1 1 2 0

 

x=

 

1 2 0 1

 

Uso Us o d de e la la TI TI

La calculadora TI 89 o TI Voyage 200 puede ser utilizada para la factorizaci´ on on QR. La ventaja de la rutina numérica erica programada progra mada es que qu e da informaci´ informa ci´ on sobre el espacio nulo de la matriz de entrada cuando las columnas on de la matriz no son linealmente independientes. Considere por ejemplo la matriz A=

  1 2 2 4

Las figuras 3 y 4 muestran la entrada y los c´ alculos en la TI. El punto a señalar alculos nalar es que habiendo ceros en la diagonal de R se indica que los vectores correspondientes en Q están an en el espacio nulo de la matriz A. De 19

Figura 3: Descomposici´ Descomposici´ on on QR de A en la TI.

Figura 4: La naturaleza de los ceros en la diagonal de R. hecho, todos los vectores correspondientes a ceros en la diagonal de R forman la base para el espacio nulo de A. Ejemplo 9

Determine la distancia de P (0 P (0,, 2, 1) al espacio que generan los vectores:

− −

  −      −   −  √   √  − √ √ √  √ √  · v1 =

2 3 1

1 5 3

, v2 =

Con los vectores v1 y v2 formamos la matriz A a la cual le aplicamos la factorizaci´ on on QR: 1/7 14 17/1365 1365 3/14 14 4/273 1365 1/14 14 2/105 1365

A = [v1 v2 ] = Q R =

√ √

14 5/7 14 0 1/7 1365

−

De donde los coeficientes de Fourier del vector que representa a P , P ,v =< 0, 2, 1 > son: [v]Q

= QT v =

·



√ 14 − 12√

− 1952

1365

−



y de all´ı que la proyección on de v a C (A) es: vC (A) = Q [v]Q =

·

Por tanto, la distancia de v a C (A) es

 −

d(v, C (A)) = v

vC (A)

161 195 133 78 7 30

   −−  161 195 23 78 23 30

     −−  − =

20

 

=

23 390

√

390



Ejemplo 10

Determine la distancia de P (0 P (0,, 2, 1, 1) al conjunto de soluciones del sistema

− −

Bx =



−

2 1 3 1 1 0 2 1

  

   

x1 x2 x3 x4

0 0

=

Este problema se resuelve como el anterior, pero debemos encontrar un conjunto generador. Para ello tenemos dos alternativas: o seguir el proceso descrito en lecturas anteriores o calcular lo que se conoce como el espacio nulo de B: Aquellos vectores x tal que Bx = 0. En general, los conjuntos generadores obtenidos por ambos procesos son diferentes pero ambos son base para el mismo conjunto. Si utilizamos la alternativa del espacio nulo tenemos: 2 1 7 3 nullspace(B) = Gen , 1 0 0 1

  − 

 

  

  −

As´ As´ı el problema se ha transformado t ransformado en encontrar la distancia de P (= P (= v) a C (A) donde A es la matriz cuyas columnas son el generador de nullspace( B). Se deja como ejercicio comprobar que:

A=

  −

2 7 1 0

1 3 0 1

−

 

= QR =

√ √ 390 4 / 585 √ −1/1170 √ 390 √ −23 √ 390 · 23//1170 √

1/9 6 7/18 6 1/18 6 0

  −

vC (A) =

 

3/65 390

  −− −

43 43/ /65 19 19//65 47 47//65 14 14//65

√

√

 

d(v, C (A)) = 1/ 1/65 4615 Ejemplo 11

Determine la matriz X que mejor resuelve el sistema A X = B para A=

La factorizaci´ on on QR de A es

 

A = QR =

1 0 1

 

−

2 1 1

 

, B=

 

1 0 1

√ 1/6 √ 6 √ 6 − 1 / 3 √ −1/6 √ 6

1/2 2 0 1/2 2

Por tanto, la matriz X que minimiza el error cuadrático atico es: X=R

Y el error cometido con X es 25/ 25/3

−1

′

QB=





21

1 0 0 1

2 1 1

−1

8 2

−

  √ 

  √ √

2 3/2 2 0 1/2 6

10 19 19//3

−



√ √

3 6 23 23//18 6 0 1/18 390





Producto Interno Matrices

Recommend Documents