´ FRANCISCO MONTALVO DURAN
CALCULO DIFERENCIAL E INTEGRAL EN VARIAS VARIABLES
Departamento de Matem´aticas, Universidad de Extremadura, Badajoz 2003
´Indice General I
Iniciaci´ on a los Espacios Normados
1
1 Espacios Normados Conceptos b´asicos . . . . . . . . . La estructura de espacio normado Conexi´on en espacios normados . . Ejercicios . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3 3 6 8 10
2 Normas Equivalentes Equivalencia de normas . . Espacios de dimensi´on finita L´ımites y continuidad . . . Ejercicios . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
15 15 17 21 27
. . . .
. . . .
. . . .
. . . .
3 El Teorema de Stone-Weierstrass 31 El teorema de Weierstrass . . . . . . . . . . . . . . . . . . . . 31 El teorema de Stone . . . . . . . . . . . . . . . . . . . . . . . 34 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 4 Linealidad Aplicaciones lineales continuas . . . . . . Norma de una aplicaci´on lineal y continua Aplicaciones multilineales continuas . . . Ejercicios . . . . . . . . . . . . . . . . . .
II C´ alculo Diferencial para Funciones de Varias Variables Reales
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
39 39 40 42 44
47
5 Derivadas Parciales 49 Derivadas direccionales . . . . . . . . . . . . . . . . . . . . . . 50 vii
viii
Contenido Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51 55
6 La Diferencial de Fr´ echet 57 Tangencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Diferenciabilidad en un punto . . . . . . . . . . . . . . . . . . 58 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 7 Funciones de Clase C1 Preliminares . . . . . . Condici´on suficiente de Algunos ejemplos . . . Ejercicios . . . . . . .
. . . . . . . . . . diferenciabilidad . . . . . . . . . . . . . . . . . . . .
8 Reglas Formales de Derivaci´ on Regla de la cadena . . . . . . F´ormula de Leibnitz . . . . . El teorema del valor medio . Ejercicios . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . .
69 69 71 73 76
. . . .
77 77 80 82 86
9 Derivadas Parciales de Orden Superior 91 Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 El teorema de Schwartz . . . . . . . . . . . . . . . . . . . . . 92 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 10 Diferenciales de Orden Superior La diferencial de orden r en un punto Relaci´on con las derivadas parciales . . Reglas de derivaci´ on . . . . . . . . . . Permutaci´on en el orden de derivaci´ on Ejercicios . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
97 . 97 . 98 . 102 . 105 . 108
11 Teoremas de Taylor 111 Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Los teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 12 Extremos Relativos 123 Condiciones necesarias de extremo . . . . . . . . . . . . . . . 123 Condici´on suficiente de extremo . . . . . . . . . . . . . . . . . 125 La matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . 127
Contenido
ix
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 13 Funciones Impl´ıcitas: Existencia Un teorema de punto fijo . . . . . . . . El problema de las Funciones Impl´ıcitas Existencia de funciones impl´ıcitas . . . . Ejercicios . . . . . . . . . . . . . . . . . 14 Funciones Impl´ıcitas: Lema fundamental Teorema general . Ejercicios . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
131 . 131 . 133 . 136 . 138
Derivaci´ on 141 . . . . . . . . . . . . . . . . . . . . . . . . 141 . . . . . . . . . . . . . . . . . . . . . . . . 143 . . . . . . . . . . . . . . . . . . . . . . . . 145
15 Funciones Inversas 147 Derivada de funciones inversas . . . . . . . . . . . . . . . . . 147 Inversi´on local . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 16 Variedades y Extremos Condicionados Variedades diferenciables . . . . . . . . . Variedad tangente . . . . . . . . . . . . Multiplicadores de Lagrange . . . . . . . Distintas presentaciones de una variedad Ejercicios . . . . . . . . . . . . . . . . .
III
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Medida e Integraci´ on en Rn
153 153 155 157 159 161
165
17 Medida Exterior 167 n Semintervalos de R . . . . . . . . . . . . . . . . . . . . . . . 169 Medida exterior . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 18 Conjuntos Medibles La identidad de Caratheodory . . . La σ-´algebra de conjuntos medibles Conjuntos medibles y no medibles Ejercicios . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
181 181 183 186 190
x
Contenido
19 La Medida de Lebesgue 193 Propiedades de la medida de Lebesgue . . . . . . . . . . . . . 193 El problema de la medida . . . . . . . . . . . . . . . . . . . . 196 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 20 Conjuntos de Borel ´ σ-Algebras . . . . . . . . . . La σ-´algebra de Borel . . . . Transformaciones de medibles Otras propiedades de m∗ . . Ejercicios . . . . . . . . . . . 21 Caracterizaci´ on de Funciones Definiciones . . . . . . . . . Funciones simples . . . . . . El teorema principal . . . . Ejercicios . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
199 199 200 202 204 207
Medibles . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
209 209 210 212 215
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
217 217 222 223 227
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
22 Espacio de Funciones Medibles Definiciones y ejemplos . . . . . . . . . Aritm´etica en [−∞, ∞] . . . . . . . . . Propiedades de las funciones medibles Ejercicios . . . . . . . . . . . . . . . .
. . . .
23 Integraci´ on Preliminares . . . . . . . . Conjuntos de medida nula Propiedades de la integral Los espacios Lp . . . . . . Ejercicios . . . . . . . . .
. . . en la . . . . . . . . .
. . . . . . . integraci´ on . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
229 229 231 233 240 241
24 Teoremas de Convergencia Convergencia mon´otona . Convergencia dominada . Consecuencias . . . . . . . Ejercicios . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
245 245 248 251 254
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
25 Primitivas e Integrales 257 Las integrales de Riemann y Lebesgue . . . . . . . . . . . . . 257 Teorema Fundamental del C´alculo Integral . . . . . . . . . . . 259 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
Contenido
xi
26 El Teorema de Fubini-Tonelli 267 El teorema de Tonelli . . . . . . . . . . . . . . . . . . . . . . 267 El teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . 270 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 27 T. Cambio de Variables 273 Transformaci´on de medibles por funciones de clase C 1 . . . . 273 El teorema del cambio de variables . . . . . . . . . . . . . . . 276 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
iii
Introducci´ on La asignatura est´a estructurado en tres partes: I. Iniciaci´on a los Espacios Normados, II. Calculo Diferencial, III. Medida e Integraci´on en Rn . La primera parte est´a pensada con un triple objetivo: estudiar las cuestiones esenciales sobre equivalencia de normas y linealidad que despu´es se utilizar´an en el desarrollo del C´alculo Diferencial; servir de pretexto para repasar los conceptos y propiedades b´ asicas de la topolog´ıa de un espacio m´etrico y, en particular, de Rn ; y, por u ´ltimo, abordar el estudio de la convergencia uniforme, como la convergencia en un cierto espacio de funciones, para concluir con el teorema de aproximaci´on uniforme de Weierstrass y la generalizaci´on del mismo debida a Stone. En la segunda parte se establece el C´ alculo Diferencial. Los temas que se incluyen est´an muy determinados por la tradici´on y por el marcado car´acter auxiliar para otras materias. Hay un primer bloque en el que se extienden a las funciones de varias variables las reglas y teoremas habituales del c´ alculo con derivadas, tanto para las de primer orden como para las de orden superior. Se obtienen as´ı, la regla de la cadena, la f´ormula de Leibnitz etc., para terminar con los teoremas de Taylor y su aplicaci´on a los problemas de extremos relativos. En un segundo bloque, con materia espec´ıfica s´olo de las varias variables, se dan los primeros pasos para el estudio de las Variedades Diferenciables: se prueban los teoremas de existencia y derivabilidad de funciones impl´ıcitas, los teoremas sobre funciones inversas, para terminar con un cap´ıtulo sobre variedades en Rn . En este u ´ltimo tema se incluyen algunas caracterizaciones del Espacio Tangente a una variedad en un punto, que se aplicar´an en la obtenci´on de condiciones de extremo sobre variedades. Si bien no hay un inter´es especial en trabajar en dimensi´on infinita, no se ha querido renunciar a la ventaja que supone el uso de las t´ecnicas de los Espacios Normados. As´ı, tanto el concepto de funci´ on diferenciable como las reglas del c´alculo con derivadas de cualquier orden, se formulan en este marco. Sin embargo, el objetivo son las funciones de varias variables reales y la obtenci´on rigurosa de los teoremas ligados con sus propiedades de as o menos expl´ıcita, diferenciaci´on. En la mayor parte de ellos, de forma m´ interviene el teorema de valor medio de las funciones de una variable o bien una consecuencia del mismo, que relaciona el car´ acter lipschitziano de una aplicaci´on con la acotaci´on de sus derivadas parciales o su diferencial. La
iv versi´on m´as fuerte de este u ´ltimo resultado establece que la menor constante de Lipschitz para una funci´on f , diferenciable en un segmento de un espacio normado y que toma sus valores en otro espacio normado, es “ sup kDf (x)k”. Por el inter´es que en s´ı mismo tiene este u ´ltimo resultado, que a veces se conoce como “teorema de valor medio vectorial”, se ha incluido en un Anexo la demostraci´on del mismo, extra´ıda del excelente libro de Flett[12]. Sin embargo, para el desarrollo del C´alculo Diferencial en Rn tal versi´ on no resulta necesaria. De hecho, sin recurrir a ella y sin ning´ un esfuerzo adicional, puede obtenerse: el teorema de caracterizaci´on de las aplicaciones de clase C r en t´ermino de la continuidad de las derivadas parciales de orden r; el teorema de Schwartz que, en su forma m´as general, establece la simetr´ıa de la diferencial de orden r de una funci´on en un punto; el teorema local on es algo m´as larga que la que usa de Taylor (en este caso, la demostraci´ del teorema del valor medio vectorial, y que puede verse, por ejemplo, en Cartan [5]); el teorema de existencia de funciones impl´ıcitas... La tercera parte se dedica a la Medida y la Integral de Lebesgue en n R . Para la construcci´on de la medida se sigue el m´etodo de Caratheodory, que define los conjuntos medibles utilizando s´olo la medida exterior. Este procedimiento, adem´ as de ser completamente generalizable a los espacios de medida abstracta, parece el m´as r´apido y no precisa distinguir el caso acotado del no acotado. En los primeros cap´ıtulos se estudian, pues, las propiedades de la familia de los conjuntos medibles y de la medida de Lebesgue y su relaci´on con la topolog´ıa de Rn . El desarrollo de la integraci´on para funciones de varias variables, que se aborda a continuaci´on, se basa en el concepto “geom´etrico” de funci´on medible. Una funci´on no negativa se dir´a medible cuando su conjunto de ordenadas (o subyacente a su gr´afica) es un conjunto medible. La medida de este conjunto ser´a, por definici´on, su integral. Inmediatamente, con ayuda de las propiedades ya estudiadas de la medida, se obtendr´ a un teorema de caracterizaci´on de funciones medibles en los t´erminos que son habituales en los espacios de medida abstracta. Algunas de los t´ıpicos resultados sobre integraci´on, tales como la desigualdad de Chebyshev o el teorema de la convergencia mon´otona, ser´an consecuencias directas de esta definici´on geom´etrica de integral. El estudio de las Funciones Medibles, la linealidad del operador integral y los teoremas de convergencia y sus consecuencias, completan b´asicamente el bloque te´orico sobre la Integral de Lebesgue en ´ltimos cap´ıtulos est´an enfocados al C´alculo Integral. En primer Rn . Los u lugar se estudia, en algunos casos particulares, la relaci´ on entre primitivas e integrales (teorema fundamental del C´ alculo Integral), despu´es se establece el teorema de Fubini-Tonelli, que reduce el c´ alculo de una integral m´ ultiple
v al c´alculo de integrales simples y, por u ´ltimo, el teorema del Cambio de Variables. Al margen de las referencias utilizadas para elaborar los distintos cap´ıtulos, quiero destacar aqu´ı dos influencias esenciales. La primera, la de las notas sobre Integraci´on de mi amigo, el profesor Carlos Ben´ıtez, y sobre todo de dos de las peculiaridades de esas notas: la presentaci´ on unificada de la medida de Jordan y la de Lebesgue, y la noci´ on geom´etrica de la Integral. De hecho, la idea de plasmar en un libro sus notas fue lo que determin´o mi decisi´on de ponerme a escribir. Espero que el resultado conseguido no le desagrade y, en todo caso, agradezco su confianza y su generosidad, sin lo cual este proyecto no lo hubiera podido realizar. La otra influencia a que asico, y quiz´as poco conocido, me refiero es la ejercida por un libro muy cl´ el segundo tomo de las “Fontions de Variables R´eelles” de Garnir [15]. Es impresionante la cantidad de detalles, ejemplos, ejercicios y problemas con que el autor adorna la exposici´on de los resultados. Ahora agradezco a mi profesor en la Universidad de Valladolid, Antonio P´erez, que se emplease a fondo para explicarnos la Integraci´on Lebesgue en Rn , a trav´es de este libro.
Parte I
Iniciaci´ on a los Espacios Normados
Cap´ıtulo 1
Espacios Normados Conceptos b´ asicos Sea E un espacio vectorial sobre un cuerpo K = R ´o C indistintamente. Una norma sobre E es una aplicaci´on de E en R que satisface las tres propiedades siguientes: 1. kxk = 0 si y s´olo si x = 0 2. kλxk = |λ| kxk, ∀λ ∈ K, ∀x ∈ E 3. kx + yk ≤ kxk + kyk, ∀x, y ∈ E Al n´ umero real kxk se le denomina norma del vector x y se dice que el par (E, k · k) es un espacio normado. Ejemplos 1.1 (1) Las u ´nicas normas sobre R son el valor absoluto y sus m´ ultiplos positivos. En efecto, sea k k una norma cualquiera sobre R y sea k = k1k. Entonces kxk = kx·1k = |x|k1k = k|x|. (2) En Rn las normas m´as utilizadas son à k(x1 , . . . , xn )kp =
n X
!1/p |xi |p
, p≥1
i=1
k(x1 , . . . , xn )k∞ = max{|x1 |, . . . , |xn |}. La comprobaci´on, en las del tipo p, de la tercera propiedad de norma se basa en la desigualdad de H¨older (Ver ejercicio 1A), aunque para el caso p = 2 3
4
Espacios Normados
1.1
cabe una demostraci´on alternativa, basada en la desigualdad de CauchySchwartz. La k · k2 es la norma de la geometr´ıa eucl´ıdea, ella forma parte del importante grupo de normas que se derivan de un producto escalar y que vamos a estudiar a continuaci´ on: (3) Normas Eucl´ıdeas (o Prehilbertianas). Definici´ on 1.2 Si E es un espacio vectorial real, un producto escalar sobre E es una aplicaci´on h , i : E ×E → R que cumple las siguientes condiciones: 1. hx, xi > 0, para x 6= 0. 2. hx, yi = hy, xi, para todos x, y ∈ E. 3. hλx, yi = λhx, yi. 4. hx + y, zi = hx, zi + hy, zi. A partir de un producto escalar se puede definir una norma sin m´as que tomar kxk = hx, xi1/2 . Para demostrarlo necesitamos establecer antes la desigualdad de Cauchy-Schwartz: (1.1)
∀x, y ∈ E,
khx, yi| ≤ kxk kyk.
En efecto, sean x, y dos vectores no nulos de E. Entonces, seg´ un la condici´on 1 de la definici´on de producto escalar, hx + λy, x + λyi ≥ 0,
∀λ
por lo que de la bilinealidad del mismo se deduce que λ2 hy, yi + 2λhx, yi + hx, xi ≥ 0,
∀λ.
equivalentemente (1.2)
λ2 kyk2 + 2λhx, yi + kxk ≥ 0,
∀λ.
Es bien conocido que un polinomio de segundo grado, ax2 + bx + c, tiene signo constante si y s´olo si su discriminante, b2 − 4ac, es menor o igual que 0, Aplicado esto al polinomio (en λ) (1.2), resulta inmediatamente la desigualdad buscada. Comprobemos ya que kxk = hx, xi1/2 es una norma. Las dos primeras condiciones de norma se obtiene directamente de la definici´on. Veamos pues la tercera: kx + yk2 = hx + y, x + yi = kxk2 + kyk2 + 2 hx, yi ≤ kxk2 + kyk2 + 2 kxk kyk = (kxk + kyk)2 .
1.2
Espacios Normados
5
En particular, si consideramos en Rn el producto escalar habitual: Pn hx, yi = i=1 xi yi , la norma asociada es n X kxk = hx, xi1/2 = ( x2i )1/2 = kxk2 . i=1
Sea ahora E = C[0, 1], el espacio vectorial de las funciones continuas sobre el intervalo compacto [0,1]. Sobre este espacio puede definirse muchas normas de inter´es: (4) Definiendo un producto escalar en E mediante la f´ormula: Z
1
hf, gi =
f (t)g(t)dt, 0
(La u ´nica condici´on de producto escalar que no es trivial de comprobar es la primera, es decir que el producto escalar de una funci´on no nula por s´ı misma es estrictamente positivo (ejercicio)) se construye, siguiendo el procedimiento descrito antes, una norma eucl´ıdea µZ 1/2
kf k = hf, f i
1
=
¶1/2
2
f (t)dt
.
0
Tambi´en son normas sobre E: Z (5) kf k =
1
|f (t)| d t.
0
(6)
kf k = max{|f (t)| : t ∈ [0, 1]}.
Esta u ´ltima norma se conoce como norma de la convergencia uniforme: Es claro que una sucesi´on de funciones de este espacio {fp } converge en el sentido de esta norma a la funci´on f si y s´olo si converge uniformemente i.e., si, para ε > 0, existe un ´ındice ν tal que, si p ≥ ν, entonces |fp (x)−f (x)| < ε para todo x. (7) Otros espacios normados habituales del An´alisis son los espacios lp , p ≥ 1 y l∞ (ver ejercicio 1B). lp , es el espacio vectorial de las sucesiones de K de potencia p-´esima sumable, es decir de las sucesiones (xn ) tales que P |xn |p < ∞, dotado de la norma kxn kp =
³X
|xn |p
´1/p
.
6
Espacios Normados
1.2
l∞ , es el espacio vectorial de las sucesiones acotadas de n´ umeros reales (o complejos) con la norma del supremo, es decir: k(x1 , x2 , ..., xn , ...)k = sup{|x1 |, |x2 |, ..., |xn |, ...}. De la definici´on de norma se deducen las siguientes propiedades adicionales: 4. kxk ≥ 0, ∀x ∈ E. 5. kxk = k − xk, ∀x ∈ E. 6. kx − yk ≤ kxk + kyk. ¯ ¯ ¯ ¯ ¯ 7. ¯kxk − kyk¯¯ ≤ kx − yk (kx + yk). Las propiedades 5 y 6 son evidentes. La propiedad 4 se obtiene as´ı: 0 = kx − xk ≤ kxk + k − xk = 2kxk ⇒ kxk ≥ 0. Por u ´ltimo observemos que 7 equivale a que −kx − yk ≤ kxk − kyk ≤ kx − yk, desigualdades ´estas que se prueban f´acilmente a partir de la condici´on (3) de norma. 1.3 Toda norma lleva asociada de forma natural una distancia d definida por d(x, y) = kx − yk. Esta distancia posee dos propiedades especiales: (i) d es invariante por traslaciones, es decir d(x, y) = d(x + a, y + a), cualesquiera que sean los puntos x, y, a ∈ E. (ii) d es absolutamente homog´enea por homotecias, es decir d(λx, λy) = |λ| d(x, y). Ambas propiedades se comprueban de forma inmediata. Rec´ıprocamente, es f´acil ver que toda distancia sobre un espacio vectorial E que tengan las propiedades (i) y (ii) induce una norma sobre E (concretamente, kxk = d(x, 0)).
La estructura de espacio normado Puesto que en un espacio normado se superponen dos estructuras, una algebraica, la de espacio vectorial, y otra topol´ ogica, la inducida por la m´etrica, todos los conceptos y propiedades asociadas a ellas admiten una formulaci´on en este nuevo marco. Redefinamos, por ejemplo, los conceptos:
1.5
Espacios Normados • Bola abierta, B(a, r) = {x : kx−ak < r}. An´alogamente bola cerrada, B[a, r] y esfera, S[a, r]. • Sucesi´on convergente. {xn } → x si para cada ε > 0 existe un ´ındice ν tal que si n ≥ ν entonces kxn − xk < ε. • Funci´on continua en un punto. f : E → F es continua en el punto x0 si para cada ε > 0 existe un δ > 0 tal que si kx − x0 k < δ entonces kf (x) − f (x0 )k < ε. An´aloga definici´on para funci´on uniformemente continua. • Funci´on lipschitziana. La funci´on f : E → F se dice lipschitziana si existe una constante k > 0 tal que kf (x) − f (y)k ≤ kkx − yk. • Isometr´ıa. f es una isometr´ıa si kf (x) − f (y)k = kx − yk.
Proposici´ on 1.4 Toda propiedad topol´ogica, uniforme o lipschitziana que tenga una bola abierta (cerrada), la tienen todas las bolas abiertas (cerradas). En particular si la bola cerrada unidad, B[0, 1], es compacta entonces toda bola cerrada es compacta. Demostraci´ on. Consideremos la aplicaci´on T : E → E definida por T (x) = a + rx. Esta aplicaci´on es un homeomorfismo lipschitziano, ya que es lipschitziana: kT (x) − T (y)k = ka + rx − (a + rx)k = rkx − yk, e inversible:
−a 1 + y. r r resulta del mismo tipo que T , esta aplicaci´on tambi´en es T −1 (y) =
Y puesto que T −1 lipschitziana. As´ı pues T es un homeomorfismo lipschitziano que, adem´as, lleva la bola unidad en la bola con centro en a y radio r, ya que trivialmente B[a, r] = a + rB[0, 1]. Se tiene pues que toda propiedad a lo sumo lipschitziana de la bola unidad es tambi´en propiedad de cualquier otra bola, de lo que se deduce ya lo que quer´ıamos. 1.5 A continuaci´on vamos a rese˜ nar algunas propiedades algebraicotopol´ogicas de los espacios normados.
7
8
Espacios Normados
1.5
1. Ning´ un subespacio vectorial propio tiene puntos interiores. 2. Un espacio normado es localmente compacto si y s´olo si la bola cerrada unidad es compacta. 3. Ning´ un espacio normado puede ser compacto. 4. Todo espacio normado es conexo (por arcos) y localmente conexo (por arcos). 5. La adherencia de la bola abierta es la bola cerrada del mismo centro y radio. 6. Un conjunto abierto es conexo si y s´olo si es conexo por arcos. La primera de estas propiedades es geom´etricamente intuitiva (Visualizase en el plano eucl´ıdeo). Formalmente es as´ı: En primer lugar observemos que si L es un subespacio vectorial propio, 0 no es interior a L. En efecto, si x 6∈ L, entonces en toda bola centrada en 0 existe alg´ un vector λx proporcional a x. Trasladar a cualquier otro punto la situaci´on del 0 es un sencillo ejercicio. (2) Pr´acticamente ha sido demostrada ya. Si la bola cerrada unidad es compacta, entonces cualquier bola cerrada es compacta, luego cada punto admite un entorno compacto, es decir que E es localmente compacto. Rec´ıprocamente, si a admite un entorno V compacto, entonces tambi´en es compacta cualquier bola cerrada con centro en a contenida en V, y por la proposici´on 1.4, la bola cerrada unidad es compacta. Que no puede existir un espacio normado compacto es obvio. Todo espacio normado es un conjunto no acotado (si x 6= 0 se pueden encontrar proporcionales a x de norma tan grande como se quiera). La propiedad (5) se deja como ejercicio. Las dem´as propiedades las comentamos m´as ampliamente a continuaci´on.
Conexi´ on en espacios normados En un espacio normado tiene sentido considerar varias formas de conexi´on, algunas de ellas de naturaleza puramente algebraica. Definici´ on 1.6 Se denomina segmento de extremos a, b, al conjunto [a, b] = {a + t(b − a) : t ∈ [0, 1]} = {(1 − t)a + tb : t ∈ [0, 1]}. El conjunto A se dir´a convexo si para cada par de puntos de A, el segmento que los une est´a totalmente contenido en A.
1.9
Espacios Normados
Proposici´ on 1.7 Toda bola es un conjunto convexo. Demostraci´ on. Sean x, y dos puntos de la bola B(a, r) y sea z = (1−t)x+ty un punto del segmento [x, y]. Entonces kz − ak = k(1 − t)x + ty − ((1 − t)a + tak ≤ (1 − t)kx − ak + tky − ak < (1 − t)r + tr = r. Proposici´ on 1.8 Todo espacio normado es conexo (por arcos) y localmente conexo. Demostraci´ on. Todo espacio normado es conexo por arcos, ya que para cada par de puntos x, y de E el segmento [x, y] define un arco (aplicaci´ on continua de un intervalo compacto de R en E) que une al punto x con el punto y. Este arco es la aplicaci´on continua ϕ : [0, 1] → E, definida por ϕ(t) = a + t(b − a). Para demostrar que E es localmente conexo, observemos en primer lugar que por ser cada segmento un arco, se tiene trivialmente que cada conjunto convexo es conexo por arcos. Luego, de la proposici´on anterior resulta que para cada punto x de E, las bolas centradas en x constituyen una base de entornos conexos de x. El concepto de segmento admite una generalizaci´on natural Definiciones 1.9 (i) Llamaremos Poligonal de v´ertices x0 , x1 , ..., xn al conjunto n−1
∪ [xi , xi+1 ],
i=0
o indistintamente a la aplicaci´on (claramente continua) ϕ : [0, n] → E definida por ϕ(t) = xi + (t − i)(xi+1 − xi ), si t ∈ [i, i + 1]. (ii) Un conjunto A se dir´a conexo por poligonales si cada par de puntos x, y ∈ A se pueden conectar mediante una poligonal contenida en A y de extremos x e y. Es claro que convexo ⇒ conexo por poligonales ⇒ conexo por arcos ⇒ conexo.
9
10
Espacios Normados
1.10
Proposici´ on 1.10 En un espacio normado E, un conjunto abierto U es conexo si y s´olo si es conexo por poligonales (a fortiori si y s´olo si es conexo por arcos). Demostraci´ on. Sea U un abierto conexo y a un punto de U . Llamemos A al conjunto de puntos de U que se pueden conectar con a mediante una poligonal contenida en U . Vamos a demostrar que A es un conjunto a la vez abierto y cerrado en el subespacio topol´ogico U . Esto implicar´a, en virtud de la conexi´on de U , que A coincide con U (A es no vac´ıo ya que al menos el punto a ∈ A). A es abierto: Sea x ∈ A y sea B(x, r) una bola centrada en x y contenida en U . Esta bola debe estar contenida ´ıntegramente en A, pues cada punto y de la misma se conecta con el centro x mediante el segmento [y, x], y x con a mediante una poligonal, luego tambi´en y se conecta con a mediante una poligonal. A es cerrado en U: Mediante un razonamiento an´alogo al anterior, se prueba que U \ A es un conjunto abierto.
Ejercicios 1A Sean p, q n´ umeros reales positivos tales 1/p + 1/q = 1 (observar que en estas condiciones p y q deben ser mayores que 1). (a) Demostrar la desigualdad: xy ≤
1 p 1 q x + y , p q p
1
x, y ≥ 0. 1
q
´ n. Escribir xy = e p ln x + q ln y Indicacio y tener en cuenta que la funci´on ex es convexa. (b) (Desigualdad de H¨older) Utilizar el apartado anterior para demostrar que n X i=1
xi yi ≤
à n X i=1
!1/p à |xi |
p
n X
!1/q |yi |
q
.
i=1
En otros t´erminos, hx, yi ≤ kxkp kykq , x = (x1 , . . . , xn ); y = (y1 , . . . , yn ). ´ n. Suponer en una primera etapa que kxkp = 1, kykq = 1 y Indicacio demostrar que entonces hx, yi ≤ 1. Pn 1/p (c) Demostrar que kxkp = ( i=1 |xi |p ) es una norma sobre Rn . 1B Sea p un n´ umero real mayor o igual queP1 y denotemos por lp al conjunto de ∞ sucesiones de n´ umeros reales (xn ) tales que n=1 |xn |p < ∞. Definamos tambi´en l∞ como el conjunto de las sucesiones acotadas de n´ umeros reales.
1F
Espacios Normados
11
(a) Probar que lp y l∞ son espacios vectoriales y que la expresiones kxkp =
∞ ¡X
|xn |p )1/p ;
kxk∞ = sup |xn | n∈N
n=1
definen sendas normas sobre lp y l∞ (b) Demostrar que la adherencia en l∞ del conjunto de sucesiones que tienen todos sus t´erminos nulos, salvo un n´ umero finito de ellos, es c0 : el espacio vectorial de sucesiones reales que convergen a 0. (c) Probar que l∞ no es separable pero c0 s´ı. 1C Demostrar que si k · k es una norma sobre Rn tal que (*)
k(u1 , . . . , un )k ≤ 1
⇒
|ui | ≤ 1,
entonces |xi | ≤ kxk, para cada x = (x1 , . . . , xn ) ∈ Rn . Dar ejemplos de normas que no satisfagan la condici´on (*) para ning´ un i. 1D Estudiar si las expresiones siguientes definen una norma sobre R2 : p 1. k(x, y)k = 4x2 + y 2 . p 2. k(x, y)k = |x| + |y|. p 3. k(x, y)k = |x| + | 3 x3 + y 3 |. p 4. k(x, y)k = (x − y)2 + y 2 . p p 1E Demostrar que el conjunto {(x, y) ∈ R2 : |x| + |y| < 1} no es convexo (hacer un dibujo de este conjunto). Deducir de ello que p ¢2 ¡p |x| + |y| k(x, y)k = no es una norma sobre R2 ¿qu´e condici´on falla? 1F Sean (Ei , i = 1, 2, . . . , n) una familia finita de espacios normados y empleemos la notaci´on com´ un k · k para designar a las normas de Ei . (a) Demostrar que k(x1 , . . . , xn )k =
n X
αi kxi k,
αi ≥ 0,
i=1
k(x1 , . . . , xn )k =
p
kx1 k2 + . . . + kxn k2
son normas sobre E = E1 × . . . × En . (b) Utilizar lo anterior para demostrar que p k(x, y, z)k = (2|x| + |y|)2 + z 2 es una norma sobre R3 .
12
Espacios Normados
1G
1G Sea (E, k · k) un espacio normado. Estudiar si la aplicaci´on de E en s´ı mismo, f (x) = xkxk, es continua, uniformemente continua o lipschitziana. 1H Encontrar una norma sobre R2 para la que la esfera unidad sea la elipse de ecuaci´on x2 + 4y 2 = 4. 1I
(a) Probar que en un espacio normado un conjunto A es acotado si y s´olo si existe una constante k tal que kxk ≤ k, para todo x de A. (b) Demostrar que en C[0, 1] todo conjunto acotado mediante la norma k · k∞ R1 es tambi´en acotado mediante la norma kf k1 = 0 |f (t)|dt. ¿Es cierto el rec´ıproco? (c) Sea A = {Pn (t) = t+1/2 t2 +. . .+1/n tn : n ∈ N} ¿Es A un conjunto acotado para estas normas?
1J Sea F un espacio vectorial cerrado del espacio normado E. Probar que al espacio vectorial cociente E/F se le dota de estructura de espacio normado definiendo kx + F k = inf{kx + yk : y ∈ F } = d(x, F ).
1K Sea (E, k · k) un espacio normado y sea d(x, y) = kx − yk ¿Puede ser d la distancia discreta? 1L
(a) Probar que d(x, y) =
|x − y| 1 + |x − y|
es una distancia sobre R invariante por traslaciones, pero que no es absolutamente homog´enea por homotecias. (b) Probar que p d(x, y) = 3 |x3 − y 3 | es una distancia sobre R absolutamente homog´enea por homotecias, pero no invariante por traslaciones. (c) Si d es una distancia sobre el espacio vectorial E, que no es invariante por traslaciones o absolutamente homog´enea, ¿puede ser la aplicaci´on x → d(x, 0) una norma sobre E. 1M Probar que la bola abierta unidad de un espacio normado E es homeomorfa a todo el espacio E. ´ n. Probar que la aplicaci´on Indicacio T (x) = establece el homeomorfismo buscado.
x 1 + kxk
1T
Espacios Normados
13
1N Sea E un espacio normado y f una aplicaci´on continua de E en R tal que f (x) 6= 0 para todo punto x ∈ E. Probar que entonces, o bien f (x) > 0 para cada x, o bien f (x) < 0 para cada x ¿Es v´alida esta conclusi´on si se sustituye en lo anterior E por la esfera unidad? 1O
(a) Probar que un espacio normado es completo (se dice entonces que es de Banach) si y s´olo si su bola cerrada unidad es completa. (b) Probar que un espacio normado es separable si y s´olo si la bola unidad es separable.
1P Sea {xn } con xn 6= 0 para todo n, una sucesi´on de Cauchy en un espacio normado. (a) Probar que la sucesi´on de n´ umeros reales {kxn k} es convergente. Sea α su l´ımite. (b) Probar que si α > 0 entonces la sucesi´on { kxxnn k } es de Cauchy. (c) Demostrar con un ejemplo que si α = 0, la sucesi´on { kxxnn k } no es necesariamente de Cauchy. 1Q Sea {xn } una sucesi´on convergente a 0 en un espacio normado. Probar que tambi´en converge a 0 la sucesi´on: yn =
x1 + x2 + . . . + xn n
1R Sea E el espacio normado C[0, 1] dotado de la norma de la convergencia uniforme y A = {f : f (0) = f (1) = 1; kf k = 1}. (a) Calcular la adherencia y el interior de A. (b) ¿Es A un conjunto conexo? (c) ¿Es A compacto? 1S Sea E un espacio vectorial sobre R. Demostrar que una aplicaci´on k·k : E → R es una norma si y s´olo si satisface las condiciones 1 y 2 de norma y la bola unidad {x : kxk ≤ 1} es un conjunto convexo. o
1T Sea A un conjunto convexo de un espacio normado tal que A6= ∅. Probar que o
cl (A) = cl ( A).
o
o
´ n. Probar que si a ∈ A, x ∈ A entonces el segmento [a, x) ⊂ A. Indicacio
Cap´ıtulo 2
Normas Equivalentes. Espacios Normados de Dimensi´ on Finita Dos son los resultados m´as importantes que, sobre la equivalencia de normas, veremos en este cap´ıtulo. El primero de ellos establece que, en el marco de los espacios normados, la equivalencia de normas es siempre lipschitziana. El segundo que sobre un espacio de dimensi´ on finita, todas las normas son equivalentes. Incluiremos tambi´en en este cap´ıtulo la caracterizaci´on topol´ogica, dada por F. Riesz, de los espacios normados de dimensi´on finita. Para terminar desarrollaremos algunas t´ecnicas de ´ındole pr´actico para la existencia de l´ımite (continuidad) de funciones de varias variables.
Equivalencia de normas Definici´ on 2.1 Dos normas sobre un mismo espacio vectorial E se dicen equivalentes, cuando inducen la misma topolog´ıa sobre E. La proposici´on que veremos a continuaci´on determinar´a que no tengamos necesidad de distinguir, como pasaba en los espacios m´etricos, entre distintas formas de equivalencia de normas. Proposici´ on 2.2 Dos normas k · k y k · k∗ sobre E son equivalentes si y s´olo si existen dos constantes a, b > 0 tales que (2.1)
akxk ≤ kxk∗ ≤ bkxk , 15
∀x ∈ E.
16
Normas Equivalentes
2.2
Demostraci´ on. En efecto, si ambas normas son equivalentes, las bolas abiertas relativas a ellas, {B(x, r) : x ∈ E, r > 0} y {B ∗ (x, r) : x ∈ E, r > 0} constituyen dos bases de una misma topolog´ıa. Entonces, puesto que B(0, 1) es un conjunto abierto debe existir r > 0 tal que B ∗ (0, r) ⊂ B(0, 1). Lo que significa que kxk∗ < r ⇒ kxk < 1. Sea a un n´ umero real tal que 0 < a < r, y un vector cualquiera. Si y 6= 0 es claro que el vector u = a(y/kyk∗ ) verifica que kuk∗ = a < r, y por tanto que kuk < 1. Se deduce pues que para y 6= 0, akyk < kyk∗ . En todo caso akyk ≤ kyk∗ . Intercambiando los papeles de ambas normas, se obtiene la otra desigualdad. Rec´ıprocamente, si para todo x ∈ E se tiene que akyk ≤ kyk∗ ≤ bkxk, es f´acil deducir entonces que la aplicaci´on Identidad: Id : (E, k · k) → (E, k · k∗ ) es un homeomorfismo lipschitziano. En particular, las topolog´ıas que inducen estas normas sobre E coinciden, luego k · k y k · k∗ son equivalentes. En la proposici´on anterior hemos demostrado que si dos normas sobre un mismo espacio vectorial E son equivalentes, los espacios normados (E, k · k) y (E, k · k∗ ) no s´olo tienen las mismas propiedades topol´ogicas, sino tambi´en las mismas propiedades uniformes y lipschitzianas. Puede resumirse este hecho diciendo que en los espacios normados, la equivalencia de normas es siempre lipschitziana. Antes de pasar al estudio de los espacios normados de dimensi´ on finita, es conveniente establecer algunas cuestiones referentes al producto de espacios normados. Definici´ on 2.3 (Norma producto) Sean (Ei , k · ki ), i = 1, 2, . . . , n, un n´ umero finito de espacios normados. Llamaremos norma producto de las normas k · ki a la norma sobre E = E1 × . . . × En , k(x1 , . . . , xn )k∞ = max(kx1 k1 , . . . , kxn kn ).
Adem´as de la norma producto, se puede probar que tambi´en definen normas sobre E las expresiones à p !1/p X p k(x1 , . . . , xn )kp = kxi ki . i=1
2.6
Normas Equivalentes
17
Obviamente, si los espacios Ei = R para todo i y k · ki = | · |, entonces las normas anteriores son las ya estudiadas k · k∞ y k · kp de Rn . Proposici´ on 2.4 Todas las normas anteriores son equivalentes e inducen en E la topolog´ıa producto de los espacios (Ei , k · ki ). Demostraci´ on. Es f´acil ver que kxk∞ ≤ kxkp ≤ n1/p kxk∞ , lo que demuestra que todas estas normas son equivalentes. Asimismo constituye un sencillo ejercicio comprobar que la topolog´ıa que ´estas inducen sobre E es la producto de los espacios (Ei , k · ki ). Como indicaci´on, observar que, con respecto a la norma producto k · k∞ , las bolas en E son productos de bolas en Ei , es decir: B(a, r) =
n Y
B(ai , r) ;
a = (a1 , . . . , an ).
i=1
Espacios de dimensi´ on finita Como establece el teorema de Riesz, los espacios normados de dimensi´ on finita son, bajo el punto de vista topol´ogico, esencialmente diferente a los de dimensi´on infinita. Antes de enunciar este teorema, observemos que el modelo matem´atico en el que se representan los espacios normados de dimensi´on finita es Rn , en el sentido de que: Proposici´ on 2.5 Si E es un espacio normado de dimensi´on finita n, entonces existe alguna norma sobre Rn , tal que E es isom´etrico a Rn con esa norma. on. Sea T : x → (xi ) el isomorfismo de espacio vectoriales que Demostraci´ asocia a cada vector x de E sus coordenadas xi ∈ R en una base dada. Obviamente kyk∗ = kT −1 (y)k define una norma sobre Rn , para la que T es una isometr´ıa. La propiedad m´as importante de Rn como espacio normado, se establece en la proposici´on siguiente Proposici´ on 2.6 En Rn todas las normas son equivalentes.
18
Normas Equivalentes
2.6
Demostraci´ on. Vamos a probar que cada norma k · k sobre Rn es equivalente a la norma k · k1 (k(x1 , . . . , xn )k1 = |x1 | + · · · + |xn |). Consideremos para ello la aplicaci´ on k · k : (Rn , k · k1 ) → R. Esta aplicaci´on es continua pues, si denotamos por ei = (0, . . . , 1, . . . , 0) y M = max(ke1 k, . . . , ken k) , entonces n ¯ X ¯ ¯kxk − kyk¯ ≤ |xi − yi |kei k ≤ M kx − yk1 . i=1
Adem´as, si en la desigualdad anterior se toma y = 0, se tiene (2.2)
kxk ≤ M kxk1 .
Sea ahora S = {x : kxk1 = 1}. Este conjunto es compacto ya que es un cerrado que es subconjunto de un compacto. Concretamente, S ⊂ [−1, 1]n . (N´otese que seg´ un 2.4 la topolog´ıa del espacio normado (Rn , k · k1 ) es la topolog´ıa producto). Se deduce entonces que la aplicaci´on k·k : (Rn , k·k1 ) → R alcanza un m´ınimo sobre S, es decir existe un punto u0 ∈ S tal que ku0 k ≤ kuk cualquiera que sea u ∈ S. Sea m = ku0 k y x 6= 0, cualquiera (m > 0 pues u0 6= 0). Puesto que x/kxk1 es un punto de S, se tiene: ° ° ° x ° ° (2.3) m≤° ° kxk1 ° ⇒ mkxk1 ≤ kxk. De 2.2 y 2.3, se deduce que ambas normas son equivalentes. 2.7 De lo anterior se pueden extraer las siguientes consecuencias 1. En Rn un conjunto es compacto si y s´olo si es cerrado y acotado (respecto de cualquier norma). Sabemos que en todo espacio m´etrico cada compacto es un conjunto cerrado y acotado. Para probar que en Rn el rec´ıproco tambi´en es cierto, basta observar que si un conjunto es acotado respecto de una norma es tambi´en acotado respecto de cualquier norma equivalente. As´ı, si K es cerrado y acotado, entonces es acotado respecto a la norma producto, luego existe alguna constante r > 0 tal que, para todo x = (x1 , . . . , xn ) ∈ K |xi | ≤ r, (i = 1, 2, . . . , n)
⇒
De esto se sigue pues que K es compacto.
K ⊂ [−r, r]n .
2.9
Normas Equivalentes
19
2. Rn es un espacio de Banach respecto de cualquier norma. Es f´acil ver que esto es cierto para la norma producto (una sucesi´on de puntos de Rn es de Cauchy si y s´olo si las sucesiones coordenadas son de Cauchy etc.) Adem´as, si k · k es otra norma cualquiera, Rn tiene las mismas propiedades topol´ogicas, uniformes y lipschitzianas para ambas normas, ya que seg´ un la proposici´on anterior, son equivalentes. En particular (Rn , k · k) es completo (propiedad uniforme). 3. Todo subespacio vectorial de dimensi´on finita de un espacio normado es cerrado. En efecto, si F es un subespacio vectorial de dimensi´on n del espacio normado (E, k · k), entonces (F, k · k) es isom´etrico a Rn (proposici´on 2.5), luego es completo. Como todo conjunto completo de un espacio m´etrico es cerrado, se deduce ya que F es cerrado. Vamos a terminar esta secci´on con la caracterizaci´on topol´ogica de los espacios normadas de dimensi´on finita, dada por F.Riesz. Usaremos para ello el siguiente lema Lema 2.8 Sea E un espacio normado y F un subespacio vectorial propio y cerrado en E. Entonces para cada 0 < ε < 1 existe un vector x ∈ E tal que ε < d(x, F ) < 1.
on. Puesto que F es un conjunto cerrado distinto de E, existe Demostraci´ alg´ un vector y tal que d(y, F ) > 0. Entonces alg´ un proporcional de y, λy, debe verificar que ε < d(λy, F ) < 1. Tomemos ahora un vector u ∈ F tal que kλy − uk < 1, y sea x = λy − u. Es claro entonces que ε < d(λy, F ) = d(x, F ) ≤ kxk < 1.
Teorema 2.9 (T. de Riesz) Si E es un espacio normado, son equivalentes: (a) E es de dimensi´on finita. (b) La bola cerrada unidad es compacta.
20
Normas Equivalentes
2.6
(c) Los conjuntos compactos de E son, justamente, los cerrados y acotados. (d) E es localmente compacto. Demostraci´ on. En primer lugar veamos que las condiciones (b), (c) y (d) son equivalentes: Supongamos que se verifica (b), y sea K un conjunto cerrado y acotado. Entonces K es subconjunto de una bola cerrada, por ejemplo K ⊂ B[a, r]. Por la proposici´on 1.4, sabemos que B[0, 1] y cualquier otra bola cerrada resultan simult´aneamente compactas o no compactas. Se deduce pues que K es un subconjunto cerrado de un compacto, y por lo tanto K tambi´en es compacto. Trivialmente (c) implica (d). Y aplicando de nuevo la proposici´ on 1.4, se demuestra que (d) implica (b). (a) implica todas las dem´as condiciones. Por u ´ltimo, veamos que los espacios normados de dimensi´on finita son ´nicos en los que la bola cerrada unidad es compacta: los u En efecto, supongamos que E tiene dimensi´on infinita. Vamos a aplicar el lema 2.8 para encontrar una sucesi´on en la bola unidad que no tiene ninguna subsucesi´on convergente: Sea x1 un vector no nulo de E y sea F1 = lin {x1 }, el subespacio generado por x1 . Como dim(F1 )=1, F1 es cerrado. Existe por tanto un punto x2 tal que kx2 k < 1,
1 kx1 − x2 k > . 2
Procediendo igual con el subespacio cerrado (y propio) generado por los vectores x1 , x2 , encontramos un punto x3 tal que kx3 k < 1,
1 kx1 − x3 k > , 2
1 kx2 − x3 k > . 2
Es evidente que, de este modo, se construye una sucesi´on {xn } de puntos de la bola unidad, que no admite subsucesiones de Cauchy, pues cada dos t´erminos de la misma distan entre s´ı m´as de 1/2. Por lo tanto tampoco admite subsucesiones convergentes, luego la bola cerrada unidad no es compacta, como se trataba de probar.
2.11
Normas Equivalentes
21
L´ımites y continuidad El contenido de este par´agrafo es eminentemente pr´actico. En ´el se exponen algunas t´ecnicas para el estudio de la continuidad (existencia de l´ımite) para una funci´on de varias variables reales, f : A ⊂ Rn → Rp . Si p = 1, es decir si f toma sus valores en R, se dir´a que f es una funci´ on escalar. Cuando p > 1, una funci´on de este tipo se dir´a que es una funci´on vectorial. En ese caso escribiremos f = (f1 , f2 , . . . , fp ), donde fi (x) es la coordenada i-´esima de f (x), es decir las funciones f1 , f2 , . . . , fp son las funciones coordenadas de f . Definici´ on 2.10 Sea f : A ⊂ Rn → Rp y a un punto de acumulaci´ on de A. Diremos que el punto l ∈ Rp es l´ımite de la funci´on en el punto a, lo que denotaremos como lim f (x) = l, x→a
si para ε > 0, existe δ > 0 tal que 0 < kx − ak < δ ⇒ kf (x) − lk < ε.
Es claro que la funci´on f es continua en a si y s´olo si lim f (x) = f (a).
x→a
N´otese que en la definici´on anterior, de acuerdo con la proposici´on 2.6, pueden utilizarse las normas que se quieran, es decir: “Si l es l´ımite de la funci´on f en el punto a con respecto a dos normas en Rn y Rp , l es tambi´en l´ımite de f en a respecto a cualquier otro par de normas”. Proposici´ on 2.11 Sea f = (f1 , f2 , . . . , fp ) una funci´on de A ⊂ Rn → Rp y a un punto de acumulaci´on de A. Entonces lim f (x) = l = (l1 , . . . , lp )
x→a
⇔
lim fi (x) = li
x→a
Demostraci´ on. Si en Rp utilizamos la norma producto, es evidente que la definici´on de l´ımite para f en a puede expresarse en los siguientes t´erminos: para cada ε > 0, existe δ > 0 tal que 0 < kx − ak < δ
⇒
|fi (x) − li | < ε ,
∀i
lo que equivale a decir que li es el l´ımite de fi en a, para todo i.
22
Normas Equivalentes
2.12
2.12 Para estudiar la existencia de l´ımite y/o la continuidad para funciones de varias variables se tendr´a en cuenta, en primer lugar, las propiedades generales de las funciones continuas entre espacios topol´ogicos (la composici´on de continuas es continuas, las aplicaciones constantes, la identidad, las proyecciones,... son continuas), o las que hacen referencia a la estructura vectorial de los espacios normados (el conjunto de las aplicaciones que toman sus valores en un espacio normado y que son continuas en un punto es tambi´en un espacio vectorial, ver ejercicios 2A,2B). Adem´as, despu´es de la proposici´on anterior, dicho estudio bastar´a hacerse para funciones escalares. Para ellas podemos establecer sin dificultad que 1. El producto de funciones continuas en un punto es una funci´on continua en ese punto. 2. Si f, g son funciones continuas en un punto a y g(a) 6= 0, entonces f /g es continua en a. An´alogos resultados y consideraciones se pueden obtener sobre la existencia de l´ımites en un punto. Ejemplo 2.13 Las funciones polin´omicas son continuas: En efecto, toda funci´on polin´omica es suma de monomios, es decir de aplicaciones de la forma (x1 , ..., xn ) → axk11 . . . xknn , que son continuas por ser el producto de aplicaciones del tipo (x1 , ..., xn ) → a ,
(x1 , ..., xn ) → xi .
2.14 En lo que sigue trataremos de buscar criterios que nos permitan estudiar la existencia de l´ımite (continuidad), en aquellos casos en que las reglas generales para el c´alculo de l´ımites (2.12) no sean aplicables, es decir cuando aparezcan indeterminaciones. Cuando tales criterios sean aplicables, se evitar´a tener que usar, para resolver esas indeterminaciones, el engorroso m´etodo ε − δ que proporciona la definici´on de l´ımite. Para simplificar trabajaremos con funciones escalares de dos variables. Si f : A ⊂ R2 → R y (x0 , y0 ) un punto de acumulaci´ on de A, entonces, de acuerdo con la definici´on 2.10, l=
lim
(x,y)→(x0 ,y0 )
f (x, y),
2.16
Normas Equivalentes
si para cada ε > 0 existe δ > 0 tal que |x − x0 | < δ, |y − y0 | < δ |x − x0 | + |y − y0 | < δ 0 < k(x − x0 , y − y0 )k < δ p (x − x0 )2 + (y − y0 )2 < δ ......................
23
⇓ |f (x, y) − l| < ε, on suficiente para existencia de l´ımite) Con las nota2.15 (Condici´ ciones anteriores, si existen dos constantes positivas M y α tales que, para (x, y) en alg´ un entorno de (x0 , y0 ), se verifica que |f (x, y) − l| ≤ M k(x − x0 , y − y0 )kα entonces l = lim(x,y)→(x0 ,y0 ) f (x, y).
Ejemplo 2.16 Consideremos la funci´ on f (x, y) =
(1 − y)(x − 1)2 + y 2 si (x, y) 6= (1, 0) ; f (1, 0) = 1. (x − 1)2 + y 2
Esta funci´on es continua en el punto (1,0), pues ¯ ¯ ¯ (1 − y)(x − 1)2 + y 2 ¯ |f (x, y) − 1| = ¯¯ − 1¯¯ 2 2 (x − 1) + y |y|(x − 1)2 ≤ |y| ≤ k(x, y) − (1, 0)k∞ . = (x − 1)2 + y 2 Hay que hacer notar que la condici´on de la proposici´on anterior no es necesaria, es decir una funci´on puede tener l´ımite y no satisfacer ninguna desigualdad de ese tipo. (Compru´ebense, por ejemplo, con la funci´on f (x, y) = en el punto (0,0)).
1 + y2 )
ln(x2
24
Normas Equivalentes
2.17
Definici´ on 2.17 (L´ımites iterados) Con las notaciones anteriores, a cada uno de los l´ımites lim ( lim f (x, y)),
x→x0 y→y0
lim ( lim f (x, y))
y→y0 x→x0
se les denomina l´ımites iterados. Proposici´ on 2.18 Si existe el l´ımite de una funci´on en un punto (x0 , y0 ) es decir, l = lim(x,y)→(x0 ,y0 ) f (x, y), entonces tambi´en existen y son iguales a “l”los l´ımites iterados. (Se supone que para cada y 6= y0 y x 6= x0 existen los l´ımites limx→x0 f (x, y) y limy→y0 f (x, y)). Demostraci´ on. Resulta directamente de aplicar la definici´on de l´ımite. Definici´ on 2.19 (L´ımites direccionales) Llamaremos l´ımites direccionales de la funci´on f en el punto (x0 , y0 ) a los l´ımites siguiendo rectas que pasen por el punto, es decir limx→x0 f (x, y0 +m(x−x0 )). (An´aloga definici´on para l´ımite siguiendo curvas que pasan por el punto). Nota. La condici´on 2.15 as´ı como la definici´on 2.17 se generalizan de manera natural al caso de funciones de 3 o m´ as variables. Para generalizar tambi´en la noci´on de l´ımites direccionales de una funci´on en un punto, deberemos escribir en forma param´etrica las ecuaciones de las rectas que pasan por el punto. As´ı si a = (a1 , . . . , an ), entonces x1 = a1 + th1 , x2 = a2 + th2 , . . . , xn = an + thn es la ecuaci´on de la recta que tiene como vector director h = (h1 , . . . , hn ) y que pasa por a. El l´ımite siguiendo esta recta ser´a entonces lim f (a1 + th1 , . . . , an + thn ).
t→0
Para n = 2 el l´ımite anterior coincide con el l´ımite direccional en el sentido de la definici´on 2.19, siguiendo la recta de pendiente m = h2 /h1 . Como en el caso de los l´ımites iterados, es evidente que la existencia de l´ımite implica la de los l´ımites direccionales y siguiendo curvas. Se deduce, pues, que la existencia de los l´ımites iterados, direccionales y siguiendo curvas son condiciones necesarias para la existencia del l´ımite. Por lo tanto: NO existe l´ımite cuando 1. No existe alguno de los l´ımites iterados o existen pero son distintos.
2.23
Normas Equivalentes
25
Ejemplo 2.20 Consideremos la funci´ on x2 + y si (x, y) 6= (0, 0); f (x, y) = p x2 + y 2
f (0, 0) = 0.
Esta funci´on no es continua en (0, 0) ya que uno de los l´ımites iterados no existe: x2 + y y lim ( lim p ) = lim = ±1. y→0 x→0 y→0 |y| x2 + y 2 Ejemplo 2.21 Este es un ejemplo de una funci´on para la que los l´ımites iterados existen pero son diferentes (luego el l´ımite no existe) (x + y − 1) ln(x2 + 2y 2 ) , (x − 1)2 + y 2
f (x, y) =
si (x, y) 6= (1, 0).
Se tiene que 2(x − 1) ln x =2 (x − 1)2 y ln(1 + 2y 2 ) 4y lim ( lim f (x, y)) = lim = lim = 0. 2 y→0 x→1 y→0 y→0 1 + 2y 2 y lim (lim f (x, y)) = lim
x→1 y→0
x→1
2. No existe alguno de los l´ımites direccionales o existen, pero no son iguales. Ejemplo 2.22 Sea f (x, y) =
x2
xy si (x, y) 6= (0, 0). + y2
Los l´ımites direccionales de esta funci´on no son todos iguales. En efecto: mx2 m = 2 2 2 x→0 (m + 1)x m +1
lim f (x, mx) = lim
x→0
que depende de m. Se deduce pues que el l´ımite no existe. Ejemplo 2.23 Sea f (x, y) =
x2 y si (x, y) 6= (0, 0); x4 + (y − x)2
f (0, 0) = 0.
Es inmediato comprobar que limx→0 f (x, mx) = 0 para m 6= 1. En cambio para m = 1 el l´ımite anterior no existe, es decir la funci´on no tiene l´ımite en (0,0) siguiendo la recta y = x y por lo tanto no admite l´ımite en ese punto (no es continua en (0,0)).
26
Normas Equivalentes
2.23
3. No existe el l´ımite siguiendo alguna curva que pasa por el punto o el l´ımite var´ıa dependiendo de la curva que se tome. Ejemplo 2.24 Consideremos la funci´on f (x, y) =
xy 2 si (x, y) 6= (0, 0). x2 + y 4
Tanto los l´ımite iterados como los l´ımites direccionales en el punto (0,0) existen y valen 0, sin embargo esta funci´on no tiene l´ımite en ese punto, ya √ que si tomamos las curvas y = m x, se tiene: m2 x2 m2 = . x→0 x2 + m4 x2 m4 + 1
√ lim f (x, m x) = lim
x→0
Es decir los l´ımites siguiendo esa familia de curvas existen todos pero son diferentes entre s´ı, luego el l´ımite no existe. Ejemplo 2.25 Sea f (x, y) =
x2 ln y , x4 + (x2 + ln y)2
si (x, y) 6= (0, 1);
f (0, 1) = 0.
Es inmediato comprobar que tambi´en en este caso los l´ımites iterados en (0,1) valen 0. En cuanto a los l´ımites direccionales x2 ln(1 + mx) ln(1 + mx) ln 1 = lim 2 = 2 = 0. 4 2 2 x→0 x + (x + ln(1 + mx)) x→0 x + (x + 1/x ln(1 + mx)) m lim
Sin embargo tampoco existe el l´ımite ya que si consideramos la curva y = 2 e−x , que obviamente pasa por (0,1), la funci´on admite l´ımite siguiendo esta curva, pero es diferente de 0. Aunque los casos m´as frecuentes sobre la existencia de l´ımite en un punto se resuelven mediante el estudio desarrollado anteriormente, a veces no queda m´as remedio que acudir al estudio ε − δ. En esos casos puede ayudar el paso a coordenadas polares (s´olo si f es una funci´on de dos variables). 2.26 (Coordenadas polares para l´ımite en (0,0)) La funci´on f tiene l´ımite en (0, 0), es decir l = lim(x,y)→(x0 ,y0 ) f (x, y), si y s´olo si para cada ε > 0 existe un δ > 0 tal que si r < δ entonces |f (r cos θ, rsen θ) − l| < ε (uniformemente en θ).
2C
Normas Equivalentes
27
Demostraci´ on. Basta espresar la condici´on de l´ımite en coordenadas polares. Ejemplo 2.27 Sea f (x, y) =
y sen (x2 + y 2 ) si x 6= 0; x
f (0, y) = 0.
Pasando a polares se obtiene f (r cos θ, rsen θ) = tan θsen r2 . La condici´on anterior no se cumple, pues existe ε (por ejemplo ε = 1) tal que cualquiera que sea δ > 0 se puede encontrar r < δ de manera que | tan θsen r2 | > 1 para alg´ un θ. Basta tomar r < δ con la condici´on r2 6= kπ y θ tal que | tan θ| > 1/|sen r2 |. Se deduce pues que la aplicaci´on no es continua en (0,0). Tampoco resulta continua en ning´ un punto de la forma (0, y0 ). Si y02 6= kπ es obvio, pues entonces lim(x,y)→(x0 ,y0 ) f (x, y) = ∞. En otro caso, puede comprobarse que los l´ımites direccionales no son todos iguales. En los puntos con x 6= 0 se pueden aplicar los teoremas generales sobre funciones continuas para probar que la funci´on s´ı que es continua.
Ejercicios 2A Demostrar que en todo espacio normado la aplicaci´on suma (i) Es continua. (ii) Es abierta. M´as precisamente, si U es un conjunto abierto de E y A es un conjunto cualquiera, entonces A + U es abierto. (iii) No es cerrada. Sin embargo, si K es compacto y F cerrado, entonces K + F es tambi´en cerrado. Indicaci´ on. Para probar que no es cerrada consid´erense los conjuntos F1 = Eje X y F2 = {(x, 1/x) : x > 0}. 2B
(a) Demostrar que, en todo espacio normado E, la aplicaci´on “multiplicaci´on por escalares”es una aplicaci´on continua. (b) Sea S = {x ∈ E : kxk = 1}. Demostrar que esta aplicaci´on lleva el conjunto [0, 1] × S sobre la bola cerrada unidad, B[0, 1] = {x ∈ E : kxk ≤ 1}. (c) Deducir de (b) que el espacio normado E es de dimensi´on finita si y s´olo si la esfera unidad S es compacta.
2C Demostrar que en todo espacio normado
28
Normas Equivalentes
2C
(a) La adherencia de un subespacio vectorial es un subespacio vectorial. (b) La adherencia de un conjunto convexo es tambi´en convexo. 2D Sea E un espacio normado y k · k, k · k∗ dos normas comparables sobre E, i.e., o bien existe una constante positiva a > 0 tal que kxk ≤ akxk∗ , ∀x ∈ E, o bien existe una constante positiva b > 0 tal que kxk∗ ≤ bkxk, ∀x ∈ E. Probar que si {xn } es una sucesi´on en E que converge respecto a ambas normas, entonces los limites coinciden. 2E Sea f la aplicaci´on definida sobre el conjunto C = {(x, y) : x2 6= y 2 } de R2 como µ ¶ sen x − sen y ex − ey , f (x, y) = . x−y x+y Demostrar que f es continua sobre C y que se puede extender a R2 continuamente. 2F Estudiar la existencia de los siguientes l´ımites 1.
1 − cos(x − y) x2 + y 2 (x,y)→(0,0) lim
(x + 1)y 3 + x2 p (x,y)→(0,0) x2 + y 4 2x2 + y 2 − xy p p 5. lim (x,y)→(0,0) 2 x2 + y 2 − 3x2 + 2y 2 3.
lim
xα y β (x,y)→(0,0) sen x2 + sen y 2 x3 − y 2 + z 3 9. lim (x,y,z)→(0,0,0) x2 + y 2 + z 2 cos xz − cos yz 11. lim (x,y,z)→(0,0,0) x2 + y 2 + z 2 √ 1 + cos(x + 3y) 13. lim (x,y)→(π,0) 1 + y 2 + cos(x − y) 7.
(x + 1)y 2 + x2 p (x,y)→(0,0) x4 + y 4 xy 2 + π 2 (x − 1)2 p 4. lim (x,y)→(1,0) sen 4 πx + y 4 x3 (x + y) 6. lim (x,y)→(0,0) (x + y)2 + x2 y 2 2.
lim
(x2 + y 3 )(x2 + y 2 ) x2 + y 4 (x,y)→(0,0) x3 − y 3 + z 3 10. lim (x,y,z)→(0,0,0) x2 + y 2 + z 2 cos xz − cos yz 12. lim (x,y,z)→(0,0,0) (x2 + y 2 + z 2 )2
lim
8.
14.
lim
(y + ln(x − 1))2 2 (x,y)→(2,0) ey + x2 − 4x + 3 lim
2G Demostrar que si (Ei ) es una familia Q infinita de espacios normados, ninguna norma sobre el espacio vectorial E = Ei puede inducir sobre E la topolog´ıa producto de los espacios Ei . 2H Demostrar que la expresi´on k(x, y, z)k =
p
x2 + (y − x)2 + (z − y)2
define una norma sobre R3 . Compararla con la norma eucl´ıdea.
2N
Normas Equivalentes
29
2I Sea (E, k · k) un espacio normado. Probar que mediante la expresi´on k(x, y)k = kx + yk + kx − yk se define una norma sobre E × E, equivalente a la norma producto. ´ n. La equivalencia entre esta norma y la norma producto constituye un Indicacio f´acil ejercicio si antes se prueba la desigualdad 2kxk ≤ kx + yk + kx − yk, para todos x, y ∈ E. 2J Sea E = C([0, 1] y consideremos las normas Z kf k∞ = max |f (t)| , t∈[0,1]
1
kf k1 =
|f (t)|dt. 0
(a) ¿Son comparables ambas normas? ¿y equivalentes? (b) Estudiar la continuidad del producto de funciones de E, respecto a las normas anteriores. 2K Sea E el espacio vectorial de las funciones polin´omicas sobre el intervalo [0, 1]. Consideremos sobre ´el las normas: ka0 + a1 x + . . . + an xn k∞ = max(|a0 |, . . . , |an |) ka0 + a1 x + . . . + an xn k1 = |a0 | + · · · + |an | ka0 + a1 x + . . . + an xn k = max |a0 + a1 x + . . . + an xn |. x∈[0,1]
Establecer las comparaciones posibles entre ellas, probando, en particular, que la primera y la tercera no son comparables. 2L Sea f una aplicaci´on entre espacios normados y supongamos que existe limx→x0 kf (x)k ¿se mantendr´a la existencia de este l´ımite si se cambia la norma k · k por otra equivalente? 2M Calcular la adherencia del conjunto ½ ¾ 1 1 3 1 A = (x, y, z) ∈ R : + + = 1 . x y z
2N Sea K = {(x, y, z) : x2 + y 2 + z 2 − 2z ≤ 2, x + y + z ≤ 1}. o
(a) Probar que K es un conjunto compacto de R3 y hallar K y Fr(K). (b) Sea S = {(x, y, z) : x2 + y 2 + z 2 − 2z = 2} y M la traza sobre S del conjunto {(x, y, z) : x + y + z < 1}. Obtener el interior, la adherencia y la frontera de M , relativo al subespacio S.
30
Normas Equivalentes
2O
2O
(a) Demostrar las desigualdades 1. x2 + y 2 − x2 y 2 ≥ 1/2(x2 + y 2 ), si |x| < 2. x4 + y 4 − x2 y 2 ≥ 1/2(x4 + y 4 ), ∀x, y.
√
2 o |y| <
√
2.
(b) Estudiar, teniendo en cuenta las desigualdades anteriores, los siguientes l´ımites: lim
(x,y)→(0,0)
¡
x3 y 2
¢2 , x2 y 2 − (x2 + y 2 )
xα y β , α, β ≥ 0. (x,y)→(0,0) x4 + y 4 − x2 y 2 lim
2P Estudiar, pasando a coordenadas polares, los siguientes l´ımites y(x2 + y 2 )3/2 , (x,y)→(0,0) (x2 + y 2 )2 + y 2 lim
x3 (x + y) . (x,y)→(0,0) (x + y)2 + x2 y 2 lim
2Q Estudiar la continuidad uniforme de la aplicaci´on f (x, y) = sen 2
1 x2 + y 2
en C1 = {(x, y) : 0 < x2 + y 2 < 1} y en C2 = {(x, y) : x2 + y 2 > 1}.
Cap´ıtulo 3
El Teorema de Stone-Weierstrass Vamos a ver en esta lecci´on el teorema cl´asico de Weierstrass y la importante generalizaci´on del mismo dada por Stone.
El teorema de Weierstrass El teorema de Weierstrass establece que cada funci´ on continua sobre un intervalo [a, b] de R puede ser aproximada uniformemente por polinomios o, dicho de otro modo, que los polinomios constituyen una familia uniformemente densa de C[a, b]. Cuando se trata de aproximar una funci´on por polinomios, parece inevitable pensar en los polinomios de interpolaci´on (polinomios que toman el umero finito de puntos dados)1 , como mismo valor que la funci´on en un n´ on de una buenos aproximantes. Sin embargo, los polinomios de interpolaci´ funci´on no convergen, en general, ni siquiera puntualmente hacia la funci´ on. Por ejemplo, Berstein [4] demostr´o que los polinomios de interpolaci´ on de la funci´on |x| en [−1, 1], para puntos igualmente separados, s´ olo convergen en los puntos −1, 1 y 0. Tambi´en es famoso el ejemplo de Runge: los polinomios de interpolaci´on de la funci´on (incluso anal´ıtica) 1/(1 + x2 ), para puntos equidistantes del intervalo [−5, 5], diverge para |x| ≥ 3, 63....(Ver [18]). Por otra parte s´olo para las funciones anal´ıticas puede garantizarse que los polinomios de Taylor converjan uniformemente. Se observa, pues, 1
Es bien conocido que para cada n + 1 puntos del plano {(xi , yi ) : x1 < x2 < . . . xn+1 } existe un u ´nico polinomio de grado menor o igual que n que pasa por ellos.
31
32
El Teorema de Stone-Weierstrass
3.1
que la aproximaci´on uniforme de una funci´ on continua mediante polinomios debe ir por otros derroteros (Ver Cheney [6]). La demostraci´on que vamos a hacer del teorema de Weierstrass es debida a Berstein. Teorema 3.1 Para una funci´on continua f definida sobre el intervalo [0, 1], la sucesi´on de polinomios Bn (f )x =
n X
¡ ¢ f (k/n) nk xk (1 − x)n−k
k=0
converge uniformemente hacia la funci´on f . ¡n¢ k n−k , con lo que podreon. Denotemos por r (x) = Demostraci´ k k x (1 − x) Pn mos escribir, Bn (f )x = k=0 f (k/n)rk (x). Llamaremos a Bn (f ) el polinomio n-´esimo de Berstein de la funci´on f . Tendremos necesidad de conocer los polinomios de Berstein de las funciones 1, x y x2 : Bn (1)x =
n X
n X ¡n¢ k ¡ ¢n n−k x (1 − x) = x + (1 − x) rk (x) = = 1, k k=0
k=0
Bn (x)x =
n X
n X ¡ ¢ (k/n) nk xk (1 − x)n−k (k/n)rk (x) =
k=0 n X
=x
k=0
¡n−1¢ k−1 (1 − x)n−k = x, k−1 x
k=1 2
Bn (x )x = =
=
n X
n
x X ¡n−1¢ k−1 (k/n) rk (x) = k k−1 x (1 − x)n−k n 2
k=0 n−1 X
x n
k=1
¡ ¢ j n−1−j (j + 1) n−1 j x (1 − x)
j=0
n−1 n − 1 X j ¡n−1¢ j x x (1 − x)n−1−j n n−1 j j=0
+
n−1 x X ¡n−1¢ j n−1−j j x (1 − x) n j=0
n−1 2 1 = x + x. n n
3.1
El Teorema de Stone-Weierstrass
33
Veamos que Bn (f ) converge uniformemente hacia f . (Observemos que esto es verdad para f = 1, x o x2 ). Hemos de probar que para ε > 0 existe un ´ındice ν tal que Si n ≥ ν ,
|f (x) − Bn (f )(x)| ≤ ε ∀x, P o lo que es lo mismo, teniendo en cuenta que nk=0 rk (x) = 1, que Si n ≥ ν ,
n ¯X ¯ ¯ (f (x) − f (k/n))rk (x)¯ ≤ ε ∀x ∈ [0, 1]. k=0
Puesto que f es uniformemente continua en [0,1], debe existir un δ > 0 tal que si |x − y| < δ entonces |f (x) − f (y)| < ε. Sean x ∈ [0, 1] y n ∈ N cualesquiera y consideremos los conjuntos I1 = {k : 0 ≤ k ≤ n, |x − k/n| ≤ δ} ,
I2 = {k : 0 ≤ k ≤ n, |x − k/n| > δ}.
Entonces n ¯ X ¯X ¯ (f (x) − f (k/n))rk (x)¯ ≤ |f (x) − f (k/n)|rk (x) k=0
k∈I1
+
(3.1)
X
|f (x) − f (k/n)|rk (x)
k∈I2
≤ε+
X
|f (x) − f (k/n)|rk (x).
k∈I2
Sea M una cota superior de la funci´ on f en [0,1]. Observemos que la condici´on k ∈ I2 significa que (x − k/n)2 > δ 2 . Luego 1 k ∈ I2 ⇔ 1 < 2 (x − k/n)2 . δ Se tiene entonces que X 2M X |f (x) − f (k/n)|rk (x) ≤ 2 (x − k/n)2 rk (x) δ k∈I2
k∈I2
n 2M X (x − k/n)2 rk (x) ≤ 2 δ
2M ¡ = 2 x2 δ
n X k=0
k=0 n X
rk (x) − 2x
k=0
(k/n)rk (x) +
n X
¢ (k/n)2 rk (x)
k=0
2M ¡ n−1 2 1 ¢ = 2 x2 − 2x2 + x + x δ n n 2M 2M = 2 x(1 − x) ≤ 2 . δ n δ n
34
El Teorema de Stone-Weierstrass
3.1
De lo anterior se deduce que tambi´en el segundo sumatorio en 3.1 puede hacerse menor que ε, independientemente de c´ ual sea x, sin m´as que tomar n suficientemente grande. Por tanto la sucesi´ on de polinomios de Berstein de la funci´on f converge uniformemente a f . Nota. N´otese que la demostraci´on del teorema anterior est´a basada fundamentalmente en el hecho de que los polinomios de Berstein correspondientes a las funciones 1, x y x2 convergen uniformemente a estas funciones. Este atico ruso Korovkin, que consihecho fue destacado y utilizado por el matem´ gui´o de esta manera, una fruct´ıfera generalizaci´on del teorema de Weierstrass (Ver [6]). Nota. El teorema de Weierstrass se generaliza sin dificultad a un intervalo compacto [a, b] de R. En efecto: Sea f : [a, b] → R continua y sea g = f ◦ ϕ donde ϕ(t) = (b − a)x + a. La funci´on g est´a definida entonces en [0,1]. Si Bn (g) son los polinomios de Berstein para la funci´on g, es claro que la sucesi´on Bn (f ) = Bn (g) ◦ ϕ−1 converge uniformemente a f y se obtiene f´acilmente que n X ¡ ¢ 1 f (b − a)k/n + a (x − a)k (b − x)n−k . Bn (f )x = (b − a)n k=0
El teorema de Stone La generalizaci´on m´as importante del teorema de Weierstrass es la de Stone. Su teorema, conocido como el teorema de Stone-Weierstrass, caracteriza en t´erminos sumamente sencillos las ´algebras de funciones continuas que son uniformemente densas en C(X), para X compacto. Este es un teorema de gran inter´es, no s´olo pr´ actico, en cuanto que permite la construcci´on de nuevos ejemplos, sino tambi´en te´orico. Sin ´el no se concibe, actualmente, un estudio serio de los anillos de funciones continuas y su relaci´on con la topolog´ıa del espacio. En todo lo que sigue X denotar´a un espacio topol´ogico compacto. X sustituir´a as´ı al intervalo [0,1], que era el espacio marco para la secci´on anterior. Sobre C(X) consideraremos la norma de la convergencia uniforme. Necesitaremos algunas definiciones y resultados previos antes de establecer el teorema de Stone-Weierstrass: Definici´ on 3.2 Una familia F de funciones de C(X) se dice que separa puntos de X si para cada par de puntos distintos de X, x 6= y, existe
3.4
El Teorema de Stone-Weierstrass
35
alguna funci´on f ∈ F tal que f (x) 6= f (y). La familia F se dice que separa puntos fuertemente si para cada par de puntos distintos de X, x 6= y, y para cada par de n´ umeros reales α, β existe alguna funci´on f ∈ F tal que f (x) = α, f (y) = β. Lema 3.3 Todo subespacio vectorial F de C(X) que separa puntos de X y contiene las funciones constantes, separa puntos fuertemente. Demostraci´ on. Sean x, y dos puntos distintos de X, α, β dos n´ umeros reales y f ∈ F una funci´on que separe x de y. Vamos a probar que existe alguna funci´on de la forma λf + µ (y por tanto perteneciente a F) que toma el valor α en x y el valor β en y. Bastar´a resolver el sistema λf (x) + µ = α λf (y) + µ = β que tiene soluci´on u ´nica ya que f (x) 6= f (y). Concretamente resulta: λ=
α−β ; f (x) − f (y)
µ=α−
α−β f (x). f (x) − f (y)
Lema 3.4 (Kakutani-Stone) Si F es un ret´ıulo vectorial (i.e., F es un espacio vectorial que satisface la condici´on: si f, g ∈ F entonces sup(f, g) ∈ F e inf(f, g) ∈ F), que separa puntos de X y contiene a las funciones constantes, entonces F es uniformemente denso en C(X). Demostraci´ on. Sea ε > 0, f ∈ F y x ∈ X. Para cada t 6= x sea ft una funci´on de F tal que ft (t) = f (t); ft (x) = f (x). Tal funci´on existe puesto que F separa puntos fuertemente. Sea entonces Vt = {z : ft (z) > f (z) − ε}. Vt es un conjunto abierto que contiene, obviamente, a x y a t y sobre ´el la funci´on ft no sobrepasa, por debajo, en m´as de ε a la funci´on f . Cuando t recorre X \ {x} los conjuntos Vt constituyen un recubrimiento abierto de X que, como X es un espacio compacto, admitir´a un subrecubrimiento finito, es decir X = Vt1 ∪ Vt2 ∪ . . . ∪ Vtk . Consideremos la funci´on de F, gx = sup(ft1 , . . . , ftk ). Entonces si z es un punto de X que pertenece, por ejemplo, al abierto Vtj , se tiene: gx (z) ≥ ftj (z) > f (z) − ε.
36
El Teorema de Stone-Weierstrass
3.4
Se deduce, pues, que la funci´on gx no sobrepasa, por debajo, en m´ as de ε a la funci´on f en ning´ un punto z de X. Adem´as gx coincide con f en el punto x, es decir gx (x) = f (x). Procediendo con las funciones gx como hicimos antes con las funciones ft , o sea construyendo el recubrimiento de X mediante los abiertos Ux = {z : gx (z) < f (z) + ε} y extrayendo un subrecubrimiento finito, se obtiene una funci´ on g = inf(gx1 ,. . . , gxp ) de F que no sobrepasa a la funci´on f en m´as de ε, ni por abajo ni por arriba, es decir f (z) − ε < g(z) < f (z) + ε ,
∀z ∈ X.
Teorema 3.5 (Stone-Weierstrass) Todo ´algebra F de C(X) que separa puntos y contiene a las funciones constantes es uniformemente densa en C(X) (i.e., densa respecto a la norma de la convergencia uniforme en C(X)). on. Todo se reduce a probar que la clausura uniforme de un Demostraci´ ´algebra de C(X) es un ret´ıculo vectorial. Pues entonces, aplicando el teorema de Kakutani, cl(F) resultar´ıa ser un conjunto denso en C(X), lo que implicar´ıa, por ser cerrado, que cl(F) = C(X). Teniendo en cuenta las f´ormula sup(f, g) = 1/2(f + g + |f − g|) ,
inf(f, g) = 1/2(f + g − |f − g|),
y que en todo espacio normado la adherencia de un subespacio vectorial es un espacio vectorial, s´olo falta probar que (3.2)
f ∈ cl (F)
⇒
|f | ∈ cl (F).
Sea ε > 0 y consideremos g ∈ F tal que kg − f k < ε. Entonces tambi´en se verifica que k|g| − |f |k ≤ kg − f k < ε. Por lo tanto, para demostrar 3.2 s´olo ser´a preciso demostrar a su vez que g∈F
⇒
|g| ∈ cl (F).
Sea M tal que |g(x)| ≤ M para todo x ∈ X (g es continua sobre un compacto). La funci´on |g| es la composici´on de las funciones g
|·|
X → [−M, M ] → R x → g(x) → |g(x)|
3D
El Teorema de Stone-Weierstrass
37
Por el teorema de Weierstrass la funci´on t → |t| puede aproximarse uniformemente por polinomios, es decir ¯ que para ¯ ε > 0 existe un polinomio P (t) = a0 + a1 t + · · · + ak tk tal que ¯|t| − P (t)¯ ≤ ε, para todo t ∈ [−M, M ]. Como para cada x ∈ X, t = g(x) ∈ [−M, M ], se tiene que ¯ ¯ ¯|g(x)| − a0 + a1 g(x) + · · · + ak g k (x)¯ ≤ ε , ∀x ∈ X. Entonces, teniendo en cuenta que F es un ´algebra que contiene a las funciones constantes, la funci´on a0 + a1 g + · · · + ak g k ∈ F y por lo tanto la desigualdad anterior prueba que |g| ∈ cl (F). Corolario 3.6 Si K es un compacto de Rn , entonces los polinomios sobre K constituyen una familia uniformemente densa de C(K). Demostraci´ on. La familia P de polinomios sobre K est´a formada por las funciones del tipo X ai1 i2 ...in xi11 xi22 · · · xinn , (ik = 0, 1, . . .), finitas
luego es obvio que constituye un ´algebra que contiene a las funciones constantes. Adem´as separa puntos: Sean a, b son dos puntos distintos de K, supongamos, por ejemplo, que la coordenada k de a es diferente que la de b, es decir ak 6= bk , entonces el polinomio P (x) = xk toma un valor distinto en a que en b. Del teorema anterior se deduce, pues, que P es uniformemente denso en C(K).
Ejercicios 3A Obtener los polinomios de Berstein de la funci´on |x| sobre el intervalo [−1, 1]. 3B Demostrar que las siguientes familias de funciones de C[0, 1] son uniformemente densas en C[0, 1]: Las poligonales. Las funciones de clase C ∞ . Las funciones lipschitzianas. 3C Demostrar que el espacio vectorial de C[0, 1] generado por las funciones {enx : n ∈ Z}, es uniformemente denso en C[0, 1]. 3D Demostrar que, en C(R), los polinomios no s´olo “no son” uniformemente densos, sino que, adem´as, es imposible que una sucesi´on de polinomios pueda converger uniformemente en todo R a una funci´on que no sea un polinomio.
38
El Teorema de Stone-Weierstrass
3E
3E Demostrar que todo ´algebra E de funciones de C[0, 1], cerrada uniformemente, que contiene a las funciones constantes, es cerrada respecto a la composici´on con funciones continuas definidas sobre R, es decir f ∈ E ⇒ ϕ ◦ f ∈ E,
∀ϕ ∈ C(R).
(Por ejemplo, si f ∈ E entonces sen f ∈ E). 3F Probar que ni el ´algebra, ni el ret´ıculo de C[0, 1] generados por la funci´on h(x) = x es uniformemente denso en C[0, 1]. Calcular las clausuras respectivas. ¿Qu´e hip´otesis de los teoremas de densidad se incumplen? 3G Demostrar que la familia, L, de los polinomios de grado impar, es uniformemente densa en C[0, 1], a pesar de no constituir un ´algebra ni contener a las funciones constantes. 3H Demostrar que una condici´on necesaria para que una familia F de C(X) con X compacto sea uniformemente densa es que F separe puntos. Como aplicaci´on, v´ease que la familia F de polinomios que tienen todos sus t´erminos de grado par, no puede ser densa en C[−1, 1] ¿Y en C[0, 1]?. 3I Demostrar que si una funci´on f , continua sobre el intervalo [a, b], satisface la condici´on Z b xk f (x)dx = 0, ∀k ≥ 0, a
entonces f = 0.
Cap´ıtulo 4
Aplicaciones Lineales y Multilineales Continuas La conexi´on entre las estructuras vectorial y topol´ogica de los espacios normados, se pone claramente de manifiesto en el estudio de las aplicaciones lineales y n-lineales continuas. Los teoremas de caracterizaci´ on para estas aplicaciones, que veremos en este cap´ıtulo, son consecuencias importantes de esa conexi´on. Puesto que no es nuestro objetivo en este curso profundizar en el conocimiento de los espacios normados, nos limitaremos a considerar, adem´as de los teoremas de caracterizaci´on aludidos, s´olo algunas t´ecnicas de linealidad, que nos ser´an u ´tiles despu´es para el C´alculo Diferencial.
Aplicaciones lineales continuas on 4.1 Si E, F son dos espacios normados y T : E → F es una Proposici´ aplicaci´on lineal entre ellos, entonces son equivalentes: (a) T es continua. (b) T es continua en 0. (c) T est´a acotada en la bola unidad. (d) Existe una constante M tal que kT (x)k ≤ M kxk para todo x ∈ E. (e) T es lipschitziana. Demostraci´ on. (a) implica (b) trivialmente. (b) implica (c) La continuidad en 0 garantiza que kT (x)k ≤ 1 siempre que kxk ≤ δ, para alg´ un δ. Entonces, si x ∈ B[0, 1] se tiene kδxk ≤ δ y por tanto kT (δx)k = δ kT (x)k ≤ 1, es decir kT (x)k ≤ 1/δ = M. 39
40
Linealidad
4.1
(c) implica (d) Supongamos T acotada por M en B[0, 1] y sea x 6= 0 cualquiera. Entonces kT (x/kxk)k ≤ M y por tanto kT (x)k ≤ M kxk. (d) implica (e) Es evidente, debido a la linealidad de la aplicaci´ on T . (e) implica (a) Trivial. Ejercicio. Probar que los enunciados anteriores son tambi´en equivalentes un punto”. a “T es continua en alg´ Ejemplo 4.2 Toda aplicaci´on lineal entre espacios de dimensi´on finita es continua. En efecto, si T : Rn → F es una aplicaci´on lineal, entonces X P kT (x)k = kT ( xi ei )k ≤ |xi |kT (ei )k ≤ M kxk1 , donde ei = (0, .., 1, 0..0) y M = max{kT (ei )k : i = 1, 2, .., n}. Ejemplo 4.3 Sea E = C[0, 1] dotado de la norma de la convergencia uniforme, y consideremos la aplicaci´on T : E → R definida por Z 1 f (t) dt. T (f ) = 0
T es una aplicaci´on lineal trivialmente, y es continua pues Z Z 1 ¯ 1 ¯ ¯ ¯ |T (f )| = f (t) dt ≤ |f (t)| dt ≤ kf k∞ . 0
0
on definido entre los Ejemplo 4.4 Consideremos ahora el operador derivaci´ espacios C 1 [0, 1] y C[0, 1], D(f ) = f 0 . Esta aplicaci´on es claramente lineal, pero no es continua respecto a la norma de la convergencia uniforme, pues es bien conocido que aunque una funci´on (derivable) sea l´ımite uniforme de una sucesi´on de funciones derivables {fn }, la funci´on derivada f 0 no es en general el l´ımite (ni siquiera puntual) de la sucesi´on {fn0 }.
Norma de una aplicaci´ on lineal y continua Hemos demostrado que si T es una aplicaci´on lineal y continua entre los a acotada sobre la bola cerrada espacios normados E y F , entonces T est´ unidad, es decir el conjunto {kT (x)k : kxk ≤ 1} est´ a acotado superiormente. Si denotamos por kT k al extremo superior (la menor de las cotas superiores) de este conjunto, es inmediato comprobar que, de esta forma, definimos una
4.5
Linealidad
41
norma en el espacio vectorial L (E, F ) de las aplicaciones lineales y continuas de E en F . Abreviadamente escribiremos kT k = sup kT (x)k. kxk≤1
Por otra parte, si se observa la demostraci´ on de que (c) implica (d) en la proposici´on anterior, es claro que lo que en realidad se demuestra all´ı es que cualquier cota superior de T en la bola unidad vale tambi´en como constante en la desigualdad (d) y como constante de Lipschitz para T (y rec´ıprocamente, como f´acilmente se comprueba). Por tanto kT k es tambi´en la menor constante de Lipschitz para la aplicaci´on T . 4.5 Algunas de las propiedades elementales de la norma de una aplicaci´on lineal son las siguientes: (a) kT (x)k ≤ kT kkxk, (b) kT k ≤ M
⇔
∀x ∈ E. kT (x)k ≤ M kxk,
∀x.
(c) kT k = sup{kT (x)k : kxk ≤ 1} = sup{kT (x)k : kxk < 1} = sup{kT (x)k : kxk = 1}. (d) kT ◦ U k ≤ kT k kU k. En (a) s´olo dice que kT k es una constante de Lipschitz, lo cual forma parte de la definici´on de kT k. (b) kT k ≤ M , significa que M es una cota superior de T en la bola unidad, lo que, seg´ un establecimos antes, equivale a que M sea constante de Lipschitz para T o a que kT (x)k ≤ M kxk. (c) Hemos de demostrar que kT k es tambi´en la menor de las cotas superiores de cada uno de los conjuntos {kT (x)k : kxk = 1} ,
{kT (x)k : kxk < 1}.
Como kT k es cota superior del conjunto {kT (x)k : kxk ≤ 1}, es evidente que es tambi´en cota superior de cada uno de los conjuntos anteriores. Demostremos primero que kT k es tambi´en la menor cota superior de {kT (x)k : kxk = 1}, es decir que si “α es cota superior de {kT (x)k : kxk = 1} entonces kT k ≤ α”. Teniendo en cuenta la definici´on de kT k, para que esto suceda bastar´a probar que α es cota de {kT (x)k : kxk ≤ 1}. En efecto, si x 6= 0 y kxk ≤ 1 entonces x/kxk es un vector de norma 1, luego kT (x/kxk)k ≤ α ⇒ (1/kxk)kT (x)k ≤ α ⇒ kT (x)k ≤ αkxk ≤ α.
42
Linealidad
4.5
Veamos finalmente que kT k es tambi´en la menor cota superior de {kT (x)k : kxk < 1}, es decir que si “β es cota superior de {kT (x)k : kxk < 1} entonces kT k ≤ β”. Como antes, s´olo habr´a que demostrar que β es cota superior de {kT (x)k : kxk ≤ 1}. Sea x con kxk ≤ 1, entonces para cada 0 < ε < 1, se tiene que kεxk < 1, luego kT (εx)k ≤ β. Por otra parte, es claro que kT (x)k = lim kT (εx)k. ε→1−
De ambas hechos se deduce entonces que kT (x)k ≤ β, que era lo que quer´ıamos demostrar. (d) Aplicando dos veces (a) resulta k(T ◦ U )(x)k ≤ kT k kU k kxk, es decir que kT k kU k es una constante de Lipschitz para la aplicaci´on lineal T ◦ U , luego kT ◦ U k ≤ kT k kU k.
Aplicaciones multilineales continuas Para las aplicaciones multilineales continuas cabe hacer un estudio paralelo al anterior. As´ı pues, comenzaremos con un teorema de caracterizaci´ on para estas aplicaciones, para pasar despu´es a construir una norma can´onica en el espacio vectorial que ellas forman. Una aplicaci´on T : E1 × E2 × . . . × En → F se dice n-lineal cuando es lineal en cada coordenada, es decir T (. . . , λxi + µyi , . . .) = λ T (. . . , xi , . . .) + µ T (. . . , yi , . . .).
Proposici´ on 4.6 . Para una aplicaci´on n-lineal, las condiciones siguientes son equivalentes: (a) T es continua. (b) T es continua en 0. (c) T est´a acotada sobre la bola unidad. (d) Existe una constante M tal que kT (x1 , x2 , . . . , xn )k ≤ M kx1 k kx2 k . . . kxn k.
4.6
Linealidad
43
Demostraci´ on. Obviamente (a) implica (b). (b) implica (c). Por ser T continua en 0, existe un δ tal que kT (x1 , . . . , xn )k ≤ 1
si kx1 k ≤ δ, . . . , kxn k ≤ δ.
Por tanto, si y1 , . . . , yn son puntos de la bola unidad se tiene que kT (δy1 , . . . , δyn )k ≤ 1, lo que implica que kT (y1 , . . . , yn )k ≤ M =
1 . δn
(c) implica (d). Sean x1 , .., xn puntos distintos de 0, entonces por (c) se tiene que kT ( kxx11 k , . . . , kxxnn k )k ≤ M ⇒ kT (x1 , x2 , . . . , xn )k ≤ M kx1 k kx2 k . . . kxn k. (d) implica (a) Sea a = (a1 , .., an ) un punto cualquiera. Para probar que T es continua en a basta hacer tender hacia a mediante puntos x = (x1 , .., xn ) de un entorno acotado de a. As´ı puede suponerse kx1 k ≤ α, .., kxn k ≤ α, para alguna constante α. Entonces: kT (x1 , . . . , xn ) − T (a1 , . . . , an )k ≤ kT (x1 , x2 , . . . , xn ) − T (a1 , x2 , . . . , xn )k + kT (a1 , x2 , . . . , xn ) − T (a1 , a2 , x3 , . . . , xn )k + ...... + kT (a1 , . . . , an−1 , xn ) − T (a1 , a2 , . . . , an )k = kT (x1 − a1 ,x2 , . . . , xn )k + kT (a1 , x2 − a2 , x3 , . . . , xn )k +
...
+kT (a1 , . . . ,an−1 , xn − an )k ≤ M αn−1 (kx1 − a1 k + . . . + kxn − an k). De estas desigualdades se sigue que la funci´ on T es continua en a. Nota. A diferencia de las aplicaciones lineales, una aplicaci´ on n-lineal y continua no nula nunca es lipchitziana. Para simplificar, supongamos que T es una aplicaci´on bilineal y sean u, v dos vectores tales que T (u, v) 6= 0. Que T no es lipschitziana se deduce entonces de la igualdad T (λu, µv) = λµT (u, v) y de que la aplicaci´on bilineal de R × R en R, (λ, µ) → λµ, no es ni siquiera uniformemente continua (Ejercicio).
44
Linealidad
4.7
4.7 Como para el caso lineal, la proposici´on anterior permite definir de forma natural una norma en el espacio L n (E1 ×. . .×En , F ) de las aplicaciones n-lineales continuas de E1 × . . . × En en F : kT k = sup{kT (x1 , . . . , xn )k : kx1 k ≤ 1, . . . , kxn k ≤ 1}. Y, como antes, kT k es la menor de las constantes M para la que es cierta la desigualdad kT (x1 , x2 , . . . , xn )k ≤ M kx1 k kx2 k . . . kxn k, y por lo tanto se tiene kT (x1 , x2 , . . . , xn )k ≤ kT k kx1 k kx2 k . . . kxn k.
Ejercicios 4A Considerar C[0, 1], el espacio vectorial de las aplicaciones continuas sobre [0, 1] que toman sus valores en R, y sea T : C[0, 1] → C[0, 1] la aplicaci´on T (f )(x) = p(x) · f (x), donde p es una aplicaci´on fija de C[0, 1] . (a) Probar que T es una aplicaci´on lineal y continua, tanto si en C[0, 1] se tiene la norma de la convergencia uniforme como si se tiene la norma kf k1 = R1 |f (t)|dt. 0 (b) Obtener, para cada una de las normas anteriores, la norma de la aplicaci´on T , suponiendo que p sea la funci´on p(x) = x. ´ n (Para el apartado (b) en el caso que la norma sobre C[0, 1] sea k · k1 ). Indicacio R1 R1 Para conseguir una funci´on f tal que 0 |f (x)|dx y 0 x|f (x)|dx se diferencien poco, pensar que bastar´ıa con que f fuese distinta de 0 s´olo cerca del punto x = 1. 4B Sean E y F dos espacios normados. (a) Probar que la convergencia en el espacio L (E, F ) implica la convergencia puntual. (b) Si {Tn } es una sucesi´on convergente de L (E, F ) y {xn } es una sucesi´on convergente de puntos de E, probar que {Tn (xn )} es una sucesi´on convergente de puntos de F 4C Sea E un espacio normado y denotemos por E 0 al espacio normado L (E, K) (que se le denomina dual topol´ogico de E). Probar que E 0 es un espacio de Banach. 4D Sea E = C[a, b], dotado R xde la norma de la convergencia uniforme, y sea T : E → E la aplicaci´on T (f )(x) = a f (t)dt. (a) Probar que T es lineal y continua y hallar kT k.
4H
Linealidad
45
(b) Deducir de (a) el siguiente teorema: Si {fn } es una sucesi´on de funciones de clase C 1 sobre el intervalo [a, b] tal que 1. La sucesi´on {fn (a)} es convergente. 2. La sucesi´on de las derivadas {fn0 } converge uniformemente en [a, b] hacia alguna funci´on g. Entonces la sucesi´on {fn } converge uniformemente en [a, b] hacia una funci´on f de clase C 1 tal que f 0 = g. 4E
(a) Sean E, F espacios normados, S un subespacio vectorial denso de E y T una aplicaci´on lineal y continua de E en F . Probar que entonces kT k = kT|S k, donde con T|S se denota a la restricci´on de T a S. (b) Sea T : (R2 , k · k1 ) → (R2 , k · k1 ) la aplicaci´on lineal T (x, y) = (x + y, y). Determinar kT k y kT|S k, siendo S = {(x, y) : x = y}.
4F
(a) Sea E un espacio normado y T ∈ L (E, E). Probar que la imagen por T de la bola abierta unidad, T (B(0, 1)), est´a contenida en B(0, kT k). (b) Sea T la aplicaci´on lineal de R2 en R2 dada por la matriz µ ¶ 1 −2 2 −2 Comprobar que T (B(0, 1)) es un conjunto abierto, pero distinto de B(0, kT k). (c) Demostrar que si la imagen de la bola abierta unidad por una aplicaci´on T ∈ L (E, F ) es un conjunto abierto, entonces la aplicaci´on T es abierta e inversible. ´ n. La condici´on implica, en particular, que 0 es interior al subesIndicacio pacio vectorial Im T , luego Im T = E. (d) Dar un ejemplo de aplicaci´on T ∈ L (E, F ) tal que T (B(0, 1)) no sea un conjunto abierto.
4G Sea T la aplicaci´on lineal de R3 en R definida por T (x, y, z) = ax + by + cz. Demostrar que |a| + |b| + |c| √ 2 2 2 kT k = a +b +c max(|a|, |b|, |c|) seg´ un que consideremos en R3 respectivamente las normas k · k∞ , k · k2 , k · k1 . 4H Sea T la aplicaci´on lineal de (R2 , k · ki en (R2 , k · ki dada por la matriz µ ¶ a 1 1 a siendo a un n´ umero real arbitrario. Probar que para i = 1, 2 y ∞, kT k = 1 + |a|.
46
Linealidad
4I
4I Calcular la norma de: (a) La aplicaci´on lineal T (x, y) = 2x − y, seg´ un se considere en R2 la norma k · k1 o la norma eucl´ıdea. (b) La aplicaci´on lineal T : (R2 , k · k∞ ) → (R2 , k · k1 ) dada por la matriz µ ¶ 2 −1 1 1 (c) La aplicaci´on bilineal de (R2 , k · k1 ) × R en R, T (x, y, z) = (2x + y)z (d) La aplicaci´on lineal de C[0, 1] en R Z
Z
1/2
T (f ) =
1
f (x)dx − 0
f (x)dx 1/2
(Se supone en C[0, 1] la norma de la convergencia uniforme)
Parte II
C´ alculo Diferencial para Funciones de Varias Variables Reales
Cap´ıtulo 5
Derivadas Direccionales y Derivadas Parciales Iniciamos, con este cap´ıtulo, el c´alculo diferencial para funciones de varias variables reales. Aunque el marco de trabajo ser´ a, con frecuencia, el de los espacios normados, nuestro inter´es se centra en la generalizaci´on del concepto de derivada, y el estudio de sus propiedades, a las funciones de varias variables reales. Si esta extensi´ on se hace a las funciones definidas sobre un espacio normado, es para aprovechar las t´ecnicas ya estudiadas de los espacios normados y tambi´en porque, en ocasiones, necesitaremos de esta generalidad para poder establecer con comodidad algunos de los resultados cl´asicos del c´alculo diferencial. Si f es una funci´on real de una variable real, sabemos que f es derivable en el punto a si existe (5.1)
f (a + h) − f (a) . h→0 h
f 0 (a) = lim
Es obvio que el concepto anterior de funci´ on derivable puede extenderse, sin modificaci´on alguna, a las funciones de una sola variable, pero que toman valores en un espacio normado cualquiera F . En particular si f : A ⊂ R → Rp , es f´acil ver que f 0 (a) = (f10 (a), f20 (a), . . . , fp0 (a)). Esta f´ormula es igualmente v´alida si f es una funci´on de 1 variable que toma sus valores en un producto finito de espacios normados. Sin embargo, cuando f es una funci´on varias variables (o de “variable vectorial”), no podemos definir f 0 (a) como en (5.1) pues el “h” por el que habr´ıa que dividir no ser´ıa, en ese caso, elemento de un cuerpo. A´ un ser´ıa esto posible para las funciones de variable compleja, pero ´estas no son objeto de estudio en este curso. En lo sucesivo, por tanto, 49
50
Derivadas Parciales
5.1
el t´ermino variable habr´a que entenderlo como variable real, y del mismo modo un espacio normado ser´ a, siempre, un espacio normado real. No obstante, hemos de se˜ nalar que no existen diferencias esenciales entre un c´alculo diferencial real y un c´alculo diferencial complejo. Antes de proceder a la extensi´on definitiva del concepto de derivada a las funciones de varias variables, vamos a dedicar un primer cap´ıtulo a la introducci´on de dos conceptos b´asicos, el de derivada direccional y el de derivada parcial. Aunque pueda parecer exagerado, se podr´ıa afirmar que el C´alculo Diferencial en dimensi´on finita consiste en el c´alculo con derivadas parciales.
Derivadas direccionales o
Definici´ on 5.1 Sea f : A ⊂ E → F, a ∈ A y h 6= 0 un vector de E. Se dir´a que f es derivable en el punto a, siguiendo el vector h, si existe (5.2)
Dh f (a) = lim
t→0
f (a + th) − f (a) . t
Al elemento de F, Dh f (a), se le denominar´a derivada de f en a, siguiendo el vector h. Cuando f admite derivada siguiendo cualquier vector no nulo, se dir´a tambi´en que f admite derivadas en todos las direcciones. Sea f , para concretar, una funci´on de A ⊂ Rn en R. Consideremos la recta de ecuaci´on x = a + th, t ∈ R (recta que pasa por a y tiene a h como vector director). Entonces f (a + th) son los valores que toma f sobre esta recta, y por tanto, por analog´ıa con los l´ımites direccionales, podr´ıa pensarse en denominar al l´ımite 5.2, como la derivada de la funci´on f en a siguiendo la recta x = a+th. Esto ser´ıa correcto, de no ser porque para cada vector director de esa recta puede resultar un valor distinto para Dh f (a). Concretamente, es f´acil ver que Dλh f (a) = λDh f (a). Debido a esto, se ha convenido en destacar por cada direcci´on dos de estas derivadas: Dh f (a) y D−h f (a), siendo h uno de los dos vectores de esa direcci´on y norma 1, denominando “derivada direccional en a” al valor |Dh f (a)| = |D−h f (a)|. (S´olo hablaremos de derivada direccional en el sentido anterior para funciones escalares varias variables reales, y la norma que se utilizar´a en ese caso ser´a la norma eucl´ıdea).
5.4
Derivadas Parciales
51
5.2 La existencia de derivadas en todas las direcciones, ser´a una condici´on necesaria para que una funci´on sea derivable en un punto. Pero ´esta condici´on es muy d´ebil. Es posible, por ejemplo, que una funci´on verifique esto y no sea ni siquiera continua. Ejemplo (Una funci´on no continua en un punto, que admite en ese punto derivadas en todas las direcciones). f (x, y) =
x2 y si (x, y) 6= (0, 0); x4 + y 2
f (0, 0) = 0.
Si tomamos v = (h, k) y aplicamos la definici´on para calcular la derivada en el punto (0,0) siguiendo el vector v, resulta Si k 6= 0, Si k = 0,
f (th, tk) t3 h2 k h2 = lim 4 4 = t→0 t→0 (t h + t2 k 2 )t t k Dv f (0, 0) = 0. Dv f (0, 0) = lim
Sin embargo, esta funci´on no es continua en (0,0), pues aunque los l´ımites iterados y direccionales existen todos y valen 0, los l´ımites siguiendo las curvas y = mx2 son todos diferentes.
Derivadas parciales o
Definici´ on 5.3 Sea f : A ⊂ Rn → F y sea a ∈ A. Se dir´a que f admite derivada parcial j-´esima en a, si f es derivable en a, siguiendo el vector ej = (0, ..0, 1, 0, .., 0). Emplearemos la notaci´on (∂f /∂xj )(a) o, tambi´en, Dj f (a), para designar a la derivada parcial j-´esima de f en a. Es decir: f (a + tej ) − f (a) ∂f (a) = Dej f (a) = lim t→0 ∂xj t f (a1 , . . . , aj + hj , . . . , an ) − f (a) = lim hj →0 hj f (a1 , . . . , aj−1 , xj , aj+1 , . . . , an ) − f (a) = lim . xj →aj xj − aj De las igualdades anteriores resulta: Proposici´ on 5.4 La funci´on f admite derivada parcial j-´esima en a si, y s´olo si, la aplicaci´on g : xj → f (a1 , .., aj−1 , xj , aj+1 , .., an ) es derivable en aj , siendo (∂f / ∂xj )(a) = g 0 (aj ).
52
Derivadas Parciales
5.4
De lo que ya hemos visto, se deduce que la existencia de derivadas parciales en un punto, respecto a cualquier ´ındice, no implica la continuidad en ese punto. Asimismo tampoco puede derivarse la existencia de otras derivadas direccionales. Por ejemplo, la funci´ on f (x, y) =
x2
xy si (x, y) 6= (0, 0); + y2
f (0, 0) = 0.
admite derivadas parciales en (0,0), respecto a las dos variables, sin embargo, en ese punto no es, ni continua, ni admite otras derivadas direccionales que las parciales. El concepto de derivada parcial es, a pesar de la aparente descalificaci´on que ejemplos como el anterior suponen, el m´ as importante del c´alculo diferencial en dimensi´on finita. Vamos a ver a continuaci´on un resultado, que se enuncia exclusivamente en t´erminos de derivadas parciales, y que constituye un aut´entico teorema de valor medio para funciones de varias variables no necesariamente derivables (en estos momentos a´ un no sabemos qu´e es una funci´on derivable de varias variables). Precisaremos de un sencillo lema de car´acter geom´etrico. Lema 5.5 Sean x0 , x1 , . . . , xp un n´ umero finito de puntos de Rn alineados, (es decir existe un vector “u” tal que x1 = x0 + t1 u, x2 = x0 + t2 u, . . . , xp = x0 + tp u), y supongamos que 0 ≤ t1 ≤ t2 ≤ . . . ≤ tp . Entonces kxp − x0 k =
p X
kxi − xi−1 k,
i=1
cualquiera que sea la norma que consideremos en Rn . on. Es inmediato comprobar que Demostraci´ p X
kxi − xi−1 k = kuk(t1 + (t2 − t1 ) + . . . + (tp − tp−1 )) = tp kuk,
i=1
kxp − x0 k = tp kuk.
Escribiremos x0 ≤ x1 ≤ . . . ≤ xp para denotar que los puntos x0 , x1 , . . . , xp est´an en las condiciones del lema.
5.6
Derivadas Parciales
53
Teorema 5.6 Sea U un conjunto abierto convexo de Rn y f : U → Rp una funci´on que admite derivadas parciales respecto a cualquier ´ındice en cada punto de U . Supongamos adem´as que existe M > 0 tal que ¯ ¯ ¯ ¯ ∂fi ¯ ≤ M, ∀x ∈ U ; i = 1, . . . , p ; j = 1, . . . , n. ¯ (x) ¯ ¯ ∂xj Entonces f es lipschitziana en U . M´as precisamente, para todos x, y ∈ U , se tiene (5.3)
kf (x) − f (y)k∞ ≤ M kx − yk1 .
Demostraci´ on. Puede suponerse que f es una funci´on escalar, pues si el teorema fuese cierto para funciones escalares, entonces para una funci´ on vectorial, f = (f1 , f2 , ..., fp ), se tendr´ıa tambi´en: kf (x) − f (y)k∞ = max |fi (x) − fi (y)| ≤ M kx − yk1 . 1≤i≤p
Veamos, en primer lugar, que la desigualdad 5.3 se verifica sobre cada n-cubo cerrado contenido en U . Por definici´on, un n-cubo (cerrado) es un producto cartesiano de n intervalos (cerrados) de R de la misma longitud. Es decir, un conjunto de la forma C = [c1 , d1 ] × . . . × [cn , dn ],
con d1 − c1 = d2 − c2 = . . . = dn − cn .
Por tanto un punto z = (zi ) est´a en C si y s´olo si ci ≤ zi ≤ di , para todo i. Supongamos C ⊂ U y tomemos dos puntos x, y de C. Entonces f (x) − f (y) =f (x1 , x2 , . . . , xn ) − f (y1 , x2 , . . . , xn ) + f (y1 , x2 , . . . , xn ) − f (y1 , y2 , x3 , . . . , xn ) .................................................. + f (y1 , y2 , . . . , yn−1 , xn ) − f (y1 , . . . , yn ). Evidentemente cada uno de los nuevos puntos que utilizamos en esta descomposici´on pertenecen a C, y en cada paso los dos puntos que aparecen s´olo se diferencian en una de las coordenadas. Entonces, la existencia de derivadas parciales en cada punto de C, nos permite aplicar en cada uno de los pasos anteriores el teorema de valor medio para funciones de una variable, de lo que resulta que f (x) − f (y) =
X ∂f (y1 , . . . , yj−1 , θj , xj+1 , . . . , xn )(xj − yj ), ∂xj
54
Derivadas Parciales
luego |f (x) − f (y)| ≤ M
n X
5.6
|xj − yj | = M kx − yk1 .
j=1
Veamos ya que la desigualdad anterior se verifica en todo el abierto convexo U : Sean x, y dos puntos de U . Puesto que el segmento K = [x, y] es un compacto contenido en U, K dista una cantidad positiva de U c . Sea entonces 0 < λ < d∞ (K, U c ). Es evidente que cualquiera que sea el punto z de K, el n-cubo cerrado, B∞ [z, λ], est´a totalmente contenido en U. Sea u el vector unitario en la direcci´on del vector y − x, es decir u=
y−x , ky − xk∞
y consideremos los puntos de K, x0 = x, x1 = x0 + λu, x2 = x0 + 2 λu, . . . , xp = y, donde p es el primer natural para el que x0 +p λu ≥ y. Es claro entonces que cada dos puntos consecutivos de los anteriores se encuentran en un mismo n-cubo contenido en U (basta observar que ellos est´an a una distancia λ uno del otro). Aplicando la etapa anterior, se tiene entonces que |f (x) − f (y)| ≤
n−1 X i=0
|f (xi ) − f (xi+1 )| ≤ M
n−1 X
kxi − xi+1 k1 = M kx − yk1 .
i=0
Corolario 5.7 Sea U un conjunto abierto de Rn y f : U → Rp una funci´on que admite derivadas parciales en U localmente acotadas. Entonces f es localmente lipschitziana en U. on. Para cada x de U , existe una bola centrada en x, B(x, rx ), Demostraci´ tal que en ella todas las derivadas parciales est´an acotadas por el mismo n´ umero Mx . Teniendo en cuenta que las bolas son conjuntos convexos, del teorema anterior se sigue que kf (u) − f (v)k∞ ≤ Mx ku − vk1 ,
∀u, v ∈ B(x, rx ).
Corolario 5.8 Si todas las derivadas parciales de una funci´ on f : U ⊂ Rn → p R son nulas en U y U es conexo, entonces f es constante.
5D
Derivadas Parciales
55
Demostraci´ on. Puesto que todas las derivadas parciales est´an acotadas por 0, del corolario anterior se deduce que f es localmente constante. En particular f es continua en U . Resulta por tanto que, si a ∈ U , el conjunto A = {x ∈ U : f (x) = f (a)} es abierto y cerrado de U , luego A = U ya que U es conexo.
Ejercicios 5A Estudiar continuidad y existencia de derivadas parciales para las funciones ( ln(1 + (x − y)2 ) si x − y > 1 1. f (x, y) = x − y + ln 2 si x − y ≤ 1 p 2. f (x, y) = x4 + sen 2 xy 3 x si (x, y) 6= (0, 0) 2 3. f (x, y) = x + y 2 0 si (x, y) = (0, 0) ( sen x−sen y si x 6= y x−y 4. f (x, y) = cos x si x = y 5B (a) Probar que si k · k es una norma cualquiera sobre Rn , entonces la aplicaci´on x → kxk es una aplicaci´on lipschitziana que no admite derivadas direccionales en 0. (b) Sea U = {(x, y) ∈ R2 : x2 + y 2 < 1} \ {0} × [0, 1], y consideremos la funci´on f definida sobre U por ( y 2 si x > 0 e y ≥ 0 f (x, y) = 0 en otro caso Probar que U es un abierto conexo (no convexo) sobre el que f es continua, admite derivadas parciales acotadas, pero no es lipschitziana. 5C (a) Probar que si f es una funci´on lipschitziana sobre un abierto U de Rn y admite derivadas parciales, respecto a cualquier ´ındice, en todo punto de U , entonces sus derivadas parciales est´an acotadas en U . (b) Estudiar si la funci´on f (x, y, z) = sen(x2 − y 2 + z 2 ) es lipschitziana o localmente lipschitziana en R3 . 5D (a) Probar que toda aplicaci´on lipschitziana f : A ⊂ E → F, donde E y F son espacios de Banach, se extiende a una aplicaci´on lipschitziana sobre A.
56
Derivadas Parciales
5D
(b) Sean A, B dos conjuntos no vac´ıos de un espacio normado, con B ⊂ A, y supongamos que cada uno de los conjuntos B, A \ B y A es convexo. Probar entonces que una aplicaci´on f es lipschitziana sobre A si y s´olo si es lipschitziana sobre B y sobre A \ B. (c) Estudiar si las aplicaciones f (x, y) = sen |x − y|,
g(x, y, z) = sen |x2 + y 2 − z 2 |
son lipschizianas o localmente lipschitzianas. 5E Consideremos la funci´on ( f (x, y) =
x sen ln(x2 + y 2 ) si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0)
Probar que f es una funci´on continua en todo punto, que admite derivadas parciales acotadas en R2 \ (0, 0) ¿Es lipschitziana? 5F (a) Sea U un abierto conexo de Rn y supongamos que f, g : U → Rp son dos funciones tales que, en cada punto x ∈ U , ∂fi /∂xj (x) = ∂gi /∂xj (x), cualesquiera que sean los ´ındices i, j. Probar entonces que las funciones f y g se diferencian en una constante. (b) Determinar las funciones f : R2 → R que satisfacen las ecuaciones ∂f (x, y) = 1 ; ∂x
∂f (x, y) = y, ∂y
∀(x, y).
5G Sea I un intervalo abierto de R, U un abierto de Rn y f : (t, x) ∈ I×U → f (t, x) una funci´on escalar. Demostrar que si ∂f (t, x) = 0, ∂t
∀(t, x) ∈ I × U
entonces f no depende de t, es decir f (t1 , x) = f (t2 , x) cualesquiera que sean t1 , t2 , x.
Cap´ıtulo 6
La Diferencial de Fr´ echet Es bien conocido que una funci´on de una variable f es derivable en un punto a si y s´olo si su gr´afica admite una recta tangente (no vertical) en el punto (a, f (a)). Queremos que una funci´on de varias variables que sea derivable en un punto tenga una propiedad geom´etrica an´aloga. Previamente debemos formalizar la noci´on de tangencia.
Tangencia on 6.1 Un vector w de un espacio normado G se dir´a tangente al Definici´ conjunto M ⊂ G en el punto c ∈ M , si existe alg´ un arco γ : [t1 , t2 ] → G satisfaciendo: i)γ(t) ∈ M para cada t, ii) existe t0 ∈ (t1 , t2 ) tal que γ(t0 ) = c, iii) γ es derivable en t0 y γ 0 (t0 ) = w. En particular si el arco de curva γ : [t1 , t2 ] → G es derivable en t0 ∈ (t1 , t2 ), entonces γ 0 (t0 ) es un vector tangente a la curva en c = γ(t0 ). Geom´etricamente, un vector tangente a M en c es pues un vector tangente a alguna curva trazada sobre M pasando por c (ver ejercicio 6A para una definici´on m´as general de vector tangente tomada del libro de Schwartz [26].) Al conjunto de vectores tangentes a M en el punto c ∈ M se le denotar´ a por Tc (M ). 6.2 La definici´on anterior nos va a permitir dar una interpretaci´ on geom´etrica de la derivada de una funci´on en un punto siguiendo un vector: Sea E, F espacios normados, f : A ⊂ E → F , y M = {(x, f (x)) : x ∈ A} o
su gr´afica. Para a ∈ A y h 6= 0 un vector de E, consideremos la curva 57
58
La Diferencial de Fr´ echet
6.2
γ(t) = (a + th, f (a + th)). γ es una curva contenida en M que pasa por c = (a, f (a)), adem´as, puesto que ¡ f (a + th) − f (a) ¢ , γ 0 (0) = h, lim t→0 t es obvio, que f es derivable en a siguiendo el vector h si y s´olo si γ es derivable en 0. Se deduce que si f es derivable en a siguiendo el vector h entonces γ 0 (0) = (h, Dh f (a)) es un vector tangente a M en el punto c.
Diferenciabilidad en un punto o
Definici´ on 6.3 Sea f : A ⊂ E → F, a ∈ A. Se dice que f es diferenciable en a (en el sentido de Fr´echet), si existe una aplicaci´on lineal y continua L ∈ L (E, F ) tal que (6.1)
f (x) − [f (a) + L(x − a)] = 0. x→a kx − ak lim
Para funciones de una variable, la definici´on anterior coincide con la de funci´on derivable en un punto. En efecto, supongamos que f es una funci´on de una variable (con valores en un espacio normado F ) derivable en a, entonces f (x) − f (a) f (x) − f (a) − f 0 (a)(x − a) = f 0 (a) ⇒ lim =0 x→a x→a x−a x−a f (x) − f (a) − f 0 (a)(x − a)] ⇒ lim = 0. x→a |x − a| lim
Puesto que L(h) = f 0 (a)h es una aplicaci´on lineal de R en F , de esto se deduce que f es diferenciable, en el sentido de la definici´on anterior. Rec´ıprocamente, puesto que las aplicaciones lineales de R en F son de la forma h → m · h, la condici´on de diferenciabilidad dice en este caso que lim
x→a
f (x) − [f (a) + m(x − a)] = 0, |x − a|
lo cual equivale, sin m´as que invertir las implicaciones anteriores, a que f sea derivable en a y m = f 0 (a).
6.4
La Diferencial de Fr´ echet
59
Vamos a ver ahora y en los cap´ıtulos sucesivos que la definici´on que hemos adoptado para funci´on diferenciable satisface todas las expectativas que cab´ıa esperarse de una buena generalizaci´on del concepto de derivada. Adem´as, en la proposici´on siguiente, demostraremos que la ambig¨ uedad que parece indicar la expresi´on “existe alguna aplicaci´ on L ∈ L (E, F )”, es s´olo aparente. Esto ya sab´ıamos que era as´ı para funciones de una variable: Si f es de una variable y diferenciable en a, la u ´nica aplicaci´on lineal que satisface la condici´on 6.1 es L : h → f 0 (a)h. Ahora veremos que esto es cierto en todo caso. Proposici´ on 6.4 Si f : A ⊂ E → F es una aplicaci´on diferenciable en el o
punto a ∈ A, entonces: (a) f es derivable en a en todas las direcciones. (b) La aplicaci´on h → Dh f (a) es lineal y continua. (c) La aplicaci´on del apartado anterior es la u ´nica aplicaci´on L de L (E, F ) para la que f (a + h) − f (a) − L(h) lim = 0. h→0 khk (d) Si M es la gr´afica de f y c = (a, f (a)), el conjunto Tc (M ) es un subespacio vectorial de E×F isomorfo a E (que no contiene vectores de la forma (0, v) con v 6= 0). Precisamente, Tc (M ) = {(h, Dh f (a)) : h 6= 0} ∪ {(0, 0)}. on. (a) Sea h un vector no nulo de E. Entonces, de la diferenDemostraci´ ciabilidad de f en a se sigue que existe L ∈ L (E, F ) tal que f (a + th) − f (a) − tL(h) = 0, t→0 |t|khk lim
lo que equivale a que lim
t→0
f (a + th) − f (a) − tL(h) = 0. |t|
Como f (a + th) − f (a) − tL(h) =0 ⇔ t→0 |t| f (a + th) − f (a) ⇔ lim = L(h), t→0 t lim
f (a + th) − f (a) − tL(h) =0 t→0 t lim
60
La Diferencial de Fr´ echet
6.4
se deduce, pues, que f es derivable en a, siguiendo cada vector h y que la aplicaci´on L no puede ser otra m´as que la que lleva h en Dh f (a), lo cual demuestra (b) y tambi´en (c). Veamos finalmente que tambi´en se satisface (d): puesto que f es derivable en a en todas las direcciones, ya hemos visto que para cada h 6= 0 el vector (h, Dh f (a)) ∈ Tc (M ). Rec´ıprocamente, sea w = (h, v) ∈ E × F un vector tangente a M en c. Nosotros queremos probar que w = (h, Dh f (a)). Puesto que w ∈ Tc (M ), debe existir una curva γ : [−δ, δ] → E × F contenida en M, que pasa por c y tiene a w como vector tangente. Puede suponerse pues que γ(t) = (x(t), f (x(t)); γ(0) = (x(0), f (x(0)) = (a, f (a)); (x(0)) γ 0 (0) = (x0 (0), limt→0 f (x(t))−f ) = (h, v). As´ı que hemos de ver que t lim
t→0
f (x(t)) − f (x(0)) = Dx0 (0) f (a) = lim 1/tDx(t)−x(0) f (a) t→ t
equivalentemente que f (x(t)) − f (x(0)) − Dx(t)−x(0) f (a) = 0. t→0 t
(6.2)
lim
En efecto, observemos que si x(t) = x(0) = a entonces la expresi´on ° ° ° f (x(t)) − f (x(0)) − Dx(t)−x(0) f (a) ° ° ° ° ° t toma el valor 0, y en otro caso se puede escribir as´ı: kf (x(t)) − f (x(0)) − Dx(t)−x(0) f (a)k kx(t) − x(0)k . kx(t) − x(0)k |t| De la diferenciabilidad de f en a y la acotaci´on de kx(t)−x(0)k en un entorno |t| de 0, se deduce entonces (6.2). Despu´es de lo visto, es claro ya que la aplicaci´on h → Dh f (a) establece un isomorfismo de espacios vectoriales entre E y Tc (M ). En particular, esto significa que si f es una funci´on escalar n variables reales diferenciable en un punto a, entonces el conjunto de vectores tangentes a su gr´afica en el punto (a, f (a)) es un hiperplano vectorial de Rn+1 . La proposici´on anterior admite claramente la siguiente lectura: Proposici´ on 6.5 Una aplicaci´on f : A ⊂ E → F es diferenciable en el o
punto a ∈ A, si y s´olo si satisface las tres condiciones siguientes:
6.7
La Diferencial de Fr´ echet
61
(i) f es derivable en a en todas las direcciones. (ii) La aplicaci´on h → Dh f (a) es lineal y continua. (iii) f (a + h) − f (a) − Dh f (a) = 0. h→0 khk lim
Nota. Una aplicaci´on que satisface las condiciones (i) y (ii) se dice diferenciable en a en el sentido de Gateaux. (Un amplio estudio de la diferencial de Gateaux puede verse en el libro de Flett [12]). o
Definici´ on 6.6 Si f : A ⊂ E → F es diferenciable en el punto a ∈ A, a la u ´nica aplicaci´on lineal de E en F , que satisface la definici´on 6.3, la llamaremos diferencial de la funci´on f en a, y la denotaremos como Df (a). Por la proposici´on anterior, Df (a) es la aplicaci´on definida por Df (a)h = Dh f (a). En dimensi´on finita, es decir si E = Rn , la f´ormula anterior puede completarse con la expresi´on correspondiente en t´erminos de derivadas parciales, pudi´endose obtener tambi´en un resultado an´alogo al de la proposici´on 6.5: o
Proposici´ on 6.7 Sea f : A ⊂ Rn → F y a ∈ A, entonces (a) Si f es diferenciable en a entonces f admite derivadas parciales en a respecto a cualquier ´ındice y (6.3)
n X ∂f Df (a)h = (a)hj . ∂xj j=1
(b) Si f admite derivadas parciales en a respecto a cualquier ´ındice y P ∂f (a)hj f (a + h) − f (a) − nj=1 ∂x j = 0, (6.4) lim h→0 khk entonces f es diferenciable en a. Demostraci´ on. (a) Si f es diferenciable en a entonces admite, seg´ un hemos visto, derivadas en todas las direcciones, en particular f tiene derivadas siguiendo los vectores ej = (0, . . . , 0, 1, 0, . . . , 0), que son, por definici´on, las
62
La Diferencial de Fr´ echet
derivadas parciales en a. Sea h = can´onica, entonces Df (a)h =
n X
P
hj Df (a)ej =
j=1
6.7
hj ej un vector de Rn , escrito en la base n X j=1
n X ∂f hj Dej f (a) = (a)hj . ∂xj j=1
(b) Si f satisface 6.4, entonces f es diferenciable en a, ya que la aplicaci´on lineal y continua ∂f L : h −→ (a)hj ∂xj verifica la condici´on de diferenciabilidad 6.1. Si F es tambi´en de dimensi´on finita, i.e., F = Rk , y denotamos por f1 , .., fk a sus funciones coordenadas, la f´ormula 6.3 puede escribirse matricialmente como sigue: ∂f1 ∂f1 ∂f1 h1 ∂x1 (a) ∂x2 (a) . . . ∂xn (a) ∂f h2 ∂f2 ∂f2 2 (a) (a) . . . (a) × Df (a)h = Dh f (a) = ∂x2 ∂xn ∂x1 h3 . ... ... ... ... · · · ∂fk ∂fk ∂fk (a) (a) . . . (a) hn ∂x1 ∂x2 ∂xn La matriz anterior es conocida como matriz jacobiana, en honor al matem´atico Jacobi. Df (a) es, pues, la aplicaci´on lineal cuya matriz asociada es la matriz jacobiana. Nota. Ya sabemos que en el caso de que f sea una funci´ on de una variable, su diferencial en a es la aplicaci´on Df (a)h = f 0 (a)h. Y aunque en todo lo que sigue los t´erminos, diferencial de f en a y derivada de f en a, los consideraremos sin´onimos, y emplearemos la notaci´ on Df (a) para referirnos a ellos, conservaremos, no obstante, la notaci´ on f 0 (a) para referirnos, en el caso de que f sea de una variable, a f (a + h) − f (a) , h→0 h
f 0 (a) = lim
por lo que se tiene que f 0 (a) = Df (a) · 1. La siguiente proposici´on establece que la diferenciabilidad es invariante frente a isomorfismos de espacios normados. Dos espacios normados E1 y E2
6.9
La Diferencial de Fr´ echet
63
se dir´an isomorfos si se puede establecer entre ellos un isomorfismo Φ de espacios vectoriales que tambi´en es homeomorfismo. Del car´acter lineal y continuo de Φ y Φ−1 se deduce f´acilmente la existencia de dos constantes a, b > 0 tales que akxk ≤ kΦ(x)k ≤ bkxk para todo x Proposici´ on 6.8 Consideremos el diagrama conmutativo siguiente f1
A1 ⊂ E1 −−−−→ Φy
F1 yΨ
f2
A2 ⊂ E1 −−−−→ F2 donde Φ y Ψ denotan isomorfismos entre los espacios Ei y Fi respectivao
mente. Entonces f1 es continua (diferenciable) en el punto a1 ∈ A1 si y s´olo o
o
si f2 es continua (diferenciable) en a2 = Φ(a1 ) ∈ A2 = Φ(A1 ). Demostraci´ on. Puesto que f2 = Ψ ◦ f1 ◦ Φ−1 es claro que si f1 es continua en a1 entonces f2 es continua en a2 = Φ(a1 ). Supongamos que f1 diferenciable en a1 . Para probar que f2 diferenciable en a2 , bastar´a comprobar que f2 (a2 + h2 ) − f2 (a2 ) − (Ψ ◦ Df1 (a1 ) ◦ Φ−1 )(h2 ) = 0. h2 →0 kh2 k lim
Si sustituimos aqu´ı f2 por Ψ ◦ f1 ◦ Φ−1 , h2 por Φ(h1 ) y tenemos en cuenta que h1 → 0 si y s´olo si Φ(h1 ) → 0, es f´acil ver que la condici´on a demostrar es que lim
h1 →0
Ψ(f1 (a1 + h1 ) − f1 (a1 ) − Df1 (a1 )h1 ) =0 kΦ(h1 )k
y, por la continuidad de Ψ, que lim
h1 →0
f1 (a1 + h1 ) − f1 (a1 ) − Df1 (a1 )h1 = 0. kΦ(h1 )k
Pero esto es consecuencia directa de que f1 es diferenciable en a1 y de que por ser Φ isomorfismo existe una constante k > 0 tal que kΦ(h1 )k ≥ kkh1 k. Proposici´ on 6.9 Una funci´on diferenciable en un punto a es continua en ese punto. De hecho, existe alg´ un entorno V de a y alguna constante M ≥ 0 tal que si x ∈ V , entonces kf (x) − f (a)k ≤ M kx − ak.
64
La Diferencial de Fr´ echet
6.9
Demostraci´ on. Por la diferenciabilidad de f en a existe δ > 0 tal que si kx − ak ≤ δ entonces kf (x) − f (a) − Df (a)(x − a)k ≤1 kx − ak ⇒kf (x) − f (a) − Df (a)(x − a)k ≤ kx − ak. Sea V = B(a, δ) y x ∈ V , entonces kf (x) − f (a)k ≤ kf (x) − f (a) − Df (a)(x − a)k + kDf (a)(x − a)k ≤ (1 + kDf (a)k)kx − ak.
Ejercicios 6A (Una definici´ on m´ as general de vector tangente) Sea M un subconjunto de un espacio normado G, c ∈ M y v ∈ G. Se dir´a que v es tangente a M en c, si existe una sucesi´on {zn } de puntos de M y una sucesi´on de escalares {λn > 0} tal que: zn → c, λn (zn − c) → v. Se denotar´a por Tc (M ) al conjunto de vectores tangentes a M en c. (a) Probar que un vector no nulo v es tangente a M en c si y s´olo si existe una sucesi´on {zn } ⊂ M, zn 6= c tal que zn → c,
zn − c → v. kzn − ck
(b) Sea γ : (a, b) ⊂ R → G una curva contenida en M que pasa por el punto c ∈ M . Para concretar, sea c = γ(t0 ). Probar que si γ es derivable en t0 entonces el vector v = γ 0 (t0 ) es un vector tangente a M en c. (c) Sean E, F espacios normados y f : A ⊂ E → F una aplicaci´on continua y o
derivable siguiendo un vector h en el punto a ∈ A. Probar que el vector (h, Dh f (a)) es un vector tangente en el punto c = (a, f (a)) a la gr´afica de la funci´on f . (e) Sea f : A ⊂ E → F una funci´on diferenciable en un punto a y M su gr´afica: 1. Demostrar que el conjunto de los vectores tangentes a M en el punto c = (a, f (a)) es el subespacio vectorial isomorfo a E, Tc (M ) = {(h, Df (a)h) : h ∈ E}. 2. Demostrar que el vector v es tangente a M en c = (a, f (a)) si y s´olo si v es tangente en c a alguna curva contenida en M que pasa por c.
6G
La Diferencial de Fr´ echet
65
6B Considerar la funci´on f (x, y) = x2 − 2y. (a) (b) (c) (d)
Probar que f es una funci´on diferenciable en el punto (0,1). Obtener la ecuaci´on del plano tangente a la gr´afica de f en el punto (0,1,-2). Calcular la derivada de f en (0,1) siguiendo el vector v = (2, 3). Encontrar alguna curva sobre la gr´afica de la funci´on f , que pase por el punto (0,1,-2) y tenga como vector tangente en ese punto a (2, 3, D(2,3) f (0, 1)). (e) ¿En qu´e direcci´on es m´axima la derivada direccional de f en (0,1)? Calcularla.
6C Estudiar si entre todos los planos de R3 que tienen como vector normal a (1/2,1,1) existe alguno que sea tangente a la funci´on f (x, y) = xsen y. 6D Estudiar la existencia de derivadas direccionales en (0,0) para las funciones p p f1 (x, y) = 3 x3 + y 3 ; f2 (x, y) = 3 x3 + y 4 ¿Son G-diferenciables en (0,0)? ¿diferenciables? ´ n: Para estudiar la diferenciabilidad de f2 en (0,0), puede resultar u Indicacio ´til saber que, si r es un n´ u mero real > 0 y denotamos por g a la funci´ o n g(u) = √ √ 3 u + r − 3 u, entonces g es no negativa y alcanza un m´aximo absoluto en el punto u = −r/2. 6E Supongamos que f es una funci´on escalar de dos variables, continua en el punto (0,0), y sea g(x, y) = xf (x, y). Probar que g es diferenciable en (0,0). 6F Sea f (x, y) = (x2 , xy). Calcular kDf (0, 1)k cuando se considera en R2 la norma k · k1 . o
6G Sean E, F espacios normados, f : A ⊂ E → F y a ∈ A. (a) Si f es diferenciable en a, probar que f (a + h) − f (a) lim = h→0 khk
( 0 No existe
si Df (a) = 0 si Df (a) 6= 0
(b) Probar que si f admite derivadas en a siguiendo cualquier vector y (∗)
lim
h→0
kf (a + h) − f (a)k = α 6= 0 khk
entonces kDh f (a)k = αkhk, para todo h ∈ E. (c) Deducir de (b) que si dim E > dim F y f satisface (∗) entonces f no puede ser diferenciable en a. ´ n. De ser diferenciable en a, existir´ıa alg´ Indicacio un vector no nulo en el n´ ucleo de Df (a).
66
La Diferencial de Fr´ echet
6G
(d) Si f es diferenciable en a, entonces son equivalentes: i) Existe limh→0
kf (a + h) − f (a)k khk
ii) kDf (a)hk = kDf (a)kkhk para todo h ∈ E. (e) Considerar las funciones p f1 (x, y) = x2 + y 2 ;
(p x2 + y 2 p f2 (x, y) = − x2 + y 2
si x ≥ 0 si x < 0
Probar que ambas funciones satisfacen la condici´on (∗) en (0,0), cuando se considera la norma eucl´ıdea en R2 . Ninguna de las dos funciones son diferenciables en (0,0), pero mientras que la funci´on f1 no admite derivadas direccionales, la funci´on f2 s´ı. (f) Sea f la funci´on f (x, y) = (sen x − cos y, cos x + sen y) Calcular kDf (π/3, π/3)k respecto a la norma eucl´ıdea y comprobar que f es una funci´on del tipo estudiado en (d). 6H Probar que la funci´on f (x) = x3/2 sen 1/x, no es lipschitziana en ning´ un entorno de 0.
f (0) = 0 es derivable en 0, pero
6I Estudiar continuidad, existencia de derivadas parciales, existencia de derivadas direccionales y diferenciabilidad en el origen de coordenadas, para cada una de las funciones siguientes. (Supondremos que todas estas funciones toman el valor 0 en el origen) x4 + x2 y 2 + y 5 x2 + y 4 4 x + y4 3. f (x, y) = 2 x + y2 ln(1 + xy) 5. f (x, y) = p x2 + y 2 (x2 + y 3 )(x2 + y 2 ) 7. f (x, y) = x2 + y 4 1. f (x, y) =
6J
x3 − y 3 x2 + y 2 sen (x3 + xyz) 4. f (x, y) = 2 x + y2 + z2 ln(1 + xy) 6. f (x, y) = p 3 x2 + y 2 xy p 8. f (x, y) = x2 + x2 + y 2 2. f (x, y) =
1. Estudiar la diferenciabilidad de la funci´on f (x, y) = sen |x2 − y 2 |, en los puntos (0,0) y (1,1). 2. Estudiar la diferenciabilidad en (0,0) de la funci´on f (x, y) = |xy|α , seg´ un los valores de α ≥ 0.
6K
La Diferencial de Fr´ echet
67
3. Estudiar continuidad, existencia de derivadas parciales, existencia de derivadas direccionales y diferenciabilidad en los puntos (0,0) y (0,1), para la funci´on (p x4 + sen 2 (xy) si x ≥ 0 p f (x, y) = 4 2 − x + sen (xy) si x < 0 4. Considerar la funciones f (x, y) = f (x, y) =
xy(x2 + y 2 )3/4 ; + y 2 )1/2 + x2
y 2 (x2
y(x2 + y 2 )3/2 ; (x2 + y 2 )2 + y 2
f (0, 0) = 0
f (0, 0) = 0.
Probar, utilizando coordenadas polares, que son funciones continuas y G-diferenciables en (0,0), pero no diferenciables en dicho punto. 6K Demostrar que la funci´on x5 − y 3 f (x, y) = p ; x6 + y 4
f (0, 0) = 0
es diferenciable en (0,0). ´ n: Probar que Indicacio 0≤
p
x6 + y 4 − y 2 ≤ |x|3 ,
∀x, y.
Cap´ıtulo 7
Funciones de Clase C1 Vamos a considerar ahora la extensi´ on a varias variables del concepto de 1 funci´on de clase C . Cada vez que establezcamos una propiedad de las funciones diferenciables, trataremos de establecer, paralelamente, el mismo resultado para las aplicaciones de clase C 1 .
Preliminares Definici´ on 7.1 Sea f : U ⊂ E → F donde U un conjunto abierto de E. Diremos que f es de clase C 1 sobre A ⊂ U , lo que denotaremos por f ∈ C 1 (A), si (i) f es diferenciable en cada punto x de A. (ii) La aplicaci´on Df : x → Df (x) es continua en A. Aunque no se exprese explicitamente, siempre que escribamos f ∈ C 1 (A) supondremos que f est´a definida sobre alg´ un conjunto abierto que contiene a A. Veremos en este cap´ıtulo un teorema de caracterizaci´on para estas aplicaciones, en t´erminos de derivadas parciales. Para establecer con comodidad dicho teorema y tambi´en otros posteriores, necesitaremos algunos resultados previos. Proposici´ on 7.2 Sea f : A ⊂ E → F1 × F2 × . . . × Fk . Es decir f = o
(f1 , f2 , ..., fk ) y sea a ∈ A . Entonces, f es diferenciable en a (f ∈ C 1 (A)) si y s´olo si cada funci´on coordenada fi es diferenciable en a (fi ∈ C 1 (A)). Se verifica entonces que Df (a)h = (Df1 (a)h, Df2 (a)h, ..., Dfk (a)h). 69
Funciones de Clase C1
70
7.2
Demostraci´ on. Supongamos que cada fi es diferenciable en a, entonces teniendo en cuenta la proposici´ on 2.11 0= ¶ µ f1 (a + h) − f1 (a) − Df1 (a)h fk (a + h) − fk (a) − Dfk (a)h , . . . , lim lim h→0 h→0 khk khk µ ¶ f1 (a + h) − f1 (a) − Df1 (a)h fk (a + h) − fk (a) − Dfk (a)h = lim ,..., h→0 khk khk f (a + h) − f (a) − (Df1 (a)h, . . . , Dfk (a)h) = lim , h→0 khk y puesto que la aplicaci´ on h → (Df1 (a)h, Df2 (a)h, . . . , Dfk (a)h) es lineal y continua (est´a en L (E, F1 × . . . × Fk )), se deduce que f es diferenciable en a, siendo Df (a)h = (Df1 (a)h, Df2 (a)h, ..., Dfk (a)h). Rec´ıprocamente, si f es diferenciable en a entonces lim
h→0
f (a + h) − f (a) − Df (a)h = 0, khk
lo que implica, usando de nuevo 2.11, que lim
h→0
fi (a + h) − fi (a) − πi (Df (a)h) = 0, khk
i = 1, 2, . . . , k
donde πi es la proyecci´ on sobre Fi . Esto significa que fi es diferenciable en a, y Dfi (a) = πi ◦ Df (a). Veamos por u ´ltimo que f es de clase C 1 si y s´olo si cada fi es de clase 1 C , es decir que la aplicaci´on Df : x → Df (x) es continua si y s´ olo si la aplicaci´on x → (Df1 (x), . . . , Dfk (x)) es continua. En efecto, kDf (x) − Df (a)k ≤ ε ⇔ k(Df (x) − Df (a))hk ≤ εkhk, ∀h °¡ ¢° ⇔ ° (Df1 (x) − Df1 (a))h, . . . , (Dfk (x) − Dfk (a))h ° ≤ εkhk, ⇔ k(Dfj (x) − Dfj (a))hk ≤ εkhk,
∀h
∀h, ∀j = 1 . . . , k
⇔ kDfj (x) − Dfj (a)k ≤ ε, ∀j = 1 . . . , k. Nota. Obs´ervese que a pesar de la f´ormula Df (x)h = (Df1 (x)h, Df2 (x)h, ..., Dfk (x)h), las aplicaciones Dfi no son las funciones coordenadas de la aplicaci´on Df , pues Df (x) 6= (Df1 (x), Df2 (x), ..., Dfk (x)) ya que Df (x) ∈ L (E, F1 × . . . × Fk ) mientras que (Df1 (x), Df2 (x), ..., Dfk (x)) ∈
7.3
Funciones de Clase C1
71
Qk
ıa lineal entre estos dos i=1 L (E, Fi ). Sin embargo, existe una isometr´ espacios normados que aplica Df (x) sobre (Df1 (x), Df2 (x), ..., Dfk (x)) (la prueba de esto est´a impl´ıcita en la demostraci´ on anterior), y por tanto que Df es continua si y s´olo si, para cada i, Dfi es continua, se puede obtener como consecuencia de la proposici´on 6.8
Condici´ on suficiente de diferenciabilidad o
Teorema 7.3 Sea f : A ⊂ Rn → Rp , y a ∈ A. Si f admite derivadas parciales, respecto a cualquier ´ındice, en un entorno del punto a y ´estas son aplicaciones continuas en a, entonces f es diferenciable en a. Demostraci´ on. Observemos antes de nada que la hip´otesis, las derivadas parciales de f son continuas en a, es equivalente a que esto mismo suceda para las funciones coordenadas, ya que es evidente que ¡ ∂f1 ¢ ∂fp ∂f (x) = (x), . . . , (x) . ∂xj ∂xj ∂xj Puesto que suponemos que las aplicaciones ∂fi ∂fi :x→ (x) ∂xj ∂xj est´an definidas en a, para que f sea adem´as diferenciable se tendr´a que verificar que P ∂f (a)(xj − aj ) f (x) − f (a) − nj=1 ∂x j (7.1) lim = 0. x→a kx − ak Para ello vamos a aplicar el teorema 5.6 a la funci´on n X ∂f g(x) = f (x) − f (a) − (a)(xj − aj ). ∂xj j=1
Es claro que
∂gi ∂fi ∂fi (x) = (x) − (a). ∂xj ∂xj ∂xj
Por tanto, aplicando el hecho de que las derivadas parciales de f son continuas en a, se tiene que para todo ε > 0 existe alg´ un δ > 0 tal que si x ∈ V = B[a, δ] entonces ¯ ∂gi ¯ ¯ ∂fi ¯ ∂fi ¯ (x)¯ = ¯ (x) − (a)¯ ≤ ε, ∀i, j. ∂xj ∂xj ∂xj
Funciones de Clase C1
72
7.3
Se deduce, pues, que la funci´on g cumple en V las hip´otesis del teorema 5.6, luego es lipschitziana en V . En particular, si x ∈ V kg(x) − g(a)k∞
n X ° ° ∂f ° (a)(xj − aj )°∞ ≤ εkx − ak1 , = f (x) − f (a) − ∂xj j=1
que, obviamente, significa que f satisface la condici´ on 7.1. Nota. Obs´ervese que del hecho de que la funci´on g de la demostraci´on anterior sea lipschitziana en V , se deduce que P ∂f f (x) − f (y) − nj=1 ∂x (a)(xj − yj ) j lim = 0. kx − yk (x,y)→(a,a) Una funci´on que satisface la condici´ on anterior se dice que es estrictamente diferenciable en a. Por lo tanto, se ha demostrado que si f es una funci´on cuyas derivadas parciales son continuas en a, entonces f es algo m´as de diferenciable en a, es estrictamente diferenciable en a. En particular, es f´acil ver que f es, en ese caso, lipschitziana en alg´ un entorno de a. Corolario 7.4 Sea f : U ⊂ Rn → Rp con U un abierto, entonces f es de clase C 1 sobre U si, y s´olo si, admite derivadas parciales continuas en U . Demostraci´ on. Si f admite derivadas parciales continuas en U , por el resultado anterior, se tiene que f es diferenciable en cada punto de U. Para que f ∈ C 1 (U ) s´olo falta ver que la aplicaci´on Df es continua en U . Trabajemos, para concretar, con la norma producto de Rn : kDf (x) − Df (a)k = sup kDf (x)h − Df (a)hk khk≤1 n n ° ∂f °X ° ¡ ∂f ¢ ° X ∂f ∂f ° = sup ° (x) − (a) hj ° ≤ (x) − (a)°. ∂xj ∂xj ∂xj ∂xj |hj |≤1 j=1
j=1
De las desigualdades anteriores se deduce trivialmente que si las aplicaciones son continuas en a, entonces tambi´en es continua en a la aplicaci´on Df. Rec´ıprocamente, si Df es continua en a, entonces ° ∂f ° ∂f ° (x) − (a)° = k(Df (x) − Df (a))ej k ∂xj ∂xj ≤ kDf (x) − Df (a)kkej k = kDf (x) − Df (a)k, lo que expresa que la aplicaci´ on ∂f /∂xj es continua en a.
7.6
Funciones de Clase C1
73
Corolario 7.5 Sea U un abierto de Rn y f : U ⊂ Rn → Rp una funci´on de clase C 1 sobre U , entonces 1. f es localmente lipschitziana. 2. f es lipschitziana sobre cada compacto K ⊂ U . on. Teniendo en cuenta que las derivadas parciales de f est´ an Demostraci´ acotadas sobre cada bola cerrada contenida en U , del corolario 5.7 resulta entonces que f es localmente lipschitziana. Supongamos ahora que K es un compacto contenido en U y sea 0 < λ < d(K, U c ). (Utilizaremos, para situarnos en el marco del teorema 5.6, la norma k · k1 en Rn y la norma k · k∞ en Rp ) Denotemos por K1 al conjunto on de λ, es claro que K1 = {x ∈ U : d(x, K) ≤ λ}. De acuerdo con la elecci´
∪ B(y, λ) ⊂ K1 ⊂ U.
y∈K
Adem´as es f´acil probar que K1 es un compacto (ejercicio). Sea entonces α una cota superior de f en K, y β una cota superior para las derivadas parciales de f en K1 . Entonces si x, y ∈ K puede suceder: 1. kx − yk < λ. En este caso y ∈ B(x, λ) ⊂ K1 , luego kf (x) − f (y)k ≤ βkx − yk.
2. kx − yk ≥ λ, entonces kf (x) − f (y)k ≤ 2α ≤ 2α
kx − yk . λ
Luego f es lipschitziana sobre K de constante M = max(β, 2α/λ).
Algunos ejemplos Vamos a dar, para terminar, algunos ejemplos de funciones de clase C 1 utilizados con frecuencia en demostraciones de tipo te´ orico. Ejemplos 7.6 Las siguientes aplicaciones son de clase C 1 : (a) Las aplicaciones constantes. (b) Las aplicaciones lineales y continuas. (c) Las aplicaciones bilineales y continuas.
Funciones de Clase C1
74
7.6
En efecto, (a) Las funciones constantes son aplicaciones de clase C 1 . Si f (x) = α, para todo x, entonces f (x + h) − f (x) 0 = = 0, khk khk lo cual implica que f es diferenciable en x y Df (x) = 0 para cada x. Luego Df es la aplicaci´on id´enticamente nula y, por tanto, f es de clase C 1 . (b) Toda aplicaci´on lineal y continua es de clase C 1 . Supongamos, en primer lugar, que T es una forma lineal sobre Rn , es decir T (x1 , . . . , xn ) = a1 x1 + a2 x2 + . . . + an xn . Obviamente T admite derivadas parciales en cada punto, concretamente: ∂T (x) = aj , ∂xj
∀x.
Y, puesto que ´estas son aplicaciones constantes, son continuas, luego por el corolario 7.4, T es una aplicaci´ on de clase C 1 . Observemos que la matriz jacobiana de DT (x) no es otra que la matriz que representa a la aplicaci´on lineal T , por lo que necesariamente DT (x) = T . Todo lo anterior es v´alido para una aplicaci´on lineal y continua cualquiera, es decir que si T ∈ L (E, F ), entonces T ∈ C 1 (E) y DT (x) = T , para todo x de E. En efecto: T (x + h) − T (x) − T (h) T (x) + T (h) − T (x) − T (h) = lim = 0, h→0 h→0 khk khk lim
lo que significa que T es diferenciable en x y DT (x) = T . As´ı pues DT es una aplicaci´on constante: la aplicaci´on que lleva cada x de E en el elemento T de L (E, F ), por tanto T ∈ C 1 (E). (c) Sea ahora T una aplicaci´on bilineal y continua. Para fijar ideas supongamos en primer lugar que T es la aplicaci´on producto de dos n´ umeros reales, es decir la aplicaci´on (x, y) → xy. Se tiene entonces que
∂T = y; ∂x
∂T = x. ∂y
Luego las aplicaciones ∂T /∂x y ∂T /∂y son continuas, lo que implica que T es de clase C 1 y DT (x, y)(h, k) = hy + xk = T (h, y) + T (x, k) .
Funciones de Clase C1
7.6
75
En el caso general, si T es una aplicaci´on bilineal y continua de E × F en G, vamos a probar que T es diferenciable en cada punto y que DT (x, y)(h, k) = T (h, y) + T (x, k). (Obs´ervese que la aplicaci´on (h, k) → T (h, y) + T (x, k) es una aplicaci´ on lineal y continua de E × F en G) En efecto, T ((x, y) + (h, k)) − T (x, y) − T (h, y) − T (x, k) k(h, k)k (h,k)→(0,0) lim
= = lim
lim
(h,k)→(0,0)
T (x + h, y + k) − T (x, y) − T (h, y) − T (x, k) k(h, k)k
T (x, y) + T (h, y) + T (x, k) + T (h, k) − T (x, y) − T (h, y) − T (x, k) k(h, k)k =
T (h, k) = 0. (h,k)→(0,0) k(h, k)k lim
La u ´ltima igualdad es consecuencia de que kT (h, k)k ≤ kT k khk kkk ≤ kT k k(h, k)k2 . Finalmente comprobemos que DT es continua: Observemos primero que la aplicaci´on DT resulta ¡en este caso! lineal (Comprobarlo). Por lo tanto, para demostrar que es continua podemos utilizar la proposici´ on 4.1, que caracteriza a las aplicaciones lineales continuas. kDT (x, y)k =
sup
kDT (x, y)(h, k)k
k(h,k)k≤1
=
sup
kT (h, y) + T (x, k)k
k(h,k)k≤1
≤
sup
kT k khk kyk + kT k kxk kkkk
k(h,k)k≤1
≤ kT k(kxk + kyk) ≤ 2 kT k k(x, y)k.
Funciones de Clase C1
76
7.7
Ejemplo 7.7 Sean E, F y G espacios normados. Una aplicaci´on bilineal y continua con la que nos encontraremos algunas veces es la aplicaci´on de L (E, F ) × L (F, G) en L (E, G) (T, U ) → U ◦ T
Ejercicios 7A Sean f, g dos funciones escalares no nulas de una variable. Probar que la funci´on h(x, y) = f (x) · g(y) es de clase C 1 si y s´olo si f y g son de clase C 1 . 7B Probar que todas las funciones siguientes son diferenciables en (0, 0) Estudiar si tambi´en satisfacen la condici´on suficiente de diferenciabilidad en (0, 0) ¿Cu´ales son de clase C 1 ? 1. f (x, y) =
x3 , x2 + y 4
3. f (x, y) = xy cos
f (0, 0) = 0
1 , x2 + y 2
f (0, 0) = 0
p x4 + y 4 ( sen xy si xy ≥ 0 4. f (x, y) = xy si xy < 0 2. f (x, y) =
7C Sea T una aplicaci´on n-lineal y continua de E1 × · · · × En en F . Probar que T es de clase C 1 y obtener la f´ormula DT (x1 , . . . , xn )(h1 , . . . , hn ) = T (h1 , x2 , . . . , xn ) + T (x1 , h2 , x3 , . . . , xn ) + . . . + T (x1 , . . . , xn−1 , hn )
Cap´ıtulo 8
Reglas Formales de Derivaci´ on En este cap´ıtulo extenderemos a las funciones de varias variables las reglas del c´alculo de derivadas para las funciones de una variable: regla de la cadena, f´ormula de Leibnitz, etc. Los mismos enunciados de los teoremas e incluso las mismas f´ormulas, van a seguir siendo formalmente v´alidos para las funciones de varias variables. Proposici´ on 8.1 Si f, g son funciones diferenciables en un punto a (de clase C 1 ), entonces tambi´en es diferenciable en a (de clase C 1 ) la funci´on λf + µg. Y se verifica que D(λf + µg)(a) = λDf (a) + µDg(a).
on. Es consecuencia inmediata de la definici´on de funci´on difeDemostraci´ renciable (funci´on de clase C 1 ) y de la unicidad de la diferencial en un punto.
Regla de la cadena Proposici´ on 8.2 Sean E, F y G espacios normados y f : A ⊂ E → F , g : B ⊂ F → G. o
o
(i) Si f es diferenciable en a ∈ A y g es diferenciable en el punto f (a) ∈ B, entonces la aplicaci´on u = g ◦ f es diferenciable en a y se tiene que (8.1)
D(g ◦ f )(a) = Dg(f (a)) ◦ Df (a) 77
(Regla de la Cadena).
78
Reglas Formales de Derivaci´ on
8.2
(ii) Si B ⊃ f (A), f ∈ C 1 (A) y g ∈ C 1 (B), entonces u ∈ C 1 (A). Demostraci´ on. Observemos en primer lugar que por ser f continua en a y f (a) interior a B, existe alg´ un entorno V de a tal que f (V ) ⊂ B, y por tanto la aplicaci´on u = g ◦ f est´ a definida sobre V . Veamos que u es diferenciable en a: Sea ε > 0. Puesto que f es diferenciable en a, existe δ1 > 0 tal que si khk ≤ δ1 kf (a + h) − f (a) − Df (a)hk ≤ εkhk. De igual modo, por la diferenciabilidad en el punto f (a) de la aplicaci´ on g, existe η > 0 tal que si kkk ≤ η kg(f (a) + k) − g(f (a)) − Dg(f (a))kk ≤ εkkk. Por u ´ltimo, y debido tambi´en a la diferenciabilidad de f en a (ver 6.9), existen δ2 > 0 y α > 0 tal que si khk ≤ δ2 entonces kf (a + h) − f (a)k ≤ αkhk ≤ η. Luego, para khk ≤ δ = min(δ1 , δ2 ) y k = f (a + h) − f (a), se tiene k(g ◦ f )(a + h) − (g ◦ f )(a) − (Dg(f (a)) ◦ Df (a))hk ≤ kg(f (a) + k) − g(f (a)) − Dg(f (a))kk + kDg(f (a))(f (a + h) − f (a) − Df (a)hk ≤ εkkk + εkDg(f (a))kkhk ≤ (α + kDg(f (a))k)εkhk. Esto demuestra que si khk ≤ δ k(g ◦ f )(a + h) − (g ◦ f )(a) − (Dg(f (a)) ◦ Df (a))hk ≤ M εkhk, donde M = α + kDg(f (a))k, es decir que u = g ◦ f es diferenciable en a y que Du(a) = Dg(f (a)) ◦ Df (a). Supongamos ahora que f y g son de clase C 1 . Seg´ un lo anterior la aplicaci´on u es diferenciable en cada punto de A y se tiene que Du(x) = Dg(f (x)) ◦ Df (x). Si consideramos entonces la descomposici´on de Du x → (Dg(f (x)), Df (x)) → Dg(f (x)) ◦ Df (x), resulta que Du es continua por ser composici´on de dos aplicaciones continuas, la primera de ellas continua por serlo sus funciones coordenadas, (Dg) ◦ f y Df , y la segunda por tratarse de una aplicaci´on bilineal del tipo considerado en 7.7.
8.4
Reglas Formales de Derivaci´ on
79
Corolario 8.3 (T. del valor medio) Sea [a, b] un segmento de Rn contenido en el abierto U . Supongamos que f : U ⊂ Rn → Rp es una aplicaci´on continua en cada punto de [a, b] y diferenciable en (a, b) y que existe un n´ umero real M tal que kDf (x)k ≤ M,
∀x ∈ (a, b),
entonces kf (b) − f (a)k ≤ M kb − ak.
Demostraci´ on. S´olo daremos aqu´ı la demostraci´on para el caso en que la norma utilizada en Rp sea la norma producto. Para el caso general, ver el anexo. Consideremos la aplicaci´on λ : [0, 1] ⊂ R → Rn definida por λ(t) = a + t(b − a). Esta aplicaci´on es claramente continua en [0,1] y derivable en (0,1), siendo λ0 (t) = b − a. Denotemos entonces por fi a la i-´esima funci´ on coordenada de f y sea gi = fi ◦ λ; gi es una funci´on escalar de una variable, que por ser composici´on de dos funciones derivables es, seg´ un lo anterior, derivable en cada punto de (0,1), siendo su derivada, gi0 (t) = Dfi (λ(t))(b−a). Se deduce pues que (8.2)
|gi0 (t)| ≤ kDfi (λ(t)kkb − ak.
Teniendo en cuenta que si la norma utilizada en Rp es k k∞ , entonces kDfi (x)k ≤ kDf (x)k (ejercicio), de 8.2 se deduce que |gi0 (t)| ≤ kDfi (λ(t)kkb − ak ≤ kDf (x)kkb − ak ≤ M kb − ak; aplicando ahora el teorema de valor medio para funciones escalares de una variable, se tiene que kf (b) − f (a)k∞ = max |fi (b) − fi (a)| = max |gi (1) − gi (0)| ≤ M kb − ak.
8.4 A la sencillez formal de la regla de la cadena ser´a preciso adjuntar, a efectos de c´alculo, su reformulaci´ on en t´erminos de derivadas parciales. Es claro que, en dimensi´on finita, lo que expresa la f´ormula, Du(a) = Dg(f (a)) ◦ Df (a), es que la matriz jacobiana de la aplicaci´on u en el punto a es el producto de las matrices jacobianas de la aplicaci´on g en el punto
80
Reglas Formales de Derivaci´ on
8.4
f (a) por la matriz jacobiana de la f en a, es decir, si f : A ⊂ Rn → Rp y g : B ⊂ Rp → Rk , entonces: ∂g1 ∂g1 ∂f1 ∂f1 ∂u1 ∂u1 · · · · · · ··· ∂y1 ∂yp ∂x1 ∂x1 ∂xn ∂xn ∂g ∂g ∂f2 ∂u2 2 ∂f2 ∂u2 2 ··· · · · ··· = × ∂x1 ∂y1 ∂yp ∂x1 ∂x ∂x n n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ∂u ∂gk ∂fp ∂fp ∂uk ∂gk k ··· ··· ··· ∂x1 ∂xn (a) ∂y1 ∂yp f(a) ∂x1 ∂xn (a) Esta igualdad matricial nos permite escribir entonces lo que podemos llamar la regla de la cadena para derivadas parciales: p
X ∂gi ∂ui ∂fs (a) = (f (a)) (a). ∂xj ∂ys ∂xj s=1
F´ ormula de Leibnitz on 8.5 Sean f, g : A ⊂ E → R aplicaciones diferenciables en Proposici´ un punto a (de clase C 1 en A), entonces su producto, f · g, es tambi´en diferenciable en a (de clase C 1 en A) y se tiene que D(f · g)(a) = f (a)Dg(a) + g(a)Df (a) (F´ ormula de Leibnitz).
Demostraci´ on. Si escribimos s = f · g como composici´on de las funciones x → (f (x), g(x)) → f (x)·g(x), para probar que s es diferenciable en a (de clase C 1 en A), s´olo hemos de ver que la aplicaci´on T de R2 en R, (u, v) → u·v, es de clase C 1 . Pero esto ya lo sabemos, puesto que T es una aplicaci´on bilineal. La f´ormula de Leibnitz se obtiene ya sin m´as que aplicar la regla de la cadena. En efecto, si denotamos por φ a la aplicaci´on x → (f (x), g(x)), entonces Ds(a)h = D(T ◦ φ)(a)h = (DT (φ(a)) ◦ Dφ(a))h = DT (f (a), g(a)) (Df (a)h, Dg(a)h) = T (Df (a)h, g(a)) + T (f (a), Dg(a)h) = g(a)Df (a)h + f (a)Dg(a)h = (g(a)Df (a) + f (a)Dg(a))h.
8.7
Reglas Formales de Derivaci´ on
81
Se tiene pues que D(f · g)(a) = f (a)Dg(a) + g(a)Df (a). Proposici´ on 8.6 Sean f, g : A ⊂ E → R aplicaciones diferenciables en un punto a (de clase C 1 en A). Si g(a) 6= 0 (g no se anula en ning´ un punto de A), entonces la aplicaci´on h = f /g es diferenciable en a (de clase C 1 en A). Se tiene entonces que (8.3)
D(f /g)(a) =
g(a)Df (a) − f (a)Dg(a) . g(a)2
Demostraci´ on. Basta ver que si g(a) 6= 0 (g no se anula en ning´ un punto de A), entonces la aplicaci´on 1/g es diferenciable en a (de clase C 1 en A). Escribiendo 1/g como la composici´on de las aplicaciones x → g(x) →
1 , g(x)
eso se sigue de que la aplicaci´on de R en R, t → 1/t, es de clase C 1 en R \ {0}. La f´ormula 8.3 se obtiene de la correspondiente f´ormula para funciones de una variable y de la f´ormula de Leibnitz. Nota. No consideraremos aqu´ı la diferenciabilidad de la inversa de una funci´on, ya que el estudio de funciones inversas ser´ a el objeto de otro cap´ıtulo posterior. 8.7 Los resultados anteriores nos permitir´an construir una extensa familia de funciones de clase C 1 . Empecemos, por ejemplo, con los polinomios: Como se sabe un polinomio de varias variables es una aplicaci´on de la forma X f (x1 , x2 , . . . , xn ) = ai1 ...in xi11 . . . xinn , ik = 0, 1, . . . finita
Puesto que la suma y el producto de aplicaciones de clase C 1 es una aplicaci´on de clase C 1 , es evidente que los polinomios son de clase C 1 ya que las aplicaciones (x1 , x2 , . . . , xn ) → ai1 ...in (x1 , x2 , . . . , xn ) → xik lo son, por ser, respectivamente, aplicaciones constantes y lineales.
82
Reglas Formales de Derivaci´ on
8.7
Aplicando 8.6, las funciones racionales (cocientes de dos polinomios) son de clase C 1 sobre el conjunto de puntos donde el polinomio del denominador no se anula. Por u ´ltimo, mediante la composici´on de las funciones anteriores con funciones de una variable de clase C 1 , se obtienen nuevas funciones de varias variables y de clase C 1 : sen (x2 + y 2 ),
log(1 + x2 + y 2 ),
1 , 1 + cos2 (xyz)
...
ANEXO: El teorema del valor medio La versi´on m´as usual de los teoremas de valor medio para funciones de una variable, establece que 8.8 Si f es una funci´on continua en un intervalo compacto [a, b] de R y derivable en el intervalo abierto (a, b), entonces existe alg´ un punto intermedio a < ξ < b tal que f (b) − f (a) = f 0 (ξ)(b − a). Este teorema puede extenderse textualmente a las “funciones escalares”de alido para funciones vectoriales (ver varias variables, pero, en cambio, no es v´ ejercicio 8H). Para las funciones vectoriales a´ un puede obtenerse un teorema de valor medio que implica, en particular, la f´ormula conocida como de los incrementos finitos: kf (b) − f (a)k ≤ sup kDf (x)kkb − ak. x∈(a,b)
Teorema 8.9 (Funciones Escalares) Si f es una funci´on escalar definida sobre un conjunto A de un espacio normado, continua sobre el segmento [a, b] ⊂ A y derivable en (a, b) siguiendo el vector b − a, entonces existe ξ ∈ (a, b) tal que f (b) − f (a) = D(b−a) f (ξ).
on. Sea g(t) = f (a + t(b − a)), t ∈ [0, 1]. Esta aplicaci´on es Demostraci´ continua en [0, 1], ya que g = f ◦ λ, donde λ es la aplicaci´on de [0, 1] en [a, b]
8.10
Reglas Formales de Derivaci´ on
83
definida por λ(t) = a + t(b − a), que es claramente continua. Adem´as es derivable en cada punto t de (0,1), pues g(t + s) − g(t) f (a + (t + s)(b − a)) − f (a + t(b − a)) = lim s→0 s→0 s s = D(b−a) f (a + t(b − a)). lim
Aplicando a g el teorema 8.8, se deduce que existe alg´ un punto t0 en (0,1) tal que f (b) − f (a) = g(1) − g(0) = g 0 (t0 ) = D(b−a) f (ξ),
ξ = a + t0 (b − a).
Nota. Si en el teorema anterior se supone f diferenciable en (a, b), entonces este teorema establece que existe un punto ξ en el segmento (a,b) tal que f (b) − f (a) = Df (ξ)(b − a), f´ormula que en dimensi´on finita puede escribirse f (b) − f (a) =
X ∂f (ξ)(bj − aj ). ∂xj
Para el teorema de valor medio para funciones vectoriales usaremos la siguiente versi´on del teorema de valor medio para funciones de R en R: Lema 8.10 Sea [a, b] un intervalo compacto de R y f : [a, b] → R una aplicaci´on continua que admite derivada a la derecha en cada punto de (a, b). Se tiene que 1. Si f+0 (t) ≥ 0 para todo t ∈ (a, b), entonces la funci´on f es no decreciente en [a, b]. 2. Si |f+0 (t)| ≤ M para todo t ∈ (a, b), entonces |f (b) − f (a)| ≤ M (b − a). on. 1. Supongamos primero que f+0 (t) > 0 para todo t ∈ (a, b). Demostraci´ Bastar´a probar que f (a) ≤ f (b). Supongamos, por el contrario, que f (b) < f (a) y sea c un punto intermedio entre f (a) y f (b), es decir f (a) > c > f (b). Sea tc el mayor de los puntos t ∈ [a, b] para los que f (t) = c. Debido a la continuidad de f en [a, b], es claro que tal punto existe y pertenece a (a, b) y, de acuerdo con su definici´on, se tiene que: u > tc
⇒
f (u) < f (tc )
⇒
f (u) − f (tc ) < 0. u − tc
84
Reglas Formales de Derivaci´ on
8.10
Pero la anterior condici´on implica que f+0 (tc ) ≤ 0, en contra de la hip´otesis. Si f+0 (t) ≥ 0 para todo t ∈ (a, b), entonces, para cada ε > 0 la funci´on 0 (t) > 0 para todo t ∈ (a, b), luego g(t) = f (t) + ε(t − a) verifica que g+ f (a) = g(a) ≤ g(b) = f (b) + ε(b − a). Por el car´acter arbitrario de ε se deduce que f (a) ≤ f (b). 2. Si |f+0 (t)| ≤ M para todo t ∈ (a, b), entonces las funciones g1 (t) = f (t) + M (t − a) y g2 (t) = M (t − a) − f (t) son no decrecientes, pues sus derivadas a la derecha en todo punto son no negativas. Luego: f (a) = g1 (a) ≤ g1 (b) = f (b) + M (b − a) ; −f (a) = g2 (a) ≤ g2 (b) = M (b − a) − f (b). De ambas desigualdades se deduce que |f (b) − f (a)| ≤ M (b − a). Nota. Observemos que si en el lema anterior se supone f+0 (t) > 0, para todo t ∈ (a, b) entonces lo que se obtiene es que f es estrictamente creciente en [a, b], pues, por un lado f no decreciente, obliga a que f (a) < f (b) ya que, de lo contrario, f ser´ıa constante y por lo tanto f 0 (t) = 0, para todo t. En consecuencia si se tuviese que |f+0 (t)| < M , la misma demostraci´ on dada para el apartado 2 del lema, conducir´ıa ahora a que |f (b)−f (a)| < M (b−a). Corolario 8.11 Sea [a, b] un intervalo compacto de R y f : [a, b] → R una aplicaci´on continua que admite derivada a la derecha en cada punto de (a, b), entonces existe alg´ un punto t0 ∈ (a, b) tal que |f (b)−f (a)| ≤ |f+0 (t0 )(b−a)|. on. Si, por el contrario, |f (b) − f (a)| > |f+0 (t0 )(b − a)|, entonces, Demostraci´ tomando M = |f (b) − f (a)|/(b − a) y teniendo en cuenta la nota anterior, resultar´ıa que |f (b) − f (a)| < M (b − a) = |f (b) − f (a)| lo cual es absurdo. Teorema 8.12 Sean E, F espacios normados. Si f : A ⊂ E → F es una aplicaci´on continua en el segmento [a, b] ⊂ A y diferenciable en (a, b) , entonces existe un punto ξ ∈ (a, b) tal que kf (b) − f (a)k ≤ kDf (ξ)(b − a)k. En consecuencia, si existe un n´ umero real M tal que kDf (x)k ≤ M, para cada x ∈ [a, b], entonces kf (b) − f (a)k ≤ M kb − ak.
8.12
Reglas Formales de Derivaci´ on
85
Demostraci´ on. Podemos suponer, sin p´erdida de generalidad, que f (a) = 0. Consideremos la aplicaci´on g : [0, 1] → R definida por g(t) = kf (a + t(b − a))k. La prueba del teorema va a resultar del hecho de que la funci´ on g es continua y admite derivada a la derecha de cada punto t ∈ (0, 1), 0 (t)| ≤ kDf (a + t(b − a))(b − a)k. En efecto, si verific´andose adem´as que |g+ suponemos eso, entonces, por el corolario 8.11, existe t0 ∈ (0, 1) tal que 0 kf (b) − f (a)k = |g(1) − g(0)k ≤ |g+ (t0 )| ≤ kDf (a + t0 (b − a))(b − a)k.
Veamos pues que g es derivable a la derecha en cada punto de (0,1). Sea t0 ∈ (0, 1). Puesto que f es derivable en x0 = a + t0 (b − a), para t > t0 se tiene que f (a + t(b − a)) = f (x0 ) + (t − t0 )Df (x0 )(b − a) + (t − t0 )ε(t)kb − ak, siendo ε(t) una funci´on que tiende a cero cuando t → t0 . Entonces, lim
t→t+ 0
kf (a + t(b − a))k − kf (a + t0 (b − a))k g(t) − g(t0 ) = lim + t − t0 t − t0 t→t0 = lim
t→t+ 0
kf (x0 ) + (t − t0 )Df (x0 )(b − a)k − kf (x0 )k . t − t0
Por lo tanto, para que g sea derivable a la derecha en t0 bastar´ a que exista lim
t→t+ 0
kf (x0 ) + (t − t0 )Df (x0 )(b − a)k − kf (x0 )k , t − t0
con otras palabras que la funci´on t → kf (x0 ) + tDf (x0 )(b − a)k tenga derivada a la derecha en 0. Observemos que esta funci´on es del tipo t → ky + tzk, donde y, z son dos vectores dados. Es inmediato comprobar que estas funciones son convexas y, por tanto, derivables a la derecha en cada punto. Aunque tambi´en puede demostrarse esto directamente: La funci´on ky + tzk − kyk σ(t) = t es creciente a la derecha de 0. Sean 0 < t < u, (∗) ky + uzk − kyk ky + tzk − kyk tky + uzk − uky + tzk + (u − t)kyk − = . u t ut Como uky + tzk − tky + uzk ≤ kuy + utz − ty − tuzk = (u − t)kyk,
86
Reglas Formales de Derivaci´ on
8.12
se deduce de (∗) que σ(t) ≤ σ(u). Por otra parte ¯ ky + tzk − kyk ¯ ktzk ¯≤ |σ(t)| = ¯ = kzk ⇒ −kzk ≤ σ(t). t |t| As´ı, σ es una funci´on nodecreciente a la derecha de 0 y acotada inferiormente, luego existe limt→0+ σ(t) y adem´as | limt→0+ σ(t)| ≤ |z|. En el caso particular que nos interesa, habr´ıamos demostrado pues que ¯ kf (x0 ) + tDf (x0 )(b − a)k − kf (x0 )k ¯¯ 0 |g+ (t0 )| = ¯ lim ≤ kDf (x0 )(b − a)k. t t→0+ (Para otros teoremas de valor medio ver Flett [12] y Cartan [5]).
Ejercicios 8A Sea f una funci´on escalar de clase C 1 . Probar que tambi´en es de clase C 1 la funci´on h(x, y) = |f (x) + f (y)|3 .
8B Demostrar que si la funci´on escalar, f , es diferenciable en 0 y f (0) = 0, entonces f 2 (x) = 0. x→0 kxk lim
8C Estudiar si las siguientes funciones son diferenciables o de clase C 1 : p 1 ; (0, 0) = 0 2. (x, = 1. f (x, y) = xy sen 2 x2 + sen4 y f f y) x x + y2 ( p x2 y 2 sen xy1 2 si x 6= 0 o y 6= 0 4. f (x, y) = (x − y)4 + z 4 3. f (x, y) = f (x, 0) = f (0, y) = 0 2 x y xy si x > 0 5. f (x, y) = p ; f (0, 0) = 0 6. f (x, y) = x + y 2 4 2 x +y 0 si x ≤ 0 7. f (x, y) =
y3 ; f (0, 0) = 0 x4 + y 2
8. f (x, y) = xy sen |x − y|.
8D (a) Probar que la funci´on de una variable g(t) = es de clase C 1 .
t2 1 + |t|
8G
Reglas Formales de Derivaci´ on
87
(b) Utilizar (a) para probar que tambi´en es de clase C 1 la funci´on h(x, y) =
(x − y)2 1 + |x − y|
8E (a) Probar que la funci´on g(t) =
sen t , t 6= 0; t
g(0) = 1,
es de clase C 1 . (b) Estudiar, teniendo en cuenta (a), si las funciones siguientes son diferenciables o de clase C 1 : 3 3 3 sen(x − y + z ) 3 3 3 h(x, y, z) = x −y +z 1 3
3
si x3 − y 3 + z 3 6= 0 en otro caso
3
sen(x − y + z ) si x2 + y 2 + z 2 6= 0; x2 + y 2 + z 2 sen x − sen y si x 6= y x−y h(x, y, z) = cos x si x = y.
h(x, y, z) =
h(0, 0, 0) = 0
´ n. Para estudiar la tercera funci´on utilizar la f´ormula Indicacio x−y x+y sen x − sen y = 2 sen cos 2 2 8F Sea f : A ⊂ Rn → R una aplicaci´on de clase C 1 sobre A. (a) Probar que si K es un compacto y convexo de interior no vac´ıo contenido en A, entonces sup kDf (x)k x∈K
es la menor constante de Lipschitz de f en K. (b) Considerando en R2 , sucesivamente, las normas k · k1 , k · k2 y k · k∞ , calcular la menor constante de Lipschitz de la aplicaci´on f (x, y) = x2 + sen(x + y) en el compacto |x| ≤ 1, |y| ≤ 1. ´ n: Tener en cuenta los ejercicios 1T y 4G) Indicacio 8G Sea h : A ⊂ (Rn , k · k∞ ) → (Rp , k · k∞ ) una aplicaci´on de clase C 1 sobre A. Demostrar si C es un n-cubo cerrado (centrado, para concretar, en el punto a, y de lado l) contenido en A, entonces h(C) est´a contenido en el p-cubo cerrado de centro h(a) y lado α · l, donde α = max{kDh(x)k : x ∈ C}. ¿Se mantiene lo anterior si en vez de la norma k · k∞ se considera la norma k · k2 o hay que cambiar el valor de α?
88
Reglas Formales de Derivaci´ on
8H
8H Sea f : R → R2 dada por f (t) = (cos t, sen t). Probar que para a, b ∈ R distintos, no existe ning´ un n´ umero real c tal que f (b) − f (a) = Df (c)(b − a)
8I Sea E un espacio normado y Φ la aplicaci´on definida por Φ(x, y) = x − T (2x − y, x), donde T es una aplicaci´on bilineal y continua de E × E en E. Probar que Φ es de clase C 1 y calcular DΦ(x, y). 8J Sea E un espacio normado y Φ : L (E, E) → L (E, E), la aplicaci´on Φ(T ) = T 2 − 2T . Probar que Φ es de clase C 1 y hallar DΦ(T ). o
8K Sean f, g : A ⊂ R → L (E, E) aplicaciones derivables en un punto t0 ∈ A. Demostrar que tambi´en es derivable en t0 la aplicaci´on h : t → f (t) ◦ g(t), siendo su derivada h0 (t0 ) = f 0 (t0 ) ◦ g(t0 ) + f (t0 ) ◦ g 0 (t0 ).
8L Sean E, F espacios normados, T : E ×E → F , la aplicaci´on T (x, y) = a(x+y)r , donde a es una aplicaci´on r-lineal sim´etrica de E × · · · × E en F y a(x + y)r denota abreviadamente a(x+y, . . . , x+y). Probar que T es de clase C 1 y calcular DT (x, y) (Tener en cuenta el ejercicio 7C). 8M En este ejercicio g y ϕ ser´an en todos los casos una funci´on escalar de clase C 1 (aunque no siempre del mismo n´ umero de variables). Supuesto esto, se trata de probar que la funci´on h construida a partir de g es tambi´en de clase C 1 y de calcular sus derivadas parciales en t´erminos de las funciones g y ϕ y sus derivadas parciales: 1. h(x, y, z) = g(x2 − z, sen xyz)
2. h(x, y, z) = g(x + y − z 2 )
3. h(x) = g(x3 , sen x, x − 1)
4. h(x) = g(x2 , g(x, sen x))
5. h(x, y) = g(x2 , g(x, sen y)) 7. h(x) = xg(x + g(x))
6. h(x, y, z) = xg(xy) + yg(xz) + zg(yz) 8. h(x, y, z) = g(x, y) + g(x, z) + g(y, z)
9. h(x, y) = g(x + ϕ(x, y))
10. h(x, y) = g(x, yϕ(x, y))
8O
Reglas Formales de Derivaci´ on
89
8N Como en el ejercicio anterior, g y ϕ denotar´an funciones escalares de clase C 1 . Sean: (a) h(x, y, z) = g(xy, ϕ(yz)), con ϕ(0) = 0 ;
ϕ0 (0) = 1 ;
∇g(0, 0) = (2, 3)
Calcular ∇h(0, 1, 0). (b) h(x, y) = x · g(x, y, y), con g(1, 0, 0) = 1 ;
∇g(1, 0, 0) = (1, 2, −2).
Calcular ∇h(1, 0). (c) h(x, y, z) = g(xz, g(y, z)), con g(0, 1) = 0 ;
∇g(0, 0) = (1, 2) ;
∇g(0, 1) = (−3, 4).
Calcular ∇h(0, 0, 1). 8O Probar que la funci´on Z h(x, y) =
x+y
e−t
2
+x
dt
0
es diferenciable en cada punto y calcular su diferencial. ´ n: Tener en cuenta el teorema fundamental del c´alculo integral: Indicacio R x Si f es una funci´on continua en el intervalo [a, b], entonces la funci´on F (x) = a f (t)dt es derivable y su derivada es F 0 (x) = f (x).
Cap´ıtulo 9
Derivadas Parciales de Orden Superior La extensi´on a funciones de varias variables del concepto de derivada de orden superior, aunque te´oricamente no ofrece ninguna dificultad, presenta ciertas complicaciones de naturaleza formal que se hacen especialmente patentes a la hora de establecer las reglas habituales de c´alculo. Las complicaciones (al menos las pedag´ogicas) son algo menores cuando se trabaja en dimensi´on finita, ya que entonces el uso de derivadas parciales permite considerar a las derivadas de orden superior como objetos m´as “tangibles”. Comenzaremos, pues, estableciendo en esta lecci´ on el concepto de derivada parcial de orden superior.
Definiciones Conviene tener presente en todo lo que sigue que para que una funci´ on f sea derivable (aunque sea parcialmente) en un punto a es preciso que est´e definida en un entorno de a. Recordemos tambi´en que la derivada parcial ∂f /∂xj (a), coincide con la derivada en el punto aj de la aplicaci´on: xj → f (a1 , . . . , aj−1 , xj , aj+1 , . . . , an ). o
Sea f : A ⊂ Rn → F, a ∈ A. Llamaremos derivada parcial segunda de f respecto a xi y xj en el punto a, a la derivada respecto xi de la funci´on ∂f /∂xj en el punto a. Abreviadamente ∂2f ∂ ¡ ∂f ¢ (a) = (a). ∂xi ∂xj ∂xi ∂xj 91
92
Derivadas Parciales de Orden Superior
9.1
Se deduce, pues, que la funci´on f es derivable respecto a las variables xi y xj en el punto a, si y s´olo si la aplicaci´on ∂f ∂f :x→ (x) ∂xj ∂xj est´a definida en alg´ un entorno de a y admite derivada parcial respecto a xi en el punto a. M´as generalmente, si j1 , j2 , . . . , jr son n´ umeros naturales (independientes entre s´ı) comprendido entre 1 y n, definiremos inductivamente ¢ ∂ ¡ ∂ r−1 f ∂rf (a) = (a). ∂xj1 . . . ∂xjr ∂xj1 ∂xj2 . . . ∂xjr Cuando el resultado final de una derivaci´ on parcial s´olo dependa del n´ umero de veces que se deriva respecto a cada variable, y no del orden en que se realiza tal proceso (esto no suceder´ a siempre), cabe utilizar una notaci´on abreviada para designar a las derivadas parciales de orden superior. As´ı mediante la expresi´on ∂rf (a), ∂xi11 ∂xi22 . . . ∂xinn denotaremos al resultado de efectuar r derivaciones parciales: in respecto a xn , in−1 respecto a xn−1 , etc. y por u ´ltimo i1 derivaciones respecto a x1 . Por tanto i1 + i2 + · · · + in = r. Algunos de los ik pueden ser iguales a 0, lo on alguna respecto a la variable xk que expresar´a que no se realiza derivaci´ (en cuyo caso omitiremos en la expresi´on anterior el t´ermino ∂xikk ).
El teorema de Schwartz El teorema m´as cl´asico en relaci´on al problema de la permutabilidad de las derivadas es el conocido como teorema de Schwartz o de las derivadas parciales segundas cruzadas. Teorema 9.1 Sea f una funci´on escalar de dos variables. Supongamos que para cada (x, y) de alg´ un entorno V de un punto (x0 , y0 ), existen ∂f (x, y), ∂x
∂f (x, y), ∂y
∂2f (x, y), ∂x∂y
9.1
Derivadas Parciales de Orden Superior
93
∂2f es continua en (x0 , y0 ). Entonces tambi´en existe ∂x∂y la otra derivada cruzada en (x0 , y0 ), y se verifica que y que la aplicaci´on
∂2f ∂2f (x0 , y0 ) = (x0 , y0 ). ∂y∂x ∂x∂y
Demostraci´ on. De la definici´on se deduce f´acilmente que (9.1) ¶ µ ∂2f f (x, y) − f (x0 , y) − f (x, y0 ) + f (x0 , y0 ) (x0 , y0 ) = lim lim . y→y0 x→x0 ∂y∂x (x − x0 )(y − y0 ) Denotemos por G(x, y) = f (x, y) − f (x0 , y) − f (x, y0 ) + f (x0 , y0 ). Vamos a probar que ∂2f G(x, y) = (x0 , y0 ). ∂x∂y (x,y)→(x0 ,y0 ) (x − x0 )(y − y0 ) lim
La existencia de este l´ımite doble implicar´a, por tanto, la del l´ımite iterado 9.1 que es lo que buscamos. Por hip´otesis, dado ε > 0, existe δ > 0 tal que si |x−x0 | < δ y |y−y0 | < δ, entonces ¯ 2 ¯ ¯ ∂ f ¯ ∂2f ¯ ¯ ¯ ∂x∂y (x, y) − ∂x∂y (x0 , y0 )¯ < ε; adem´as podemos suponer que en este entorno, es decir en la bola de centro (x0 , y0 ) y radio δ, las tres funciones ∂f ∂f ∂ 2 f , , , ∂x ∂y ∂x∂y est´an bien definidas. Sea (x, y) un punto cualquiera de ese entorno, que lo supondremos fijo en adelante. Consideremos entonces la funci´on de una variable ϕ(z) = f (x, z)− f (x0 , z). Es inmediato comprobar que G(x, y) = ϕ(y) − ϕ(y0 ). Por otra parte, la existencia de derivada parcial respecto de y en ese entorno implica que ϕ es derivable, siendo su derivada ϕ0 (z) =
∂f ∂f (x, z) − (x0 , z). ∂y ∂y
94
Derivadas Parciales de Orden Superior
9.1
Aplicando entonces el teorema del valor medio a ϕ en el intervalo [y0 −δ, y0 + δ], se deduce que existe un punto ξy intermedio entre y0 e y tal que ϕ(y) − ϕ(y0 ) = ϕ0 (ξy )(y − y0 ), luego,
·
¸ ∂f ∂f G(x, y) = (x, ξy ) − (x0 , ξy ) (y − y0 ), ∂y ∂y
que implica G(x, y) = (x − x0 )(y − y0 ) Consideremos ahora la aplicaci´on g: z →
∂f ∂y (x, ξy )
−
∂f ∂y (x0 , ξy )
x − x0
.
∂f (z, ξy ). ∂y
Esta aplicaci´on es derivable en cada punto del intervalo [x0 − δ, x0 + δ], precisamente µ ¶ ∂2f ∂ ∂f 0 (z, ξy ) = (z, ξy ). g (z) = ∂x ∂y ∂x∂y Aplicando entonces el teorema del valor medio resulta g(x) − g(x0 ) =
∂2f (ξx , ξy )(x − x0 ), ∂x∂y
donde ξx es alg´ un punto comprendido entre x y x0 . Se deduce pues que ∂2f G(x, y) = (ξx , ξy ) (x − x0 )(y − y0 ) ∂x∂y y por tanto
¯ ¯ ¯ ¯ G(x, y) ∂2f ¯ ¯ ¯ (x − x0 )(y − y0 ) − ∂x∂y (x0 , y0 )¯ < ε.
9.2 El teorema de Schwartz puede formularse para funciones de m´ as de dos variables. En efecto si f es una funci´on de las variables x1 , x2 , . . . , xn , que satisface respecto a las coordenadas xi y xj , las condiciones del teorema anterior, entonces tambi´en satisface estas condiciones la funci´on de dos variables g(xi , xj ) = f (a1 , . . . , xi , . . . , xj , . . . , an ). Se deduce, por tanto, que las derivadas parciales cruzadas de la funci´on g coinciden en (ai , aj ), pero es f´acil comprobar que ´estas coinciden con las derivadas parciales segundas de f respecto a las coordenadas xi y xj en a.
9.3
Derivadas Parciales de Orden Superior
95
El corolario siguiente es una extensi´on u ´til del teorema anterior para derivadas de orden mayor que 2: Corolario 9.3 Supongamos que todas las derivadas parciales de orden r de la funci´on escalar f son continuas en un punto a. Entonces cada derivada parcial de orden r de f en a es independiente del orden en que se efect´ uen las derivaciones. Demostraci´ on. Observemos, en primer lugar, que de la hip´otesis se deduce que cada derivada parcial de orden r −1 de la funci´on f debe ser una funci´on continua en alg´ un entorno del punto a. En efecto, sea g = ∂ r−1 f una de estas ∂g derivadas. Se tiene entonces que, para cada j, es una funci´on continua ∂xj en a, luego g es estrictamente diferenciable en a y, en particular, continua en alg´ un entorno de a (ver nota posterior al teorema 7.3) Razonemos por inducci´on sobre r. Para r = 2, tenemos hip´otesis sobradas para poder otesis de aplicar el teorema de Schwartz. Supongamos entonces, como hip´ inducci´on, que si una funci´on escalar admite derivadas parciales de orden r − 1 continuas en un punto, el c´ alculo de estas derivadas de orden r − 1 en ese punto no depende del orden en que se efect´ uen las derivaciones. Sea la derivada de orden r en a ∂rf (a) , ∂y1 ∂y2 . . . ∂yr
yk ∈ {x1 , . . . , xn },
y consideremos, mediante una permutaci´ on de y1 , y2 , . . . , yr , la derivada de orden r ∂rf (a). ∂yi1 ∂yi2 . . . ∂yir Supongamos en primer lugar que yi1 = y1 . Puesto que, por hip´otesis de inducci´on, en las derivadas de orden r − 1 de f se puede cambiar el orden de derivaci´on (en todos los puntos de alg´ un entorno de a), podemos escribir ∂rf ∂ (a) = ∂y1 ∂y2 . . . ∂yr ∂yi1
µ
∂ r−1 f ∂y2 . . . ∂yr
¶ (a) =
∂rf (a). ∂yi1 ∂yi2 . . . ∂yir
Supongamos ahora que y1 6== yi1 , por tanto y1 = yik con k 6= 1. Entonces {yi1 , . . . , yc on de {y2 , . . . , yr }. Por inducci´on ik , . . . , yir } es una permutaci´
96
Derivadas Parciales de Orden Superior
9.3
se deduce que ¶ ∂ r−1 f (a) ∂y2 . . . ∂yr ∂rf (a) ∂y1 ∂yi1 . . . ∂ yc ik . . . ∂yir ¶ µ ∂2 ∂ r−2 f (a) ∂y1 ∂yi1 ∂yi2 . . . ∂ yc ik . . . ∂yir µ ¶ ∂2 ∂ r−2 f (a) ∂yi1 ∂y1 ∂yi2 . . . ∂ yc ik . . . ∂yir ∂rf (a). ∂yi1 ∂yi2 . . . ∂yir
∂rf ∂ (a) = ∂y1 ∂y2 . . . ∂yr ∂y1 = = = =
µ
Ejercicios 9A Comprobar si en las funciones siguientes se da la igualdad entre las derivadas parciales cruzadas en (0, 0). Estudiar en cada caso si se satisfacen las condiciones del teorema de Schwartz. x2 − y 2 ; f (0, 0) = 0. x2 + y 2 2. f (x, y) = x2 y 2 cos 1/x ; f (0, y) = 0. 1 3. f (x, y) = x2 y 2 sen 2 ; f (x, 0) = f (0, y) = 0. xy 1. f (x, y) = xy
9B Consideremos los operadores diferenciales ∂f ∂2f ∂f ∂2f ,..., ); ∆f = + ··· + 2 ∂x1 ∂xn ∂x1 ∂x2n ∂f ∂f ∂F1 ∂Fn H f = x1 + · · · + xn ; div(F1 , . . . , Fn ) = + ··· + ∂x1 ∂xn ∂x1 ∂xn µ ¶ ∂F3 ∂F2 ∂F1 ∂F3 ∂F2 ∂F1 rot(F1 , F2 , F3 ) = ∇ × F = − , − , − ∂y ∂z ∂z ∂x ∂x ∂y ∇f = (
A los operadores anteriores se les conoce, en el orden en que han sido definido, como operador: Gradiente, Laplaciano, Hamiltoniano, Divergencia y Rotacional. Supuesto que se pueden permutar las derivaciones, demostrar que 1. ∆ f = div ∇f
2. div(rot F ) = 0.
3. H ∆ − ∆ H = −2 ∆
4. ∆ f = 0 ⇒ ∆ ∆((x21 + · · · + x2n )f ) = 0.
Cap´ıtulo 10
Diferenciales de Orden Superior En este cap´ıtulo extenderemos a las funciones definidas sobre espacios normados el concepto de funci´on r-veces diferenciable y de clase C r y obtendremos las correspondientes reglas de c´ alculo. En el caso de espacios de dimensi´on finita, veremos la relaci´on entre dichos conceptos y las derivadas parciales de orden r. Para el desarrollo de este cap´ıtulo se ha seguido fundamentalmente el libro de Flett [12] y, en menor medida, el de Avez [2].
La diferencial de orden r en un punto Definici´ on 10.1 Sea f : A ⊂ E → F una aplicaci´on entre espacios normao
dos, a ∈ A y r un n´ umero natural mayor que 1. Inductivamente, diremos que f es r-veces diferenciable en a si la aplicaci´on Dr−1 f es diferenciable en a. Escribiremos entonces Dr f (a) = D(Dr−1 f )(a).
Para r = 2, la definici´on anterior expresa que f es 2-veces diferenciable en a a preciso si la aplicaci´on Df : x → Df (x) es diferenciable en a. (Para ello ser´ pues que, previamente, la aplicaci´on Df est´e definida en alg´ un entorno de a). La derivada segunda de la aplicaci´on f en a o sea la diferencial en a de la aplicaci´on Df debe ser, como siempre, una aplicaci´ on lineal, pero en este caso, un tanto especial, concretamente (10.1)
D2 f (a) ∈ L (E, L (E, F )). 97
98
Diferenciales de Orden Superior
10.1
De 10.1 se deduce que la aplicaci´on (h, k) → (D2 f (a)h)k es bilineal, lo que indica que la aplicaci´ on lineal D2 f (a) se comporta como una aplicaci´on bilineal de E × E en F , una aplicaci´on bilineal que adem´as es continua, pues k(D2 f (a)h)k)k ≤ kD2 f (a)kkhkkkk. Con frecuencia se dir´a incluso que D2 f (a) es una aplicaci´on bilineal y escribiremos D2 f (a)(h, k) en lugar de ((D2 f (a)h)k. An´alogas consideraciones cabe hacer para una funci´on r-veces diferenciable en un punto a. Dr f (a) ser´a ahora un elemento del espacio L (E, (E, . . . , L (E, F ) . . . , )). (Por comodidad denotaremos a este espacio por L r (E, F )). Como antes, se puede considerar a Dr f (a) como una aplicaci´on r r-lineal continua de E × E × z}|{ . . . ×E en F , y se tiene kDr f (a)(h1 , . . . , hr )k ≤ kDr f (a)kkh1 k · · · khr k.
Relaci´ on con las derivadas parciales La proposici´on siguiente, aunque formulada en el marco general de los Espacios Normados, ser´a esencial para establecer, en dimensi´on finita, la relaci´on entre derivadas de orden superior y derivadas parciales de orden superior. Proposici´ on 10.2 Sea f : A ⊂ E → F una aplicaci´on r-veces diferenciable o
en un punto a ∈ A . Entonces se verifica la siguiente f´ormula Dr f (a)(h1 , . . . , hr ) = Dh1 (Dh2 . . . Dhr f )(a).
on. Por inducci´on. Para r = 1 la f´ormula ya es conocida. SuponDemostraci´ gamos como hip´otesis de inducci´on que la f´ormula es cierta en cada punto en que f sea (r-1)-veces diferenciable. Entonces Dr f (a)(h1 , . . . , hr ) ¡ ¢ = D(Dr−1 f )(a)h1 (h2 , . . . , hr ) = Dh1 (Dr−1 f )(a)(h2 , . . . , hr )
10.3
Diferenciales de Orden Superior
99
µ
¶ Dr−1 f (a + th1 ) − Dr−1 f (a) (10.2) = lim (h2 , . . . , hr ) t→0 t Dr−1 f (a + th1 )(h2 , . . . , hr ) − Dr−1 f (a)(h2 , . . . , hr ) (10.3) = lim t→0 t Dh2 (. . . Dhr f )(a + th1 ) − Dh2 (. . . Dhr f )(a) = lim t→0 t = Dh1 (Dh2 . . . Dhr f )(a). Para demostrar la igualdad entre las expresiones 10.2 y 10.3, observemos que las igualdades anteriores a ´estas expresan que Dr−1 f (a + th1 ) − Dr−1 f (a) , t→0 t
Dr f (a)h1 = lim es decir que, si denotemos por φt =
Dr−1 f (a + th1 ) − Dr−1 f (a) , t
entonces kφt − Dr f (a)h1 k ≤ ε, si |t| < δ. De lo anterior se deduce, teniendo en cuenta que φt −Dr f (a)h1 ∈ L r−1 (E, F ), que k(φt − Dr f (a)h1 )(h2 , . . . , hr )k ≤ εkh2 k · . . . · khr k, si |t| < δ, lo que significa que Dr f (a)(h1 , . . . , hr ) = lim φt (h2 , . . . , hr ) t→0
Dr−1 f (a + th1 )(h2 , . . . , hr ) − Dr−1 f (a)(h2 , . . . , hr ) = lim , t→0 t lo que prueba la igualdad entre 10.2 y 10.3. Corolario 10.3 En las condiciones anteriores, si E = Rn , y por ei denotamos al vector de Rn que tiene un 1 en la coordenada i-´esima y un 0 en todas las dem´as, entonces Dr f (a)(ej1 , . . . , ejr ) =
∂rf (a). ∂xj1 . . . xjr
100
Diferenciales de Orden Superior
10.3
Demostraci´ on. Cuando E = Rn , de la f´ormula de la proposici´on anterior se deduce que Dr f (a)(ej1 , . . . , ejr ) = Dej1 (Dej2 . . . Dejr f )(a) =
∂rf (a). ∂xj1 . . . xjr
10.4 De lo anterior vamos a deducir que, en dimensi´ on finita, la aplicaci´on r D f (a), debido a su car´acter r-lineal, queda determinada por sus derivadas parciales de orden r: De manera general, una aplicaci´on T de L r (E, F ), si E es un espacio de dimensi´on n, queda determinada por los nr puntos de F , aj1 ...jr = T (ej1 , . . . , ejr ), donde {ei }, i = 1, 2, .., n, es una base de E. En efecto, sean hj = (h1j , h2j , . . . , hnj ), j = 1, 2, .., r, vectores arbitrarios de Rn . Entonces X
T (h1 , . . . , hr ) =
hj11 . . . hjrr aj1 ...jr .
1≤j1 ,...,jr ≤n
Adem´as, es f´acil comprobar (aunque pesado) que la aplicaci´on de L r (E, F ) r en F n r Φ : T ∈ L r (E, F ) → (aj1 ...jr )1≤j1 ,...,jr ≤n ∈ F n es un isomorfismo de espacios vectoriales. Del corolario anterior se deduce que, si T es la aplicaci´on Dr f (a), entonces aj1 ...jr =
∂rf (a), ∂xj1 . . . ∂xjr
luego X
Dr f (a)(h1 , . . . , hr ) =
hj11 . . . hjrr
1≤j1 ,...,jr ≤n
∂rf (a), ∂xj1 . . . ∂xjr
f´ormula que para r = 2 se escribe as´ı D2 f (a)(h, k) =
X 1≤i,j≤n
hi kj
∂2f (a). ∂xi ∂xj
De la relaci´on que hemos establecido entre diferenciales de orden r y derivadas parciales de orden r, se deduce Corolario 10.5 Para una funci´on f : A ⊂ Rn → Rp son equivalentes:
10.7
Diferenciales de Orden Superior
101
o
(i) f es r-veces diferenciable en un punto a ∈ A . (ii) f es (r-1)-veces diferenciable en un entorno del punto a y todas las derivadas parciales de orden r-1 son diferenciables en a. Demostraci´ on. Escribamos la aplicaci´on Dr−1 f como composici´on de las aplicaciones ¶ µ ∂ r−1 f (x) → Dr−1 f (x). x→ ∂xj1 . . . ∂xjr−1 1≤j1 ,...,jr−1 ≤n La primera aplicaci´on es diferenciable en a si y s´olo si lo son las derivadas parciales de orden r−1 de f. En cuanto a la segunda, se trata de la aplicaci´ on r−1 Φ−1 de F n en L r−1 (E, F ) que constru´ıamos antes, y que por ser lineal entre espacios de dimensi´on finita, es diferenciable en todo punto. De todo ello es f´acil deducir ya que los enunciados (i) y (ii) son equivalentes. Definici´ on 10.6 Sean E y F espacios normados y U un conjunto abierto de E. Una aplicaci´on f : U ⊂ E → F se dice de clase C r sobre el subconjunto A de U , lo que denotaremos por f ∈ C r (A), si es r-veces diferenciable en cada punto x de A y la aplicaci´on x → Dr f (x) es continua en A. La aplicaci´on se dir´a de clase C ∞ si es de clase C r para todo r. Aunque no se especifique, una funci´ on f ∈ C r (A) se supondr´a definida en alg´ un abierto que contiene a A. Proposici´ on 10.7 Sea f : U ⊂ Rn → Rp con U abierto. Entonces f ∈ r C (U ) si y s´olo si todas las derivadas parciales de orden r son continuas en U . Demostraci´ on. Veamos por inducci´on sobre r que si todas las derivadas paron es de clase C r . Para r = 1 ciales de orden r son continuas entonces la funci´ esto ya ha sido probado. Supondremos cierto para r − 1. De la hip´ otesis resulta que cada derivada parcial de orden r − 1 de la funci´ on f es una funci´on de clase C 1 (observar que, abreviadamente, cada derivada parcial de orden r puede obtenerse mediante la f´ ormula ∂ r f = ∂(∂ r−1 f )). En particular cada derivada parcial de orden r − 1 es una aplicaci´on continua, luego, por hip´otesis de inducci´on, f es de clase C r−1 . Consideremos la descomposici´on µ ¶ ∂ r−1 f (x) x→ → Dr−1 f (x). ∂xj1 . . . ∂xjr−1 1≤j1 ,...,jr−1 ≤n
102
Diferenciales de Orden Superior
10.7
Por hip´otesis, la primera de las aplicaciones en el diagrama anterior es de clase C 1 . En cuanto a la segunda, se trata del isomorfismo vectorial Φ, luego (en dimensi´on finita) tambi´en de clase C 1 . Se deduce pues que la aplicaci´on Dr−1 f es de clase C 1 , por ser composici´on de dos aplicaciones de clase C 1 , y por tanto f es de clase C r . Rec´ıprocamente, si f es de clase C r , entonces el diagrama ¶ µ ∂ r f (x) r , x → D f (x) → ∂xj1 . . . ∂xjr−1 1≤j1 ,...,jr ≤n nos permite deducir que las derivadas parciales de orden r son continuas.
Reglas de derivaci´ on A efectos de c´alculo, las derivadas de orden superior se comportan como las a m´as u ´til ver esto en el caso general de funciones de primer orden. Nos ser´ definidas entre espacios normados. Proposici´ on 10.8 Si f y g son funciones r-veces diferenciables en un punto a (de clase C r ), entonces la funci´on λf + µg es tambi´en r-veces diferenciable en a (de clase C r ) y se tiene que Dr (λf + µg)(a) = λDr f (a) + µDr g(a).
on. Por inducci´on. Para r = 1 ya se ha demostrado. Supuesta Demostraci´ cierta la proposici´on para r-1, supongamos que f y g son r-veces diferenciable en a. Entonces, por hip´otesis de inducci´on, la funci´on Dr−1 (λf + µg) est´a definida en un entorno de a y se tiene que Dr−1 (λf + µg) = λDr−1 f + µDr−1 g. Se deduce pues que Dr−1 (λf + µg) es diferenciable en a y que £ ¤ £ ¤ D Dr−1 (λf + µg) (a) = D λDr−1 f + µDr−1 g (a) = λDr f (a) + µDr g(a). El resultado siguiente es un caso particular de la regla de la cadena para derivadas de orden superior, que hemos de establecer antes del teorema general.
10.10
Diferenciales de Orden Superior
103
Lema 10.9 Sean E, F y G espacios normados, f : A ⊂ E → F una aplio
caci´on r-veces diferenciable en un punto a ∈ A (de clase C r en A) y T una aplicaci´on lineal y continua de F en G. Entonces la aplicaci´on T ◦f es r-veces diferenciable en a (de clase C r en A) y se verifica que £ ¤ Dr (T ◦ f )(a)(h1 , . . . , hr ) = T Dr f (a)(h1 , . . . , hr ) .
Demostraci´ on. Por inducci´on sobre r. El caso r = 1 resulta directamente de la aplicaci´on de la regla de la cadena. Supongamos que f es r-veces diferenciable en a (de clase C r en A) con r > 1. Entonces D(T ◦ f )(x) = T ◦ Df (x), lo que nos dice que la aplicaci´on D(T ◦f ) es la composici´on de las aplicaciones T
x → Df (x) →1 T ◦ Df (x). Es f´acil de comprobar que T1 es una aplicaci´ on lineal y continua. Resulta entonces que D(T ◦ f ) = T1 ◦ Df , por lo que, aplicando la hip´otesis de inducci´on, se deduce que D(T ◦ f ) es (r-1)-veces diferenciable en a (de clase C r−1 en A). Para demostrar la f´ormula procedamos tambi´en por inducci´on. Para r = 1 ya es conocida. Suponiendo que es cierta tambi´en para r − 1, se tiene: Dr (T ◦ f )(a)(h1 , . . . , hr ) = Dr−1 (D(T ◦ f ))(a)(h1 , . . . , hr ) = Dr−1 (T1 ◦ Df )(a)(h1 , . . . , hr ) ¡ ¢ ¡ ¢ = Dr−1 (T1 ◦ Df )(a)(h1 , . . . , hr−1 ) hr = T1 Dr f (a)(h1 , . . . , hr−1 ) hr ¡ ¢ = T ◦ Dr f (a)(h1 , . . . , hr−1 ) hr £ ¤ = T Dr f (a)(h1 , . . . , hr ) .
Corolario 10.10 Una funci´on f = (f1 , f2 , . . . , fp ) de A ⊂ E en F1 ×. . .×Fp o
es r-veces diferenciable en un punto a ∈ A (de clase C r en A) si y s´olo si cada fi es diferenciable en a (de clase C r en A). Se tiene entonces que (10.4) ¡ ¢ Dr f (a)(h1 , . . . , hr ) = Dr f1 (a)(h1 , . . . , hr ), . . . , Dr fp (a)(h1 , . . . , hr ) .
104
Diferenciales de Orden Superior
10.10
Demostraci´ on. Si f es r-veces diferenciable en a (de clase C r en A), entonces, por la proposici´on anterior, fi = πi ◦f (πi es la proyecci´ on i-´esima) es r-veces diferenciable en a (de clase C r en A). El rec´ıproco y la f´ormula 10.4 se siguen de las dos proposiciones anteriores sin m´as que tener en cuenta que X f= Ii ◦ fi , donde Ii es la inmersi´on can´onica z → (0, . . . , z, . . . , 0). o
o
Proposici´ on 10.11 Sean f : A ⊂ E → F , a ∈ A, B ⊃ f (A), f (a) ∈ B y g : B ⊂ F → G. Si f es r-veces diferenciable en a (de clase C r en A) y g es r-veces diferenciable en f (a) (de clase C r en B), entonces la aplicaci´on u = g ◦ f es r-veces diferenciable en a (de clase C r en A). Demostraci´ on. Por inducci´on sobre r. Para r = 1 ya ha sido demostrado. alida para funciones (r-1)-veces Supongamos que la regla de la cadena es v´ r−1 diferenciable (de clase C ), entonces si r > 1 las funciones f y g son diferenciables en alg´ un entorno de a y f (a) respectivamente, y se tiene que Dh(x) = Dg(f (x)) ◦ Df (x). Consideremos la siguiente descomposici´on de Dh, x → (Dg(f (x)), Df (x)) → Dg(f (x)) ◦ Df (x). Las dos aplicaciones de que consta el diagrama anterior son (r-1)-veces diferenciable en a (de clase C r−1 ). La segunda por tratarse de una aplicaci´on bilineal y continua y la primera porque sus dos funciones coordenadas son, otesis de inducci´on, (r-1)-veces diferenciables en a teniendo en cuenta la hip´ r−1 (de clase C ), luego, de nuevo por hip´otesis de inducci´on, se tiene que Dh es (r-1)-veces diferenciables en a (de clase C r−1 ). Proposici´ on 10.12 Sean f, g : A ⊂ E → R aplicaciones r-veces diferenciables en un punto a (de clase C r en A), entonces su producto, h = f · g, es tambi´en r-veces diferenciable en a (de clase C r en A). Demostraci´ on. Basta descomponer h como x → (f (x), g(x)) → f (x) · g(x) y aplicar la proposici´on anterior. Proposici´ on 10.13 Sean f, g : A ⊂ E → R aplicaciones r-veces diferenciables en un punto a (de clase C r en A). Si g(a) 6= 0 (g no se anula en ning´ un punto de A), entonces la aplicaci´on h = f /g es r-veces diferenciable en a (de clase C r en A).
10.17
Diferenciales de Orden Superior
105
Con ayuda de los resultados anteriores, es f´acil probar ahora las siguientes generalizaciones del corolario 10.5 y la proposici´on 10.7. Proposici´ on 10.14 Para una funci´on f : A ⊂ Rn → Rp y los n´ umeros naturales 1 ≤ k < r, son equivalentes: o
(i) f es r-veces diferenciable en un punto a ∈ A . (ii) f es k-veces diferenciable en un entorno del punto a y todas las derivadas parciales de orden k son (r − k)-veces diferenciables en a. Proposici´ on 10.15 Para una funci´on f : U ⊂ Rn → Rp (U abierto) y los n´ umeros naturales 1 ≤ k ≤ r, son equivalentes: (i) f es de clase C r sobre U . (ii) Todas las derivadas parciales de orden k de f son de clase C r−k sobre U . (Por convenio, una funci´on de clase C 0 es una funci´on continua).
Permutaci´ on en el orden de derivaci´ on Anteriormente abordamos el problema de la permutabilidad de las derivadas y establecimos el cl´asico teorema de Schwartz. En esta secci´on vamos a continuar con aquel asunto, viendo, en primer lugar, una consecuencia de dicho teorema (m´as precisamente de su generalizaci´ on 9.3). Proposici´ on 10.16 Sea U un abierto de Rn y f : U → Rp una aplicaci´on de clase C r sobre U , entonces las derivadas parciales de orden r de f son independientes del orden en que se realicen las derivaciones. on. Es consecuencia directa de la proposici´on 10.7 y el corolario Demostraci´ 9.3 . La condici´on de la proposici´on anterior es muy fuerte. En lo que sigue vamos a demostrar que se consigue el mismo efecto suponiendo s´ olo que la aplicaci´on sea r-veces diferenciable. Proposici´ on 10.17 Sea f : A ⊂ Rn → Rp una funci´on 2-veces derivable en un punto a, entonces ∂2f ∂2f (a) = (a). ∂xi ∂xj ∂xj ∂xi
106
Diferenciales de Orden Superior
10.17
Demostraci´ on. Puesto que s´olo han de intervenir dos coordenadas y basta hacer el estudio para cada funci´on coordenada, se puede suponer, sin p´erdida de generalidad, que f es una funci´ on escalar de las variables x e y. Ya vimos en la proposici´on 9.1 que ¶ µ ∂2f f (x, y) − f (x0 , y) − f (x, y0 ) + f (x0 , y0 ) (x0 , y0 ) = lim lim x→x0 y→y0 ∂x∂y (x − x0 )(y − y0 ) µ ¶ ∂2f f (x, y) − f (x0 , y) − f (x, y0 ) + f (x0 , y0 ) (x0 , y0 ) = lim lim . y→y0 x→x0 ∂y∂x (x − x0 )(y − y0 ) Pero desafortunadamente las condiciones de esta proposici´ on no permiten deducir, como entonces, la existencia del l´ımite “doble”. Sea, no obstante G(x, y) = f (x, y) − f (x0 , y) − f (x, y0 ) + f (x0 , y0 ) y procedamos como en 9.1. Obtenemos entonces ∂2f G(x, y) − (x0 , y0 ) (x − x0 )(y − y0 ) ∂x∂y ¢ 1 ¡ ∂f ∂f ∂2f = (x, ξy ) − (x0 , ξy ) − (x0 , y0 )(x − x0 ) x − x0 ∂y ∂y ∂x∂y = (10.5)
1 ¡ ∂f ∂f (x, ξy ) − (x0 , y0 ) x − x0 ∂y ∂y
¢ ∂2f ∂2f (x0 , y0 )(x − x0 ) − 2 (x0 , y0 )(ξy − y0 ) ∂x∂y ∂y ¡ ¢ ∂f ∂f ∂2f 1 − (x0 , ξy ) − (x0 , y0 ) − 2 (x0 , y0 )(ξy − y0 ) . x − x0 ∂y ∂y ∂y −
Nuestra intenci´on, al considerar la igualdad 10.5, es la de utilizar el hecho de que la funci´on ∂f /∂y es derivable en (x0 , y0 ) (ya que f es 2-veces derivable en (x0 , y0 )). As´ı, dado ε > 0, si |x − x0 | y |y − y0 | son suficientemente peque˜ nos, podemos escribir, teniendo eso en cuenta, que ¯ ¯ ¯ ¯ G(x, y) ∂2f ¯ ¯ ≤ ε k(x − x0 , ξy − y0 )k + k(0, ξy − y0 )k − (x , y ) 0 0 ¯ (x − x0 )(y − y0 ) ∂x∂y ¯ |x − x0 | k(x − x0 , y − y0 )k ≤ 2ε . |x − x0 |
10.19
Diferenciales de Orden Superior
107
De igual forma obtendr´ıamos ¯ ¯ ¯ ¯ ∂2f G(x, y) ¯ ≤ 2ε k(x − x0 , y − y0 )k . ¯ − (x , y ) 0 0 ¯ (x − x0 )(y − y0 ) ∂y∂x ¯ |y − y0 | De todo ello podemos deducir entonces que para |x − x0 | y |y − y0 | suficientemente peque˜ nos ¯ 2 ¯ ¯ ∂ f ¯ ∂2f ¯ ¯ ≤ 2ε k(x − x0 , y − y0 )k +2ε k(x − x0 , y − y0 )k . (x , y )− (x , y ) 0 0 0 0 ¯ ∂x∂y ¯ ∂y∂x |x − x0 | |y − y0 | En particular, tomando |x − x0 | = |y − y0 |, se tiene que ¯ 2 ¯ ¯ ∂ f ¯ ∂2f ∂2f ∂2f ¯ ¯ (x , y ) − (x , y ) ≤ 4ε ⇒ (x , y ) = (x0 , y0 ). 0 0 ¯ 0 0 ¯ ∂x∂y 0 0 ∂y∂x ∂x∂y ∂y∂x [Hemos utilizado la norma producto k(x, y)k = max(kxk, kyk)]. La proposici´on anterior admite la siguiente generalizaci´on: Proposici´ on 10.18 Si f : A ⊂ Rn → Rp es una funci´on r-veces derivable en un punto a, entonces las derivadas parciales de orden r en el punto a s´olo dependen del n´ umero de veces que se deriva respecto de cada variable, es decir son independientes del orden de derivaci´ on. on. Es id´entica a la del corolario 9.3, s´olo hay que tener en cuenta Demostraci´ que cada derivada parcial de orden r − 2 de la funci´on f es una funci´on 2veces diferenciable en a. Corolario 10.19 Si f : A ⊂ Rn → Rp es una funci´on r-veces derivable en un punto a, entonces su derivada de orden r en el punto a es una aplicaci´on rlineal sim´etrica, es decir, cualquiera que sea la permutaci´ on σ de {1, 2, . . . , r} se verifica Dr f (a)(h1 , . . . , hr ) = Dr f (a)(hσ(1) , . . . , hσ(r) ). Demostraci´ on. Basta tener en cuenta la proposici´on anterior en la f´ ormula que relaciona las derivadas de orden r de una funci´on en un punto con sus derivadas parciales de ese mismo orden. En efecto, sea σ una permutaci´ on de {1, 2, . . . , r}. Entonces: X ∂rf r 1 (a) Dr f (a)(hσ(1) , . . . , hσ(r) ) = hjσ(1) . . . hjσ(r) ∂xj1 . . . ∂xjr 1≤j1 ,...,jr ≤n
=
X
1≤j1 ,...,jr ≤n
hk11 . . . hkr r
∂rf (a), ∂xj1 . . . ∂xjr
108
Diferenciales de Orden Superior
10.19
donde {k1 , . . . , kr } es una permutaci´ on de {j1 , . . . , jr }. De la proposici´on anterior se deriva entonces que X
Dr f (a)(hσ(1) , . . . , hσ(r) ) = =
hk11 . . . hkr r
1≤k1 ,...,kr ≤n Dr f (a)(h1 , . . . , hr ).
∂rf (a) ∂xk1 . . . ∂xkr
Ejercicios 10A Estudiar si las funciones siguientes son r-veces diferenciables o de clase C r (r = 1, 2, . . .): x4 ; x2 + y 2 x2 y 2 ; 3. f (x, y) = 2 x + y2
1. f (x, y) =
f (0, 0) = 0
2. f (x, y) = (x − y)2 |x − y|
f (0, 0) = 0
4. f (x, y) =
p x4 + y 4 .
10B Probar que la funci´on f (x, y) = x2 (x − y)2 sen
1 ; x−y
f (x, x) = 0
es 2-veces diferenciable en (0,0), pero no es de clase C 1 en ning´ un entorno de (0,0). 10C En este ejercicio g ser´a una funci´on escalar de clase C ∞ . Se pide calcular, en t´erminos de g y/o sus derivadas parciales, las derivadas parciales de primer y segundo orden de la funci´on h en cada uno de los casos siguientes: 1. h(x, y) = g(x + g(x.y)) 3. h(x, y) = g(y, g(x, y)) 4. h(x) = g(x, sen x)
2. h(x, y, z) = zg(x, y) − g(xz, y) 4. h(x, y, z) = g(z, g(x, y)) 6. h(x) = g(x, g(x, x))
10D Probar que la funci´on Z
x2 y 2 +x2 z 2 +y 2 z 2
h(x, y, z) = 0
es de clase C ∞ y obtener
∂2h (1, 0, 0). ∂x∂y
2
e−t dt
10H
Diferenciales de Orden Superior
109
p 10E Denotemos por r = r(x, y, z) = x2 + y 2 + z 2 y sea f una funci´on de R en R de clase C 2 . Probar que si r 6= 0 entonces 1. H f (r) = rf 0 (r). 2. ∆ f (r) = f 00 (r) +
n−1 0 f (r) r
Ver el ejercicio 9B para las definiciones de H y ∆ 10F Demostrar (a) Si h(x, y) = g(ax ± by), entonces 1/a2
2 ∂2h 2∂ h = 1/b ∂x2 ∂y 2
(b) Si h(x, y) = xg(ax + by), entonces 1/a2
2 ∂2h ∂2h 2∂ h − 2/ab + 1/b = 0. ∂x2 ∂x∂y ∂y 2
(c) Si h(x, y) = xg(y/x), entonces x2
2 ∂2h ∂2h 2∂ h + 2xy + y = 0. ∂x2 ∂x∂y ∂y 2
10G Una funci´on escalar f de varias variables se dice homog´enea de grado p si f (tx) = tp f (x) para todo t > 0. (a) Probar que si f es una funci´on homog´enea de grado p, sus derivadas parciales de orden r < p (si existen) son funciones homog´eneas de grado p − r. (b) Si f es una funci´on homog´enea y diferenciable, sea g(t, x) = f (tx) = tp f (x). Probar que X ∂f ∂g (x) = ptp−1 f (x) = xi (tx). ∂t ∂xi Deducir de esto que H f = pf (c) Demostrar que las funciones homog´eneas diferenciables (de grado p) son justamente las que verifican la condici´on H f = pf . ´ n. Considerar la funci´on g(t, x) = 1/tp f (tx) y probar que la conIndicacio dici´on H f = pf implica que ∂g ∂t (t, x) = 0, aplicar entonces el resultado del ejercicio 5G 10H Probar que una funci´on f : Rn → Rp es de clase C ∞ si y s´olo si sus derivadas parciales de cualquier orden son funciones localmente acotadas.
110
Diferenciales de Orden Superior
10I
10I Sean E, F, G espacios normados, f : A ⊂ E → F 2-veces diferenciable en o
o
a ∈ A, B ⊃ f (A) y g : B ⊂ F → G 2-veces diferenciable en f (a) ∈ B. Probar la f´ormula ¡ ¢ D2 (g ◦ f )(a)(u, v) = Dg(f (a))D2 f (a)(u, v) + D2 g(f (a)) Df (a)u, Df (a)v
10J Sea g una funci´on escalar de dos variables y clase C ∞ , y definamos a partir de g la funci´on de una variable h(x) = g(x, x). Demostrar que h es una funci´on de clase C ∞ y que su derivada n-´esima viene dada por la f´ormula: h
(n)
(x) =
n µ ¶ X n k=0
∂ng (x, x) k ∂xk ∂y n−k
Cap´ıtulo 11
Teoremas de Taylor Una vez m´as nos disponemos a extender a las funciones de varias variables resultados ya conocidos para funciones de una variable, los teoremas de on del concepto de aproximaci´on de Taylor. Comenzaremos con la extensi´ polinomio de Taylor y, m´as generalmente, del concepto de polinomio al marco de los espacios normados.
Definiciones Definici´ on 11.1 Sea f : A ⊂ E → F una aplicaci´on r-veces diferenciable o
en un punto a ∈ A. Llamaremos polinomio de Taylor de orden r de la funci´on f en a a la expresi´on
Pr f (a)x = f (a) +
r X 1 k D f (a)xk , k! k=1
k
donde con Dk f (a)xk denotamos abreviadamente a Dk f (a)(x, .c . ., x). En dimensi´on finita, es decir si E = Rn , teniendo en cuenta la f´ormula que relaciona la diferencial de orden k de una funci´on con sus derivadas 111
112
Teoremas de Taylor
11.1
parciales de orden k, el polinomio de Taylor quedar´a as´ı µ ¶ ∂f ∂f Pr f (a)x = f (a) + (a)x1 + . . . + (a)xn ∂x1 ∂xn µ 2 2 1 ∂ f ∂ f (a)x1 x2 + (a)x21 + 2 2 ∂x1 ∂x1 ∂x2 ¶ ∂2f + (a)x2 x1 + . . . ∂x2 ∂x1 + ................................................................. Como vemos, el polinomio de Taylor resulta un polinomio de varias variables en el sentido habitual. Observemos que, debido a que se pueden permutar las derivaciones, en el polinomio de Taylor aparecen muchos t´erminos iguales entre s´ı. Por ejemplo si r ≥ 5, el n´ umero de t´erminos repetidos, cuya parte literal es x21 x37 ser´a igual al n´ umero de formas posibles de obtener ∂5f (a) ∂x21 ∂x37 es decir a las permutaciones con repetici´on de cinco elementos con dos y tres repetidos, por tanto 5!/2!3!. Luego, una vez agrupados todos estos t´erminos, nos quedar´a un t´ermino en x21 x37 , cuyo coeficiente ser´a: ∂5f 1 ∂5f 1 5! (a) = (a). 2 3 5! 2!3! ∂x1 ∂x7 2!3! ∂x21 ∂x37 Definici´ on 11.2 Si E, y F son dos espacios normados, llamaremos polinomio de grado r a toda funci´on de E en F de la forma a0 + a1 x + a2 x2 + . . . + ar xr , donde cada ak es una aplicaci´on k-lineal sim´etrica y continua de E k en F y ar 6= 0. En el polinomio de Taylor los coeficientes ak son precisamente las aplicaciones k-lineales sim´etricas (1/k!)Dk f (a).
Los teoremas Nuestro objetivo en esta secci´on ser´a obtener teoremas de aproximaci´ on de funciones diferenciables mediante polinomios. Dada una funci´on f , se dir´a
11.3
Teoremas de Taylor
113
que el polinomio P (x) = a0 + a1 x + a2x + . . . + ar xr aproxima a f hasta el orden k (k = 1, 2, ...) en un entorno del punto a si lim
h→0
f (a + h) − P (h) = 0. khkk
En el siguiente teorema veremos que, como en el caso de una variable, el polinomio de Taylor de orden r de una funci´on r-veces diferenciable en un on en un entorno del punto. punto, aproxima hasta el orden r a esta funci´ Para ello vamos a usar como lema una versi´on conveniente del teorema de aproximaci´on (¿local?) de Taylor para funciones de una variable Lema 11.3 Sea f : [a, b] ⊂ R → R una funci´on (r-1)-veces derivable en [a, b] y r-veces derivable en a. Entonces existe un punto ξ ∈ (a, b) tal que µ ¶ (b − a)r f r−1 (ξ) − f r−1 (a) r − f (a) . f (b) − Pr f (a)(b − a) = r! ξ−a Demostraci´ on. Por inducci´on sobre r. Veamos que el lema es cierto para r = 2. Consideremos para ello las funciones siguientes ¡ ¢ g(x) = f (x) − P2 f (a)(x − a) = f (x) − f (a) + f 0 (a)(x − a) + 1/2f 00 (a)(x − a)2 h(x) = (x − a)2 . Puesto que f es derivable en [a, b], es evidente que g y h son tambi´en derivables en [a, b]. Aplicando entonces el teorema del valor medio, se tiene que ¡ ¢ ¡ ¢ g(b) − g(a) h0 (ξ) = h(b) − h(a) g 0 (ξ) , a < ξ < b. Haciendo las sustituciones correspondientes obtenemos ¡ ¢ 2(f (b) − P2 f (a)(b − a))(ξ − a) = (b − a)2 f 0 (ξ) − (f 0 (a) + f 00 (a)(ξ − a)) , lo que implica (b − a)2 f (b) − P2 f (a)(b − a) = 2
µ
¶ f 0 (ξ) − f 0 (a) 00 − f (a) , ξ−a
que es justamente la f´ormula que busc´abamos. Supongamos pues, como hip´otesis de inducci´on, que el resultado se verifica para r −1, y consideremos las funciones g(x) = f (x) − Pr f (a)(x − a) h(x) = (x − a)r .
114
Teoremas de Taylor
11.3
Es inmediato comprobar que g y h son derivables en [a, b]. Aplic´ andolas entonces el teorema del valor medio, se tiene ¡ ¢ ¡ ¢ g(b) − g(a) h0 (ξ1 ) = h(b) − h(a) g 0 (ξ1 ) , a < ξ1 < b. O sea que (11.1) ¡ ¢ r f (b) − Pr f (a)(b − a) (ξ1 − a)r−1 ¡ ¡ ¢¢ f r (a) = (b − a)r f 0 (ξ1 ) − f 0 (a) + f 00 (a)(ξ1 − a) + . . . + (ξ1 − a)(r−1) . (r − 1)! La expresi´on entre corchetes es f 0 (ξ1 ) − Pr−1 f 0 (a)(ξ1 − a), por lo que aplicando la hip´otesis de inducci´on a f 0 en el intervalo [a, ξ1 ], podemos escribir µ ¶ (ξ1 − a)r−1 f r−1 (ξ) − f r−1 (a) r 0 0 − f (a) , f (ξ1 ) − Pr−1 f (a)(ξ1 − a) = (r − 1)! ξ−a donde a < ξ < ξ1 . De esto se deduce, teniendo en cuenta 11.1 que ¡ ¢ r f (b) − Pr f (a)(b − a) (ξ1 − a)r−1 µ r−1 ¶ r−1 f (ξ) − f r−1 (a) r (ξ1 − a) r = (b − a) − f (a) , (r − 1)! ξ−a luego (b − a)r f (b) − Pr f (a)(b − a) = r!
µ
¶ f r−1 (ξ) − f r−1 (a) r − f (a) . ξ−a
Nota. Observemos que el lema anterior no resulta v´alido para r = 1. Concretamente, no es cierto en general que si f es una funci´on continua en el intervalo [a, b] y derivable en a exista un punto ξ intermedio tal que ¶ µ ¡ ¢ f (ξ) − f (a) − f 0 (a) . f (b) − f (a) + f 0 (a)(b − a) = (b − a) ξ−a En efecto, realizando una serie de operaciones elementales, lo anterior significar´ıa que para alg´ un punto intermedio entre a y b se deber´ıa de satisfacer la igualdad f (b) − f (a) f (ξ) − f (a) = . b−a ξ−a Pero es f´acil de encontrar muchas funciones para las que eso no es posible.
11.4
Teoremas de Taylor
115
Teorema 11.4 (Local de Taylor) Si la aplicaci´on f : A ⊂ Rn → Rp es o
r-veces diferenciable en un punto a ∈ A, entonces su polinomio de Taylor de orden r en a aproxima hasta el orden r a f en un entorno del punto a. Es decir f (a + h) − Pr f (a)h lim = 0. h→0 khkr Demostraci´ on. Es evidente que la demostraci´on estar´a completa si se prueba que dado ε > 0 existe δ > 0 tal que si khk ≤ δ entonces kf (a + h) − Pr f (a)hk ≤
1 εkhkr . r!
Obviamente se puede suponer que f es una funci´on escalar. Por ser f r-veces diferenciable en a existe δ tal que si kuk ≤ δ entonces kDr−1 f (a + u) − Dr−1 f (a) − Dr f (a)uk ≤ ε. kuk
(11.2)
Fijemos h tal que khk ≤ δ, a + h ∈ A y f resulte (r-1)-veces derivable en [a, a + h]. Consideremos la aplicaci´ on F = f ◦ λ, donde λ es la aplicaci´on del intervalo [0, 1] en A dada por λ(t) = a + th. Puesto que λ es una aplicaci´on de clase C ∞ , la aplicaci´on F es r-veces derivable en 0 y (r-1)-veces derivable en [0,1]. Por tanto, a la aplicaci´on de una variable, F , se le puede aplicar el lema anterior, de lo que resulta µ ¶ 1 F (r−1) (θ) − F (r−1) (0) r − F (0) . (11.3) F (1) − Pr F (0)1 = r! θ Para escribir esta igualdad en t´erminos de la funci´on f y sus derivadas, vamos a utilizar la f´ormula (que despu´es demostraremos) F (k) (t) = Dk f (a + th)hk . De este modo, 11.3 queda as´ı µ
f (a + h) − Pr f (a)(a + h)
+ θh)hr−1 − Dr−1 f (a)hr−1 − Dr f (a)hr θ 1 Dr−1 f (a + θh) − Dr−1 f (a) − Dr f (a)(θh) r−1 = h . r! θ
1 = r!
Dr−1 f (a
¶
116
Teoremas de Taylor
11.4
Se deduce pues que ¯ ¯ ¯f (a + h) − Pr f (a)h¯
¯ ¯ ¯ 1 Dr−1 f (a + θh) − Dr−1 f (a) − Dr f (a)(θh) r−1 ¯ ¯ =¯ h ¯¯ r! θ 1 kDr−1 f (a + θh) − Dr−1 f (a) − Dr f (a)(θh)k ≤ khkkhkr−1 . r! θkhk De la condici´on (11.2) se sigue que kDr−1 f (a + θh) − Dr−1 f (a) − Dr f (a)(θh)k ≤ ε. θkhk Por tanto kf (a + h) − Pr f (a)hk ≤
1 εkhkr . r!
11.5 Demostraci´on de la f´ormula F (k) (t) = Dk f (a + th)hk . Razonemos por inducci´ on. Para k = 1, se obtiene sin m´as que aplicar la regla de la cadena ¡ ¢ F 0 (t) = D(f ◦ λ)(t)1 = Df (λ(t)) ◦ Dλ(t) 1 = Df (a + th)λ0 (t) = Df (a + th)h. Supongamos cierta la f´ormula para k − 1, es decir F (k−1) (s) = Dk−1 f (a + sh)hk−1 . Esta aplicaci´on resulta ser la composici´on de las funciones λ
g
[0, 1] → A ⊂ Rn → R s → x = a + sh → Dk−1 f (x)hk−1 Luego F (k) (t) = (F (k−1) )0 (t) = D(F (k−1) (t)1 = D(g ◦ λ)(t)1 = Dg(a + th)h. Para terminar s´olo queda calcular la diferencial de la aplicaci´on g en el punto a + th. Para ello consideremos la siguiente descomposici´ on de g: Dk−1 f
φ
x −−−−→ Dk−1 f (x) −−−−→ Dk−1 f (x)hk−1
11.7
Teoremas de Taylor
117
El segundo factor en la descomposici´on anterior es una aplicaci´on lineal y continua, por lo que se deduce que F (k) (t) = Dg(a + th)h = D(φ ◦ Dk−1 f )(a + th)h = (φ ◦ Dk f (a + th))h = Dk f (a + th)hk .
11.6 Seg´ un el teorema local de Taylor, una condici´on suficiente para que una funci´on pueda aproximarse hasta el orden r mediante un polinomio, en un entorno de un punto, es que sea r-veces diferenciable en ese punto. Esta condici´on no es, sin embargo, necesaria (para un teorema rec´ıproco del teorema de Taylor, ver Avez [2, §4.5]). En efecto, consideremos, por ejemplo, la funci´on 1 f (x) = x3 sen . x El polinomio 0 aproxima hasta el orden 2 a la funci´on f en un entorno de 0, pues f (x) 1 lim = lim x sen = 0. x→0 x2 x→0 x En cambio, f no es 2-veces derivable en 0. Teorema 11.7 (Unicidad del polinomio de Taylor) Sea f : A ⊂ Rn → o
Rp y a ∈ A. Entonces, para cada r ≥ 1 existe a lo sumo un polinomio de grado ≤ r, que aproxima a f hasta el orden r en un entorno del punto a. En particular, si f es r-veces diferenciable en a, entonces ese polinomio es el de Taylor de orden r. on. Para simplificar, vamos a hacer la demostraci´on en el punto Demostraci´ a = 0. Supongamos entonces que existen dos polinomios que satisfacen el teorema, es decir f (x) − (a0 + a1 x + . . . + ar xr ) =0 x→0 kxkr f (x) − (b0 + b1 x + . . . + br xr ) lim =0 x→0 kxkr lim
y probemos que ambos polinomios coinciden. Si llamamos ck = ak − bk , nuestra hip´otesis implica que c0 + c1 x + . . . + cr xr = 0. x→0 kxkr lim
118
Teoremas de Taylor
11.7
Se trata de ver, por tanto, que el u ´nico polinomio que tiene la propiedad anterior es el id´enticamente nulo, o sea que ck = 0 para todo k. Procederemos por inducci´on. Trivialmente c0 = 0. Supongamos que cj = 0 si j < k y veamos que tambi´en ck = 0 : Observemos en primer lugar que la condici´ on c0 + c1 x + . . . + cr xr =0 x→0 kxkr lim
implica que
c0 + c1 x + . . . + cr xr = 0 , ∀k ≤ r. x→0 kxkk lim
Se tiene entonces
µ ¡ x ck xk + . . . + cr xr x ¢ = lim ck 0 = lim ,..., k x→0 x→0 kxk kxk kxk ¢ ¡ x x ,..., ,x + ... + ck+1 kxk kxk ¶ ¡ x ¢ x + cr ,..., , x, . . . , x kxk kxk ¡ x x ¢ ,..., , = lim ck x→0 kxk kxk
donde la segunda igualdad se obtiene gracias a que ° ° ° ¡ x ¢° x °cj ° ° kxk , . . . , kxk , x, . . . , x ° ≤ kcj k · 1 · . . . · 1 · kxk . . . kxk ¡ x ¢ x ,..., , x, . . . , x = 0 , ∀j > k. ⇒ lim cj x→0 kxk kxk Hemos obtenido pues que
ck xk = 0. x→0 kxkk Por tanto, cualquiera que sea x 6= 0, se tiene que lim
0 = lim
t→0+
ck (tx)k tk ck xk ck xk = lim = , ktxkk kxkk t→0+ tk kxkk
lo que implica ck xk = 0, para todo x. Para probar que de esto se deduce ya que ck = 0, basta tener en cuenta la siguiente f´ormula para aplicaciones k-lineales y sim´etricas (ver [22]) 1 X (11.4) ck (x1 , . . . , xk ) = ε1 ε2 . . . εk ck (ε1 x1 + . . . + εk xk )k , k!2k donde εi = ±1.
11E
Teoremas de Taylor
119
Teorema 11.8 Sea f : A ⊂ Rn → R, donde A es un conjunto abierto. Si f es de clase C r en el segmento [a, b] ⊂ A y (r + 1)-veces diferenciable en (a, b), entonces existe un punto ξ ∈ (a, b) tal que f (b) − Pr f (a)(b − a) =
1 Dr+1 f (ξ)(b − a)r+1 . (r + 1)!
Demostraci´ on. Basta aplicar el teorema de Taylor con resto de Lagrange a la funci´on de una variable F (t) = f (a + t(b − a)) en el intervalo [0,1]. Nota. El teorema global de Taylor anterior (s´ olo v´alido en esta forma para funciones escalares), es para el caso r = 1 el teorema del valor medio para funciones escalares (ver Teorema 8.9): Si f : A ⊂ Rn → R es una funci´ on continua en el segmento [a, b] ⊂ A y derivable en (a, b), entonces existe un punto ξ ∈ (a, b) tal que X ∂f f (b) − f (a) = Df (ξ)(b − a) = (ξ)(bj − aj ). ∂xj
Ejercicios 11A Obtener el coeficiente del t´ermino en x4 yz 2 del desarrollo de Taylor en el origen de una funci´on de las variables x, y, z. 11B Si en el desarrollo de Taylor en el origen de una funci´on de las variables x, y, z el u ´nico t´ermino de grado 7 es 3x4 yz 2 , ¿cu´ales son las derivadas parciales de orden 7 de esta funci´on en (0, 0, 0)? 11C Supuesta conocida la funci´on f y sus derivadas, obtener el polinomio de Taylor de orden 2 de la funci´on g(x, y, z) = f (xy, xz) en un entorno del punto (0, 0, 0). 11D Obtener el polinomio de Taylor de orden 3 de la funciones cos x f (x, y) = ; g(x, y) = cos xy cos y en un entorno de (0,0) 11E (a) Probar que si P es un polinomio de grado r, entonces Q(x) = P (x + a) es tambi´en un polinomio de grado r. De hecho Q es el polinomio de Taylor de orden r de P en el punto a. (b) Obtener los polinomios de Taylor de orden 2, 3 y 4 de la funci´on f (x, y, z) = 1 + xy + 2yz − x3 − 3yz 2 en los puntos (0, 0, 0) y (1, 0, −2). Expresar f como un polinomio en potencias de (x − 1), y, (z + 2).
120
Teoremas de Taylor
11F
11F Sea f (x, y) = 3x2 y 2 +x4 +y 4 +sen3 xy. Demostrar que el polinomio de Taylor de orden 5 para la funci´on f en (0,0) es igual a 3x2 y 2 + x4 + y 4 . 11G Supongamos que f es una funci´on de clase C 6 , tal que f (x, y, z) − (2x − yz 2 + x2 yz + z 3 x2 ) = 0. (x2 + y 2 + z 2 )3 (x,y,z)→(0,0,0) lim
(a) Obtener P6 f (0, 0, 0)(x, y, z), P5 f (0, 0, 0)(x, y, z) y P3 f (0, 0, 0)(x, y, z) (b) Calcular las derivadas parciales de f en (0, 0, 0) hasta el orden 6. 11H Demostrar, sin tener que hacer el c´alculo, que todas las derivadas parciales de orden ≤ 8 de la funci´on f (x, y) = sen(x9 + y 9 ) son nulas en (0,0). Probar asimismo que igual sucede con las de orden ≤ 5 para la funci´on g(x, y, z) = cos xyz. 11I Estudiar la existencia de los l´ımites siguientes haciendo el desarrollo de Taylor que convenga y aplicando despu´es el teorema de Taylor que proceda. 1. 3. 5. 7. 9.
xy − sen x sen y x2 + y 2 xy − sen x sen y p lim (x,y)→(0,0) x6 + y 6 p 2xy − 1 + cos 2(x + y) lim x2 + y 2 (x,y)→(0,0) xey − yex − x + y lim x2 + y 2 (x,y)→(0,0) xey − yex lim (x,y)→(0,0) x2 + y 2 lim
(x,y)→(0,0)
xy − sen x sen y (x2 + y 2 )3/2 sen x + cos y − cos x − x + y 2 4. lim x2 + y 2 (x,y)→(0,0)
2.
lim
(x,y)→(0,0)
sen2 x + sen2 y x2 + y 2 (x,y)→(0,0) xey − yex − x + y + x3 8. lim x2 + y 2 (x,y)→(0,0) xey − yex − x + y 10. lim x2 + y 2 (x,y)→(0,0) 6.
lim
11J Sean f, g funciones escalares de varias variables y de clase C ∞ tales que f (0) = g(0) = 0, y para las que el cociente f (x)/g(x) est´a definido en todo punto x 6= 0 de alg´ un entorno de 0 (para concretar se puede suponer por tanto que g(x) ≥ 0 en ese entorno). (a) Para cada x denotemos por r(x) y s(x), respectivamente, a los n´ umeros naturales m´as peque˜ nos (o infinito) tales que Dr(x) f (0)xr(x) 6= 0, Ds(x) g(0)xs(x) 6= 0. Demostrar que si existe limx→0 f (x)/g(x) = l (l finito), entonces: i) r(x) ≥ s(x) para todo x; ii) si para alg´ un x, r(x) > s(x), l = 0; iii) si para alg´ un x, r(x) = s(x) < ∞, l 6= 0. (b) Sea r = min{r(x) : x ∈ Rn } , s = min{s(x) : x ∈ Rn } y supongamos que r y s son finitos, es decir Dr f (0) 6= 0, Ds g(0) 6= 0, y ´estas son las primeras derivadas de f y g que no se anulan en 0. Se tiene entonces:
11L
Teoremas de Taylor
121
i) Si r < s el limx→0 f (x)/g(x) no es finito. ii) Si r = s una condici´on necesaria para la existencia de limx→0 f (x)/g(x) es que Dr f (0) = kDs g(0). En ese caso, si existe el l´ımite, su valor es k (y por tanto 6= 0). x2 + y 3 iii) Sea h(x, y) = 2 . Es evidente que en este ejemplo x + y4 r = s = 2, 1/2D2 f (0, 0)(x, y)2 = 1/2D2 g(0, 0)(x, y)2 = x2 . Sin embargo, no existe lim(x,y)→(0,0) f (x, y)/g(x, y). iv) Si r > s el u ´nico valor posible del limx→0 f (x)/g(x) es el 0. (c) Cada una de estas condiciones implica la siguiente: g(x) = ∞. kxks ii) Ds g(0)xs 6= 0, ∀x 6= 0. iii) Existe λ > 0 tal que g(x) ≥ λkxks para x en alg´ un entorno de 0. iv) Si r > s entonces limx→0 f (x)/g(x) = 0. Si r = s y Dr f (0) = lDs g(0) (l 6= 0) entonces limx→0 f (x)/g(x) = l. i) limx→0
11K En cada uno de los ejemplos siguientes comprobar si se satisface la condici´on necesaria (a) y/o alguna de las condiciones suficientes de (c) y estudiar la existencia del l´ımite en (0,0). 1. h(x, y) = 3. h(x, y) = 5. h(x, y) = 7. h(x, y) = 9. h(x, y) =
(x − y)3 . (x − y)2 + x4 x5 + y 3 x2 − x3 y 2 + y 4 x x4 + y 4 − x2 y 2 + y 6 4 x + y 2 x2 + y 4 x + y 6 x4 + x2 y 2 + y 6 4 x + y 2 x2 + (x + y)6 x4 + x2 y 2 + y 6 x sen y − y sen x (sen2 x + sen2 y)2
x5 + y 3 x − x2 y 2 + y 4 x x4 + y 4 − x2 y 2 + y 6 x5 + y 3 x2 − x3 y 2 + y 4 x 4. h(x, y) = x4 + x2 y 2 + y 6 5 x + y4 x + y7 6. h(x, y) = 4 x + x2 y 2 + y 6 x sen y − y sen x 8. h(x, y) = sen2 x + sen2 y xy − sen x sen y 10. h(x, y) = x4 + y 4 2. h(x, y) =
11L Sea P un polinomio homog´eneo de n variables y grado k ≥ 1 y f : R → R una funci´on derivable hasta el orden que necesitemos. Consideremos la funci´on g = f ◦ P. (a) Probar que para cada 0 ≤ j < k se verifica que Pkr+j g(0)x = Pr f (0)(P (x)) (b) Aplicar (a) para calcular el polinomio de Taylor de orden 7 en (0,0) de la funci´on f (x, y) = cos(x2 − xy).
122
Teoremas de Taylor
11M
11M (a) Sea f : R → R una funci´on n-veces diferenciable en 0. Probar que si 1 ≤ k < n, la funci´on g(t) =
f (t) − Pn f (0)t ; tn−k
g(0) = 0
es k-veces diferenciable en 0. ´ n: Razonar por inducci´on sobre k. Indicacio (b) Deducir de (a) que si f es n-veces diferenciable en 0 (n ≥ 2), entonces la funci´on f (t) − f (0) h(t) = ; h(0) = f 0 (0) t es (n − 1)-veces diferenciable en 0, siendo Pn−1 g(0)t = f 0 (0) + 1/2!f 00 (0)t + . . . + 1/n!f (n) (0)tn−1 (c) Utilizar lo anterior para demostrar que las funciones sen x − sen y si x 6= y x−y g1 (x, y) = cos x si x = y √ 1 − 1 + xy si xy 6= 0 g2 (x, y) = xy 0 si xy = 0 son de clase C ∞ (g2 en alg´ un entorno de (0,0)). Obtener el polinomio de Taylor de orden 4 en (0,0) de ambas funciones. 11N Sea f : R2 → R. (a) Probar que si f es una aplicaci´on de clase C r , entonces la aplicaci´on g(x, y) = xf (x, y) es (r + 1)-veces diferenciable en (0,0). (b) Demostrar que Pr+1 g(0, 0)(x, y) = xPr f (0, 0)(x, y).
Cap´ıtulo 12
Extremos Relativos Una aplicaci´on cl´asica del Teorema Local de Taylor, que vimos en el cap´ıtulo anterior, es el estudio de los extremos relativos de una funci´on escalar. Aunque la analog´ıa con el caso de una variable es total, hay algunas diferencias que surgen de manera natural por el paso a una dimensi´on superior. En lo sucesivo trabajaremos con funciones escalares, definidas sobre un conjunto A ⊂ Rn . Se dir´a que una tal funci´on presenta un extremo relativo o
en un punto a ∈ A, si existe un entorno V de a contenido en A, tal que la diferencia f (x) − f (a) no cambia de signo cuando x ∈ V : M´ aximo Si f (x) − f (a) ≤ 0. M´ınimo Si f (x) − f (a) ≥ 0.
Condiciones necesarias de extremo Cuando f es una funci´on diferenciable se obtiene la siguiente condici´ on nealoga a la de funciones de una variable. cesaria de extremo, totalmente an´ Proposici´ on 12.1 Si f es diferenciable en a y presenta un extremo relativo en ese punto, entonces Df (a) = 0. on. Supongamos, para concretar, que f presenta un m´ınimo en Demostraci´ a. Sea entonces h un vector cualquiera y sea δ > 0 tal que para cada t ∈ [−δ, δ] f (a + th) − f (a) ≥ 0. Sea F = f ◦ λ, donde λ es la aplicaci´on de [−δ, δ] en A, λ(t) = a + th. Entonces F es una aplicaci´on de una variable, derivable en 0 y que presenta 123
124
Extremos Relativos
12.1
un m´ınimo relativo en ese punto. Luego su derivada en 0, F 0 (0) debe ser igual a 0. Se tiene pues: 0 = F 0 (0) = Df (a) · h.
12.2 Por tanto, el proceso para encontrar los puntos de extremo relativo para una funci´on diferenciable comienza con el planteamiento del sistema Df (x) = 0 ⇔
∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n. ∂xi
Los puntos soluci´on de este sistema de n ecuaciones con n inc´ ognitas se denominan puntos cr´ıticos . Despu´es de la proposici´on 12.1, una condici´on necesaria para que la funci´on f presente un extremo relativo en un punto x es que x sea un punto cr´ıtico. Es bien conocido que para funciones de una variable, una condici´on necesaria y suficiente para que una funci´on suficientemente derivable presente un extremo relativo en un punto cr´ıtico, es que la primera derivada que no se anule en ese punto (supuesta que hay alguna) sea de orden par. Para funciones de varias variables, las cosas son menos simples y esta condici´on, aunque necesaria, no ser´a suficiente para garantizar la existencia de extremo. on 12.3 Sea f : A ⊂ Rn −→ R una aplicaci´on derivable hasta el Proposici´ o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1 y Dr f (a) 6= 0. Entonces, las siguientes condiciones son necesarias para que f presente un extremo relativo en el punto a: 1. r sea par. 2. Dr f (a)hr tenga signo constante. Concretamente Dr f (a)hr ≥ 0 para todo h (≤ 0), si en a hay un m´ınimo (m´aximo). on. Sea Demostraci´ ε(h) =
f (a + h) − Pr f (a)h (ε(0) = 0). khkr
Entonces (12.1)
f (a + h) − f (a) −
1 r D f (a)hr = ε(h) · khkr , r!
donde, por el teorema local de Taylor, ε(h) → 0 cuando h → 0.
12.4
Extremos Relativos
125
Supongamos, por ejemplo, que f presenta un m´ınimo en a y sea h un vector no nulo arbitrario. Existe entonces un n´ umero real δ > 0 tal que f (a + th) − f (a) ≥ 0 si | t |≤ δ. De la ecuaci´on 12.1 se sigue que para | t |≤ δ 1 r D f (a) (th)r + ε(th) · khkr ≥ 0 r!
⇒
tr r D f (a)hr + | t |r ε(th) · khkr ≥ 0, r!
y dividiendo por | t |r la expresi´on anterior, se tiene que para | t |≤ δ µ ¶ 1 t r r (12.2) D f (a)hr + ε(th) · khkr ≥ 0. r! | t | Pasando al l´ımite cuando t → 0+ en 12.2 y teniendo en cuenta que ε(th) → 0 , cuando t → 0, se deduce que (12.3)
1 r D f (a)hr ≥ 0 Para todo h ∈ Rn . r!
Si r fuese impar, lo anterior s´olo ser´ıa posible si Dr f (a)hr = 0, ya que la condici´on 12.3 implica tambi´en que 0 ≤ Dr f (a)(−h)r = (−1)r Dr f (a). Entonces, al ser h arbitrario, la aplicaci´on r-lineal Dr f (a) deber´ıa ser nula (ver f´ormula 11.4), lo que contradice la hip´otesis. Por lo tanto r es par y Dr f (a)hr ≥ 0. Nota. Como hemos visto la condici´ on r par de la proposici´on anterior no es preciso exigirla de modo expl´ıcito, ya que se deduce de la condici´on Dr f (a) tiene signo constante
Condici´ on suficiente de extremo Proposici´ on 12.4 Sea f : A ⊂ Rn −→ R una aplicaci´on derivable hasta el o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1. Entonces, una condici´on suficiente para que f presente un extremo relativo en a es que Dr f (a)hr > 0 para todo h 6= 0 (m´ınimo) o que Dr f (a)hr < 0 para todo h 6= 0 (m´aximo) Demostraci´ on. Consideremos la aplicaci´on Φ : h → Dr f (a)hr . Se trata de una aplicaci´on continua que toma sus valore en R, luego alcanza un m´ınimo sobre cada compacto, en particular sobre la esfera unidad S . As´ı pues, existe alg´ un punto u0 con ku0 k = 1 tal que cualquiera que sea u ∈ S, Dr f (a)ur ≥
126
Extremos Relativos
12.4
Dr f (a)ur0 = λ. La hip´otesis de esta proposici´on implica que el n´ umero λ debe ser estrictamente positivo. Sea ahora h 6= 0 un vector cualquiera. Entonces µ ¶ h h 1 Dr f (a) ,··· , ≥λ ⇒ Dr f (a)hr ≥ λ khk khk khkr ⇒ Dr f (a)hr ≥ λkhkr .
(12.4)
Veamos ya que en las condiciones de esta proposici´ on la funci´on f presenta un m´ınimo relativo en el punto a. 1 r D f (a)hr + ε(h)khkr r! µ ¶ λ λ r r ≥ khk + ε(h)khk = + ε(h) khkr . r! r!
f (a + h) − f (a) =
Como ε(h) → 0 cuando h → 0 y λ > 0, de lo anterior se deduce que f (a + h) − f (a) ≥ 0 para h suficientemente peque˜ no, luego f presenta un m´ınimo en a. Nota. En la proposici´on anterior puede sustituirse la hip´otesis “Dr f (a)hr > 0 para todo h 6= 0 (resp. < 0)” por “r es par y Dr f (a)hr 6= 0 para todo h 6= 0”. Adem´as que r sea par s´olo hay que exigirlo en el caso de que f sea una funci´on de una variable, en cuyo caso la demostraci´on es trivial. Supongamos que se trabaja en dimensi´on estrictamente mayor que 1 y que Dr f (a)hr 6= 0 para todo h 6= 0. Consideremos de nuevo la aplicaci´on Φ : h → Dr f (a)hr . Entonces P = Rn \ {0} es un conjunto conexo y por tanto su imagen por la aplicaci´on continua Φ, Φ(P ), es un conjunto conexo de R. Este conjunto conexo, si suponemos que Dr f (a)hr 6= 0 para todo h 6= 0, debe ser un intervalo que no contenga a 0, lo que s´olo es posible si Dr f (a)hr > 0 para todo h 6= 0 o bien Dr f (a)hr < 0 para todo h 6= 0. 12.5 En resumen, el procedimiento general para la obtenci´on de los puntos de extremos relativos es el siguiente: 1. Obtenci´on de los Puntos Cr´ıticos ∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n ∂xi Supongamos que a es un punto cr´ıtico y la primera derivada de la funci´on f que no se anula en a es la de orden r, entonces:
12.7
Extremos Relativos
127
2. r impar La funci´on f no tiene extremos en a 3. r par y Dr f (a)hr 6= 0 para todo h 6= 0. La funci´on presenta un extremo en a: • M´ınimo si Dr f (a)hr > 0 para todo h 6= 0. • M´ aximo si Dr f (a)hr < 0 para todo h 6= 0. 4. r par, pero existe alg´ un h 6= 0 tal que Dr f (a)hr = 0. • Dr f (a)hr no tiene signo constante. La funci´on f no tiene extremos en a • Dr f (a)hr tiene signo constante. Caso Dudoso.
Hessiano En esta secci´on vamos a estudiar la existencia de extremos en un punto en el caso particular de que la primera derivada que no se anule en ese punto sea la de orden 2, es decir Df (a) = 0 y D2 f (a) 6= 0. Para ello vamos a apoyarnos en la teor´ıa de las formas cuadr´aticas. 12.6 Una forma cuadr´atica φ sobre un espacio vectorial E es una aplicaci´on de E en R que coincide con la restricci´on a la diagonal de una forma bilineal sim´etrica ϕ, es decir para cada x ∈ E φ(x) = ϕ(x, x). La forma cuadr´atica φ se dir´a definida si φ(x) 6= 0, para cada x 6= 0 y se dir´a positiva (resp. negativa) si para todo x, φ(x) ≥ 0 (resp. φ(x) ≤ 0). Como es bien conocido, en dimensi´on finita, la forma cuadr´atica φ est´ a determinada por una matriz cuadrada y sim´etrica, la matriz (aij ) con aij = ϕ(ei , ej ), ei = (0, . . . , 1, . . . , 0). Por definici´on llamaremos Menor Principal de esta matriz a cada menor cuya diagonal principal est´e formada por elementos de la diagonal principal de φ. Denotaremos por ∆i , i = 1, 2, . . . , n al menor principal de orden i formado con las i primeras filas y las i primeras columnas. Los siguientes resultados sobre formas cuadr´aticas pueden verse en [13] Proposici´ on 12.7 Para una forma cuadr´atica φ sobre Rn se tiene: (i) φ es positiva si y s´olo si todos los menores principales de la matriz asociada son no negativos.
128
Extremos Relativos
12.7
(ii) φ es negativa si y s´olo si los menores principales de orden par son no negativos y los menores principales de orden impar no positivos. (iii) φ es definida positiva si y s´olo si ∆i > 0 para todo i. (iv) φ es definida negativa si y s´olo si (−1)i ∆i > 0 para todo i. Para aplicar esto al estudio de los extremos relativos, supongamos pues que f es una funci´on escalar de n variables reales tal que Df (a) = 0 y D2 f (a) 6= 0. Consideremos entonces la forma cuadr´atica X ∂2f (a)hi hj φ(h) = D2 f (a)h2 = ∂xi ∂xj i,j
La matriz asociada a esta particular forma cuadr´atica se conoce con el nombre de Hessiano de f en a y se trata, obviamente, de la matriz de las derivadas parciales segundas en a H(a) =
∂2f (a) ∂x21
∂2f ∂x1 ∂x2 (a)
∂2f
∂2f
∂x2 ∂x1 (a)
∂x22
···
(a)
···
···
···
···
∂2f ∂xn ∂x1 (a)
∂2f ∂xn ∂x2 (a)
···
∂2f ∂x1 ∂xn (a)
∂x2 ∂xn (a) ··· ∂2f (a) ∂x2 ∂2f
n
un ve´ıamos en las secciones anteriores, en el caso que estamos consideSeg´ rando una condici´on necesaria de m´ınimo relativo en a es que D2 f (a)h2 ≥ 0 para cada h, es decir que φ sea positiva. Y una condici´on suficiente que D2 f (a)h2 > 0 para todo h 6= 0, es decir que φ sea definida positiva. La proposici´on anterior nos da pues un criterio pr´actico para reconocer, a partir del Hessiano, la existencia, en algunos casos, de extremos relativos. 12.8 Cuando f es una funci´on de dos variables, el criterio del Hessiano tiene mayor alcance, es decir son menos los casos en los este criterio no nos permite decidir si existe o no un extremo en el punto. Concretamente, sea z = f (x, y) y (a, b) un punto cr´ıtico de f . Formemos el Hessiano de f en (a, b) H(a, b) =
∂2f (a, b) ∂x2
∂2f ∂x∂y (a, b)
∂2f ∂x∂y (a, b)
∂2f (a, b) ∂y 2
12C
Extremos Relativos
129
Entonces, si denotamos por ∆ al determinante de H(a, b), resulta 1. ∆ > 0 ⇒ Extremo: M´ınimo si ∆1 > 0. M´ aximo si ∆1 < 0 2. ∆ < 0 ⇒ No hay extremo 3. ∆ = 0 ⇒ Caso Dudoso Lo anterior se obtiene f´acilmente como consecuencia del criterio general: Si ∆ > 0 es inmediato comprobar que ∆1 6= 0, luego seg´ un el criterio del hessiano, habr´a un m´ınimo si ∆1 > 0 y un m´aximo si ∆1 > 0. Si ∆ < 0, la forma cuadr´atica φ no es ni positiva ni negativa, pues tanto para una cosa como para la otra es preciso que los menores principales de orden par sean no negativos y ∆ es un menor de orden 2.
Ejercicios 12A Sea f : U ⊂ Rn → R una funci´on r-veces diferenciable en el abierto U (r > 1) y supongamos que para alg´ un punto a ∈ U se tiene 1. todas las derivadas de orden menor que r se anulan en a; 2. para cada x de alguna bola centrada en a, Dr f (x)hr ≥ 0 para todo h ∈ Rn . Probar que entonces f presenta un m´ınimo relativo en a. 12B Estudiar la existencia de extremos relativos para las funciones 1. f (x, y) = x4 + y 4 − 2(x − y)2
2. f (x, y) = x3 + y 2 − xy 2
3. f (x, y) = x3 + y 3 − 3x2 y 2 + 1
4. f (x, y, z) = x4 + y 4 − 3x2 y 2 xz
5. f (x, y, z) = 2x4 + 2y 4 + z 4 − 4x2 y 2 z
6. f (x, y) = 2x4 + 3y 4 − 4x2 y 3
7. f (x, y) = x2 y + x2 + 2xy + xy 2 + y 2
8. f (x, y) = x4 + y 4 − xy 3 + 1
9. f (x, y) = x4 + y 4 − xy 4 + 1
10. f (x, y) = y 2 − 3x2 y + 2x4
11. f (x, y) = x3 + 3x2 y − xy 2 + 1
12. f (x, y) = x2 y 2 + xy 4
12C Demostrar que los siguientes enunciados son equivalentes (a) x2 + y 2 + z 2 ≥ α(xy + xz + yz), para todos x, y, z. (b) La funci´on f (x, y, z) = x2 + y 2 + z 2 − α(xy + xz + yz), presenta un m´ınimo relativo en el punto (0, 0, 0). (c) α ∈ [−2, 1].
130
Extremos Relativos
12D
12D Estudiar la existencia de extremos relativos para las funciones f (x, y) = sen |xy|, ax+y 2
0 < x ≤ π/2,
0 < y ≤ π/2.
+ b sen(x + by ) − y 2 . µ ¶ 1 1 f (x1 , . . . , xn ) = x1 x2 · · · xn + an+1 + ... + , (a > 0) , x ∈ Ω = (0, ∞)n x1 xn X 2 2 f (x1 , . . . , xn ) = ( ai xi )e−(x1 +...+xn )
f (x, y) = e
2
2
12E Demostrar que entre los pol´ıgonos convexos de n lados inscritos en una circunferencia, el pol´ıgono regular es el de mayor per´ımetro y tambi´en el de mayor ´area. 12F (T.de Rolle) Sea A un conjunto abierto de Rn de adherencia compacta, y ¯ Entonces, si f es sea f una funci´on escalar diferenciable en A y continua en A. constante sobre la frontera de A existe un punto a ∈ A tal que Df (a) = 0.
Cap´ıtulo 13
Funciones Impl´ıcitas: Existencia El teorema de las funciones impl´ıcitas constituye, junto con el de la funci´ on inversa, la herramienta te´orica b´asica para el estudio de las variedades diferenciables (curvas, superficies,...). Nosotros lo obtendremos como corolario de un teorema de punto fijo, que es una modificaci´ on del teorema de Banach de la aplicaci´on contractiva.
Un teorema de punto fijo Lema 13.1 Sea X un espacio m´etrico cualquiera, Y un espacio m´etrico completo y B una bola de Y de centro b y radio r. Supongamos que k : X × B → Y es una aplicaci´on que satisface: (a) k es contractiva respecto a la segunda variable, es decir existe una constante 0 < c < 1 tal que para cada x ∈ X, d (k(x, y1 ), k(x, y2 )) ≤ c d(y1 , y2 ). (b) k mueve el centro de B a una distancia menor (estrictamente) que r(1 − c), es decir, para cada x ∈ X, d(k(x, b), b) < r (1 − c). En estas condiciones se tiene que para cada x ∈ X existe un u ´nico punto y = h(x) ∈ B que satisface la ecuaci´on k(x, y) = y. Demostraci´ on. Para cada x ∈ X consideremos la aplicaci´on kx : B → F , definida por kx (y) = k(x, y). Si esta aplicaci´on fuese contractiva y estuviese definida de un espacio m´etrico completo en s´ı mismo, por el teorema de Banach del punto fijo, esta aplicaci´ on tendr´ıa un u ´nico punto fijo, es decir 131
132
Funciones Impl´ıcitas: Existencia
13.1
existir´ıa un u ´nico punto y ∈ B tal que k(x, y) = y, que es lo que queremos demostrar. Por la hip´otesis (a), la aplicaci´on kx es claramente contractiva. En cuanto a las dem´as condiciones del teorema del punto fijo, supongamos en primer lugar que B es una bola cerrada. En ese caso B es un subespacio cerrado de un espacio m´etrico completo, luego ´el tambi´en es completo. Adem´as kx (B) ⊂ B, pues si y ∈ B, es decir d(y, b) ≤ r, entonces d(kx (y), b) = d(k(x, y), b) ≤ d(k(x, y), k(x, b)) + d(k(x, b), b) ≤ c d(y, b) + (1 − c)r = r. Luego en este caso podemos concluir como quer´ıamos. Supongamos ahora que B es una bola abierta. Para cada x fijado sea r0 > 0 (dependiente de x) tal que d(k(x, b), b) < r0 (1 − c) < r(1 − c) y denotemos por B 0 a la bola cerrada de centro b y radio r0 . Entonces la restricci´on a B 0 de la aplicaci´on kx est´ a en las condiciones del caso anterior, luego debe tener un u ´nico punto fijo en B 0 . Con esto queda garantizada la existencia de un punto fijo para la aplicaci´ on kx en B, pero no la unicidad. Supongamos que y1 , y2 son dos puntos fijos para la misma aplicaci´ on kx , es decir kx (y1 ) = y1 , kx (y2 ) = y2 . Entonces d(y1 , y2 ) = d(kx (y1 ), kx (y2 )) ≤ cd(y1 , y2 ) y como c < 1, se deduce de lo anterior que y1 = y2 . En otros t´erminos, el resultado anterior dice que con esas hip´otesis sobre k, la ecuaci´on k(x, y) = y define (impl´ıcitamente) una funci´on h. Para cada x ∈ X, h(x) es el u ´nico punto fijo de la aplicaci´on kx en la bola B. Corolario 13.2 Sea k la aplicaci´on anterior y sea (x0 , y0 ) un punto soluci´on de la ecuaci´on k(x, y) = y (por tanto y0 = h(x0 )). Si suponemos adem´as que k es continua en (x0 , y0 ), entonces la aplicaci´on h tambi´en es continua en x0 .
13.4
Funciones Impl´ıcitas: Existencia
133
Demostraci´ on. Sea ε > 0. Por la continuidad de k en (x0 , y0 ), podemos encontrar un δ > 0 tal que si d(x, x0 ) < δ entonces d (k(x, h(x0 )), k(x0 , h(x0 ))) < ε(1 − c), luego d(h(x), h(x0 )) = d (k(x, h(x)), k(x0 , h(x0 ))) ≤ d (k(x, h(x)), k(x, h(x0 ))) + d (k(x, h(x0 )), k(x0 , h(x0 ))) ≤ cd(h(x), h(x0 )) + ε(1 − c). De lo anterior se deduce que d(h(x), h(x0 )) < ε.
El problema de las Funciones Impl´ıcitas Antes de enunciar el teorema de existencia de Funciones Impl´ıcitas, conviene precisar bien algunos conceptos que vamos a utilizar con frecuencia y hacer algunas consideraciones sobre el tipo de problemas que vamos a tratar ahora. Definici´ on 13.3 Sean X, Y espacios topol´ogicos, M un subconjunto no vac´ıo de X × Y y (a, b) un punto de M . Diremos que M es, en alg´ un entorno de (a, b), la gr´afica de una funci´on de x (de y), si existen entornos abiertos U y V de a y b, respectivamente, y una funci´on h definida sobre U (una funci´on g definida sobre V ) tal que M ∩ (U × V ) = {(x, h(x)) : x ∈ U } (M ∩ (U × V ) = {(g(y), y)) : y ∈ V }) Observemos que en la definici´on anterior se pide algo m´as que la existencia de un entorno W de (a, b) tal que M ∩ W sea la gr´afica de una funci´on de x (de y)(Ver ejercicio 13C) Proposici´ on 13.4 Sean X, Y espacios topol´ogicos, M un subconjunto no vac´ıo de X × Y y (a, b) un punto de M . Son equivalentes: (a) M es, en alg´ un entorno de (a, b), la gr´afica de alguna funci´on de x (de y). (b) Existen entornos abiertos U y V de a y b, respectivamente, tales que para cada x ∈ U (y ∈ V ) existe un u ´nico y ∈ V (x ∈ U ) con (x, y) ∈ M . Demostraci´ on. (a)⇒ (b). Supongamos, para concretar, que existen entornos abiertos U y V de a y b, respectivamente, y una funci´on h : U → Y tal que M ∩ (U × V ) = {(x, h(x)) : x ∈ U }. Entonces, si x ∈ U existe un punto
134
Funciones Impl´ıcitas: Existencia
13.4
h(x) ∈ V tal que (x, h(x)) ∈ M ; y si para alg´ un y ∈ V se satisface que (x, y) ∈ M entonces (x, y) ∈ M ∩ (U × V ), por lo que de (a) se deduce que y = h(x). (b)⇒ (a). Sean U y V en las condiciones de (b) y definamos la aplicaci´on de U en V , h(x) = u ´nico punto y ∈ V tal que (x, y) ∈ M . Es claro entonces que M ∩ (U × V ) = {(x, h(x)) : x ∈ U }. Ejemplos 13.5 1. Sea M el conjunto de puntos del plano que satisfacen la ecuaci´on sen2 (π/2)xy = 1. Es claro que M es la uni´on de las hip´erbolas xy = 2k + 1, k ∈ Z. Para cada x existen pues infinitos y tales que (x, y) ∈ M y tambi´en, para cada y infinitos x tales que (x, y) ∈ M . Luego M no puede ser la gr´afica de una funci´on de x ni tampoco la gr´afica de una funci´on de y. Sin embargo, es f´acil ver que localmente s´ı, es decir para cada (x, y) ∈ M , M es, en alg´ un entorno de (x, y), la gr´afica de una funci´on de x (y en este caso tambi´en de y). 2. Sea ahora M el conjunto de puntos del plano que satisfacen la ecuaci´on (y − x2 )(x2 + y 2 − 1) = 0. Tampoco M es, globalmente, la gr´afica de una funci´on de x ni la de una funci´on de y. Pero, en este caso, ni siquiera localmente lo es. Concretamente en esta curva hay tres tipos diferentes de puntos: Para algunos existe un entorno U × V tal que la traza de M con ´el es la gr´afica de una funci´on de x definida sobre U y tambi´en la gr´afica de una funci´on de y definida sobre V . Para otros, como por ejemplo el (0,1), dicha traza s´olo es la gr´afica de una funci´on de x o s´olo de y, como en el caso del punto (1,0). Por u ´ltimo 2 2 est´an los dos puntos de corte de la curva y = x con la curva x + y 2 = 1, en ning´ un entorno de ellos M puede ser la gr´afica de una funci´on. Un subconjunto M ⊂ Rk se dir´a que es una variedad diferenciable de dimensi´on n < k y clase C r si M es, en un entorno de cada punto z ∈ M , la gr´afica de alguna funci´on de n-variables y clase C r . Las variedades diferenciables son objetos matem´aticos b´asicos para la Geometr´ıa Diferencial: una parte importante de esta materia es el C´ alculo Diferencial e Integral sobre Variedades. Seg´ un esta definici´on es claro que el conjunto M del primero de los ejemplos es una variedad diferenciable de R2 de dimensi´on 1, mientras que no lo es el del segundo ejemplo. El estudio de las variedades diferenciables se fundamenta en el teorema de las funciones impl´ıcitas. Para establecer dicho teorema, partiremos de una ecuaci´on de la forma f (x, y) = 0, donde f es una funci´on definida sobre un subconjunto A ⊂ Rn × Rp y con valores en Rp . La ecuaci´on consiste en realidad en un sistema de p ecuaciones (tan-
13.6
Funciones Impl´ıcitas: Existencia
135
tas ecuaciones como coordenadas yj ). Muchas curvas y superficies cl´asicas vienen dadas como el lugar geom´etrico de los puntos que satisfacen un sistema de los anteriores: Una curva plana, mediante una sola ecuaci´on de dos inc´ognitas. Una superficie, tambi´en mediante una sola ecuaci´on pero de tres inc´ognitas. Una curva en R3 , como intersecci´ on de dos superficies, es decir mediante un sistema de dos ecuaciones y tres inc´ ognitas. Nuestro inter´es no estar´a en resolver la ecuaci´on f (x, y) = 0, lo cual puede ser un problema bien dif´ıcil e incluso insoluble de forma exacta, sino en estudiar si el lugar geom´etrico M de los puntos que satisfacen esta ecuaci´ on, es, en alg´ un entorno de un punto (a, b) de M , la gr´afica de una funci´on de x. Cuando esto ocurre, se dir´a, tambi´en, que en alg´ un entorno de (a, b) la ecuaci´on permite un entorno de (a, b), la ecuaci´on despejar a y como funci´on de x, o que, en alg´ define a y como funci´on impl´ıcita de x. El teorema de existencia de funciones impl´ıcitas establecer´a condiciones suficientes para ello. Para enunciarlo necesitaremos a´ un algunas notaciones y resultados previos: Sea f = (f1 , . . . , fp ) una funci´on de A ⊂ Rn × Rp en Rp y (a, b) un punto o
de A. Denotaremos entonces por D1 f (a, b) a la diferencial (si existe) de la funci´on x → f (x, b) en el punto a. De la misma forma se define D2 f (a, b). Es evidente que D1 f (a, b) y D2 f (a, b) son, respectivamente, las aplicaciones lineales dadas por las matrices ¶ µ ¶ µ ∂fi ∂fi (a, b) ; (a, b) . ∂xj ∂ys i,s i,j La proposici´on siguiente constituye una generalizaci´on natural de resultados bien conocidos. o
Proposici´ on 13.6 Sea f : A ⊂ Rn × Rp −→ Rp y (a, b) un punto de A. (a) Una condici´on suficiente para la existencia de D2 f (a, b) es que existan todas las derivadas parciales ∂fi /∂yj en un entorno del punto (a, b) y sean continuas en (a, b). (b) Si f es derivable en (a, b) entonces tanto D1 f (a, b) como D2 f (a, b) existen y se tiene que Df (a, b)(h, k) = D1 f (a, b)h + D2 f (a, b)k. Demostraci´ on. (a) Es inmediato comprobar que las hip´otesis dadas implican que la aplicaci´on y → f (a, y) admite derivadas parciales en un entorno del punto b, que adem´as son continuas en ese punto. Es bien conocido que esto
136
Funciones Impl´ıcitas: Existencia
13.6
es suficiente para la diferenciabilidad de esta aplicaci´ on en b o lo que es lo mismo para la existencia de D2 f (a, b). (b) Si f es diferenciable en (a, b) entonces la aplicaci´on x → f (x, b) es diferenciable en a ya que es composici´on de las aplicaciones x → (x, b) → f (x, b). Adem´as por la regla de la cadena se tiene que D1 f (a, b)h = Df (a, b)(h, 0). An´alogamente la D2 f (a, b) tambi´en existe, pudi´endose escribir finalmente Df (a, b)(h, k) = Df (a, b)(h, 0) + Df (a, b)(0, k) = D1 f (a, b)h + D2 f (a, b)k.
Existencia de funciones impl´ıcitas o
Teorema 13.7 Sea f : A ⊂ Rn × Rp −→ Rp y (a, b) un punto de A tal que f (a, b) = 0. Supongamos que (i) f es continua en (a, b). (ii) Las derivadas parciales ∂fi /∂yj existen en alg´ un entorno del punto (a, b) y son continuas en (a, b). ¶ µ ∂fi (a, b) 6= 0. (iii) det ∂yj En estas condiciones, existen dos bolas abiertas U y V , centradas en a y b respectivamente, tales que para cada x ∈ U existe un u ´nico punto y = h(x) ∈ V verificando la ecuaci´on f (x, y) = 0, i.e., M ∩(U ×V ) = {(x, h(x)) : x ∈ U }. Adem´as la funci´on h es continua en a. Demostraci´ on. 1 [?] Vamos a ponernos en situaci´on de aplicar el lema 13.1. Teniendo en cuenta que la condici´on (ii) implica la existencia de D2 f (a, b), definamos k(x, y) = y − (D2 f (a, b))−1 (f (x, y)). Es inmediato comprobar entonces que f (x, y) = 0 ⇐⇒ k(x, y) = y. Por otra parte la aplicaci´ on k hereda las propiedades de continuidad y derivabilidad de f . En particular, es continua en (a, b) y admite derivadas 1
La demostraci´ on est´ a sugerida por el m´etodo de Newton de obtenci´ on num´erica de ra´ıces en una ecuaci´ on
13.7
Funciones Impl´ıcitas: Existencia
137
parciales respecto a yj en alg´ un entorno de (a, b) que adem´as son continuas en (a, b). En efecto, si denotamos por T a la aplicaci´on lineal y continua (D2 f (a, b))−1 se tiene k(x, y) = y − (T ◦ f )(x, y). Luego f continua en (a, b) implica k continua en (a, b). Para probar que k admite las mismas derivadas parciales que f , basta tener en cuenta que T , al ser lineal y continua, es diferenciable, siendo su diferencial en cada punto la propia aplicaci´on T . Es f´acil ver tambi´en que ∂(T ◦ f ) ∂f =T ◦ . ∂yj ∂yj Esta u ´ltima f´ormula nos demuestra que las derivadas parciales ∂ki /∂yj son continuas en (a, b). Un sencillo c´alculo nos permite afirmar adem´as que ∂ki (a, b) = 0. ∂yj En efecto, la D2 k(a, b) es la derivada en b de la aplicaci´on y −→ k(a, y) = y − (D2 f (a, b))−1 (f (a, y)), que, aplicando la regla de la cadena, resulta igual a IdRp − (D2 f (a, b))−1 ◦ D2 f (a, b) = 0. De lo anterior se deduce que dado 0 < c < 1, existen n´ umeros reales s1 > 0 y r > 0 tales que ¯ ¯ ¯ c ¯ ∂ki ¯ (x, y)¯¯ ≤ , kx − ak < s1 , ky − bk < r ⇒ ¯ ∂yj p lo cual significa que para cada x con kx − ak < s1 , la aplicaci´on kx : y → k(x, y) tiene sus derivadas parciales acotadas en la bola B = B(b, r). Por tanto se trata de una aplicaci´on contractiva, m´as concretamente, si kx−ak < s1 , ky − bk < r entonces c kk(x, y1 ) − k(x, y2 )k∞ ≤ ky1 − y2 k1 ≤ c ky1 − y2 k∞ . p Por otra parte, de la continuidad de k en (a, b) se deriva que existe un n´ umero real s2 > 0 tal que kx − ak < s2 =⇒ kk(x, b) − bk < r(1 − c). Por tanto la restricci´on de k a X ×B, donde X = {x : kx−ak < s}, s = min(s1 , s2 ), satisface las condiciones del lema 13.1 y las de su corolario, por lo que el teorema queda demostrado. Los entornos U y V del enunciado son respectivamente las bolas abiertas X y B.
138
Funciones Impl´ıcitas: Existencia
13.8
Corolario 13.8 Si en el teorema anterior se sustituye la hip´otesis “f continua en (a, b)”por (i)’ f es continua en un entorno de (a, b). Entonces la aplicaci´on h definida impl´ıcitamente por la ecuaci´on f (x, y) = 0 es continua en alg´ un entorno de a. Demostraci´ on. Es consecuencia directa del corolario 13.2.
Ejercicios 13A Dar ejemplos de funciones de clase C ∞ , f , para las que el conjunto M = {(x, y) : f (x, y) = 0} sea respectivamente ∅, finito e infinito numerable. 13B Consideremos las funciones f1 (x, y) = 1 + cos πxy; f2 (x, y) = sen π(x2 + y 2 ); f3 (x, y) = (x2 + y 2 ) cos πxy y sea Mi = {(x, y) : fi (x, y) = 0} (i = 1, 2, 3). (a) Probar que (0, 0) es el u ´nico punto de Mi en el que las funciones fi no satisfacen una de las hip´otesis del teorema de existencia de funciones impl´ıcitas. (b) Probar que existen entornos abiertos U, V de 0 tales que M1 ∩ (U × V ) es la gr´afica de una funci´on de x definida en U y continua en 0. (c) Probar que existen entornos abiertos U, V de 0 tales que M2 ∩ (U × V ) es la gr´afica de una funci´on de x definida en U , pero no continua en 0. (d) Probar que no existen entornos abiertos U, V de 0 tales que M3 ∩ (U × V ) sea la gr´afica de una funci´on de x definida en U . 13C (a) Sean X, Y espacios topol´ogicos, M un subconjunto no vac´ıo de X × Y y (a, b) un punto de M . Es evidente que cada uno de los enunciados implica el siguiente, probar, sin embargo, que las implicaciones contrarias no se dan: 1. Existen entornos abiertos U y V de a y b y una funci´on h, definida sobre U , tal que M ∩ (U × V ) = {(x, h(x)) : x ∈ U }. 2. Existe un entorno abierto W de (a, b) y una funci´on h, definida sobre un entorno abierto U de a, tal que M ∩ W = {(x, h(x)) : x ∈ U }. 3. Existe un entorno abierto W de (a, b) y una funci´on h, definida sobre un conjunto B ⊂ X, tal que M ∩ W = {(x, h(x)) : x ∈ B}. sugerencia: Para probar que 2 no implica 1, tomar como M el lugar geom´etrico M3 del ejercicio anterior. (b) Probar que los enunciados 1 y 2 son equivalentes, si en ellos se exige adem´as que h sea continua en a.
13E
Funciones Impl´ıcitas: Existencia
139
13D Sea f : G ⊂ Rn × Rp → Rp y supongamos que el conjunto M = {(x, y) : f (x, y) = 0} es, en un entorno de cada uno de sus puntos, la gr´afica de alguna funci´on continua de la variable x (es decir, la ecuaci´on f (x, y) = 0 permite despejar localmente a la variable y como funci´on continua de x). (a) Dar alg´ un ejemplo que demuestre que M no es, en general, un conjunto conexo. (b) Si C es la componente conexa de un punto (x0 , y0 ) ∈ M , probar que el conjunto A = prx M es un conjunto abierto y conexo, y que existe a lo sumo una aplicaci´on h continua sobre A tal que h(x0 ) = y0 y que tenga su gr´afica contenida en M . (c) La existencia de una aplicaci´on h del tipo anterior est´a garantizada si f es una funci´on escalar de dos variables reales. (La demostraci´on no es inmediata). No es as´ı para funciones escalares de m´as variables: (d) Sea la funci´on f (x, y, z) = x sen z−y cos z definida en el abierto U = {(x, y, z) : x 6= 0, y 6= 0}, y sea M = {(x, y, z) ∈ U : f (x, y, z) = 0}. Probar i) M es conexo. ii) M es, en alg´ un entorno de cada uno de sus puntos, la gr´afica de alguna funci´on continua de las variables x, y. iii) No existe ninguna funci´on continua h de las variables x, y definida en A = prxy (M ) tal que f (x, y, h(x, y)) = 0, para todo (x, y) ∈ A. (e) Si h es una aplicaci´on de clase C 1 de Rn en s´ı mismo, cuyo jacobiano no se anula en ning´ un punto, entonces la ecuaci´on y − h(x) = 0 s´olo permite, en general, despejar localmente a x como funci´on de y (teorema de la funci´on inversa), a pesar de que el conjunto M = {(x, y) : y − h(x) = 0} es conexo. 13E Estudiar si el sistema x2 − y 2 + 2t = 2 z 2 − t2 − xy = −1 permite despejar dos de las variables un entorno √ √ como funci´on de las otras dos en alg´ del punto (x0 , y0 , z0 , t0 ) = ( 6, 0, 3, −2) y en alg´ un entorno del punto (0, 0, 0, 1).
Cap´ıtulo 14
Derivaci´ on de Funciones Impl´ıcitas El teorema de existencia de funciones impl´ıcitas y sobre todo su corolario, muestra c´omo las condiciones de continuidad de la aplicaci´on f las hereda ´ıntegramente la funci´on h definida impl´ıcitamente a partir de la ecuaci´ on f (x, y) = 0. Vamos a ver en este cap´ıtulo que igual sucede con la diferenciabilidad.
Lema fundamental o
Lema 14.1 Sea f : A ⊂ Rn × Rp → Rp y (a, b) un punto de A tal que f (a, b) = 0. Supongamos que h es una funci´on continua en a tal que h(a) = b y que verifica f (x, h(x)) = 0 para cada x de alg´ un entorno U de a. Entonces, si (i) f es diferenciable en (a, b), y ¶ µ ∂fi (ii) det (a, b) 6= 0, ∂yj la aplicaci´on h es tambi´en diferenciable en a y su diferencial en a se calcula mediante la f´ormula: Dh(a) = −D2 f (a, b)−1 ◦ D1 f (a, b).
Demostraci´ on. Vamos a probar en primer lugar que, supuesta h diferenciable en a, su diferencial en a es la de la f´ormula. 141
142
Funciones Impl´ıcitas: Derivaci´ on
14.5
Puesto que f (x, h(x)) = 0 para cada x ∈ U , la composici´on de las aplicaciones x → (x, h(x)) → f (x, h(x)) = 0 es la aplicaci´on id´enticamente nula sobre U . Aplicando entonces la regla de la cadena, se tiene que para todo u ∈ Rn 0 = Df (a, b)(u, Dh(a)u) = D1 f (a, b)u + (D2 f (a, b) ◦ Dh(a))u. En esta identidad es f´acil despejar Dh(a), no hay m´as que componer con D2 f (a, b)−1 en la igualdad anterior, obteni´endose la f´ormula buscada. Probemos que h es diferenciable en a: Hemos de ver que h(a + u) − h(a) + (D2 f (a, b)−1 ◦ D1 f (a, b))u = 0. u→0 kuk lim
Como hip´otesis tenemos que f es diferenciable en el punto (a, b), luego lim
(u,v)→(0,0)
f (a + u, b + v) − f (a, b) − D1 f (a, b)u − D2 f (a, b)v = 0. kuk + kvk
Consideremos en la expresi´on anterior v = h(a + u) − h(a). Teniendo en cuenta que h es continua en a, es decir (h(a + u) − h(a)) → 0 cuando u → 0) y que f (x, h(x)) = 0, se deduce que D2 f (a, b)(h(a + u) − h(a)) + D1 f (a, b)u = 0, u→0 kuk + kh(a + u) − h(a)k lim
o equivalentemente (componiendo con D2 f (a, b)−1 ) que h(a + u) − h(a) + (D2 f (a, b)−1 ◦ D1 f (a, b))u = 0. u→0 kuk + kvk lim
Observamos entonces que la diferencia entre las expresiones que dan la diferenciabilidad de f en (a, b) y la diferenciabilidad de h en a est´ au ´nicamente en el denominador de las mismas. Si escribimos h(a + u) − h(a) + (D2 f (a, b)−1 ◦ D1 f (a, b))u = kuk h(a + u) − h(a) + (D2 f (a, b)−1 ◦ D1 f (a, b))u kuk + kvk · , kuk + kvk kuk
14.2
Funciones Impl´ıcitas: Derivaci´ on
143
donde v = h(a + u) − h(a), bastar´a probar para terminar que cuando u → 0, la expresi´on kuk + kvk kuk est´a acotada: kvk = kh(a + u) − h(a)k ≤kh(a + u) − h(a) + (D2 f (a, b)−1 ◦ D1 f (a, b))uk + k(D2 f (a, b)−1 ◦ D1 f (a, b))uk ≤ε(kuk + kvk) + kD2 f (a, b)−1 kkD1 f (a, b)kkuk, donde ε es arbitrario y las desigualdades se verifican para u suficientemente peque˜ no, es decir siempre que kuk < δ (que depende de ε). Se deduce que (1 − ε)kvk ≤ (ε + kD2 f (a, b)−1 kkD1 f (a, b)k)kuk. Por lo que tomando por ejemplo ε = 1/2, se tiene ya que kuk + kvk kvk =1+ ≤ 1 + 2kD2 f (a, b)−1 kkD1 f (a, b)k. kuk kuk
Teorema general o
Teorema 14.2 Sea f : A ⊂ Rn × Rp → Rp y (a, b) un punto de A tal que f (a, b) = 0. Supongamos que (i) f es r-veces diferenciable en (a, b) (De clase C r en alg´ un entorno de (a, b)). (ii) Las derivadas parciales ∂fi /∂yj existen en alg´ un entorno del punto (a, b) y son continuas en (a, b). µ ¶ ∂fi (iii) det (a, b) 6= 0. ∂yj En estas condiciones, existen dos bolas abiertas U y V , centradas en a y b respectivamente, tales que para cada x ∈ U existe un u ´nico punto y = h(x) ∈ V verificando la ecuaci´on f (x, y) = 0. Adem´as la funci´on h es r-veces diferenciable en a (De clase C r en alg´ un entorno de a).
144
Funciones Impl´ıcitas: Derivaci´ on
14.2
Demostraci´ on. La diferenciabilidad de la funci´on h en el punto a es consecuencia inmediata del lema 14.1. El resto de la demostraci´on del teorema se basa en el siguiente caso particular del mismo: Si f diferenciable en un entorno del punto (a, b), entonces la funci´on impl´ıcita h determinada por la ecuaci´ on f (x, y) = 0, es tambi´en diferenciable en un entorno del punto a, y su diferencial en a se calcula mediante la f´ormula Dh(x) = −D2 f (x, h(x))−1 ◦ D1 f (x, h(x)). Para probarlo, consideremos un entorno W del punto (a, b) sobre el que f sea diferenciable. Podemos suponer tambi´en que en todo punto (x, y) ∈ W se tiene que det(D2 f (x, y)) 6= 0. En efecto, escribamos la aplicaci´ on (x, y) → det(D2 f (x, y)) como composici´ on de las funciones del diagrama ¶ µ ¶ µ ∂fi ∂fi (x, y) → det (x, y) . (x, y) → ∂yj ∂yj i,j i,j Puesto que, por hip´otesis, las derivadas parciales de f respecto a las coordenadas y son continuas en (a, b) y la aplicaci´ on determinante es tambi´en continua, la funci´on composici´on es continua en (a, b). De la hip´otesis det( D2 f (a, b)) 6= 0 resulta entonces que, para todo (x, y) en alg´ un entorno de (a, b), det( D2 f (x, y)) 6= 0. Tomando ahora los entornos U y V del teorema de existencia de funciones on h est´a en las condiciones impl´ıcitas satisfaciendo que U × V ⊂ W , la funci´ del lema 14.1 en cada punto x ∈ U , pues h es continua en x (Corolario 13.8), f diferenciable en (x, h(x)) y det (D2 f (x, h(x)) 6= 0. Se deduce pues que h es diferenciable en cada x de U , siendo Dh(x) = −D2 f (x, h(x))−1 ◦ D1 f (x, h(x)). Teniendo en cuenta lo anterior, vamos a ver ya que si f es r-veces diferenciable en (a, b), entonces h es asimismo r-veces diferenciable en a. (Una demostraci´on an´aloga puede hacerse para el caso C r ): Usaremos la siguiente caracterizaci´on de funciones r-veces derivable en un punto: Una funci´on ϕ es r-veces diferenciable en un punto a si y s´olo si ϕ es diferenciable en alg´ un entorno de a y sus derivadas parciales de primer orden son funciones (r-1)-veces diferenciables en a. Supongamos que f es r-veces diferenciable en el punto (a, b) y probemos por inducci´on que la aplicaci´on h, que nos proporciona el teorema de existencia de funciones impl´ıcitas, es r-veces diferenciable en a. Para r = 1, el
14B
Funciones Impl´ıcitas: Derivaci´ on
145
resultado ya sabemos que es cierto. Supongamos r > 1 y que por hip´otesis de inducci´on la aplicaci´on h es (r-1)-veces diferenciable en a. La aplicaci´on f es diferenciable en alg´ un entorno del punto (a, b) y cada una de sus derivadas parciales es (r-1)-veces diferenciable en (a, b). Entonces h debe ser diferenciable en alg´ un entorno de a, pudi´endose calcular su diferencial por la f´ormula Dh(x) = −D2 f (x, h(x))−1 ◦ D1 f (x, h(x)), lo que implica que ∂hi 1 (x) = · gik (x, h(x)), ∂xk det D2 f (x, h(x)) donde las funciones gik son sumas de productos de derivadas parciales de primer orden de la funci´on f . Lo mismo cabe decir para la funci´on det D2 f (x, h(x)), de la que adem´as sabemos que es distinta de cero en alg´ un entorno de a. Por tanto para probar que las derivadas parciales de primer orden de la aplicaci´on h son (r-1)-veces diferenciable en a, bastar´a comprobar que eso mismo les pasa a las aplicaciones x → ∂fs (x, h(x)). Pero cada una de estas aplicaciones es a su vez la composici´on de las aplicaciones x → (x, h(x)) y ∂fs , que son (r-1)-veces diferenciable en a por hip´otesis.
Ejercicios 14A Sean x, y, z, t cuatro variables ligadas entre s´ı por las ecuaciones x3 + y 3 + z 3 + t3 = 0 x2 + y 2 + z 2 + t2 = 1 Comprobar que la expresi´on ∂x/∂y puede tener m´asp de un significado, p p y calcular p todos sus posibles valores para (x0 , y0 , z0 , t0 ) = (− 3/8, − 1/8, 3/8, 1/8). ¿Qu´e ocurre para (x0 , y0 , z0 , t0 ) = (1/2, −1/2, 1/2, −1/2)? 14B Considerar las funciones √ f1 (x, y) = y − x2 3 y;
p f2 (x, y) = y − x 3 y 3 + x.
Probar que las dos son diferenciables en (0, 0), sus derivadas respecto a y en (0,0) son distintas de 0, pero no son continuas en (0,0). Comprobar que f1 (x, h(x)) = 0 para m´as de una funci´on h diferenciable en 0. En cambio s´olo existe una funci´on h verificando f2 (x, h(x)) = 0.
Cap´ıtulo 15
Funciones Inversas En este cap´ıtulo estudiaremos condiciones para la derivaci´ on de la inversa de una funci´on de varias variables y, en particular, extenderemos a estas funciones la f´ormula (g −1 )0 (g(a)) = 1/g 0 (a). Sin embargo, el principal resultado de este cap´ıtulo es el teorema conocido como Teorema de la Funci´on Inversa. Lo obtendremos a partir del teorema de las funciones impl´ıcitas y constituir´a el otro pilar b´asico de la Geometr´ıa Diferencial. Formalmente este teorema consiste en una condici´ on suficiente para que una funci´on de varias variables, g, admita localmente una funci´on inversa con las mismas propiedades de diferenciabilidad que g.
Derivada de funciones inversas El u ´nico resultado de esta secci´on tiene por objeto establecer condiciones para que la inversa de una funci´on biyectiva y diferenciable sea tambi´en diferenciable. Si no se ha incluido en el cap´ıtulo dedicado a las reglas de derivaci´on, es porque todo el estudio sobre funciones inversas est´a estrechamente ligado al de las funciones impl´ıcitas. Teorema 15.1 Sea g : A ⊂ Rn → Rn una aplicaci´on inyectiva y difereno
ciable en un punto a ∈ A. Entonces la aplicaci´on g −1 es diferenciable en el punto b = g(a) si y s´olo si o
(a) b ∈ g(A) y g −1 es continua en b. ¶ µ ∂gi (a) 6= 0. (b) det ∂xj En tal caso se tiene que Dg −1 (b) = (Dg(a))−1 . 147
148
Funciones Inversas
15.1
Demostraci´ on. Veamos que las condiciones son necesarias. Si g −1 es diferenciable en b, entonces esta aplicaci´on (que debe estar definida en alg´ un entorno de b) es continua en b. Por otro lado, aplicando la regla de la cadena resulta que Dg(a) ◦ Dg −1 (b) = idRn , de lo que se deduce que Dg(a) es una aplicaci´on lineal inversible (es decir se verifica (b)), siendo adem´ as Dg −1 (b) = (Dg(a))−1 . Que las condiciones anteriores tambi´en son suficientes resulta del lema 14.1, aplicado a las funciones f (x, y) = g(x) − y; h = g −1 , cambiando en ´el los papeles de las coordenadas y y las coordenadas x.
Inversi´ on local o
Teorema 15.2 (Lema fundamental) Sea g : A ⊂ Rn → Rn , a ∈ A y supongamos que (a) g admite derivadas parciales en alg´ un entorno del punto a, continuas en a. ¶ µ ∂gi (a) 6= 0. (b) det ∂xj Entonces existen U y V , entornos abiertos de a y b = g(a) respectivamente, tales que la restricci´on de g a U es una biyecci´ on de U sobre V , cuya inversa es diferenciable en b. Demostraci´ on. Observemos en primer lugar que de (a) se deriva que g es una un entorno de a (ver Nota). aplicaci´on diferenciable en a y continua en alg´ Teniendo en cuenta esto, es f´ acil ver que la funci´on f (x, y) = g(x)−y satisface la condiciones para poder aplicar el teorema de las Funciones Impl´ıcitas en el punto (a, b) respecto de las coordenadas x, es decir siendo x el bloque de coordenadas a despejar. Concretamente, f (a, b) = 0, f es una funci´on derivable en (a, b) y continua en alg´ un entorno de (a, b), admite derivadas parciales continuas en (a, b) y det(∂fi /∂xj )(a, b) =
∂gi (a) 6= 0. ∂xj
Existen, por tanto, dos entornos U1 y V , de a y b respectivamente (si se quiere, bolas abiertas), tales que ∀y ∈ V, ∃(´ unico) x ∈ U1 tal que y = g(x).
15.4
Funciones Inversas
149
Con otras palabras, cada punto y de V tiene una u ´nica antimagen x en U1 . Luego la aplicaci´on que nos proporciona el teorema de las F. Impl´ıcitas es la aplicaci´on g −1 : V → U1 y → x = g −1 (y) ∩ U1 que, seg´ un dicho teorema, es diferenciable en b. (M´as precisamente habr´ıa que decir que la aplicaci´on anterior es una secci´on o inversa local sobre V de la aplicaci´on g). Tomando el entorno de a, U = g −1 (V ) ∩ U1 , es evidente que g establece una biyecci´on entre U y V . Observar que U se puede tomar abierto, ya que g la podemos suponer continua sobre U1 . Para establecer el teorema de las Funciones Inversas en su formulaci´ on cl´asica necesitaremos dar la siguiente definici´on: Definici´ on 15.3 (i) Sean U, V dos abiertos de Rn . Una aplicaci´on g : U → V es un difeomorfismo de clase C r si es biyectiva y tanto g como g −1 son diferenciables de clase C r . Es habitual tambi´en denominar a una aplicaci´on de este tipo un cambio de coordenadas. (ii) Una aplicaci´on g : U ⊂ Rn → Rn es un difeomorfismo local de clase C r , si para cada x de U existe alg´ un entorno abierto Ux ⊂ U tal que r g es un difeomorfismo de clase C entre Ux y g(Ux ). De la definici´on anterior se sigue que si g : U ⊂ Rn → Rn es un difeomorfismo local entonces g es localmente inyectiva. Adem´as g es una aplicaci´on abierta: sea W un abierto contenido en U y veamos que para cada x ∈ W g(W ) es entorno de g(x). Por hip´otesis sabemos que existe un entorno abierto Ux tal que la aplicaci´on g : Ux → g(Ux ) es un difeomorfismo. En particular g(Ux ) es un conjunto abierto de Rn y g un homeomorfismo entre Ux y g(Ux ). Se tiene entonces que g(Ux ∩ W ) es un entorno abierto de g(x) contenido en g(W ) Teorema 15.4 (Teorema de la funci´ on inversa) Sea Ω un abierto de Rn y g : Ω → Rn una aplicaci´on de clase C r sobre Ω. µ ¶ ∂gi (a) Si det (a) 6= 0, entonces existe un entorno abierto de a, U , tal ∂xj que: la restricci´on de g a U es inyectiva, g(U ) es abierto y g : U → g(U ) es un difeomorfismo de clase C r .
150
Funciones Inversas
15.4
(b) Una condici´on necesaria y suficiente para que g sea un difeomorfismo local de clase C r sobre Ω es que para cada x ∈ Ω µ ¶ ∂gi (x) 6= 0. det ∂xj Demostraci´ on. (a) Seg´ un el lema anterior existen entornos abiertos U y V de a y b = g(a) respectivamente tales que g : U → V es una biyecci´on. Para probar que g es un difeomorfismo de U sobre V , s´olo hay que tener en cuenta que la aplicaci´ on g −1 : V → U es la que proporciona el teorema de las Funciones Impl´ıcitas para la funci´on f (x, y) = g(x) − y, y que por lo tanto hereda las propiedades de f , en particular debe ser de clase C r . (b) Es evidente, despu´es del apartado (a), que esta condici´on es suficiente para que g sea un difeomorfismo local. Rec´ıprocamente, si para x ∈ Ω existe un entorno abierto Ux tal que g : Ux → g(Ux ) es un difeomorfismo, entonces la inversa de esta aplicaci´on es en g(x). Pero esto implica, µ diferenciable ¶ ∂gi seg´ un el teorema 15.1, que det (x) 6= 0. ∂xj Corolario 15.5 Sea g : Ω ⊂ Rn → Rn una aplicaci´on de clase C r sobre Ω. Entonces g es un difeomorfismo de Ω sobre g(Ω) si y s´olo si satisface las dos condiciones siguientes: (a) g es inyectiva. (b) Para cada x ∈ Ω, det
µ
¶ ∂gi (x) 6= 0. ∂xj
Demostraci´ on. Que las dos condiciones anteriores son suficientes se derivan inmediatamente del teorema anterior. Que tambi´en son necesarias resulta −1 de que, seg´ un el teorema 15.1, ¶ para que g sea derivable en el punto g(x) µ ∂gi (x) 6= 0. es necesario que det ∂xj
Ejercicios 15A (T. aplicaci´ on inyectiva) Sea g : U ⊂ Rn → Rp una aplicaci´on de clase C 1 sobre el abierto U y supongamos que para todo punto x ∈ U , Dg(x) es inyectiva. Probar entonces que g es una aplicaci´on localmente inyectiva. on suprayectiva) Sea g : U ⊂ Rn → Rp una aplicaci´on de 15B (T. aplicaci´ 1 clase C sobre el abierto U y supongamos que para todo punto x ∈ U , Dg(x) es suprayectiva. Probar entonces que g es una aplicaci´on abierta.
15I
Funciones Inversas
151
15C Probar que no puede existir una aplicaci´on de clase C 1 e inyectiva de un abierto de R2 en R. 15D Sea g : R → R2 una aplicaci´on de clase C 1 . Probar que si x ∈ R existe alg´ un entorno de x cuya imagen por g no es entorno de g(x). 15E Sea g la transformaci´on de coordenadas dada por las ecuaciones u = x2 − y;
v = xy
y consideremos el abierto U = {(x, y) : det Dg(x, y) 6= 0}. (a) Estudiar si g es un difeomorfismo local o global sobre U . (b) ¿Es g localmente inyectiva sobre R2 ? (c) Probar que la transformaci´on anterior define un cambio de coordenadas (difeomorfismo global) sobre el abierto V = {(x, y) : x2 − y < 0} y utilizase en la ecuaci´on funcional · ¸ ∂ ∂f f (x, y) + x (x, y) = xy. ∂y ∂x 15F Estudiar si la aplicaci´on g(x, y, z) = (x2 − y − z, 2x + y + z, x + y − z) es un difeomorfismo del abierto V = {(x, y, z) : x > −1} sobre g(V ). 15G Sea g : (a, b) ⊂ R → R una aplicaci´on derivable en (a, b) con g 0 (x) 6= 0 para todo x ∈ (a, b). Probar que g admite funci´on inversa diferenciable en cada punto del abierto g(a, b). 15H Si f es una funci´on de 2 variables y clase C 2 , transformar la expresi´on x2
∂2f ∂2f ∂f ∂f + y2 2 + x +y 2 ∂x ∂y ∂x ∂y
mediante el cambio x = eu ; y = ev . 15I (a) Transformar la ecuaci´on diferencial y 0 = f (x, y) mediante el cambio de variables x = x(u, v); y = y(u, v). (b) Utilizar coordenadas polares para plantear y resolver el siguiente problema: Obtener el perfil que debe tener unas tijeras para que corten en ´angulo recto.
Cap´ıtulo 16
Variedades Diferenciables. Extremos Condicionados Vamos a completar lo visto en los cap´ıtulos anteriores sobre el teorema de las Funciones Impl´ıcitas y Funciones Inversas con un tema de iniciaci´on al estudio de las Variedades Diferenciables. Nosotros utilizaremos este estudio para tratar, con el rigor necesario, un tipo de problema que aparece con frecuencia en la pr´actica, el de los extremos condicionados, y con el que daremos por terminado el C´alculo Diferencial en varias variables.
Variedades on 16.1 (Definici´ on expl´ıcita) Sea M un subconjunto no vac´ıo Definici´ k de R . Se dir´a que M es una variedad diferenciable de dimensi´on 1 ≤ n < k y clase C r si M es, en alg´ un entorno de cada punto c ∈ M , la gr´afica de alguna funci´on h de n variables y clase C r . La primera observaci´on que es necesario hacer es que la funci´ on h, debido al car´acter local de la misma, puede cambiar de un punto a otro, y asimismo las n coordenadas de las que depende. Por tanto si M es variedad, de acuerdo con la definici´on, para el punto c ∈ M se podr´an distribuir las k coordenadas de los puntos z de Rk en dos bloques x, y de n y p = k − n coordenadas, de forma que si c = (a, b), existen U y V entornos abiertos de a y b y una funci´on h de clase C r sobre U verificando que M ∩ (U × V ) = {(x, h(x)) : x ∈ U }. (Es obvio que el bloque de coordenadas x no es necesariamente el de las n primeras coordenadas de los puntos z ∈ Rk , aunque, por comodidad, escribamos z = (x, y)) 153
154
Variedades y Extremos Condicionados
16.2
Teorema 16.2 (Definici´ on impl´ıcita) El conjunto no vac´ıo M ⊂ Rk es una variedad diferenciable de dimensi´on 1 ≤ n < k y clase C r si y s´olo si para cada c ∈ M existe un entorno abierto W de c y una funci´on f : W ⊂ Rk → Rk−n de clase C r tal que 1. Rango(Df (c)) = k − n. 2. M ∩ W = {z ∈ W : f (z) = 0}. Demostraci´ on. Supongamos que M es un variedad diferenciable de dimensi´on n y sea c un punto de M . Escribamos como antes c = (a, b) y sean U y V entornos abiertos de a y b tales que M ∩ (U × V ) = {(x, h(x)) : x ∈ U } para alguna funci´on h de las n-variables x y de clase C r en U . Entonces, la funci´on f , definida sobre el entorno de c, W = U × V , f (x, y) = h(x) − y, verifica lo que se quiere, pues claramente un punto (x, y) ∈ W pertenece a M si y s´olo si f (x, y) = 0. Adem´as, la matriz jacobiana de Df (c) es la siguiente
∂f1 ∂f1 ∂x1 (c) · · · ∂xn (c) 1 0 · · · 0 ∂f ∂f 2 2 (c) · · · (c) 0 1 · · · 0 , ∂xn ∂x1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ∂fp ∂fp (c) · · · (c) 0 0 · · · 1 ∂x1 ∂xn que tiene un menor de orden p = k − n, luego rg(Df (c)) = p. Rec´ıprocamente, si M satisface la condici´on del teorema en c ∈ M , denotemos por y = (y1 , . . . , yp ) a uno de los grupos de coordenadas tal que el menor de Df (c) correspondiente a las derivaciones respecto a yj es diferente de 0, y por x = (x1 , . . . , xn ) al grupo formado con el resto de las coordenadas. Sin p´erdida de generalidad, podemos suponer que el bloque x un esto, los puntos de M que est´an es el de las n primeras coordenadas. Seg´ en el entorno W son los que verifican la ecuaci´on f (x, y) = 0. Adem´as, de la hip´otesis se deduce que f satisface las condiciones del teorema de existencia de Funciones Impl´ıcitas en c = (a, b). Luego, existen entornos abiertos U y V de a y b, respectivamente, con U × V ⊂ W y una funci´on h de clase C r de U en V , cuya gr´afica es M ∩ (U × V ).
16.4
Variedades y Extremos Condicionados
155
Variedad tangente En el cap´ıtulo 6 se defini´o el concepto de vector tangente en un punto c de un conjunto M ⊂ Rk . Geom´etricamente, un vector tangente a M en c no era m´as que un vector tangente a alguna curva trazada sobre M pasando por c (ver ejercicio 6A para una definici´on m´as general de vector tangente). Se vio entonces que, en el caso particular de que M sea la gr´afica de una funci´on h de n variables reales y diferenciable en un punto a, el conjunto Tc (M ) de vectores tangentes a M en el punto c = (a, h(a)) es un espacio vectorial de dimensi´on n, cuya expresi´on es Tc (M ) = {(u, Dh(a)u) : u ∈ Rn }. Proposici´ on 16.3 Si M es una variedad diferenciable de Rk de dimensi´on 1 ≤ n < k y clase C r y c ∈ M , entonces el conjunto Tc (M ) es un subespacio vectorial de Rk de dimensi´on n Demostraci´ on. Puesto que, localmente, M es la gr´afica de una funci´on de n variables y clase C r , basta tener en cuenta lo comentado en el p´arrafo anterior. A Tc (M ) se le llamar´a el espacio vectorial tangente a la variedad M en c y al trasladado a c de este subespacio, i.e., c + Tc (M ) se le llamar´a pues la variedad tangente a M en c. Un punto z de Rk pertenecer´a a la variedad tangente a M en c si (z − c) ∈ Tc (M ). Vamos a caracterizar ahora el espacio vectorial tangente a un variedad en un punto a partir de la definici´ on impl´ıcita. Suponemos, pues, que M es una variedad de Rk determinada, en un entorno W del punto c ∈ M , como el lugar geom´etrico de los puntos de W que satisfacen la ecuaci´ on f (z1 , z2 , . . . , zk ) = 0, donde f = (f1 , f2 , . . . , fp ) es una funci´on de clase C r tal que rg(Df (c)) 6= 0. (Abreviadamente, nos referiremos a lo anterior diciendo que M est´a determinada en un entorno de c por la funci´on f = (f1 , . . . , fp )). Se tiene entonces Proposici´ on 16.4 Si M es la variedad determinada en un entorno del punto c ∈ M por la funci´on f = (f1 , . . . , fp ), entonces Tc (M ) = ker Df (c) = ∩ ker Dfi (c).
Demostraci´ on. Sea v ∈ Tc (M ). Entonces v es el vector velocidad en c de alguna curva γ contenida en M y que pasa por c. Es decir γ(t) ∈ M y
156
Variedades y Extremos Condicionados
16.4
para alg´ un t0 , γ(t0 ) = c y γ 0 (t0 ) = v. Puesto que M est´a determinada en un entorno de c por f y γ esta contenida en M , se deduce que, para t suficientemente pr´oximo a t0 , f (γ(t)) = 0. Luego derivando en t0 , se obtiene que Df (γ(t0 ))γ 0 (t0 ) = 0, o sea Df (c)v = 0, T que nos dice que v ∈ ker Df (c) = pi=1 ker Dfi (c). Para demostrar que Tc (M ) ⊃ ker Df (c) basta tener en cuenta que ambos subespacios tienen la misma dimensi´on. En efecto, como por hip´ otesis, el rango de la aplicaci´on lineal Df (c) es igual a p, su n´ ucleo debe ser un subespacio de dimensi´on igual a n = k − p.
Multiplicadores de Lagrange Vamos a desarrollar en esta secci´ on una t´ecnica cl´asica, basada en el uso de Multiplicadores, para la obtenci´on de condiciones de extremo sobre una variedad. Dichas condiciones no diferir´an formalmente de las ya vimos para extremos relativos. o
Definici´ on 16.5 Sea ϕ : A ⊂ Rk → R una funci´on escalar, c ∈ A y M una variedad diferenciable que contiene a c. Se dir´a que ϕ presenta un extremo sobre M (o condicionado) en el punto c, si existe un entorno W de c tal que ϕ(z) − ϕ(c) no cambia de signo cuando z ∈ W ∩ M . Proposici´ on 16.6 En la situaci´on anterior, una condici´on necesaria para que la funci´on ϕ presente un extremo en c sobre la variedad M es que Dϕ(c)v = 0, para todo v ∈ Tc (M ). Se dice en ese caso que c es un punto cr´ıtico de ϕ sobre la variedad M . Demostraci´ on. Sea v ∈ Tc (M ) y γ una curva contenida en M que pase por c y tenga a v por vector tangente en c. Es decir, γ(t0 ) = c, y γ 0 (t0 ) = v en alg´ un punto t0 . Entonces la funci´on de la variable t, ϕ ◦ γ, presenta un extremo relativo en el punto t0 , luego D(ϕ ◦ γ)(t0 ) = 0. Se tiene pues 0 = D(ϕ ◦ γ)(t0 )1 = Dϕ(γ(t0 ))γ 0 (t0 ) = Dϕ(c)v.
16.8
Variedades y Extremos Condicionados
157
Corolario 16.7 (Multiplicadores de Lagrange) Sean M y ϕ en las condiciones de la definici´on 16.5 y supongamos que M est´a determinada, en un entorno del punto c ∈ M , por las funciones f1 , f2 , . . . , fp . Entonces, una condici´on necesaria para que la aplicaci´on ϕ presente un extremo sobre la variedad M en el punto c, es que existan p n´ umeros reales λ1 , . . . , λp tales que c sea un punto cr´ıtico de la funci´on F = ϕ + λ1 f1 + . . . + λp fp . Demostraci´ on. Por la proposici´on anterior, si ϕ presenta un extremo condicionado en c entonces Dϕ(c)v = 0 para todo v ∈ Tc (M ) = ∩ ker Dfi (c). Luego ker Dϕ(c) ⊃ ∩ ker Dfi (c), y esto implica ya lo que quer´ıamos, en virtud del lema algebraico siguiente Lema 16.8 Si g1 , g2 , . . . , gp son formas lineales independientes de Rk y g es otra forma lineal tal que ker g ⊃ ∩pi=1 ker gi , entonces existen p n´ umeros reales λ1 , . . . , λp tales que X g+ λi gi = 0.
on. Completemos la familia de formas lineales g1 , g2 , . . . , gp hasta Demostraci´ obtener una base B = {g1 , . . . , gp , gp+1 , . . . , gk }. Entonces g=
k X
µi gi .
i=1
Sea {e1 , . . . , ek } la base dual de B, es decir gi (ej ) = δij . Es evidente entonces que si i ≤ p < j, p \ ej ∈ ker gi ⊂ ker g, i=1
luego 0 = g(ej ) =
k X
µi gi (ej ) = µj gj (ej ) = µj ,
i=1
P lo que implica que g = pi=1 µi gi . Tomando λi = −µi resulta lo que quer´ıamos. Tambi´en se pueden conseguir condiciones de segundo orden, es decir expresadas en t´erminos de las derivadas de orden 2, para la existencia de extremo condicionado en un punto de una variedad:
158
Variedades y Extremos Condicionados
16.9
Proposici´ on 16.9 Con las notaciones del corolario 16.7, supongamos que existen n´ uP meros reales λ1 , . . . , λp tales que c es un punto cr´ıtico de la funci´on F = ϕ + λi fi , es decir DF (c) = 0, pero que D2 F (c) 6= 0. Entonces una condici´on necesaria (suficiente) para que la funci´on ϕ presente un m´ınimo sobre M en c es que la forma cuadr´atica D2 F (c) sea positiva (definida positiva) sobre Tc (M ), el espacio tangente a M en c. An´alogas condiciones para m´aximo. on. Supongamos que en el entorno W de c Demostraci´ M ∩ W = {z ∈ W : fi (z) = 0} = {(x, h(x)) : x ∈ U },
c = (a, h(a)),
donde, seg´ un vimos, h es la funci´on definida impl´ıcitamente por el sistema fi (z) = 0. Consideremos la funci´ on definida en el abierto U de Rn por Φ(x) = ϕ(x, h(x)). Es claro entonces que ϕ presenta un extremo sobre M en c si y s´olo si la funci´on Φ presenta un extremo relativo a. Vamos a probar entonces que las condiciones del enunciado son condiciones de extremo relativo para Φ en a. Para ello s´olo necesitamos obtener DΦ(a) y D2 Φ(a) en t´erminos de las derivadas de la funci´on F : Observemos en primer lugar que, puesto que fi (x, h(x)) = 0, Φ(x) = F (x, h(x). Entonces, aplicando la regla de la cadena, resulta DΦ(a)u = DF (a, h(a))(u, Dh(a)u). Por lo tanto la condici´ on DF (c) = 0 implica DΦ(a) = 0. Aplicando ahora la regla de la cadena para derivadas de orden 2 (ver acilmente, teniendo presente que c es un punto Ejercicio 10I) se deduce f´ cr´ıtico de la funci´on F , que D2 Φ(a)u2 = D2 F (c)(u, Dh(a)u)2 . De esta igualdad se deduce ya que D2 Φ(a) es positiva o definida positiva seg´ un que lo sea D2 F (c) sobre los vectores de la forma (u, Dh(a)), que son justamente los del espacio vectorial tangente a M en c.
Anexo: Distintas presentaciones de una variedad Para las subvariedades de Rk es habitual considerar otras definiciones, adem´as de las ya establecidas, la definici´on param´etrica y la definici´on difeom´orfica [2]:
16.11
Variedades y Extremos Condicionados
159
Teorema 16.10 (Definici´ on param´ etrica) Un subconjunto M ⊂ Rk es una variedad diferenciable de dimensi´on n y clase C r si y s´olo si para cada c ∈ M existe un entorno abierto W y una aplicaci´on j : O → Rk (O, abierto de Rn ), tal que 1. j es un homeomorfismo entre O y W ∩ M . 2. j es de clase C r y rg(Dj(u)) = n, para todo u ∈ O. Se dice entonces que (O, j) es una parametrizaci´on de W ∩ M . Demostraci´ on. Supongamos que M es una variedad diferenciable y sea, entonces, W un entorno abierto de c ∈ M tal que W ∩ M = {(x, h(x)) : x ∈ U }. Puesto que h es continua, es claro que la aplicaci´on j definida sobre U por j(x) = (x, h(x)), es un homeomorfismo entre U y W ∩ M (W ∩ M es la gr´afica de h). Por otra parte, es evidentemente que rg(Dj(x)) = n, para todo x ∈ U . Luego si tomamos O = U, (O, j) es una parametrizaci´ on de W ∩ M. Rec´ıprocamente, supongamos que (O, j) es una parametrizaci´on de W ∩ M . Sean j1 , . . . , jn n funciones coordenadas de j tales que Dj1 (c), . . . , Djn (c) sean formas lineales independientes (tales funciones existen ya que el rango de Dj(u) es n para todo u ∈ O, y en particular en u0 = j −1 (c)). Sean x1 = j1 (u); x2 = j2 (u); . . . xn = jn (u). Por el teorema de la Funci´ on Inversa, la aplicaci´on g = (j1 , . . . , jn ) es un difeomorfismo entre un entorno abierto O1 de u0 y un entorno abierto U de a = g(u0 ). Escribiendo u = g −1 (x), se tiene que 1. existe un entorno abierto W1 de c tal que j(O1 ) = W1 ∩ M (tengamos en cuenta que j es un homeomorfismo entre O y W ∩ M ). 2. W1 ∩ M = {(g(u), jn+1 (u), . . . , jk (u)) : u ∈ O1 } = {(x, jn+1 (g −1 (x)), . . . , jk (g −1 (x))) : x ∈ U }. Se deduce pues que W1 ∩ M = {(x, h(x)) : x ∈ U }, siendo h = (jn+1 ◦ g −1 , . . . , jk ◦ g −1 ). Teorema 16.11 (Definici´ on difeom´ orfica) Un subconjunto M ⊂ Rk es una variedad diferenciable de dimensi´on n y clase C r si y s´olo si para cada c ∈ M existe un entorno abierto W y un difeomorfismo de clase C r , ϕ : W → ϕ(W ), tal que ϕ(W ∩ M ) = ϕ(W ) ∩ F , siendo F un subespacio vectorial de Rk de dimensi´on n.
160
Variedades y Extremos Condicionados
16.11
Demostraci´ on. Supongamos que M satisface las condiciones de la definici´on difeom´orfica y sea c ∈ M . Se puede suponer que el subespacio F es justamente Rn × {0} × . . . × {0}. En efecto, bastar´ıa considerar un isomorfismo vectorial T de Rk que llevase F en este otro subespacio y tomar el difeomorfismo T ◦ ϕ. Llamando entonces fi = ϕn+i , se tiene que M ∩ W = {z ∈ W : fi (z) = 0}. Adem´as las formas lineales Dfi (z) independientes en cada punto de W , ya que ϕ es un difeomorfismo. Luego M es una variedad determinada impl´ıcitamente en un entorno de c por las funciones f1 , . . . , fp . Rec´ıprocamente, supongamos que M est´a determinada impl´ıcitamente en un entorno abierto W de c por las funciones f1 , . . . , fp . Escribamos z = (x, y), siendo y uno de los bloques de p coordenadas verificando que det(∂fi /∂yj (c)) 6= 0, y consideremos la funci´on ϕ : z = (x, y) −→ (x, f1 (z), . . . , fp (z)). Esta funci´on es de clase C r y es f´acil ver que su matriz jacobiana tiene determinante no nulo en c. Del Teorema de la Funci´ on Inversa se deduce un entorno abierto de c, W0 ⊂ W . que ϕ es un difeomorfismo sobre alg´ Puesto que M ∩ W = {z ∈ W : fi (z) = 0}, se tiene que ϕ(M ∩ W0 ) = ϕ(W0 ) ∩ Rn × {0} × {0}.
Ejercicios 16A Estudiar si el conjunto M de los puntos que satisfacen las ecuaciones siguientes son variedades diferenciables y en tal caso de qu´e dimensi´on. 1.
x2 + y 2 + z 2 + xy + yz − xz = 0
2. x2 + y 2 + z 2 + xy + yz − xz = 1
16B Hallar la distancia (a) entre la recta x + y = 1 y la hip´erbola xy = 2. (b) entre las curvas ( x2 − xy + y 2 − z 2 y z x = = ; 1 2 4 x2 + y 2
=1 =1
16C Hallar la distancia al origen de la curva intersecci´on de las superficies xyz = a;
y = bx,
a > 0, b > 0.
16J
Variedades y Extremos Condicionados
161
16D Estudiar los extremos de la funciones 1. 2. 3. 4.
f (x, y) = (x − y)n sujetos a la condici´on x2 + y 2 = 1. f (x, y) = x + y sobre la variedad x2 − y 2 + xy = 1. f (x1 , . . . , xn ) = (x1 · · · xn )2 con la condici´on x21 + · · · + x2n = 1. f (x, y) = cos2 x + cos2 y con x + y = π/4.
16E Sea M el conjunto de puntos de R3 que satisfacen el sistema ( x2 + y 2 − z = 1 x − y + z2 = 1 (a) Probar que M es una variedad diferenciable. (b) Hallar la ecuaci´on de la recta tangente a M en (1, 0, 0). (c) Estudiar si la funci´on g(x, y, z) = xyz − x − y + z presenta un extremo sobre M en el punto (1, 0, 0). 16F (a) Obtener el paralelep´ıpedo recto de menor ´area entre los que tienen igual volumen. (b) Obtener el paralelep´ıpedo de mayor volumen entre los que tienen igual ´area. 3 16G Calcular la norma del p funcional lineal de R , T (x, y, z) = 2x − y + z respecto 2 2 2 de la norma k(x, y, z)k = x + y + z .
16H Probar que las relaciones x = 2u − v y =u+v z = u.v definen (param´etricamente) una variedad diferenciable de R3 de dimensi´on 2. 16I Sea f (x, y, z) = xy − z 2 . Probar que f es lipschitziana sobre el conjunto M = {(x, y, z) : x2 + y 2 + z 2 ≤ 1} y hallar su menor constante de Lipschitz respecto a la norma eucl´ıdea. 16J Sea M = {(x, y, z) 6= (0, 0, 0) : x3 + y 3 + z 3 = 2(x + y + z)2 }. (a) Probar que M es una variedad diferenciable. (b) Determinar los posibles puntos de M en los que el plano x + y = 0 sea tangente a M. (c) Determinar la recta tangente a la curva intersecci´on de M con el plano x+y = 0 en el punto (1, −1, 2).
162
Variedades y Extremos Condicionados
16K
16K Sea K = {(x, y, z) ∈ R3 : z = x2 + y 2 ; z ≤ x + 1}. Probar que K es un compacto y hallar el m´aximo y el m´ınimo absoluto de la funci´on ϕ(x, y, z) = y 2 − 2x + z sobre K. 16L Calcular el m´aximo y el m´ınimo absoluto de la funci´on ϕ(x, y, z) = x + y − z sobre el compacto K = {(x, y, z) : x2 + y 2 ≤ 1, x2 + y 2 + z 2 ≤ 4}. 16M Estudiar si la funci´on ϕ(x, y, z) = 1/2x + y presenta un extremo relativo sobre la variedad 1 M = {(x, y, z) : x3 + y 3 − xz + yz = √ }. 2
16N Sea M el lugar geom´etrico de los puntos de R3 que satisfacen el sistema xy + z = 1;
x2 + y 2 − z 2 = 2.
Probar que M es una variedad y estudiar si la funci´on ϕ(x, y, z) = z presenta alg´ un extremo sobre M . 16O Calcular la distancia al eje Y de la curva M de R3 dada por las ecuaciones y − xz = 1;
x + y + z = 4.
Parte III
Medida e Integraci´ on en Rn
Cap´ıtulo 17
La Medida Exterior de Lebesgue en Rn El c´alculo de longitudes, ´areas y vol´ umenes es uno de los asuntos matem´aticos con m´as larga tradici´on hist´orica, habi´endose desarrollados a este fin abundantes t´ecnicas a lo largo de los siglos. Sin embargo, no es hasta bien aticos ven la necesidad de dar una entrado el siglo XIX, cuando los matem´ definici´on rigurosa de los conceptos de longitud, ´area y volumen. Este ser´ a el problema que nosotros abordaremos en esta lecci´on y en algunas de las sucesivas. En este curso no estamos interesados en definir la longitud de una curva, ni el ´area de una superficie no plana, por lo que s´ olo trataremos el problema n de “intentar” asignar a cada subconjunto de R un n´ umero real mayor o igual que cero (+∞), su n-medida, y que ser´a su longitud, ´area o volumen, seg´ un que n sea 1, 2 o 3. En el caso n = 1, no hay ninguna duda sobre cu´al ha de ser la medida (longitud) de, por ejemplo, un segmento o una uni´on finita de segmentos. Elegida una unidad de longitud, un segmento se representa en R por un intervalo [a, b], luego es l´ ogico tomar como longitud de este segmento al n´ umero b − a. En cambio no parece claro cu´al deba ser la longitud de otros subconjuntos de n´ umeros reales, como por ejemplo el conjunto Q de los racionales. Para medir ´areas es natural comenzar con figuras geom´etricamente sencillas, y obtener, a partir de ´estas, el ´area de otras m´as complicadas. As´ı, definiremos en primer lugar el ´area de un rect´angulo. Si C es un rect´angulo de lados a y b, su ´area ser´a a·b. Para extender esta medida a otras figuras planas, parece natural respetar el criterio de que si una figura plana se descompone en una cantidad finita (incluso numerable) de rect´angulos 165
166
Medida Exterior
17.11
disjuntos dos a dos, su ´area sea la suma de las ´areas de estos rect´ angulos. Precisamente, la propiedad de que la medida del “todo”sea igual a la suma de las medidas de las “partes”, es lo que se tomar´a como definici´ on de medida abstracta. An´alogas consideraciones cabe hacer sobre el concepto de volumen de un cuerpo en el espacio. Definici´ on 17.1 Sea X un conjunto y F una familia de subconjuntos de X. Una aplicaci´on µ : F ⊂ P(X) → [0, ∞] se dir´a que es una medida finitamente aditiva , si para cada colecci´on finita (Ai ) de conjuntos disjuntos dos a dos de F tales que ∪ Ai ∈ F, se tiene que µ(∪ Ai ) =
X
µ(Ai ).
µ se dir´a que es una medida (o tambi´en medida numerablemente aditiva o σ-aditiva) si para cada colecci´on numerable (Ai ) de conjuntos disjuntos dos a dos de F tales que ∪ Ai ∈ F, se tiene que µ(∪ Ai ) =
X
µ(Ai ).
(Supondremos que α < +∞, α + ∞ = ∞, para cada α ∈ R). Esta definici´on, siendo tan general, permite la construcci´on de numerosas medidas: 1. µ(A) = 0 para todo A ⊂ X. 2. µ(A) = ∞ para todo A ⊂ X. ( p , si A tiene p elementos 3. µ(A) = ∞ , si A es infinito. 4. Aunque no lo precisemos aqu´ı, toda probabilidad ser´ a tambi´en una medida. Pero en este curso la u ´nica medida que estamos interesados en construir es la medida de Lebesgue en Rn , que denotaremos por “m”, y que mide longitudes, ´areas o vol´ umenes seg´ un que n=1,2 ´o 3.
17.2
Medida Exterior
167
Semintervalos de Rn La primera familia sobre la que definiremos la medida de Lebesgue ser´ a la de semintervalos. Definici´ on 17.2 En Rn llamaremos Semintervalo a cada producto cartesiano de n intervalos acotados de R Q de la forma [ai , bi ), ai < bi i = 1, 2, . . . , n. La medida del semintervalo I = ni=1 [ai , bi ) es el n´ umero real m(I) = (b1 − a1 ) × (b2 − a2 ) × · · · × (bn − an ). Por convenio, consideraremos al ∅ como un semintervalo de medida 0. Para n = 2 un semintervalo es un rect´angulo de lados paralelos a los ejes coordenados, al que le falta parte del borde. Puede parecer un poco extra˜ no comenzar este proceso de medir con la consideraci´on de un tipo tan particular de rect´angulos, en vez de trabajar desde un principio con rect´angulos arbitrarios, definiendo su medida como el a en que aceptar, producto de las longitudes de sus lados. La raz´on de esto est´ de entrada, que la medida de un rect´angulo abierto y del rect´ angulo cerrado que tiene los mismos lados coinciden, puede ser demasiado fuerte para una mentalidad matem´atica: Lo anterior tiene m´ as apariencia de teorema que de algo asumible como hip´otesis. Como punto de partida nos deber´ıamos de limitar, pues, a considerar todos los rect´angulos del mismo tipo, en lugar de rect´angulos arbitrarios (por ejemplo todos abiertos, o todos cerrados o semintervalos). Y de todas estas subfamilias, la m´as adecuada es la de semintervalos: Mediante semintervalos podemos obtener una partici´on numerable del plano (y de cualquier conjunto abierto), en cambio eso no es posible hacerlo a base s´olo ositos, de rect´angulos abiertos o de rect´angulos cerrados. Para nuestros prop´ lo anterior constituye una importante propiedad de los semintervalos de la que habremos de hacer uso en m´as de una ocasi´on (Ver Zaanen [30]). Nuestro objetivo inmediato es demostrar que “m” es una medida σaditiva sobre la familia de semintervalos. Posteriormente extenderemos esta medida a conjuntos m´as generales (ser´ıa deseable que esta extensi´on la pudi´esemos hacer a cada subconjunto de Rn , pero, como veremos, esto es imposible manteniendo el car´acter σ-aditivo de la medida). Para todo ello necesitaremos destacar algunas de las propiedades de la familia de semintervalos y de la medida definida sobre ella.
168
Medida Exterior
17.3
Proposici´ on 17.3 Sea I un semintervalo de Rn . Entonces para cada ε > 0 existen semintervalos I1 , I2 tales que o
o
I1 ⊂ I ⊂ I ⊂ I 2 y m(I2 ) − ε ≤ m(I) ≤ m(I1 ) + ε.
Demostraci´ on. Consideremos la aplicaci´on n Y (x1 , . . . , xn , y1 , . . . , yn ) −→ (yi − xi ) Φ
i=1
de R2n en R. Esta aplicaci´on es continua yaQque es un polinomio de 2n variables. Sea entonces el semintervalo I = [ai , bi ). De la continuidad de Φ en ((ai ), (bi )) se deduce que si nos aproximamos suficientemente al punto ((ai ), (bi )) mediante puntos ((xi )ni=1 , (yi )ni=1 ) con ai < xi < yi < bi o con puntos tales que xi ≤ ai , bi ≤ yi se consiguen los intervalos I1 , I2 requeridos. Proposici´ on 17.4 mintervalo.
(a) La intersecci´ on finita de semintervalos es un se-
(b) La diferencia de dos semintervalos puede expresarse como uni´on de una familia finita de semintervalos disjuntos dos a dos. Q Q [ai , bi ), J = [ci , di ). Entonces Y I ∩J = [ai , bi ) ∩ [ci , di ),
on. (a) Sean I = Demostraci´
y es obvio que, si esta intersecci´on es no vac´ıa, entonces hi = max{ai , ci } < ki = min{bi , di } y Y I ∩J = [hi , ki ). Q Q (b) Consideremos los semintervalos I = [ai , bi ), J = [ci , di ). Puesto que I \ J = I \ I ∩ J, puede suponerse sin p´erdida de generalidad que J ⊂ I. Prolongando los lados de los semintervalos I, J obtenemos en cada eje los tres semintervalos [ai , ci ), [ci , di ), [di , bi ). Estos intervalos (alguno de los cuales puede ser, eventualmente, vac´ıo) constituyen una partici´on de [ai , bi ). Si formamos todos los n-productos posibles
17.6
Medida Exterior
169
tomando como factores a estos intervalos, se obtiene trivialmente una partici´on finita del semintervalo I, uno de cuyos miembros es el semintervalo J. Por tanto I \ J es igual a la uni´on del resto de los semintervalos de la partici´on. La partici´on del semintervalo I, obtenida de la forma anterior, diremos que constituye un cuadriculado o red del semintervalo I. M´as generalmente, sea Qn el semintervalo I = i=1 [ai , bi ) y consideremos en cada eje una partici´ on finita de [ai , bi ). Entonces, la colecci´on de semintervalos, {Ks }, obtenidos como antes (es decir, formando los n-productos posibles que tienen en el factor i, (i = 1, . . . , n), un semintervalo de la partici´on de [ai , bi )), constituye una partici´on de I que se denomina cuadriculado o red de I. Lema 17.5 Si {Ks } es un cuadriculado del semintervalo I entonces, X m(I) = m(Ks ).
Demostraci´ on. Para no complicar en exceso las notaciones, supongamos n = 2. Sea I = [a1 , b1 ) × [a2 , b2 ), y a1 = t0 < t1 < . . . < tp = b1 ; a2 = u0 < u1 < . . . < uq = b2 particiones de [a1 , b1 ) y [a2 , b2 ). Entonces cada cuadr´ıcula es de la forma Ks = [ti , ti+1 ) × [uj , uj+1 ), luego X X m(Ks ) = (ti+1 − ti )·(uj+1 − uj ) i,j
=
X i
=
X
(ti+1 − ti )
X
(uj+1 − uj )
j
(ti+1 − ti )·(b2 − a2 )
i
=(b2 − a2 )(b1 − a1 ) = m(I). Proposici´ on 17.6 Sean I0 , I1 , . . . , Ip una colecci´on finita de semintervalos de Rn . P (a) Si I0 ⊂ ∪pk=1 Ik entonces m(I0 ) ≤ m(Ik ). P (b) Si Ik ∩ Ir = ∅ (k 6= r) y ∪ Ik ⊂ I0 entonces m(Ik ) ≤ m(I0 ).
170
Medida Exterior
17.6
Demostraci´ on. (a) Prolongando los lados de los semintervalos I0 , I1 , . . . , Ip (como en la proposici´on anterior) se obtiene en cada eje una colecci´on finita de semintervalos disjuntos. Si se construyen a partir de ellos todos los nproductos posibles, la colecci´on finita Ks de semintervalos disjuntos de Rn que resulta, proporciona un cuadriculado de cada Ik . Concretamente, cada Ik es la uni´on de los Ks que lo cortan. Se tiene pues que X m(Ik ) = m(Ks ). Ks ⊂Ik
Entonces, si I0 ⊂ ∪pk=1 Ik , cada semintervalo que est´a contenido en I0 est´a tambi´en contenido en alg´ un Ik (k ≥ 1), y por tanto X X X X m(I0 ) = m(Ks ) ≤ m(Ks ) = m(Ik ). Ks ⊂I0
k Ks ⊂Ik
(b) Se demuestra de forma an´ aloga. Para quien no le guste la demostraci´on anterior, vamos a ver, a continuaci´ on, la singular demostraci´on que dio Von Newman [24] de este resultado. Demostraci´ on*. (a) Supongamos, en primer lugar, que todos los intervalos Q Ik = [aki , bki ) verifican que las longitudes de sus lados son mayores que 1, es decir bki − aki > 1, y denotemos por NIk al n´ umero de elementos de Ik que tienen como coordenadas (todas) n´ umeros enteros. Si se tiene en cuenta que umeros un semintervalo de R cuya longitud l est´e comprendida entre los n´ naturales N y N + 1 (N ≤ l ≤ N + 1), contiene N o N + 1 enteros, resulta que n n Y Y k k (bi − ai − 1) ≤ NIk < (bki − aki + 1). Como NI0 ≤ (17.1)
P
i=1
i=1
NIk , de la relaci´on anterior resulta que n Y XY (b0i − a0i − 1) ≤ (bki − aki + 1). i=1
k
i
Si las longitudes de los lados de los Ik no fuesen todas mayor o igual que 1 entonces, tomando r un natural suficientemente grande, los semintervalos rIk ser´ıan del tipo anterior (y es obvio que rI0 ⊂ ∪pk=1 rIk ). Aplicando la desigualdad 17.1 se obtiene n XY Y (rb0i − ra0i − 1) ≤ (rbki − raki + 1), i=1
k
i
17.7
Medida Exterior
171
equivalentemente n Y XY 1 1 (bki − aki + ), (b0i − a0i − ) ≤ r r i=1
k
i
lo que, pasando al l´ımite cuando r → ∞, implica n XY Y (bki − aki ), (b0i − a0i ) ≤ i=1
k
i
P
o sea que m(I0 ) ≤ m(Ik ). (b) Resulta como en (a), sin m´ as que observar que si Ik ∩Ih = ∅, entonces para cualquier n´ umero real r 6= 0, rIk y rIh son tambi´en semintervalos disjuntos. Proposici´ on 17.7 Sean I0 , I1 , I2 , . . . una colecci´on numerable de semintervalos. P (a) Si I0 ⊂ ∪∞ m(Ik ). k=1 Ik entonces m(I0 ) ≤ P (b) Si Ik ∩ Ir = ∅ (k 6= r) y ∪ Ik ⊂ I0 entonces m(Ik ) ≤ m(I0 ). Demostraci´ on. (a) Veamos que ∞
I0 ⊂ ∪ Ik k=1
⇒
m(I0 ) ≤
∞ X
m(Ik ).
k=1
Para cada ε > 0 y para cada k, sean J y Hk semintervalos tales que J ⊂ I0 , m(I0 ) ≤ m(J) + ε/2, o
Ik ⊂ H k , m(Hk ) ≤ m(Ik ) + ε/2k+1 . Puesto que J es un compacto, se deduce que J ⊂ ∪finita Hk , luego aplicando la proposici´on anterior se tiene que m(J) ≤
X finita
m(Hk ) ≤
∞ X
m(Hk ) ≤
k=1
Por tanto
k=1 ∞
m(I0 ) ≤ m(J) +
∞ X
ε m(Ik ) + . 2
ε X ≤ m(Ik ) + ε, 2 k=1
172
Medida Exterior
17.7
lo que implica, por ser ε arbitrario, que m(I0 ) ≤
∞ X
m(Ik ).
k=1
(b) Si los semintervalos Ik son disjuntos entre s´ı y est´an contenidos en I0 entonces, por la proposici´on anterior, se tiene que para cada p ∈ N p X
luego tambi´en
P∞
k=1 m(Ik )
m(Ik ) ≤ m(I0 ),
k=1
≤ m(I0 ).
Corolario 17.8 Si F denota a la familia de semintervalos de Rn , la aplicaci´on m : F ⊂ P(Rn ) → [0, ∞] , que asigna a cada semintervalo el producto de las longitudes de sus lados, es una medida numerablemente aditiva. on. Si el semintervalo I se escribe como Demostraci´ I = ∪ Ik , donde los Ik son semintervalos disjuntos entre s´ı entonces, del apartado (a) de la proposici´on anterior, se deduce que X m(I) ≤ m(Ik ) y del apartado (b) que
X
m(Ik ) ≤ m(I).
Medida exterior En esta secci´on vamos a extender la medida de semintervalos a conjuntos m´as generales. Vamos a comenzar asignando a cada subconjunto A de Rn un n´ umero real (+∞), m∗ (A) ≥ 0, que pretendemos sea su medida. Definici´ on 17.9 Si A ⊂ Rn , llamaremos medida exterior del conjunto A, al elemento de [0, +∞], nX o m∗ (A) = inf m(Ik ) : A ⊂ ∪ Ik donde este ´ınfimo est´a extendido al conjunto de colecciones numerables, {Ik }, de semintervalos que recubren el conjunto A.
17.11
Medida Exterior
173
Es inmediato comprobar que la definici´on anterior tiene perfecto sentido, ya que, por una parte, para cada conjunto existe alguna colecci´ on numerable P de semintervalos que lo recubre, y por otra, todas la sumas m(Ik ) est´an acotadas inferiormente por 0, luego el extremo inferior de todas ellas existe en [0, +∞]. Precisamente por ser la medida exterior del conjunto A el extremo inferior de un conjunto de n´ umeros reales, se deduce Proposici´ on 17.10 Sea A un conjunto de Rn . El n´ umero α ∈ [0, +∞] es la medida exterior de A si y s´olo si se dan las dos condiciones 1. Cualquiera que sea Pla colecci´on {Ik } de semintervalos con A ⊂ ∪ Ik , se tiene que α ≤ m(Ik ). 2. Para cada ε > 0, existe alguna colecci´on {Ik } de semintervalos que recubre a A y tal que X m(Ik ) ≤ α + ε. Probaremos a continuaci´on que la medida exterior de un semintervalo coincide con su n-volumen, es decir la medida que ya le hab´ıamos asignado. Pero, desafortunadamente, m∗ no es numerablemente aditiva sobre la totalidad de P(Rn ) y, por tanto, no es una medida sobre P(Rn ). Sin embargo, podremos encontrar despu´es una familia M de subconjuntos de Rn , suficientemente amplia (contiene a los semintervalos, a todos los abiertos, cerrados etc.), de forma que la restricci´on de m∗ a M s´ı que sea numerablemente aditiva.
Propiedades de la Medida Exterior Proposici´ on 17.11 La medida exterior de un semintervalo I es igual al producto de las longitudes de sus lados. Es decir m∗ (I) = m(I). Demostraci´ on. Sea I un semintervalo no vac´ıo de Rn . Por definici´on nX o m∗ (I) = inf m(Ik ) : I ⊂ ∪ Ik , donde este ´ınfimo est´a extendido al conjunto de colecciones numerables, {Ik }, de semintervalos que recubren el conjunto I. Como un recubrimiento trivial de I lo constituye el propio {I}, resulta que m∗ (I) ≤ m(I).
174
Medida Exterior
17.11
Para obtener la desigualdad contraria, sea {Ik } una colecci´on numerable de semintervalos que recubran a I. Como por la proposici´on 17.7(a) X m(I) ≤ m(Ik ), resulta m(I) ≤ inf
nX
m(Ik ) : I ⊂ ∪ Ik
o
= m∗ (I),
con lo que termina la demostraci´on. La siguiente propiedad de la medida exterior es la Monoton´ıa y su demostraci´on es inmediata. Proposici´ on 17.12 Si A ⊂ B entonces m∗ (A) ≤ m∗ (B). Aunque como ya anunciamos la medida exterior no va a ser numerablemente aditiva en todo Rn , s´ı va a ser, en cambio, σ-subaditiva. Proposici´ on 17.13 Sea {Ak }∞ on numerable de conjuntos de k=1 una colecci´ n R . Entonces X m∗ (∪ Ak ) ≤ m∗ (Ak ).
Demostraci´ on. Consideremos para cada ε > 0 y para cada k, una colecci´on numerable de semintervalos, {Iki }, tal que Ak ⊂ ∪ Iki , i
X
m(Iki ) ≤ m∗ (Ak ) +
i
ε . 2k
Entonces A ⊂ ∪k,i Iki (una colecci´ on numerable de semintervalos). De la definici´on de m∗ (A) se deduce entonces que XX X X m∗ (A) ≤ m(Iki ) = m(Iki ) ≤ m∗ (Ak ) + ε. k,i
k
i
k
La conclusi´on resulta ya de que ε es arbitrario. Una de las propiedades que cab´ıa esperar de una medida en Rn es la ser invariante frente a movimientos. Aunque es cierto que la medida exterior tiene esta propiedad, la demostraci´ on general de la misma la vamos a aplazar de momento (ver Lema 27.2). S´ olo vamos a probar ahora que la medida exterior es Invariante por Traslaciones.
17.15
Medida Exterior
175
Proposici´ on 17.14 La medida exterior de Lebesgue es invariante por traslaciones. Es decir, para todo conjunto A de Rn y para todo punto x, se tiene que m∗ (x + A) = m∗ (A). Demostraci´ on. El resultado es cierto si A es un semintervalo. En efecto, si Q A es el semintervalo ni=1 [ai , bi ), entonces es evidente que x+A=
n Y [xi + ai , xi + bi ). i=1
Por lo tanto m∗ (x + A) =
Y Y (xi + bi − (xi + ai )) = (bi − ai ) = m∗ (A).
En general, si A es un conjunto cualquiera, veamos que m∗ (x + A) ≤ Sea (Ik ) una colecci´on de semintervalos tal que A ⊂ ∪ Ik . Entonces x + A ⊂ ∪(x + Ik ), por lo que de la definici´ on de medida exterior resulta que X X m∗ (x + A) ≤ m(x + Ik ) = m(Ik ). m∗ (A).
Esto significa que m∗ (x + A) es una cota inferior del conjunto nX o m(Ik ) : A ⊂ ∪ Ik , por tanto m∗ (x + A) ≤ m∗ (A). La desigualdad contraria se obtiene de la anterior escribiendo A = (−x)+ (x + A). As´ı, m∗ (A) = m∗ ((−x) + (x + A)) ≤ m∗ (x + A). Por u ´ltimo, vamos a ver que la medida exterior de Lebesgue no es numerablemente aditiva. Para ello vamos a dar el ejemplo cl´ asico de Vitali, el cual proporciona, a partir del axioma de elecci´on, una familia numerable de conjuntos de R, disjuntos dos a dos, cuya suma de medidas no coincide con la medida de la uni´on de ellos. Ejemplo 17.15 (Vitali) Sea A un conjunto acotado de n´ umeros reales con m∗ (A) > 0. Supongamos, por ejemplo, A ⊂ [−r, r). Definimos sobre A la relaci´on de equivalencia x ∼ y ⇔ x − y ∈ Q.
176
Medida Exterior
17.15
Obviamente cada clase de equivalencia es de la forma (x+Q)∩A, luego es un conjunto numerable. Se deduce pues que existe una cantidad no numerable de clases de equivalencia. Sea V un conjunto obtenido seleccionando en cada clase un u ´nico representante (observar que para ello se hace uso del Axioma de Elecci´on), y consideremos, para cada racional q del intervalo [−2r, 2r), el conjunto Vq = q + V . Se tiene entonces 1. Los conjuntos Vq son disjuntos dos a dos. En efecto, si x ∈ Vq1 ∩ Vq2 , entonces x = q1 + a1 = q2 + a2 ⇒ a1 − a2 ∈ Q. Es decir los puntos de V , a1 y a2 , est´an relacionados, y esto implica, por la construcci´on de V , que a1 = a2 , y por tanto, q1 = q2 . 2. A ⊂ ∪ Vq ⊂ [−3r, 3r), q ∈ Q ∩ [−2r, 2r). En efecto, sea x ∈ A, y sea a ∈ V tal que q = x − a ∈ Q. Entonces x = q + a ∈ q + V, siendo |q| = |x−a| < 2r, como se sigue f´acilmente de que tanto x como a est´en en [−r, r). De igual modo si x ∈ Vq , es decir x = q + a con −2r ≤ q < 2r y a ∈ V (por tanto −r ≤ a < r), entonces x ∈ [−3r, 3r). Teniendo en cuenta lo anterior, vamos a comprobar que X m∗ (∪ Vq ) 6= m∗ (Vq ), lo que demostrar´a que m∗ no es σ-aditiva en todo Rn : Por una lado, de la monoton´ıa de la medida exterior, se deduce que 0 < m∗ (A) ≤ m∗ (∪ Vq ) ≤ 6r. Por otro, como la medida exterior es invariante por traslaciones, m∗ (Vq ) = m∗ (V ), y por tanto P ∗ m (Vq ) = 0 , si m∗ (V ) = 0 P
m∗ (Vq ) = ∞ ,
si m∗ (V ) > 0
Tanto enPun caso como en otro, resultar´ıa imposible que m∗ (∪ Vq ) fuese igual a m∗ (Vq ). (Comprobar adem´as que la primera opci´on, es decir ∗ m (V ) = 0, no puede darse).
17D
Medida Exterior
177
Ejercicios 17A Sea I un semintervalo de Rn . Probar que para todo conjunto A tal que o
−
I ⊂ A ⊂ I , se tiene que m∗ (A) = m(I). 17B (Sobre conjuntos de medida nula). (a) Probar que la medida exterior de cada conjunto numerable es igual a 0, pero que el rec´ıproco no es cierto (considerar el conjunto de Cantor). (b) Demostrar que la gr´afica de una funci´on continua de R en R es un conjunto de medida nula en R2 . (c) Demostrar que todo conjunto de medida nula tiene interior vac´ıo, pero que el rec´ıproco no es cierto. 17C Probar que la medida exterior de Lebesgue no es finitamente aditiva en P(Rn ). 17D Extender a Rn el ejemplo de Vitali.
Cap´ıtulo 18
Conjuntos Medibles La identidad de Caratheodory En el cap´ıtulo anterior vimos que la medida exterior de Lebesgue no resulta σ-aditiva en todo Rn . Ahora vamos a construir una familia M de subconjuntos de Rn , a los que llamaremos medibles, que goza de buenas propiedades conjuntistas y topol´ogicas, y sobre la cual m∗ ser´ a una verdadera medida, es decir una funci´on de conjunto numerablemente aditiva. Definici´ on 18.1 (Caratheodory) Un conjunto B de Rn se dir´a medible si, para todo conjunto A, se verifica la siguiente identidad. m∗ (A) = m∗ (A ∩ B) + m∗ (A \ B). Denotaremos por M a la familia de conjuntos medibles. Aunque despu´es dedicaremos una secci´on para estudiar la familia M y la restricci´on de m∗ a M , ya podemos obtener como consecuencia directa de la definici´on que m∗ es finitamente aditiva sobre M , incluso un resultado algo m´as fuerte: 18.2 Si L ∈ M y A es un subconjunto cualquiera de Rn disjunto con L, entonces (18.1)
m∗ (A ∪ L) = m∗ (A) + m∗ (L).
Demostraci´ on. Inmediata. 179
180
Conjuntos Medibles
18.2
La definici´on anterior de conjunto medible es una elaboraci´on conveniente de otra m´as natural, en la que interviene no s´olo la medida exterior, sino tambi´en una medida interior. Aunque el estudio de esta medida interior, y en consecuencia, esta otra v´ıa de introducci´on de los conjuntos medibles, no ser´a objeto de este curso, vamos a exponer en qu´e consiste. Simplemente, se pretende aclarar, con ello, la definici´on de Caratheodory. En el cap´ıtulo anterior hemos establecido la t´ecnica para medir conjuntos de Rn . Esta consiste en aproximar por fuera la medida de un conjunto a partir de recubrimientos numerables por semintervalos (de ah´ı el nombre alogamente podr´ıa concebirse una medida interior, de medida exterior). An´ aproximando los conjuntos por dentro. Para que todo fuese coherente con nuestra intuici´on, ambas formas de medir deber´ıan conducir al mismo resultado. Sin embargo, era bien conocido ya en la ´epoca de Lebesgue que, cuando se utilizaban s´ olo colecciones finitas de semintervalos para aproximar, pod´ıan aparecer conjuntos no medibles, en el sentido de que su medida exterior difer´ıa de la interior (por ejemplo, tal era el caso del conjunto de los o que tal hecho suced´ıa, preciracionales del intervalo [0,1]). Lebesgue pens´ samente, por la limitaci´ on que supon´ıa el uso exclusivo de colecciones finitas de semintervalos. Sin embargo, Vitali, primero, y posteriormente Haussdorf y Banach-Tarski (Ver Natanson [23] y Benedetto [3]), demostraron que la ra´ız de tales males se encontraba en la propia Teor´ıa de Conjuntos y m´as concretamente en el Axioma de Elecci´ on. La presencia de este axioma har´a inevitable que surjan conjuntos con diferentes medida exterior que interior (Ver [3], Solovay [27] y Moore [21]). Definici´ on 18.3 Sea A un conjunto de Rn contenido en el semintervalo I. Llamaremos medida interior de A al n´ umero real m∗ (A) = m(I) − m∗ (I \ A).
Esta es la definici´on de medida interior que propuso Lebesgue. Con ella se aparta de la idea de Jordan de aproximar, tambi´en internamente, la medida de un conjunto mediante intervalos contenidos en ´el. As´ı, por ejemplo, con su definici´on, la medida interior del conjunto I de los irracionales de [0,1] es m∗ (I) = 1 − m∗ (Q) = 1, mientras que si trat´aramos de aproximar mediante intervalos contenidos en I, la medida (interior) de este conjunto ser´ıa 0, ya que los u ´nicos intervalos contenidos en I son los puntos (y el u ´nico semintervalo el ∅).
18.5
Conjuntos Medibles
181
Pasar de la definici´on 18.3 a definir la medida interior de un conjunto A, sin la restricci´on A ⊂ I, requiere algunos detalles m´as (Ver Williamson [28]). Despu´es de esto se puede probar el siguiente resultado: Proposici´ on 18.4 Si B es un conjunto con m∗ (B) < ∞, entonces B es medible (en el sentido de Caratheodory) si y s´olo si m∗ (B) = m∗ (B) (medible en el sentido de Lebesgue). S´olo vamos a demostrar parte de la proposici´on, concretamente, que si B es un conjunto acotado y medible en el sentido de Caratheodory, entonces tambi´en es medible en el sentido de Lebesgue. En efecto, sea I un semintervalo que contenga a B. Entonces de la identidad de Caratheodory m(I) = m∗ (I ∩ B) + m∗ (I \ B) = m∗ (B) + m∗ (I \ B), se deduce que m∗ (B) = m(I) − m∗ (I \ B) = m∗ (B).
La σ-´ algebra de conjuntos medibles Teorema 18.5 La familia M de conjuntos medibles tiene las siguientes propiedades: (a) Es cerrada respecto al paso a complementario, es decir si B ∈ M entonces B c ∈ M . (b) Es cerrada respecto a uniones numerables, es decir si Bi ∈ M , i = 1, 2, . . ., entonces ∪∞ i=1 Bi ∈ M . Adem´as, la restricci´on de m∗ a M es numerablemente aditiva. Demostraci´ on. Antes de nada, observemos que cuando haya de comprobarse que se satisface la identidad de Caratheodory, bastar´a con ver que se cumple la desigualdad m∗ (A ∩ B) + m∗ (A \ B) ≤ m∗ (A), ya que, por la monoton´ıa de la medida exterior, la otra desigualdad siempre se da. M es cerrada por paso a complementarios. Si B ∈ M entonces para cada conjunto A se tiene m∗ (A) = m∗ (A ∩ B) + m∗ (A \ B).
182
Conjuntos Medibles
18.5
Como A \ B = A ∩ B c y A ∩ B = A \ B c , la igualdad anterior puede escribirse en la forma m∗ (A) = m∗ (A ∩ B c ) + m∗ (A \ B c ), lo que expresa que B c ∈ M . M es cerrada respecto a uniones finitas. Supongamos que B1 , B2 ∈ M y veamos que el conjunto B1 ∪ B2 satisface la identidad de Caratheodory. En primer lugar, por ser B1 medible, se tiene m∗ (A ∩ (B1 ∪ B2 )) = m∗ (A ∩ (B1 ∪ B2 ) ∩ B1 ) + m∗ (A ∩ (B1 ∪ B2 ) \ B1 ) = m∗ (A ∩ B1 ) + m∗ (A ∩ B1c ∩ B2 ), Por tanto m∗ (A ∩ (B1 ∪ B2 )) + m∗ (A \ (B1 ∪ B2 )) = m∗ (A ∩ B1 ) + m∗ (A ∩ B1c ∩ B2 ) + m∗ (A ∩ B1c ∩ B2c ). Teniendo en cuenta ahora que B2 es medible, los dos u ´ltimos sumandos anteriores se transforman en m∗ (A ∩ B1c ∩ B2 ) + m∗ (A ∩ B1c ∩ B2c ) = m∗ (A ∩ B1c ), y de todo ello se deduce ya que m∗ (A ∩ (B1 ∪ B2 )) + m∗ (A \ (B1 ∪ B2 )) = m∗ (A), es decir B1 ∪ B2 es medible. Observemos que del proceso seguido en la demostraci´ on anterior se deduce, para B1 y B2 disjuntos, la siguiente f´ormula: m∗ (A ∩ (B1 ∪ B2 )) = m∗ (A ∩ B1 ) + m∗ (A ∩ B2 ), de la que resulta, en particular, la aditividad finita, es decir B1 ∩ B2 = ∅
⇒
m∗ (B1 ∪ B2 ) = m∗ (B1 ) + m∗ (B2 ).
Por inducci´on, lo anterior se extiende inmediatamente a un n´ umero finito de conjuntos medibles.
18.5
Conjuntos Medibles
183
σ-aditividad. Sea Bi , i = 1, 2, . . . , una colecci´ on numerable de conjuntos medibles, disaneamente que juntos entre s´ı. Vamos a demostrar simult´ ∞
∞
i=1
i=1
∪ Bi ∈ M y m∗ ( ∪ Bi ) =
∞ X
m∗ (Bi ).
i=1
En efecto, ∞
∞
i=1
i=1
m∗ (A ∩ ( ∪ Bi ) + m∗ (A \ ∪ Bi ) (18.2)
≤
∞ X
∞
m∗ (A ∩ Bi ) + m∗ (A \ ∪ Bi ) i=1
i=1
= lim
à k X
k→∞
! ∗
∗
∞
m (A ∩ Bi ) + m (A \ ∪ Bi ) . i=1
i=1
Por otra parte sabemos que para todo k, ∪ki=1 Bi es medible y k
∗
m (A ∩ ( ∪ Bi )) = i=1
k X
m∗ (A ∩ Bi ),
i=1
por tanto k X
∞
m∗ (A ∩ Bi ) + m∗ (A \ ∪ Bi ) ≤ i=1
i=1
k X
k
m∗ (A ∩ Bi ) + m∗ (A \ ∪ Bi ) i=1
i=1
k
k
i=1
i=1
= m∗ (A ∩ ( ∪ Bi )) + m∗ (A \ ∪ Bi ) = m∗ (A), de lo que se deduce que à k ! X ∞ (18.3) lim m∗ (A ∩ Bi ) + m∗ (A \ ∪ Bi ) ≤ m∗ (A). k→∞
i=1
i=1
Hemos demostrado que ∞
∞
i=1
i=1
m∗ (A ∩ ( ∪ Bi ) + m∗ (A \ ∪ Bi ) ≤ m∗ (A), lo que significa que ∪Bi es medible. Adem´as puesto que la desigualdad contraria de esta u ´ltima tambi´en es cierta, resulta que las desigualdades y 18.3 son, en realidad, igualdades, y por lo tanto se tiene en particular que ∞
∞
i=1
i=1
m∗ (A ∩ ( ∪ Bi ) + m∗ (A \ ∪ Bi ) =
∞ X i=1
∞
m∗ (A ∩ Bi ) + m∗ (A \ ∪ Bi ), i=1
184
Conjuntos Medibles
18.5
lo que implica, tomando A = Rn , ∗
∞
m ( ∪ Bi ) = i=1
∞ X
m∗ (Bi ),
i=1
es decir la aditividad numerable de m∗ sobre M . M es cerrada respecto a uniones numerables Sean Bi ∈ M , i = 1, 2, . . . ,. Formemos los conjuntos i−1
Bi0 = Bi \ ∪ Bi , i = 1, 2, . . . , . s=1
∞ 0 Obviamente estos conjuntos son disjuntos dos a dos y ∪∞ s=1 Bi = ∪s=1 Bi . Por lo que si adem´as fuesen medibles, entonces de la etapa anterior se deducir´ıa 0 que ∪∞ s=1 Bi ∈ M . Cada conjunto Bi es diferencia de dos conjuntos medibles, luego para terminar s´olo hay que probar que si dos conjuntos C1 y C2 son medibles, entonces C1 \ C2 tambi´en es medible. Y, en efecto, esto resulta de lo ya visto y de las identidades conjuntistas
C1 \ C2 = C1 ∩ C2c = (C1c ∪ C2 )c .
Conjuntos medibles y no medibles Hemos establecido en la secci´on anterior las buenas propiedades conjuntistas de las que goza la familia M de los conjuntos medibles. Anticip´ andonos un poco al cap´ıtulo 20, vamos a considerar ahora (de momento s´ olo a modo de ejemplos) algunos tipos de conjuntos medibles, a partir de los cu´ales podremos caracterizar all´ı todos los dem´as. Esto nos permitir´a ver, adem´as, que, si bien la familia M no es P(Rn ), se llega bastante lejos con la extensi´on de la medida de semintervalos a la familia M . Proposici´ on 18.6 Todo conjunto de medida nula es un conjunto medible. Demostraci´ on. Sea B con m∗ (B) = 0. Entonces si A es un conjunto cualquiera, utilizando la monoton´ıa de la medida exterior, se tiene m∗ (A ∩ B) + m∗ (A \ B) = m∗ (A \ B) ≤ m∗ (A), lo que prueba que B es medible.
18.8
Conjuntos Medibles
185
Esta proposici´on nos permite afirmar que los puntos, los conjuntos finitos o numerables, como Q por ejemplo, son conjuntos medibles, por tener medida cero. Pero no solo los conjuntos numerables van a tener medida cero, como veremos cualquier arco de curva continuo de Rn (n > 1) ser´a tambi´en un conjunto de medida nula. En R, el bien conocido conjunto de Cantor constituye un ejemplo de conjunto no numerable que tambi´en mide cero. Precisamente, de la existencia de conjuntos no numerables con medida nula, podemos deducir que el cardinal de la familia M de conjuntos medibles coincide con el de P(R) (Ejercicio). Como cab´ıa esperar tambi´en es medible cada semintervalo. Para demostrarlo vamos a utilizar como lema la siguiente debilitaci´on de la condici´on de Caratheodory de conjunto medible: Lema 18.7 Un conjunto B de Rn es medible si, y s´olo si, para cada semintervalo I se tiene que m∗ (I) = m∗ (I ∩ B) + m∗ (I \ B). on. Se trata de probar que basta la condici´on del lema para que Demostraci´ se satisfaga la identidad de Caratheodory para cada subconjunto A de Rn . En efecto, para ε > 0 sea (Ik ) una colecci´ on numerable de semintervalos tal que X A ⊂ ∪ Ik y m(Ik ) ≤ m∗ (A) + ε. Entonces A ∩ B ⊂ ∪ Ik ∩ B y A \ B ⊂ ∪ Ik \ B. Luego
≤
X
m∗ (A ∩ B) + m∗ (A \ B) X m∗ (Ik ∩ B) + m∗ (Ik \ B) = (m∗ (Ik ∩ B) + m∗ (Ik \ B)) X = m∗ (Ik ) ≤ m∗ (A) + ε. X
Puesto que ε es arbitrario, de esto se deduce que B es medible. Proposici´ on 18.8 Cada semintervalo de Rn es un conjunto medible. Demostraci´ on. Sea J un semintervalo de Rn y veamos que m∗ (I) = m∗ (I ∩ J) + m∗ (I \ J) para cada semintervalo I.
186
Conjuntos Medibles
18.8
Escribamos I \ J = ∪ps=1 Ks , siendo {Ks } una partici´on finita de I \ J por semintervalos. Entonces, si a {Ks } a˜ nadimos el semintervalo I ∩ J, obtenemos una partici´on finita de I. Luego X m∗ (I ∩J)+m∗ (I \J) = m(I ∩J)+m∗ (∪ Ks ) ≤ m(I ∩J)+ m(Ks ) = m(I), P donde hemos usado la subaditividad de m∗ (en m∗ (∪Ks ) ≤ m(Ks )) y la proposici´on 17.8. Esto significa, despu´es del lema, que J es medible. A continuaci´on vamos a probar que todo abierto de Rn es un conjunto medible. Esto podr´ıa obtenerse, de manera sencilla, como consecuencia de la propiedad de Lindelof de los conjuntos de Rn (Ejercicio), sin embargo nosotros vamos a establecer un resultado m´as profundo, que incluye en particular ´til despu´es. el que queremos, y que va a sernos u Proposici´ on 18.9 Todo abierto de Rn admite una partici´on numerable por semicubos que tienen su adherencia contenida en ´el. on. Llamaremos semicubo de lado l a un semintervalo que tiene Demostraci´ todos sus lados de la misma longitud l. Si U es abierto, entonces se trata de on numerable (Ck ) de semicubos disjuntos dos a dos y encontrar una colecci´ tales que Ck ⊂ U . Para ello vamos a proceder as´ı: Consideremos, en primer lugar, una partici´on de Rn mediante semicubos de nalando en cada eje los n´ umeros lado 1 (Puede hacerse esto, por ejemplo, se˜ enteros y formando todos los n-productos posibles de semintervalos de R que tienen como extremos dos enteros consecutivos). Denotemos por S1 a la colecci´on (numerable) de los semicubos de esta partici´on, y reservemos aquellos que tienen su adherencia contenida en U . Denotemos a dicha subcolecci´on por C1 . A continuaci´on, obtenemos una nueva partici´on de Rn , ahora por semicubos de lado 1/2, dividiendo los lados de cada semicubo de S1 en dos partes iguales (De cada semicubo de lado 1 se obtendr´ an entonces 2n semicubos de lado 1/2). Sea S2 esta partici´ on y llamemos C2 a la subcolecci´on de S2 obtenida tomando los semicubos de adherencia contenida en U y que, adem´as, no son subconjuntos de alg´ un semicubo de C1 (ya tomado en la etapa anterior). De este mismo modo se conseguir´ıa para cada k = 1, 2, . . . una partici´on de Rn , Sk , formada por semicubos de lado 1/2k−1 y una subcolecci´on de ´esta, Ck , en la que est´ an aquellos que tienen su adherencia contenida en U
18.9
Conjuntos Medibles
187
y que no proceden de semicubos tomados en las etapas anteriores, es decir que no son subconjuntos de ning´ un semicubo de C1 , C2 , . . ., Ck−1 . Sea C = ∪Ck la familia de semicubos tomados en las distintas etapas. Evidentemente todos ellos son disjuntos entre s´ı y constituyen una cantidad numerable. Vamos a probar que U=
[ {C : C ∈ C }.
Como por construcci´on, los semicubos de C est´ an contenidos en U , s´olo hemos de ver que U ⊂ ∪{C : C ∈ C }. Supongamos que x es un punto de Rn que no est´a en ninguno de los semicubos de C , y veamos que entonces x 6∈ U . Denotemos por Sk al u ´nico semicubo de la partici´on Sk en el que se encuentra el punto x. De acuerdo con nuestra suposici´on, ninguno de los semicubos Sk pertenece a la familia C . Puesto que S1 ⊃ S2 ⊃ . . ., esto significa que Sk 6⊂ U, luego existe xk ∈ S k ∩ U c . Entonces xk , x ∈ S k
⇒
d∞ (xk , x) ≤ 1/2k−1 (lado de Sk ).
Se tiene pues que la sucesi´on {xk } converge a x, y como xk ∈ U c , que es un conjunto cerrado, se deduce que x ∈ U c . Debido a las propiedades conjuntistas de la familia M , adem´ as de los conjuntos abiertos, van a ser medibles tambi´en los cerrados, los conjuntos Fσ y Gδ etc.; los intervalos de cualquier tipo y, en general, los conjuntos cuya frontera sea un conjunto de medida nula (Ejercicio 18C). Ya sabemos que, al no ser m∗ σ-aditiva en todo Rn , la familia M es distinta de P(Rn ). Un ejemplo de conjunto no medible lo constituye el conjunto de Vitali. Para comprobar esto s´ olo hay que tener en cuenta que las traslaciones mantienen el car´acter medible (Ejercicio18G), pues entonces, si el conjunto V de Vitali fuese medible, los conjuntos Vq (v´ease ejemplo de Vitali tambi´en lo ser´ıan y, en consecuencia, m∗ (∪Vq ) deber´ıa ser igual P 17.15) m∗ (Vq ). En cuanto al cardinal de la familia de conjuntos que no son a medibles, ´este resulta ser el mismo que la de los medibles. Para verlo, basta observar que si J es un intervalo de R disjunto con V , entonces para todo subconjunto A ⊂ J el conjunto V ∪ A es no medible.
188
Conjuntos Medibles
18A
Ejercicios 18A Probar que para todo A ⊂ Rn , o nX m∗ (A) = inf m(Ik ) : A ⊂ ∪Ik con el ´ınfimo extendido s´olo al conjunto de colecciones numerables, {Ik }, de intervalos “abiertos”que recubren el conjunto A. 18B Sean A1 , A2 dos subconjuntos de Rn tales que d(A1 , A2 ) > 0. Probar que m∗ (A1 ∪ A2 ) = m∗ (A1 ) + m∗ (A2 ). 18C Probar que todo conjunto B de Rn cuya frontera sea un conjunto de medida nula es medible. 18D Sea B ⊂ Rn y supongamos que para cada ε > 0 existen dos conjuntos medibles C, D tales que B ⊂ C, B c ⊂ D y m(C ∩ D) < ε. Probar que B es medible 18E Probar que un conjunto B es medible si y s´olo si, cualesquiera que sean los conjuntos A1 ⊂ B, A2 ⊂ B c , se tiene m∗ (A1 ∪ A2 ) = m∗ (A1 ) + m∗ (A2 ) 18F Obtener la medida del conjunto de n´ umeros reales de [0, 1] que en su expresi´on decimal s´olo tienen “ceros y unos”. 18G Probar que si B es un conjunto medible de Rn entonces, para todo a ∈ Rn , a + B es tambi´en medible. 18H Sea A un conjunto de Rn con m∗ (A) < ∞. Demostrar que si A contiene un conjunto medible B tal que m(B) = m∗ (A), entonces A es medible. ¿Es esto cierto si m∗ (A) = ∞? 18I Demostrar que para cada α ∈ [0, 1) existe un conjunto perfecto, tipo Cantor, de medida igual a α. ´ n. Elegir adecuadamente las longitudes δ1 , δ2 , . . . , de los intervalos cenIndicacio trales que se quitan en cada paso de la construcci´on del conjunto tipo Cantor. 18J Demostrar que para todo conjunto A de Rn y todo α se tiene que m∗ (αA) = |α|n m∗ (A), y que si B es medible entonces αB tambi´en es medible. 18K Probar que existen conjuntos no medibles de cualquier medida.
18N
Conjuntos Medibles
189
18L (La Medida de Jordan). Dado un conjunto acotado C ⊂ Rn se define la medida exterior de Jordan de C como X m (C) = inf{ m(Ik ) : C ⊂ ∪Ik }, donde con (Ik ) se denota a las colecciones finitas de semintervalos que recubren al conjunto C. (a) Probar que en la definici´on anterior los semintervalos Ik se pueden tomar disjuntos entre s´ı. An´alogamente, se define la medida interior de Jordan del conjunto acotado C como X m (C) = sup{ m(Ik ) : C ⊃ ∪Ik }, donde con (Ik ) se denota a las colecciones finitas de semintervalos disjuntos entre s´ı contenidos en C. (b) Probar que m (C) ≤ m∗ (C) ≤ m (C). El conjunto acotado C se dir´a j-medible (Jordan-medible) si m (C) = m (C). (c) Probar que el conjunto Q ∩ [0, 1] no es un conjunto j-medible. (d) Demostrar que si C es un conjunto j-medible entonces su frontera es un conjunto de medida nula. (e) Deducir del apartado anterior que todo conjunto j-medible es Lebesgue medible. (f) Encontrar un abierto de R que contenga al conjunto Q ∩ [0, 1] y cuya frontera tenga medida no nula. 18M Sea A un subconjunto acotado de Rn y I un semintervalo que contenga a A. Se define entonces m∗ (A), la medida interior de Lebesgue de A, como m∗ (A) = m(I) − m∗ (I \ A) (a) Probar que m∗ (A) es independiente del intervalo I que contenga a A. (b) Demostrar que para todo conjunto acotado A m∗ (A) ≤ m∗ (A). (c) Comparar las medidas interiores de Jordan y de Lebesgue del conjunto Q ∩ [0, 1]. (d) Probar que un conjunto acotado B es Lebesgue medible si y s´olo si m∗ (B) = m∗ (B). 18N Probar que la medida exterior de Lebesgue es invariante por rotaciones. Se sugieren los siguientes pasos: (a) Sea Q0 el semicubo (0, 1]n , T la rotaci´on y k = m∗ (T (Q0 )). Probar que si Q es un semicubo entonces T (Q) es un conjunto medible y m∗ (T (Q)) = km(Q).
190
Conjuntos Medibles
18N
(b) Probar que esta u ´ltima f´ormula es v´alida para los conjuntos abiertos. (c) Teniendo en cuenta que la rotaci´on de la bola eucl´ıdea unidad es simplemente una traslaci´on de dicha bola, probar que la constante k debe ser igual a 1. (d) Deducir, teniendo en cuenta el ejercicio 18A, que m∗ es invariante por T .
Cap´ıtulo 19
La Medida de Lebesgue. Problema de la Medida Hemos demostrado en el cap´ıtulo anterior que la medida exterior de Lebesgue es una “medida”sobre la familia M de los conjuntos medibles. Por definici´on, vamos a llamar entonces medida de Lebesgue, a la restricci´on de m∗ a M . A partir de ahora, para referirnos a la medida de un conjunto medible B utilizaremos la notaci´on m(B) en lugar de m∗ (B).
Propiedades de la medida de Lebesgue Las propiedades de la medida de Lebesgue que vamos a obtener aqu´ı (y nadir, si se quiere, a la lista de propiedades de la medida que se pueden a˜ exterior), ser´an consecuencia exclusivamente de la aditividad numerable y de las propiedades conjuntistas de M (ver teorema 18.5), es decir estas mismas propiedades las tendr´ıa tambi´en cualquier funci´on de conjunto (no negativa) definida sobre una familia de conjuntos con las propiedades de M (una σ-´algebra) que fuese σ-aditiva. N´otese que, adem´as de las propiedades se˜ naladas en dicho teorema, hemos visto de forma m´as o menos expl´ıcita que M es tambi´en una familia cerrada respecto a intersecciones numerables y respecto a la diferencia de conjuntos, que contiene al ∅ y a Rn . Proposici´ on 19.1 Si B1 , B2 ∈ M y B1 ⊂ B2 entonces, m(B2 ) = m(B1 ) + m(B2 \ B1 ). En particular, si B1 tiene medida finita entonces, m(B2 \ B1 ) = m(B2 ) − m(B1 ). Demostraci´ on. Escribiendo B2 = B1 ∪ (B2 \ B1 ) y utilizando la aditividad 191
192
La Medida de Lebesgue
19.1
finita de la medida de Lebesgue, se tiene m(B2 ) = m(B1 ) + m(B2 \ B1 ). Si m(B1 ) < ∞, podemos pasar al otro miembro m(B1 ), con lo que resulta la f´ormula m(B2 \ B1 ) = m(B2 ) − m(B1 ). Proposici´ on 19.2 Si B1 , B2 ∈ M entonces, m(B1 ∪ B2 ) + m(B1 ∩ B2 ) = m(B1 ) + m(B2 ). Demostraci´ on. Si escribimos B1 ∪B2 = B1 ∪(B2 \B1 ∩B2 ), entonces, teniendo en cuenta que los conjuntos B1 y B2 \ (B1 ∩ B2 ) son disjunto y medibles, se tiene que m(B1 ∪ B2 ) = m(B1 ) + m(B2 \ B1 ∩ B2 ). Si el conjunto B1 ∩ B2 tuviese medida finita, podr´ıa aplicarse la f´ormula anterior, con lo que se tendr´ıa m(B1 ∪ B2 ) = m(B1 ) + m(B2 ) − m(B1 ∩ B2 ), y pasando m(B1 ∩ B2 ) al primer miembro, resulta la f´ ormula que buscamos m(B1 ∪ B2 ) + m(B1 ∩ B2 ) = m(B1 ) + m(B2 ). Obs´ervese que esta f´ormula se verifica trivialmente cuando m(B1 ∩B2 ) = ∞. Proposici´ on 19.3 Si B1 ⊂ B2 ⊂ . . . ⊂ Bk . . . , es una sucesi´on creciente de conjuntos medibles, entonces m(∪Bk ) = limk→∞ m(Bk ) Demostraci´ on. Puesto que la sucesi´on de conjuntos es creciente, es claro que Bk
= B1 ∪(B2 \ B1 ) ∪ . . . ∪(Bk \ Bk−1 ),
∞
∪ Bk = B1 ∪(B2 \ B1 ) ∪ . . .
k=1
y que los conjuntos Bi \ Bi−1 son disjuntos entre s´ı y medibles. Por lo tanto ∞
m( ∪ Bk ) = k=1
∞ X i=1
m(Bi \ Bi−1 ) = lim
k→∞
k X i=1
m(Bi \ Bi−1 ) = lim m(Bk ). k→∞
Nota. Veremos en el siguiente cap´ıtulo que esta propiedad de la medida es tambi´en una propiedad de la medida exterior, es decir esta proposici´on es cierta aunque los conjuntos Bk no sean medibles.
19.5
La Medida de Lebesgue
193
Proposici´ on 19.4 Si B1 ⊃ B2 ⊃ . . . ⊃ Bk . . . , es una sucesi´on decreciente de conjuntos medibles de medida finita, entonces m(∩Bk ) = limk→∞ m(Bk ) Demostraci´ on. Formemos la sucesi´on creciente de conjuntos medibles B1 \ B2 ⊂ B1 \ B3 ⊂ . . . B1 \ Bk ⊂ . . . De la proposici´on anterior resulta que m(∪(B1 \ Bk )) = lim m(B1 \ Bk ). k→∞
Entonces, teniendo en cuenta que ∪(B1 \ Bk ) = B1 \ ∩Bk y que por ser los conjuntos de medida finita, m(B1 \ Bk ) = m(B1 ) − m(Bk ), resulta m(B1 ) − m(∩ Bk ) = m(∪(B1 \ Bk )) = lim m(B1 \ Bk ) = m(B1 ) − lim m(Bk ), k→∞
k→∞
lo que implica que m(∩ Bk ) = lim m(Bk ). k→∞
Nota. Es habitual presentar el resultado anterior con la hip´ otesis m´ as d´ebil, “alguno de los conjuntos Bk es de medida finita”. Para probar que el resultado anterior se mantiene tambi´en con esta hip´otesis, basta observar que por ser la sucesi´on de conjuntos mon´otona decreciente, para cada ´ındice j se tiene que ∞
∞
k=1
k=j
∩ Bk = ∩ Bk .
Por tanto si m(Bj ) < ∞ (que implica m(Bk ) < ∞ para todo k ≥ j), se deduce que ∞
∞
k=1
k=j
m( ∩ Bk ) = m( ∩ Bk ) = lim m(Bk ). k→∞
Los ejemplos siguientes demuestran que sin las hip´otesis todos los conjuntos son medibles y de medida finita el resultado anterior no es v´alido en general. Ejemplos 19.5 1. Sea Bk = (k, ∞), k = 1, 2, . . .. Es claro que m(Bk ) = ∞ ⇒
lim m(Bk ) = ∞,
k→∞
en cambio
∩ Bk = ∅ ⇒ m(∩ Bk ) = 0.
194
La Medida de Lebesgue
19.5
2. Sean V y Vq los conjuntos construidos en el ejemplo de Vitali, V1 , V2 , . . . una numeraci´on de los conjuntos {Vq } y denotemos por Ak = ∪j≥k Vj . Entonces, es f´acil comprobar que la sucesi´on decreciente de conjuntos (no medibles, pero de medida exterior finita) A1 ⊃ A2 ⊃ . . ., satisface
∩ Ak = ∅ ,
m(Ak ) ≥ m(V ) > 0,
luego m(∩Ak ) = 0 mientras que limk→∞ m(Ak ) ≥ m(V ) > 0.
El problema de la medida El ejemplo dado por Vitali puso de manifiesto no s´ olo que la medida exterior de Lebesgue no es σ-aditiva en todo R, sino que es imposible construir una medida (σ-aditiva) para todos los subconjuntos de R, que sea adem´as invariante por traslaciones y asigne a cada intervalo su longitud. En efecto, sea V un conjunto de Vitali contenido, por ejemplo, en A = [−1, 1]. Si µ fuese una medida de estas caracter´ısticas definida en P(X), deber´ıa de verificarse que ½ ¾ X 0 µ(∪ Vq ) = µ(Vq ) = , ∞ seg´ un que µ(V ) = 0 ´o µ(V ) > 0. Pero ambas posibilidades se contradicen con el hecho de que [−1, 1] ⊂ ∪ Vq ⊂ [−6, 6]. (Obs´ervese que de la aditividad de µ resulta que µ es tambi´en mon´otona). Si bien, despu´es de lo anterior, no resulta posible extender la medida de Lebesgue a P(R), manteniendo la invariancia por traslaciones, s´ı que se han obtenido extensiones de la misma a familias de conjuntos estrictamente m´as grandes que la σ-´ algebra M de los conjuntos medibles ([19], [17]). Como ya hemos se˜ nalado, la existencia de conjuntos no medibles es consecuencia de la presencia en la teor´ıa de conjuntos del Axioma de Elecci´on(AC). Concretamente, si a los axiomas de la teor´ıa de conjuntos de Zermelo-Fraenkel (ZF) a˜ nadimos (AC), entonces aparecen subconjuntos en R que no son Lebesgue-medibles. Pero esto no significa que sin el axioma de elecci´on, es decir s´olo con los axiomas (ZF), se pueda demostrar que todo conjunto es medible. De hecho, si se sustituye (AC) por la Hip´otesis del Continuo (Cohen demostr´o que la hip´otesis del continuo es independiente del axioma de elecci´ on [8]), tambi´en se pueden construir conjuntos no Lebesgue-medibles en R.
19C
La Medida de Lebesgue
195
Por otra parte Solovay ([27]) ha demostrado que tambi´en es concebible un modelo matem´atico con la axiom´atica de Zermelo-Fraenkel (ZF), en el que todo subconjunto de R sea Lebesgue-medible. En t´erminos m´ as precisos: La proposici´on todo subconjunto de R es Lebesgue-medible, es consistente con los axiomas (ZF).
Ejercicios 19A Dar ejemplos de conjuntos medibles B1 ⊂ B2 para los que m(B2 \ B1 ) sea, sucesivamente, igual a 0, 1, ∞. 19B (Teorema de Borel-Cantelli) Sea {Bp } un sucesi´on de conjuntos medibles y supongamos que ∞ X m(Bp ) < ∞. p=1
Probar que el conjunto P de los puntos de Rn que est´an en infinitos Bp tiene medida nula. ´ n. Observar que el conjunto P = ∩p ∪j≥p Bj . Indicacio 19C Sea B un conjunto medible contenido en el intervalo cerrado [a, b] y sea h la aplicaci´on de [a, b] en R definida por h(x) = m(B ∩ [a, x]). (a) Probar que h es continua y creciente. (b) Probar que si B es un abierto denso de [a, b] entonces h es estrictamente creciente. (c) Demostrar que para cada n´ umero real 0 ≤ α ≤ m(B) existe un conjunto medible Bα ⊂ B tal que m(Bα ) = α. (d) Demostrar que si m(B) > 0 entonces, para cada 0 < α < m(B), B contiene un subconjunto no medible V tal que m∗ (V ) = α.
Cap´ıtulo 20
Conjuntos de Borel Hemos demostrado ya que la familia M de los conjuntos medibles contiene a todos los abiertos de Rn y, por tanto, a todos los conjuntos que podamos formar a partir de los abiertos mediante las operaciones: paso a complementarios, uniones e intersecciones numerables, etc. Todos estos conjuntos constituir´an la familia de conjuntos de Borel, que nos proponemos estudiar en este cap´ıtulo. Veremos que la relaci´ on entre estos conjuntos y los conjuntos medibles es mucho m´as estrecha que la de una simple relaci´ on de contenido.
´ σ-Algebras En primer lugar, vamos a precisar un concepto al que ya nos hemos referido anteriormente, el de σ-´algebra. Definici´ on 20.1 Sea X un conjunto. Una familia A de subconjuntos de X diremos que forman una σ-´algebra si satisface las condiciones siguientes: 1. Los conjuntos ∅ y X pertenecen a A . 2. A es cerrada por paso al complementario, es decir si B ∈ A entonces Bc ∈ A . 3. A es cerrada respecto a uniones numerables, es decir si Bk ∈ A , k = 1, . . . entonces ∪Bk ∈ A . Procediendo como para la σ-´algebra M , se deduce que si A es una σ-´ algebra entonces A es cerrada tambi´en respecto a las intersecciones numerables y respecto a la diferencia de conjuntos. Por otra parte es inmediato comprobar 197
198
Conjuntos de Borel
20.1
que cualquier intersecci´ on de σ-´ algebras es tambi´en una σ-´algebra. Esto permite dar la siguiente definici´on. on 20.2 Dada una familia F de subconjuntos de un conjunto X, Definici´ llamaremos σ-´algebra generada por F, a la menor σ-´algebra que contiene a F. Denotaremos a veces a esta σ-´algebra por σ(F). Es claro que σ(F) est´a siempre bien definida. De hecho, σ(F) es la intersecci´on de todas la σ-´algebras que contienen a F. (N´otese que al menos hay una σ-´algebra que contiene a F, la familia P(X) de todos los subconjuntos de X).
La σ-´ algebra de Borel Si X es un espacio topol´ogico, a la σ-´ algebra generada por los abiertos de X se le denomina σ-´algebra de Borel. Sabemos que en Rn la σ-´algebra de Borel, B, est´a contenida en M (existen ejemplos que prueban que esta contenci´on es estricta) y a ella pertenecen adem´ as de los abiertos, los cerrados, los conjuntos Fσ y los Gδ as´ı como los semintervalos etc. Ha sido precisamente la familia de semintervalos la que se ha tomado como base para definir on, que ´esta la medida de un conjunto y vamos a demostrar a continuaci´ tambi´en puede obtenerse a partir de otras familias de conjuntos Borel, como la de los abiertos, la de los Gδ , compactos etc. Proposici´ on 20.3 Para cada conjunto A ⊂ Rn se tiene: (a) m∗ (A) = inf{m(U ) : U abierto ⊂ A}. (b) Existe un conjunto Gδ , G, que contiene a A y tal que m(G) = m∗ (A). Demostraci´ on. (a) Por la monoton´ıa de la medida exterior, m∗ (A) es menor o igual que la medida de cada abierto que contiene a A. Luego s´olo har´a falta ver que existen abiertos que contienen a A y de medida tan pr´oxima a la de A como se desee. Sea ε > 0 y (Ij ) una colecci´ on numerable de semintervalos tales que X A ⊂ ∪ Ij , m(Ij ) ≤ m∗ (A) + ε. Consideremos entonces para cada j un semintervalo Kj tal que o
Ij ⊂ Kj ,
m(Kj ) ≤ m(Ij ) +
ε . 2j
20.4
Conjuntos de Borel
199 o
Obviamente A est´a contenido en el abierto U = ∪ Kj y m(U ) ≤
X
m(Kj ) ≤
X
m(Ij ) + ε ≤ m∗ (A) + 2ε.
(b) Si para cada natural k elegimos un abierto Uk ⊃ A tal que m(Uk ) ≤ m∗ (A) + 1/k, entonces la medida del conjunto Gδ , G = ∩Uk ⊃ A, coincide con la del conjunto A. (Es importante observar que esto no significa que el conjunto G \ A sea de medida nula. De hecho, esto u ´ltimo s´olo va ser cierto cuando el conjunto A sea un conjuntos medible, como vamos a ver en el siguiente teorema). Teorema 20.4 Para un conjuto B de Rn , las condiciones siguientes son equivalentes (i) B es medible. (ii) Para cada ε > 0 existe un abierto U ⊃ B tal que m∗ (U \ B) < ε. (iii) Para cada ε > 0 existe un cerrado F ⊂ B tal que m∗ (B \ F ) < ε. (iv) Existe un conjunto Gδ , G ⊃ B, tal que m∗ (G \ B) = 0. (v) Existe un conjunto Fσ , H ⊂ B, tal que m∗ (B \ H) = 0. on. Si B es un conjunto medible de medida finita y U es un Demostraci´ conjunto abierto que contiene a B con m(U ) < m(B) + ε, entonces m(U \ B) = m(U ) − m(B) < ε. Si, por el contrario, m(B) = ∞, sea {Ck } una partici´on numerable de Rn por conjuntos de medida finita (por ejemplo semicubos). Entonces, llamando Bk = B ∩ Ck y considerando un abierto Uk ⊃ Bk con m(Uk \ Bk ) < ε/2k , se tiene X m(Uk \ Bk ) < ε. U = ∪ Uk ⊃ B y m(U \ B) ≤ m(∪(Uk \ Bk )) ≤ Esto demuestra que i) implica ii). ii) implica iv) Tomemos para cada natural p un abierto Up ⊃ B tal que m∗ (Up \ B) < ε/p. Entonces el conjunto G = ∩Up satisface la condici´on iv), pues m∗ (G \ B) ≤ m∗ (Up \ B) < 1/p, ∀p ⇒ m∗ (G \ B) = 0.
200
Conjuntos de Borel
20.4
iv) implica i) En efecto, escribamos B = G \ Z con Z = G \ B. Entonces, por la condici´on iv), Z es un conjunto de medida nula, luego medible. Resulta as´ı que B se escribe como diferencia de dos conjuntos medibles y es, por tanto, tambi´en un conjunto medible. Para probar que la condici´on ii) es tambi´en equivalente a las ya vistas, procedemos as´ı: B es medible si y s´olo si B c es medible si y s´olo si para cada ε > 0 existe un abierto U ⊃ B c tal que m∗ (U \ B c ) < ε. Como U \ Bc = B \ U c, denotando por F al cerrado U c , se deduce de lo anterior que B es medible si y s´olo si para cada ε > 0 existe un cerrado F ⊂ B tal que m∗ (B \ F ) < ε. De forma an´aloga se demuestra que la condici´on v) es tambi´en equivalente a las otras. Corolario 20.5 Un conjunto L es medible si y s´olo si es de la forma L = B ∪ Z, donde B es un conjunto Borel y Z es un subconjunto de un Borel N de medida nula. Demostraci´ on. El teorema anterior establece que L es medible si y s´olo si existen dos conjuntos H, G (Fσ y Gδ respectivamente), tales que H ⊂ L ⊂ G y m(G \ L) = m(L \ H) = 0. Entonces, el corolario resulta ya tomando B = H, Z = L \ H y N = B2 \ B1 . Como vemos, los conjuntos medibles quedan perfectamente determinados a algebra de Borel. Este hecho suele expresarse partir de los conjuntos de la σ-´ diciendo que la σ-´algebra M de los conjuntos Lebesgue-medibles es la compleci´on respecto a la medida de Lebesgue de la σ-´algebra B de los conjuntos Borel.
Transformaciones de medibles En esta secci´on vamos a considerar un tipo particular de transformaciones de Rn que mantiene el car´acter medible de los conjuntos, dentro del que se encuentran las aplicaciones de clase C 1 . Nosotros usaremos este hecho posteriormente en el Cap´ıtulo 27, dedicado al cambio de variables en la integral. Debemos se˜ nalar que el car´acter medible no es una propiedad topol´ogica, es decir no es invariante frente homeomorfismos (ver Ejercicio 20C).
20.7
Conjuntos de Borel
201
Lema 20.6 Sea T : U ⊂ Rn → Rn una aplicaci´on lipschitziana, de constante k respecto de la norma k · k∞ . Entonces, (a) Para todo cubo Q contenido en U se tiene que m∗ (T (Q)) ≤ k n m(Q). (b) T transforma conjuntos de medida nula en conjuntos de medida nula. Demostraci´ on. (a) Sea u0 el centro de Q y l el lado. Puesto que T es lipschitziana, kT (u) − T (u0 )k∞ ≤ kku − u0 k∞ ≤ k l/2 ,
∀u ∈ Q
lo que nos indica que T (Q) est´a contenido en un cubo centrado en T (u0 ) y de lado k l. Por tanto m∗ (T (Q)) ≤ (k l)n = k n m(Q) (b) Sea Z un conjunto de medida nula y V un conjunto abierto tal que Z ⊂ V ; m(V ) < ε Escribamos V = ∪Ck , como uni´on numerable de semicubos disjuntos. Entonces X m∗ (T (Z)) ≤ m∗ (T (V )) ≤ m∗ (T (Ck )) X ≤ k n m(Ck ) = k n m(V ) < k n ε. Del car´acter arbitrario de ε se deduce ya que m∗ (T (Z)) = 0. Proposici´ on 20.7 Si T : U ⊂ Rn → Rn una aplicaci´on localmente lipschitziana en el abierto U , entonces la imagen por T de cada conjunto medible es medible. Demostraci´ on. Sea B ⊂ U un conjunto medible. Por tanto B = H ∪Z donde H es un Fσ y Z un conjunto de medida nula. Es f´acil comprobar que H puede escribirse como uni´on numerable de conjuntos compactos y por tanto T (H) (debido a la continuidad de T ) es tambi´en un conjunto Fσ . Para que T (B) sea medible s´olo habr´a que ver que T (Z) es un conjunto de medida cero. En efecto, consideremos para cada u del abierto U una bola abierta contenida en U , donde T sea una aplicaci´on lipschitziana. Entonces, teniendo en cuenta que cada subconjunto de Rn tiene la propiedad de Lindel¨of, podemos escribir ∞
U = ∪ B(ui , ri ). i=1
202
Conjuntos de Borel
20.7
Si denotamos entonces por Zi = Z ∩ B(ui , ri ), para que el conjunto T (Z) sea de medida nula bastar´a con que cada uno de los conjuntos T (Zi ) lo sea. Pero esto u ´ltimo es consecuencia directa del lema anterior, ya que T es lipschitziana sobre B(ui , ri ). Corolario 20.8 Toda transformaci´ on de Rn que sea lineal o de clase C 1 lleva conjuntos medibles sobre conjuntos medibles. Demostraci´ on. Estas aplicaciones son localmente lipschitzianas.
Otras propiedades de m∗ Vamos a considerar en esta secci´ on dos nuevas propiedades de la medida exterior de Lebesgue: su buen comportamiento de la misma respecto al paso al l´ımite en sucesiones crecientes de conjuntos (no necesariamente medibles) y tambi´en respecto a la medida de un producto cartesiana de conjuntos. Ambas propiedades las usaremos en el cap´ıtulo siguiente para obtener el teorema caracterizaci´on de las funciones medibles. Proposici´ on 20.9 Si A1 ⊂ A2 ⊂ . . ., es una sucesi´on no decreciente de conjuntos entonces m∗ (∪ Ak ) = lim m∗ (Ak ) k→∞
Demostraci´ on. Sean Gk , k = 1, . . ., conjuntos Gδ tales que Gk ⊃ Ak y m(Gk ) = m∗ (Ak ). Si la sucesi´on {Gk } fuese tambi´en creciente, se tratar´ıa de aplicar el resultado, ya probado, de id´entica formulaci´ on que el que buscamos, pero con conjuntos medibles. Como esto, en general, no sucede, vamos a construir la sucesi´on ∞
∞
j=1
j=2
B1 = ∩ Gj , B2 = ∩ Gj , . . . , Los conjuntos {Bk } son tambi´en medibles y constituyen una sucesi´on creciente. Adem´as Bk ⊃ Ak y m∗ (Ak ) ≤ m(Bk ) ≤ m(Gk ) = m∗ (Ak ), luego m∗ (∪ Ak ) ≤ m(∪ Bk ) = lim m(Bk ) = lim m∗ (Ak ) ≤ m∗ (∪ Ak ). k→∞
k→∞
20.10
Conjuntos de Borel
203
Vamos a obtener ahora un caso particular de la f´ ormula m∗ (A × B) = ∗ ∗ m (A) · m (B), concretamente aqu´el en que B es un intervalo. Ver [24] para una demostraci´on en el caso general. Proposici´ on 20.10 Para todo conjunto A de Rn y para todo semintervalo p J de R se tiene que m∗ (A × J) = m∗ (A) · m(J). Demostraci´ on. Vamos a considerar varias etapas: (1) Es inmediato que la f´ormula se verifica si A es un semintervalo o un conjunto abierto. (2) Si A, B son dos conjuntos de medida finita, entonces m∗ (A × B) ≤ m∗ (A) · m∗ (B). Para cada ε > 0, se pueden encontrar dos colecciones numerables de semintervalos {Ik }, {Js } tales que X X A ⊂ ∪ Ik , B ⊂ ∪ Js y m(Ik ) ≤ m∗ (A) + ε, m(Js ) ≤ m∗ (B) + ε S resulta entonces que A × B ⊂ Ik × Js y X X X X m(Ik × Js ) = m(Ik ) · m(Js ) = m(Ik )( m(Js )) ≤ k,s
k,s
X
k
s
m(Ik )(m∗ (B) + ε) ≤ (m∗ (A) + ε) · (m∗ (B) + ε) =
k
m∗ (A) · m∗ (B) + εm∗ (A) + εm∗ (B) + ε2 . Puesto que ε es arbitrario y los conjuntos tienen medida finita , de lo anterior se deduce finalmente que m∗ (A × B) ≤ m∗ (A) · m∗ (B). (3) Si m∗ (A) = 0, entonces m∗ (A×B) = 0 cualquiera que sea el conjunto B. Por la desigualdad anterior, esto es evidentemente cierto si el conjunto B es de medida finita. En el caso de que m∗ (B) = ∞, descomponiendo el conjunto B como uni´on numerable de conjuntos Bp de medida finita, se tendr´ıa A × B = ∪ A × Bp es decir A × B es una uni´on numerable de conjuntos de medida nula, luego ´el tambi´en es de medida nula.
204
Conjuntos de Borel
20.10
Nota. Para que la desigualdad m∗ (A × B) ≤ m∗ (A) · m∗ (B) tenga validez en todo caso, s´olo habr´ıa que convenir en tomar en este contexto 0 · ∞ = 0 y α · ∞ = ∞ si α 6= 0. Lema 20.11 Si A × K ⊂ U , donde K es un compacto y U un abierto, entonces existe un abierto O tal que A × K ⊂ O × K ⊂ U.
(4) Para cada conjunto A y cada semintervalo J, se verifica la siguiente f´ormula m∗ (A × J) = m∗ (A) · m(J). Sea U un abierto tal que A × J ⊂ U, y m(U ) ≤ m∗ (A × J) + ε y sea O un abierto tal que A × J ⊂ O × J ⊂ U . Entonces m∗ (A) · m(J) ≤ m(O) · m(J) = m(O) · m(J) = m(O × J) ≤ m(O × J) ≤ m(U ) ≤ m∗ (A × J) + ε. Por el car´acter arbitrario de ε, se deduce que m∗ (A) · m(J) ≤ m∗ (A × J) y, por tanto, tambi´en se da la igualdad ya que la desigualdad contraria la hemos demostrado antes. Que tambi´en, m∗ (A × J) = m∗ (A) · m(J), se obtiene del hecho de que Z = J \ J es un conjunto de medida nula, se tiene que (20.1)
m∗ (A × J) ≤ m∗ (A) · m(J) = m∗ (A) · m(J) = m∗ (A × J) ≤ m∗ (A × J) + m∗ (A × Z) = m∗ (A × J).
Observemos que para la demostraci´ on de 20.1 s´ olo se ha necesitado que el conjunto Z sea de medida nula, por lo tanto la f´ormula es v´alida para J un intervalo de cualquier tipo. Corolario 20.12 Si L1 ⊂ Rn y L2 ⊂ Rp son conjuntos medibles entonces el conjunto L1 × L2 es medible. Demostraci´ on. Escribiendo Li = Bi ∪ Zi , i = 1, 2, con Bi Borel y Zi de medida nula, podemos descomponer L1 × L2 como uni´on de medibles de la siguiente forma (ver Ejercicio 20A) L1 × L2 = B1 × B2 ∪ B1 × Z2 ∪ Z1 × B2 ∪ Z1 × Z2 .
20G
Conjuntos de Borel
205
Ejercicios 20A Demostrar que la σ-´algebra de Borel en Rn est´a generada por las siguientes familias de conjuntos: Los semintervalos, los conjuntos compactos, los conjuntos del tipo {(x1 , . . . , xn ) : x1 ≤ b1 , . . . , xn ≤ bn }. 20B Sean X, Y espacios topol´ogicos (a) Probar que si h es una aplicaci´on continua de X en Y entonces la contraimagen por h de un conjunto de Borel en Y es un conjunto de Borel de Y . (b) Utilizar que las proyecciones en un producto topol´ogico son continuas para probar que el producto cartesiano de un conjunto de Borel de X y un conjunto de Borel de Y es un conjunto de Borel en X × Y . 20C Sea B un abierto denso de [0, 1] tal que m(B) < 1 (por tanto m([0, 1]\B) > 0). (a) Demostrar que la aplicaci´on ϕ(x) =
m(B ∩ [0, x]) m(B)
es un homeomorfismo de [0, 1] en [0, 1] (ver ejercicio (19C). (b) Probar que m(ϕ(B)) = 1. (c) Sea V un conjunto no medible contenido en [0, 1] \ B. Probar que ϕ(V ) es un conjunto medible que no es un conjunto de Borel. (d) Observar que ϕ no mantiene el car´acter medible de los conjuntos, a pesar de ser un homeomorfismo. 20D Demostrar que si B es un conjunto medible, entonces m(B) = sup{m(K) : K compacto ⊂ B}. Rec´ıprocamente, si la f´ormula anterior es cierta y B es de medida finita, entonces B es medible. 20E Probar que todo subespacio vectorial propio de Rn es un conjunto de medida nula de Rn . 20F Probar que la gr´afica de toda funci´on continua f : U ⊂ Rn → Rp , donde U es un conjunto abierto, es un conjunto de medida nula. En particular, probar que toda variedad diferenciable de Rk de dimensi´on n < k es un conjunto de medida nula de Rk . 20G Probar que para un conjunto B ⊂ Rn son equivalentes: (a) B es medible. (b) B × Rp es medible. (c) Si J es un semintervalo, B × J es medible.
Cap´ıtulo 21
Caracterizaci´ on de Funciones Medibles Una vez estudiada en los cap´ıtulos anteriores la medida de Lebesgue en Rn , vamos a desarrollar ahora la integraci´ on en el sentido de Lebesgue. La idea b´asica ser´a llamar integral de una funci´on no negativa a la medida de su afica). conjunto de ordenadas (o subyacente a su gr´
Definiciones y resultados previos Sea f una funci´on de Rn en [0, ∞], llamaremos conjunto de ordenadas de la funci´on f al conjunto Ord (f ) = {(x, y) ∈ Rn × [0, ∞) : 0 ≤ y < f (x)}.
Definici´ on 21.1 Una funci´on no negativa f : Rn → [0, ∞] se dir´a medible, si el conjunto Ord(f ) es un conjunto medible de Rn+1 . Llamaremos integral de la funci´on medible (no negativa) f a Z f = m(Ord (f )).
un Nota. El suponer que una funci´on medible pueda tomar el valor ∞ en alg´ punto tendr´a como ventaja una mayor comodidad en los c´ alculos. Adem´as, 207
208
Caracterizaci´ on de Funciones Medibles
21.1
muchos resultados podr´an ser formulados de manera m´as sencilla al poderse englobar en un mismo enunciado casos particulares que de otro modo deber´ıan figurar aparte. R Aunque algunas de las propiedades del operador pod´ıan ser establecidas ahora, la fundamental de todas ellas, la linealidad, la demostraremos a partir del que puede considerarse como teorema principal de la integraci´on Lebesgue: el teorema de caracterizaci´on de funciones medibles. Para su demostraci´on necesitaremos algunos resultados previos: Lema 21.2 Sea f una funci´on medible no negativa, b un n´ umero real no negativo yRB un conjuntoR medible de Rn . Entonces la funci´on f + bXB es medible y (f + bXB ) = f + bm(B) (en esta igualdad convenimos en que 0 · ∞ = 0) on. Seg´ un la definici´on, la funci´on f + bXB ser´a medible si es Demostraci´ medible su conjunto de ordenadas. Es f´ acil intuir (con la ayuda de alg´ un dibujo) e inmediato de comprobar que Ord (f + bXB ) =B × [0, b) ∪ B c × R ∩ Ord (f ) ¡ ¢ ∪ (0, b) + (Ord (f ) ∩ B × R) . Se tiene pues que Ord (f + bXB ) es un conjunto medible ya que es uni´on de tres conjuntos medibles disjuntos. Teniendo en cuenta que la medida es invariante por traslaciones, se deduce adem´as que Z (f + bXB ) = m(Ord (f + bXB )) = bm(B) + m(Ord (f ). Lema 21.3 (Teorema de la convergencia mon´ otona) Si {fk } es una sucesi´on creciente de funciones medibles no negativas y f (x) = lim fk (x), entonces f es una funci´on medible y Z Z f = lim fk .
k→∞
k→∞
on. Como las funciones fk son medibles y 0 ≤ f1 ≤ f2 ≤ . . ., enDemostraci´ tonces, por definici´on, los conjuntos Ord (fk ) son medibles, y es f´acil deducir que Ord (f1 ) ⊂ Ord (f2 ) ⊂ . . .
21.6
Caracterizaci´ on de Funciones Medibles
209
Adem´as, por ser f (x) = limk→∞ fk (x), tambi´en se obtiene f´acilmente que Ord (f ) = ∪ Ord (fk ), por tanto f es una funci´on medible ya que Ord (f ) es una uni´on numerable de conjuntos medibles, pudi´endose calcular entonces su integral en la forma Z Z f = m(Ord (f )) = lim m(Ord (fk )) = lim fk . k→∞
k→∞
Corolario 21.4 Sea {bk } una colecci´on finita o infinita numerable de n´ umeros reales no negativos y sea, para cada k, B un conjunto medible. Entonces k R P P la funci´on t = bk XBk es medible y t = bk m(Bk ). Demostraci´ on. Razonemos por inducci´on para probar el caso Rfinito del corolario: si t = bXB , entonces Ord (f ) = B × [0, b), por tanto t = bm(B) (realmente esta demostraci´on no era necesaria ya que este caso se deduce del lema 21.2, sin m´as que tomar f = 0). Supongamos como P hip´otesis de inducci´on que el resultado es cierto para p − 1 y sea t = pk=1 bk XBk . R P P Entonces la funci´on f = p−1 f = p−1 k=1 bk XBk es medible y k=1 bk m(Bk ). Aplicando ahora el lema 21.2, se deduce que t = f + b X p Bp es medible y R R Pp t = f + bp m(Bp ) = k=1 bk m(Bk ). El caso infinito se deduce ya del teorema P de la convergencia mon´otona aplicado a la sucesi´on de funciones medibles { pk=1 bk XBk }. Definici´ on 21.5 Llamaremos funci´on simple a toda funci´on de la forma X bk XBk , s= finita
donde para cada k, bk es un n´ umero real (por tanto 6= ±∞) y Bk un conjunto medible. Cuando los conjuntos Bk sean intervalos, se dir´a que s es una funci´on escalonada. Corolario 21.6 Toda funci´on simple no negativa es medible. Demostraci´ on. Se deduce del corolario 21.4, sin m´ as que observar que “una funci´ olo puede expresarse en la forma s = X on simple s es no negativa si y s´ bk XBk con todos los coeficientes bk ≥ 0” (ver ejercicio 21A). f inita
210
Caracterizaci´ on de Funciones Medibles
21.7
El teorema principal Teorema 21.7 Para una funci´on f de Rn en [0, ∞], las siguientes condiciones son equivalentes: (i) f es medible. (ii) Para cada n´ umero real α, el conjunto f −1 (α, +∞] = {x : f (x) > α} es medible. (iii) Existe una sucesi´on no decreciente de funciones simples no negativas, que converge puntualmente hacia f . Abreviadamente, 0 ≤ sk % f. Demostraci´ on. i) implica ii). Sea α un n´ umero real y denotemos A(α) = {x : f (x) > α}. Como f ≥ 0, si α < 0, el conjunto A(α) = Rn , que es medible. Supongamos entonces α ≥ 0. Sea I un semintervalo de Rn y veamos que el conjunto A(α) satisface la identidad de Caratheodory, es decir que m(I) = m∗ (I ∩ A(α)) + m∗ (I \ A(α). Para ello, consideremos el semintervalo J = I × (α, α + 1/k] y utilicemos la hip´otesis, f medible, o sea que (21.1)
m(J) = m(J ∩ Ord (f )) + m(J \ Ord (f )).
Es f´acil comprobar (y de constatar mediante un dibujo adecuado) que J ∩ Ord (f ) ⊃ I ∩ A(α + 1/k) × (α, α + 1/k], J \ Ord (f ) ⊃ I \ A(α) × (α, α + 1/k]. Teniendo en cuenta en 21.1 estas inclusiones y la f´ ormula 20.10, se obtiene m(J) = 1/k · m(I) ≥ 1/k · m∗ (I ∩ A(α + 1/k)) + 1/k · m∗ (I \ A(α)), que implica (21.2)
m(I) ≥ m∗ (I ∩ A(α + 1/k)) + m∗ (I \ A(α)).
Para terminar s´olo nos queda eliminar 1/k en A(α + 1/k). Esto es posible gracias a que la sucesi´ on de conjuntos, {I ∩ A(α + 1/k)}, es mon´ otona creciente y, como puede verificarse f´acilmente, I ∩ A(α) = ∪ I ∩ A(α + 1/k),
21.7
Caracterizaci´ on de Funciones Medibles
211
entonces de la proposici´on 20.9 se deduce que m∗ (I ∩ A(α)) = lim m∗ (I ∩ A(α + 1/k)). k→∞
Teniendo en cuenta, por u ´ltimo, que la desigualdad 21.2 es cierta para todo k, se tiene que m(I) ≥ m∗ (I ∩ A(α) + m∗ (I \ A(α)), lo que demuestra que A(α) es medible. ii) implica iii). La demostraci´on de esta implicaci´on se basa en una t´ecnica cl´asica de aproximaci´on uniforme: dado ε > 0 consideremos la funci´on si f (x) ≤ ε 0 t(x) = (p − 1)ε si (p − 1)ε < f (x) ≤ pε ∞ si f (x) = ∞. Es obvio entonces que para cada x ∈ Rn tal que f (x) < ∞ se tiene que 0 ≤ f (x) − t(x) ≤ ε. Por lo tanto la sucesi´on {tk } construida de esta forma para los sucesivos valores de ε = 1/2k , k = 1, 2, ..., converge a la funci´on f (observemos que esta convergencia es uniforme si f es una funci´on finita, i.e., que no toma el valor +∞ en ning´ un punto). Tambi´en es cierto que la sucesi´on {tk } es mon´otona creciente. En efecto, sea x ∈ Rn : si f (x) = 0 ´o f (x) = ∞ entonces tk (x) = tk+1 (x); si 0 < f (x) < ∞ y p es el n´ umero natural para el que (p − 1)/2k < f (x) ≤ p/2k , entonces tk (x) = (p−1)/2k . Para calcular el valor de tk+1 en ese punto basta observar que la condici´on (p − 1)/2k < f (x) ≤ p/2k puede expresarse (sin m´as que multiplicar y dividir por 2) por (2p − 2)/2k+1 < f (x) ≤ 2p/2k+1 , luego tk+1 (x) = (2p − 2)/2k+1 = (p − 1)/2k ´o tk+1 (x) = (2p − 1)/2k+1 , seg´ un que (2p − 2)/2k+1 < f (x) ≤ (2p − 1)/2k+1 ´o (2p − 1)/2k+1 < f (x) ≤ 2p/2k+1 . En cualquier caso tk (x) ≤ tk+1 (x). Pero las funciones tk no son necesariamente simples: si llamamos Bk1 = {x ∈ Rn : f (x) ≤ 1/2k }, Bkp = {x ∈ Rn : (p−1)/2k < f (x) ≤ p/2k } (p > 1), es claro que estos conjuntos son disjuntos y por tanto la funci´ on (P ∞ k p=1 (p − 1)/2 XBkp (x) si f (x) < ∞ tk (x) = ∞ si f (x) = ∞, toma un n´ umero finito de valores s´ olo cuando a partir de un ´ındice p todos los conjuntos Bkp son vac´ıos (para una funci´on finita si y s´olo si f es acotada). Sin embargo, a partir de la sucesi´on {tk }, vamos a poder construir la sucesi´on de funciones simples que buscamos: Sea sk = tk ∧ k. Se tiene entonces:
212
Caracterizaci´ on de Funciones Medibles
21.7
1. sk ≤ sk+1 . Trivial 2. limk→∞ sk (x) = f (x). Si f (x) = ∞ entonces sk (x) = k, luego limk→∞ sk (x) = ∞. Si f (x) < ∞ entonces a partir de alg´ un t´ermino (que depende de x, salvo que f sea una funci´on acotada) sk (x) = tk (x) y limk→∞ sk (x) = limk→∞ tk (x) = f (x) (uniformemente si f es acotada). 3. sk es una funci´on simple. Es f´acil comprobar que k
sk =
k2 X
(p − 1)/2k XBkp + kXCk ,
p=1
donde Ck = {x : f (x) > k}. Entonces sk es simple ya que por hip´otesis f satisface la condici´ on ii) y, por tanto, los conjuntos Bkp y Ck son medibles: Bkp = {x ∈ Rn : (p − 1)/2k < f (x) ≤ p/2k } = {x ∈ Rn : (p − 1)/2k < f (x)} ∩ {x ∈ Rn : f (x) > p/2k }c . iii) implica i). Sea 0 ≤ sk % f , siendo sk simple. Como, por el corolario 21.6, sk es medible, se deduce del teorema de la convergencia mon´ otona que f es medible y adem´as que Z (21.3) f = lim sk . k→∞
Nota. La conclusi´on 21.3 significa obviamente que si f es una funci´on medible no negativa entonces Z Z © ª f = sup s : s simple, 0 ≤ s ≤ f . En los textos sobre teor´ıa de la medida, es habitual definir as´ı la integral de una funci´on medible no negativa. Corolario 21.8 Sean f, g funciones medibles no negativas y c ∈ R+ . Entonces las funciones f + g y cf son medibles y se tiene que Z Z Z Z Z (f + g) = f + g; cf = c f. Demostraci´ on. Demostraremos s´olo lo que respecta a la suma, de forma an´aloga se puede proceder para la multiplicaci´ on por escalares. Sean pues f, g medibles no negativas; supongamos, en primer lugar que son simples.
21C
Caracterizaci´ on de Funciones Medibles
213
Entonces f + g tambi´en es simple y porR tanto,R seg´ un el corolario 21.4, se R tiene que f + g es medible y (f + g) = f + g. En el caso general, sean 0 ≤ sk % f, 0 ≤ tk % g, dos sucesiones no decrecientes de funciones simples no negativas, convergiendo a f y a g, respectivamente. Entonces 0 ≤ sk + tk % f + g, por lo que, aplicando el teorema de la convergencia mon´otona y la etapa anterior, se deduce que µZ Z Z Z ¶ Z Z (f + g) = lim (sk + tk ) = lim sk + tk = f + g. k→∞
k→∞
Ejercicios 21A (a) Probar que una funci´on s : Rn → R es simple si y s´olo si toma un n´ umero finito de valores y para cada α ∈ R el conjunto s−1 (α) es medible. (b) Probar que la funci´ Xon simple s es no negativa si y s´olo si se puede expresar en la forma s = bk XBk con todos los coeficientes bk ≥ 0. f inita
21B (a) Probar que toda funci´on medible f ≥ 0 puede expresarse en la forma X f= bk XBk . k∈D⊂N
(b) Probar que si Gk es P un conjunto Gδ tal que Bk ⊂ Gk y m(Gk \ Bk ) = 0 entonces {x : f (x) 6= bk XGk } es un conjunto de medida nula. 21C (a) Probar que si B es un conjunto medible de Rn y de medida finita, entonces para cada ε > 0 existe un conjunto E que es uni´on finita de semintervalos tal que m(B∆E) < ε (B∆E = (B \ E) ∪ (E \ B)). (b) Probar la f´ormula |XB − XE | = XB∆E . (c) Sea f ≥ 0 una funci´on medible. Probar que si {sp } es una sucesi´on de funciones simples tal que 0 ≤ sp % f , entonces tp = sp X{x : kxk≤p} es otra sucesi´on de funciones simples que verifica 0 ≤ tp % f . (d) Sea f ≥ 0 una funci´on medible. Utilizar el teorema de Borel-Cantelli (Ejercicio 19B) y los apartados anteriores para construir una sucesi´on de funciones escalonadas {αp } que converja en casi todo punto de Rn a f , es decir tal que {x : {αp (x)} no converge a f(x)} sea de medida nula.
Cap´ıtulo 22
Espacio de Funciones Medibles Igual que la σ-´algebra de los conjuntos medibles, la familia de funciones medibles, adem´as de contener a todas las funciones “razonables”(por supuesto son medibles todas las continuas, las integrables en el sentido de Riemann etc.), goza de muy buenas propiedades algebraicas, que nos proponemos estudiar en este cap´ıtulo. Antes vamos a generalizar la definici´ on de funci´on medible dada en el cap´ıtulo anterior.
Definiciones y ejemplos De las tres definiciones equivalentes de funci´on medible no negativa que proporciona el teorema 21.7, la que resulta m´as c´omoda para trabajar con ella es la (ii). Nosotros vamos a adoptar esta definici´ on para extender el concepto de funci´on medible al caso general de funciones con signo variable y cuyo dominio de definici´on pueda ser un subconjunto propio de Rn . Definici´ on 22.1 Sea B un conjunto medible de Rn y f una funci´on con valores en R, cuyo dominio de definici´on contiene a B. Se dir´a que f es medible sobre B o que f|B es medible si, para cada α ∈ R, el conjunto {x ∈ B : f (x) > α} es medible. Consecuencia directa de la definici´on es la siguiente proposici´on Proposici´ on 22.2 Sean B1 , B2 conjuntos medibles contenidos en el dominio de una funci´on f . 215
216
Espacio de Funciones Medibles
22.2
(a) Si B1 ⊂ B2 y f|B2 es medible, entonces f|B1 tambi´en es medible. (b) f|B1 ∪B2 es medible si y s´olo si f|B1 y f|B2 son medibles. Demostraci´ on. Es inmediato. Ejemplos 22.3 El primer ejemplo de funci´on medible que hemos visto es el de funci´on simple. De la caracterizaci´on dada para las funciones medibles, es inmediato comprobar que tambi´en va a ser medible cada funci´on continua y m´as precisamente, 1. Sea f una funci´on definida sobre el conjunto medible B. Supongamos que el conjunto D(f ) de los puntos de discontinuidad de f es de medida nula, entonces f es medible sobre B. En efecto, denotemos por C(f ) al conjunto de puntos de continuidad de f (C(f ) es medible, pues C(f ) = B \ D(f )). Como hip´otesis se tiene entonces que f|C(f ) es continua. Veamos que {x ∈ B : f (x) > α} es un conjunto medible. {x ∈ B : f (x) > α} = {x ∈ C(f ) : f (x) > α} ∪ {x ∈ D(f ) : f (x) > α}. El conjunto {x ∈ C(f ) : f (x) > α} = f|−1 (α, +∞] C(f )
es, debido a la continuidad de f|C(f ) , abierto en el subespacio C(f ), es decir que {x ∈ C(f ) : f (x) > α} = O ∩ C(f ), donde O es un abierto de Rn , luego es un conjunto medible. Como D(f ) es de medida nula, se deduce ya lo que quer´ıamos, es decir que {x ∈ B : f (x) > α} es un conjunto medible. En particular, se deduce de lo anterior que 2. Toda funci´on Riemann integrable sobre un intervalo [a, b] es medible sobre ´el. Por el teorema de Lebesgue de caracterizaci´on de las funciones Riemann integrables, sabemos que estas funciones son continuas salvo en un conjunto de medida cero, luego son medibles. 3. Existen funciones medibles que no son continuas en ning´ un punto
22.3
Espacio de Funciones Medibles
217
Quiz´as la m´as famosa de estas funciones sea la “funci´on de Dirichlet”, f = XQ , es decir la funci´on que vale 1 sobre los racionales y 0 sobre los irracionales (O mejor, su restricci´on a un intervalo Racotado, g = XQ∩[a,b] ). g es una funci´on simple, luego es medible, siendo g = m(Q ∩ [a, b]) = 0. Observemos que g constituye un ejemplo de una funci´on cuya integral en el sentido de Lebesgue existe, pero no as´ı en el de Riemann, ya que es discontinua en todo punto y por tanto no es R-integrable. Como antes con los conjuntos no medibles, la presencia en la Teor´ıa de Conjuntos del Axioma de Elecci´on hace que tambi´en existan funciones no on entre conjuntos medibles. De hecho se puede establecer la siguiente relaci´ y funciones (no) medibles: 3. Un conjunto B es medible si y s´olo si la funci´on XB es medible. En efecto, si B es medible entonces XB es una funci´ on simple y, por tanto, medible. Rec´ıprocamente si XB medible entonces B = {x : XB (x) > 0} es medible.
Aritm´ etica en [−∞, ∞] Cada vez que hemos trabajado con R = R ∪ {−∞, +∞}, se ha usado de forma m´as o menos expl´ıcita un orden, una topolog´ıa y una aritm´etica, que respeta las estructuras ya existentes en R. Y de nuevo ahora, para el estudio de las funciones medibles, tendremos necesidad de hacerlo. As´ı, respecto al orden, R es el resultado de a˜ nadir al conjunto totalmente ordenado R, un primer elemento (−∞) y un u ´ltimo elemento (+∞). Justamente usamos este orden, al expresar el hecho de que la medida de un umero real en la forma m∗ (A) = ∞. conjunto A sea mayor que cualquier n´ La convergencia de una sucesi´on de n´ umeros reales (xk ) a +∞ cobra el sentido habitual de convergencia hacia un punto de un espacio topol´ogico, cuando se define en R la topolog´ıa que tiene como base de abiertos los abiertos de R y los intervalos de la forma [−∞, a), (b, +∞]. En cuanto a la aritm´etica de R, ya hemos hecho uso de ella, por ejemplo, cuando dec´ıamos que la f´ormula m(A ∪ B) = m(A) + m(B) es v´ alida para cada par de conjuntos medibles y disjuntos, conviniendo en que si m(A) = ∞ entonces m(A) + m(B) = ∞ + m(B) = +∞, y as´ı poder expresar con esa f´ormula el hecho cierto de que si uno de los conjuntos mide +∞, entonces el conjunto A ∪ B tambi´en mide +∞. Otro de los convenios aritm´eticos, habituales en teor´ıa de la medida y la integraci´ on, es definir 0 · ∞ = 0. Se utilizar´a este convenio para definir el producto de dos funciones medibles en
218
Espacio de Funciones Medibles
22.3
todo punto y para recoger tambi´en en la f´ormula m∗ (A1 × A2 ) = m∗ (A1 ) · m∗ (A2 ), el resultado “el producto cartesiano de un conjunto de medida nula por otro de medida arbitraria es de medida nula” (Conviene observar cierta cautela a la hora de usar que 0·∞ = 0, no vaya a resultar falso el resultado o la f´ormula en que se emplee). Por el contrario, es habitual no definir ∞ − ∞. Desde el punto de vista de la teor´ıa de la medida, para mantener la validez de la f´ormula sobre conjuntos medibles A1 ⊂ A2 , ⇒ m(A2 \ A1 ) = m(A2 ) − m(A1 ), no es preciso definir ∞ − ∞, ya que dicha f´ ormula s´olo es v´alida cuando m(A1 ) < ∞. Por otra parte, puede comprobarse (Ejercicio) que si se definiese, por ejemplo, ∞ − ∞ = 0, la suma dejar´ıa de ser asociativa en R. Concretando, la aritm´etica que supondremos en R, y respecto a la cual hablaremos de la suma, producto, etc., de funciones ser´a la siguiente: α + ∞ = +∞, ∀α 6= −∞ α − ∞ = −∞, ∀α = 6 +∞ α · ∞ = ±∞, ( Seg´ un regla de los signos ), α 6= 0 0·∞=0 ∞ − ∞, No se define . Es importante tener en cuenta que los puntos ∞ y −∞ no deben transponerse, en general, en una igualdad o desigualdad en la que est´en involucrados, ya que ´estos no admiten ni elemento opuesto ni inverso. Por otra parte, es posible comprobar que las propiedades habituales de las operaciones con umeros reales siguen teniendo vigencia en R con esta aritm´etica. En parn´ ticular es inmediato verificar que la bien conocida propiedad a≤b c≤d
⇒ a+c≤b+d
sigue siendo v´alida en R, siempre que a + c y b + d , sean distintos de ∞ − ∞
Propiedades de las funciones medibles En esta secci´on vamos a analizar el comportamiento de las funciones medibles respecto a las operaciones usuales. El siguiente lema y su corolario ser´an de uso frecuente. Lema 22.4 Sea B un conjunto medible de Rn y f una funci´on con valores en R y cuyo dominio de definici´on contiene a B. Entonces, son equivalentes:
22.5
Espacio de Funciones Medibles
219
(i) Para cada n´ umero real α, el conjunto {x ∈ B : f (x) > α} es medible. (ii) Para cada n´ umero real α, el conjunto {x ∈ B : f (x) ≤ α} es medible. (iii) Para cada n´ umero real α, el conjunto {x ∈ B : f (x) < α} es medible. (iv) Para cada n´ umero real α, el conjunto {x ∈ B : f (x) ≥ α} es medible. Demostraci´ on. Es claro que i) y ii) son equivalentes y tambi´en iii) y iv), ya que los conjuntos involucrados en sus respectivos enunciados son complementarios respecto a B uno del otro. Veamos, por ejemplo, que tambi´en son equivalentes i) y iv). En efecto, si suponemos medible cada conjunto de la forma {x ∈ B : f (x) > α}, entonces el conjunto {x ∈ B : f (x) ≥ β} puede escribirse como intersecci´on numerable de conjuntos de esa forma: {x ∈ B : f (x) ≥ β} =
∞ \
{x ∈ B : f (x) > β − 1/k},
k=1
por lo que tambi´en resulta medible. Del mismo modo se procede para establecer que iv) implica i). Corolario 22.5 Si f, g son funciones medibles sobre el conjunto medible B, entonces tambi´en son medibles los conjuntos {x ∈ B : f (x) < g(x)}, {x ∈ B : f (x) ≤ g(x)}, {x ∈ B : f (x) = g(x)}. Demostraci´ on. Todo resulta de la observaci´ on siguiente: [ {x ∈ B : f (x) < g(x)} = {x ∈ B : f (x) < q < g(x)}. q∈Q
Seg´ un esto, el conjunto {x ∈ B : f (x) < g(x)} es uni´on numerable de conjuntos medibles, pues para cada n´ umero racional q {x ∈ B : f (x) < q < g(x)} = {x ∈ B : f (x) < q} ∩ {x ∈ B : q < g(x)}. El conjunto {x ∈ B : f (x) ≤ g(x)} es el complementario en B del conjunto {x ∈ B : f (x) > g(x)}, que acabamos de probar (cambiando f por g) que es medible. Por u ´ltimo, {x ∈ B : f (x) = g(x)} = {x ∈ B : f (x) ≤ g(x)} ∩ {x ∈ B : f (x) ≥ g(x)}.
220
Espacio de Funciones Medibles
22.6
Proposici´ on 22.6 Si f, g son funciones medibles, entonces tambi´en son medibles las funciones (f ∨ g)(x) = sup(f (x), g(x)) y (f ∧ g)(x) = inf(f (x), g(x)). M´as generalmente, si {fk } es un sucesi´ de funciones medibles, entonces W on V tambi´en son medibles las funciones fk y fk . Demostraci´ on. Es evidente que sup(fk (x)) > α ⇔ ∃k / fk (x) > α, luego {x :
_
de lo que se deduce que es medible.
fk (x) > α} =
W
[ {x : fk (x) > α}, k
fk es medible. An´alogamente se prueba que
V
fk
Proposici´ on 22.7 Si {fk } es una sucesi´on de funciones medibles, entonces tambi´en son medibles las funciones limfk , limfk . Demostraci´ on. La funci´on f = limfk viene dada, por definici´on, mediante la f´ormula f (x) = lim (inf(fk (x), fk+1 (x), . . .)), k→∞
es decir f (x) es el l´ımite de la sucesi´on mon´otona creciente de n´ umeros de R, inf(f1 (x), f2 (x), . . .) ≤ inf(f2 (x), f3 (x), . . .) ≤ . . . luego, si denotamos por gk (x) = inf(fk (x), fk+1 (x), . . .)), se tiene que f (x) = sup(g1 (x), g2 (x), . . .). Que f es medible Wresulta ya de V la proposici´on anterior, sin m´as que tener en cuenta que f = gk y gk = i≥k fi . An´alogamente se demuestra que la funci´on limfk es medible. Corolario 22.8 Si {fk } es un sucesi´on de funciones medibles y B es el conjunto de los puntos x ∈ Rn en los que existe (en R) limk→∞ fk (x), entonces la funci´on f (x) = limk→∞ fk (x) es medible sobre B.
22.10
Espacio de Funciones Medibles
221
Demostraci´ on. Puesto que, como es bien conocido, la sucesi´on {fk (x)} tiene l´ımite si y s´olo si su l´ımite superior y su l´ımite inferior coinciden, entonces B = {x : limfk (x) = limfk (x)}, es decir B es el conjunto de puntos donde coinciden dos funciones medibles, luego es un conjunto es medible seg´ un el corolario 22.5. Adem´as f es medible sobre B, puesto que coincide con la restricci´on a B de la funci´on medible limfk (x). Proposici´ on 22.9 Si f es medible y λ es un n´ umero real, entonces tambi´en son medibles las funciones f + λ, λf y |f |. Demostraci´ on. f + λ es una funci´ on medible ya que {x : (f + λ)(x) > α} = {x : f (x) > α − λ}. Es inmediato que λf es medible si λ = 0. En el caso λ 6= 0, basta observar que ½ {x : f (x) > α/λ} si λ > 0 {x : λf (x) > α} = {x : f (x) < α/λ} si λ < 0 Por u ´ltimo, si f es medible, entonces la funci´on |f | tambi´en es medible pues |f | = f ∨ −f. Proposici´ on 22.10 Si f, g son funciones medibles, entonces la funci´on f +g es medible sobre el conjunto B de los puntos x ∈ Rn en los que la suma f (x) + g(x) est´a bien definida, es decir donde es 6= ∞ − ∞. Demostraci´ on. De la igualdad {x : f (x) = +∞} =
∞ \
{x : f (x) > k}
k=1
es f´acil deducir que B es un conjunto medible. Para probar la proposici´ on s´olo hemos de ver ya, que para cada α, {x ∈ B : f (x)+g(x) > α} es medible. Pero, (22.1)
{x ∈ B : f (x) + g(x) > α} = {x ∈ B : f (x) > α − g(x)}
y como, seg´ un la proposici´on anterior, la funci´on α − g es medible, este conjunto debe ser medible, en virtud del corolario 22.5.
222
Espacio de Funciones Medibles
22.11
Proposici´ on 22.11 Si f, g son dos funciones medibles, entonces la funci´on h = f · g es medible. Demostraci´ on. Veamos, en primer lugar, que si ϕ es una funci´on medible, entonces la funci´on ϕ2 es tambi´en medible. En efecto, ½ √ √ {x : ϕ(x) > α} ∪ {x : ϕ(x) < − α}, si α ≥ 0 2 {x : ϕ (x) > α} = Rn , si α < 0 Denotemos por B1 al conjunto de puntos en los que las funciones f y g son finitas. Es claro que B1 es un conjunto medible, pudi´endose escribir, cuando x ∈ B1 , que h(x) = (f · g)(x) = 1/2[(f + g)2 (x) − f 2 (x) − g 2 (x)], luego, por las propiedades de las funciones medibles ya vistas, h es medible sobre B1 . Es evidente que, fuera de B1 , los u ´nicos valores posibles para la funci´on h son 0, +∞, −∞. Si denotamos, respectivamente, por B2 , B3 , B4 , los conjuntos en los que h toma esos valores, es f´acil ver que cada uno de ellos es medible. Por ejemplo, B3 ={x : f (x) > 0 y g(x) = +∞} ∪ {x : f (x) < 0 y g(x) = −∞} ∪ {x : g(x) > 0 y f (x) = +∞} ∪ {x : g(x) < 0 y f (x) = −∞}. Luego h es tambi´en una funci´on medible sobre cada uno de los conjuntos Bi (i=2,3,4) (Comprobase), de lo que se deduce lo que quer´ıamos, es decir, que h es medible sobre Rn = B1 ∪ B2 ∪ B3 ∪ B4 . Proposici´ on 22.12 Si f, g son funciones medibles, entonces tambi´en es medible la funci´on f /g sobre el conjunto B = {x : 0 < |g(x)| < ∞}. Demostraci´ on. Obviamente s´olo ser´a preciso probar que 1/g es medible sobre B. {x ∈ B : 1/g(x) > α} ={x ∈ B : g(x) > 0} ∩ {x : α g(x) < 1}∪ {x ∈ B : g(x) < 0} ∩ {x : α g(x) > 1}.
Nota. La composici´on de funciones medibles no es, en general, una funci´on medible (ver Ejercicio 22A).
22D
Espacio de Funciones Medibles
223
Ejercicios 22A (a) Probar que si f es una aplicaci´on medible y g : R → R es continua, entonces g ◦f es medible. En particular son funciones medibles las aplicaciones: sen f (x), ef (x) , etc. (b) Probar que si existe un conjunto B medible tal que f −1 (B) es un no medible, entonces la aplicaci´on XB ◦ f es una funci´on no medible (por tanto la conclusi´on del apartado anterior no es cierta si se supone solamente que g es medible). (c) Demostrar que si f es medible y g es un difeomorfismo entonces f ◦g es medible. En particular, si f es medible entonces tambi´en es medible la aplicaci´on f (ax + b), a, b ∈ R. 22B Probar que si la funci´on f : [a, b] → R es derivable entonces la funci´on f 0 , derivada de f , es una funci´on medible. 22C Encontrar ejemplos de funciones no medibles, para las que el m´odulo o el cuadrado sea medible. 22D Si {x : f (x) = α} es medible para todo n´ umero real α, ¿es medible la funci´on f ?
Cap´ıtulo 23
Integraci´ on de Funciones Medibles Nos proponemos estudiar en este cap´ıtulo las propiedades fundamentales del operador “integral”. En particular, extenderemos aqu´ı al caso de funciones medibles arbitrarias las propiedades ya vistas en el cap´ıtulo 21 sobre la integraci´on de funciones medibles no negativas.
Preliminares Dada una funci´on f medible sobre un conjunto B (contenidoR en su dominio) y con valores en R ∪ {+∞, −∞} nos proponemos definir B f . Conviene hacer antes algunas precisiones e introducir algunas notaciones: abusando de notaci´on, denotaremos por f XB a la funci´on, definida en Rn , que coincide con f en B y toma el valor 0 en B c . Es inmediato comprobar entonces que la funci´on f es medible sobre B si y s´olo si f XB es medible. Si f es una funci´on no negativa escribiremos OrdB f = Ord(f XB ) = {(x, y) : x ∈ B, 0 ≤ y < f (x)} Definici´ on 23.1 (a) Si f : Rn → R ∪ {+∞, −∞} es una funci´on medible, se define Z Z Z f = f + − f − = m(Ord (f + )) − m(Ord (f − )). (b) Si f es una funci´on medible sobre B se define Z Z f = (f XB ). B
225
226
Integraci´ on
Por tanto, i) si f ≥ 0 entonces
R B
23.1
f = m(OrdB f );
ii) si f tiene signo variable entonces Z Z Z + (23.1) f= f − f − = m(OrdB f + ) − m(OrdB f − ) B
(observar que (f XB
B
B
)+
f + XB
=
y (f XB )− = f − XB ).
on 23.2 Sea f es una funci´on medible sobre un conjunto medible Definici´ B. Diremos que existe la integral de f sobre B, si la f´ormula 23.1 tiene R sentido, es decir si f = 6 ∞ − ∞, y diremos que f es integrable sobre B si B R as es finita. B f existe y adem´ Proposici´ on 23.3 Sean B1 , B2 dos conjuntos medibles contenidos en el dominio de una funci´on medible f . R R (a) Si B1 ⊂ B2 y f ≥ 0 entonces 0 ≤ B1 f ≤ B2 f. (b) Si B1 ∩ B2 = ∅ entonces Z (23.2)
Z f=
B1 ∪B2
Z f+
B1
f, B2
donde la igualdad anterior tiene adem´as el sentido de que un miembro de la misma est´a bien definido si y s´olo si el otro lo est´a. on. (a) Si f ≥ 0 y B1 ⊂ B2 entonces Demostraci´ Z Z f = m(OrdB1 f ) ≤ m(OrdB2 f ) = B1
f.
B2
(b) Puesto que los conjuntos B1 y B2 son disjuntos, es obvio que XB1 ∪B2 = XB1 + XB2 . Por lo tanto, si f ≥ 0, se sigue de 21.8 que Z Z Z f = f (XB1 ∪B2 ) = (f XB1 + f XB2 ) B1 ∪B2 Z Z Z Z = f XB1 + f XB2 = f+ f. B1
B2
Supongamos ahora f de signo arbitrario. Entonces Z Z Z f= f+ − f− Z ZB1 ∪B2 ZB1 ∪B2 Z B1 ∪B2 Z Z ¡ ¢ + + − − = f + f − f + f = f+ B1
B2
B1
B2
B1
B2
f,
23.5
Integraci´ on
227
lo que prueba la igualdad (23.2). Veamos, por u ´ltimo, que la existencia de uno de los miembros en esta igualdad implica la existencia del otro:R R R R Es f´acil comprobar que para que ni B1 f , ni B2 f ni B1 f + B2 f tomen la forma ∞ − ∞ es condici´ R on necesaria Ry suficiente que se d´ Re una de estas dos alternativas: o bien B1 f + < ∞ y B2 f + < ∞ o bien B1 f − < ∞ y R R − olo si B1 ∪B2 f 6= ∞ − ∞. B2 f < ∞. Pero esto sucede si y s´
Conjuntos de medida nula en la integraci´ on Vamos a comenzar esta secci´on introduciendo una terminolog´ıa habitual en la integraci´on Lebesgue: Definici´ on 23.4 Se dice que una propiedad o definici´on P es v´alida en casi todo punto (de un conjunto B), o casi siempre (en B), si el conjunto Z de los puntos (de B) donde P no es v´alida es de medida nula. Emplearemos las notaci´on c.s. para referirnos abreviadamente a la expresi´on casi siempre. c.s
De este modo, f = g, significa que si Z = {x : f (x) 6= g(x)}, entonces m(Z) = 0. Una funci´on es continua en casi todo punto de B, si el subconjunto de B donde la funci´on no es continua es de medida nula. Una sucesi´on c.s. {fk } de funciones converge c.s hacia la funci´on f , abreviadamente fk → f , si converge puntualmente a f , salvo en un conjunto de medida nula (que puede ser el vac´ıo), es decir si m({x : fk (x) 6→ f (x)}) = 0. La funci´on f es finita c.s. si el conjunto {x : |f (x)| = ∞} es de medida nula. La funci´on f + g est´a definida en c.t.p si el conjunto de puntos x en los que f (x) + g(x) = ∞ − ∞ es de medida nula. El porqu´e del t´ermino c.s. hay que buscarlo en el papel que juegan los conjuntos de medida cero en la integraci´ on: Lema 23.5 Si Z es un conjunto de medida nula, entonces toda funci´on f es medible sobre Z y se tiene que Z f = 0. Z
228
Integraci´ on
23.5
Demostraci´ on. Puesto que los conjuntos de medida nula son medibles, es evidente que toda funci´ on f es medible sobre Z. Sin p´erdida de generalidad, puede suponerse que f ≥ 0. Entonces, Z f = m(0rdZ f ). Z
¡ ¢ R Como 0rdZ f ⊂ Z ×[0, ∞) y m Z ×[0, ∞) = 0, se deduce que Z f = 0. c.s.
Proposici´ on 23.6 Si f es una funci´on medible y g = f , entonces g es medible y Z Z f = g, en el sentido de que si existe una de las integrales, entonces tambi´en existe la otra y ambas coinciden. Demostraci´ on. Supongamos f medible y Z = {x : f (x) 6= g(x)} de medida nula. Entonces {x : g(x) > α} = {x ∈ Z : g(x) > α} ∪ {x ∈ Z c : g(x) > α}. Como en Z c , g = f , la igualdad anterior se puede escribir as´ı: {x : g(x) > α} = {x ∈ Z : g(x) > α} ∪ {x ∈ Z c : f (x) > α} = {x ∈ Z : g(x) > α} ∪ {x : f (x) > α} ∩ Z c , de lo que resulta trivialmente que {x : g(x) > α} es medible. La igualdad de las dos integrales se obtiene aplicando 23.2 y el lema anterior Z Z Z Z Z f= f+ f= f = f XZ c , Zc Zc Z ZZ g = gXZ c , de donde se deduce que
R
f=
R
g, ya que f XZ c = gXZ c .
Este resultado indica que, para calcular la integral de una funci´ on medible f , no importa cu´ales sean los valores que tome f sobre un conjunto de medida nula, Z. La integral de esta funci´on va a depender exclusivamente de los valores que tome en Z c , es decir Z Z f= f. Zc
23.8
Integraci´ on
229
As´ı, para calcular (estudiar) la integral de una funci´on s´olo es preciso que est´e definida en casi todo punto. Debido a esto, en los teoremas relativos a funciones medibles y a la integral de Lebesgue, es normal que las hip´ otesis deban ser verificadas s´olo en casi todos los puntos.
Propiedades de la integral El primer bloque de propiedades que vamos a ver a continuaci´on, se derivan directamente del hecho de que la integral de una funci´ on medible no negativa es la medida de su conjunto de ordenadas. Aunque, para simplificar, trabajaremos con funciones definidas en todo n R , los resultados se extienden a funciones medibles sobre conjuntos medibles, sin m´as que tener en cuenta que una funci´on es medible sobre B si y s´olo f XB es medible y la f´ormula Z Z f = f XB . B
Proposici´ on 23.7 (Desigualdad de Ch´ ebyshev) Sea f una funci´on medible y sea, para cada n´ umero real α ≥ 0, Aα = {x : |f (x)| ≥ α}, entonces Z Z m(Aα ) ≤ 1/α |f | ≤ 1/α |f |. Aα
on. Es inmediato comprobar que Demostraci´ Aα × [0, α) ⊂ OrdAα |f |, luego
Z α m(Aα ) ≤ m(OrdAα |f |) =
Z |f | ≤
|f |.
Aα
De la desigualdad de Ch´ebyshev se pueden extraer estas dos u ´tiles consecuencias: Corolario 23.8 Si f es una funci´on medible y no negativa, entonces Z c.s. f =0 ⇔ f = 0
230
Integraci´ on
23.8
Demostraci´ on. Teniendo en cuenta que {x : f (x) > 0} =
∞ [
{x : f (x) ≥ 1/k}
k=1
y aplicando la desigualdad de Ch´ebyshev para cada k, se obtiene que {x : f (x) > 0} es de medida nula, pues Z m({x : f (x) ≥ 1/k}) ≤ k f = 0.
Corolario 23.9 Toda funci´on integrable es finita c.s. Demostraci´ on. Se trata de probar que el conjunto de puntos donde la funci´on toma el valor ±∞ es de medida nula. En efecto, sea Z = {x : f (x) = ∞} =
∞ \
{x : f (x) ≥ k}.
k=1
Todos los t´erminos de la sucesi´on decreciente de conjuntos, Zk = {x : f (x) ≥ k} = {x : f + (x) ≥ k}, son medibles y de medida finita, pues Z m(Zk ) ≤ 1/k f + < ∞, luego m(Z) = lim m(Zk ) = 0. Para demostrar que el conjunto T = {x : f (x) = −∞} tambi´en es de medida nula, proceder´ıamos de la misma forma, teniendo en cuenta ahora que T = {x : f − (x) = ∞}. Proposici´ on 23.10 Si f, g son funciones medibles y f ≤ g, entonces Z Z f ≤ g, siempre que estas integrales existan. R R Demostraci´ on. Si 0 ≤ f ≤ g, entonces Ord f ⊂ Ord g, luego f ≤ g. + + − − Si Rf y g tienen R signo arbitrario, entonces f ≤ g y f ≥ g . Luego, si tanto f como g existen, se tiene que R + R + Z Z Z Z Z Z R f − ≤ R g− ⇒ f = f + − f − ≤ g + − g − = g. f ≥ g
23.11
Integraci´ on
231
Un caso particular de dos funciones como las anteriores cuyas integrales existen es el siguiente: R R + Sean f ≤ g dos funciones medibles. Si f − < ∞ o bien R Rg < ∞, entonces las integrales de f y g existen las dos (y por tanto f ≤ g ). R R R Si f −R < ∞ entonces f existe y como f − ≥Rg − , g − < ∞, luego tambi´en existe g. An´alogamente con la condici´on si g + < ∞. Proposici´ on 23.11 (a) Si f es una funci´on medible, entonces Z Z ¯ ¯ ¯ f ¯ ≤ |f |. (b) Una funci´on f es integrable si y s´olo si es medible y su m´odulo es integrable. Demostraci´ on. Puesto |f | = f + + f − , de 21.8 se sigue que Z Z Z + (23.3) |f | = f + f − . Los dos¯ Rresultados ¯ ¯ R que queremos ¯ Rprobar Rse derivar´ R R an de la igualdad anterior: (a)¯ f ¯ = ¯ f + − f − ¯ ≤ f +R+ f − = |f R |. − R + (b) Si f es integrable, entonces f < ∞ y f < ∞, luego |f | < ∞, es decir |f | es tambi´en integrable. Rec´ıprocamente, siRf medible R y |f | es integrable, entonces de la igualdad (23.3), resulta que f + y f − son finitas, luego f integrable (ya que por hip´otesis es tambi´en medible). N´otese que hemos tenido necesidad de suponer que f es medible, ya que esto no resulta de que |f | sea integrable. Veamos el siguiente ejemplo: Sea V el conjunto de Vitali (conjunto no medible) y consideremos la funci´on ½ 1 si x ∈ V f (x) = −1 si x ∈ V c La funci´on f no es medible (por ejemplo, {x : f (x) > 0} = V ), en cambio |f | = 1 que s´ı que es medible. Si queremos que |f | sea adem´as integrable, basta con modificar la funci´on anterior, considerando la funci´on f · XI , con I un intervalo acotado que contenga a V . Las ´ltimas propiedades que vamos a ver a continuaci´ on establecen que R dos u “ ” es un operador lineal. Esto ya ha sido probado para funciones medibles no negativas, s´olo queda pues ver el caso general :
232
Integraci´ on
23.12
Proposici´ on 23.12 Sea f es una funci´on medible y λ un escalar real. Si la integral de f existe, entonces la integral de λf tambi´en existe y se tiene Z Z λ f = λ f.
Demostraci´ on. Puede suponerse λ 6= 0, pues si λ = 0 la f´ormula se verifica trivialmente. Supongamos f medible: Si λ > 0, entonces es claro que (λf )+ = λf + y (λf )− = λf − . Luego Z Z Z Z Z + − + λf = (λf ) − (λf ) = λf − λf − µZ ¶ Z Z =λ f + − f − = λ f. Si λ < 0, entonces se ve f´acilmente que (λf )+ = (−λ)f − y (λf )− = (−λ)f + . Luego, teniendo en cuenta que (−λ) > 0, se tiene Z Z Z Z Z + − − λf = (λf ) − (λf ) = (−λ)f − (−λ)f + µZ ¶ Z Z − + = (−λ) f − f = λ f.
Proposici´ on 23.13 Si f, g son funciones medibles, entonces Z Z Z (f + g) = f + g, siempre que, con la aritm´etica de R, esta igualdad tenga sentido, lo cual va a ocurrir siempre que el t´erminoR de Rla derecha de R R la igualdad tenga sentido, es decir si las tres expresiones, f, g y f + g son 6= ∞ − ∞. Demostraci´ on. (Conviene notar que, aunque no se haya especificado, la funci´on f + g se supone definida, al menos, en c.t.p). Como hip´otesis tenemos que f y g son funciones R medibles R R tales R que f + g est´a definida en casi todo punto, y las integrales, f, g y f + g existen. Un caso particular en el sabemos que se satisfacen estas hip´otesis es cuando f, g son funciones integrables. Vamos a ver que la f´ormula es cierta en este caso: observemos en primer lugar que
23.13
Integraci´ on
233
f, g integrables ⇒ f + g integrable. R R R En efecto, |f + g| ≤ |f | + |g| ⇒ |f + g| ≤ |f | + |g| < ∞. En virtud del corolario 23.9 se puede suponer, sin p´erdida de generalidad, que las funciones f, g son finitas en todo punto. Teniendo en cuenta las relaciones f = f + − f − , g = g + − g − , f + g = (f + g)+ − (f + g)− , podemos escribir (f + g)+ − (f + g)− = f + − f − + g + − g − , equivalentemente (por ser f y g finitas) (f + g)+ + f − + g − = (f + g)− + f + + g + . por lo que, aplicando la aditividad del operador integral para funciones medibles no negativas, se tiene que Z Z Z Z Z Z + − − − + (f + g) + f + g = (f + g) + f + g + . Como las funciones f , g y f + g son integrables, todos los sumandos anteriores son 6= ∞, luego Z Z Z Z Z Z + − + − + (f + g) − (f + g) = f − f + g − g − , es decir
Z
Z (f + g) =
Z f+
g.
Supongamos R ahora que la integral de una de las dos funciones es infinita, por ejemplo, f = +∞. De acuerdo con las hip´otesis con las que trabajamos, esto significa que Z Z Z Z Z + − − f = ∞, f < ∞, g < ∞, f + g = +∞, se deduce, teniendo enR cuenta que (f + g)− ≤ f − + g − , que Rde lo que − (f + g) < ∞R y, por tanto, que (f + g) existe. Para terminar s´oRlo queda ya probar que (f + g) = +∞. Por el contrario, supongamos que (f + g) fuese finita, es decir f + g integrable. Entonces f + g ser´ıa finita c.s. y, por tanto, tambi´en f y g. Razonando como antes llegar´ıamos a que c.s.
(f + g)+ + f − + g − = (f + g)− + f + + g + , de lo que concluir´ıamos que Z Z Z Z Z Z + − − − + (f + g) + f + g = (f + g) + f + g + , lo cual es absurdo, pues el primer t´ermino de esta igualdad ser´ıa finito, mientras que el segundo ser´ıa +∞.
234
Integraci´ on
23.13
Los espacios Lp Vamos a terminar este cap´ıtulo con algunas consideraciones sobre las funciones integrables. Proposici´ on 23.14 Si f es una funci´on medible, g integrable y |f | ≤ g entonces f es tambi´en integrable. on. Inmediata. Demostraci´ El criterio anterior nos permitir´ a reconocer, en la pr´actica, si una funci´on de aspecto complicado es integrable, compar´andola con algunas ya estudiadas previamente. Es frecuente utilizar este criterio en una de estas dos versiones: 23.15 Si f es una funci´on medible y acotada sobre un conjunto B de medida finita, entonces f es integrable sobre B. Demostraci´ on. Si |f (x)| ≤ M para todo x ∈ B, entonces |f |XB ≤ M XB . Luego f integrable sobre B, concretamente Z |f | ≤ M m(B). B
23.16 Toda funci´on continua y finita en todo punto es integrable sobre cada compacto contenido en su dominio. Demostraci´ on. Si f es una funci´on continua sobre el compacto K, entonces f est´a acotada en el conjunto de medida finita K, luego es integrable sobre K seg´ un el criterio anterior. Nota. Es importante observar que la hip´otesis “f continua”del criterio anon 1/x terior no puede sustituirse por “f continua c.s.”Por ejemplo la funci´ es continua en todos los puntos del compacto [0, 1], menos en el 0. Como veremos en el cap´ıtulo 13, esta funci´on no es integrable sobre [0,1]. (Es obvio que esta funci´on no es acotada y por tanto no puede utilizarse el argumento de 23.15). Definici´ on 23.17 Si B es un conjunto medible, denotaremos por L 1 (B) al conjunto de las funciones integrables y finitas sobre B. Escribiremos L 1 en lugar de L 1 (Rn ).
23D
Integraci´ on
235
De acuerdo con la proposici´on 23.11, una funci´on f que toma Rs´olo valores reales pertenecer´a a L 1 (B) si y s´olo si es medible sobre B y B |f | < ∞. Asimismo, de esta proposici´on y del comportamiento lineal del operador integral, se deduce que L 1 (B) es ret´ıculo vectorial (espacio vectorial y ret´ıculo). Vamos a denotar por L1 (B) al espacio vectorial cociente resultado de identificar las funciones de L 1 (B) que son iguales en c.t.p. En este espacio vectorial se puede definir una norma, conocida como norma de la convergencia en media, de la siguiente forma Z kf k = |f |. B
La comprobaci´on de que esto es una norma es inmediata. M´as generalmente, si p ≥ 1 un n´ umero real, las funciones medibles y finitas de potencia p-´esima integrables sobre B constituyen tambi´en un espacio vectorial que se denotar´a como L p (B). A partir de ´el se construye como antes el espacio Lp (B), que tambi´en resulta ser un espacio normado respecto de la norma Z ¡ ¢1/p kf kp = |f |p . B
No obstante, las comprobaciones en el caso general no son f´ aciles y las omitiremos.
Ejercicios 23A Probar que una funci´on f es medible si y s´olo si existe una sucesi´on de funciones escalonadas que converge c.s hacia f . 23B Probar que dos funciones continuas que son iguales c.s. son iguales en todo punto. 23C Sea f una funci´on con dominio en Rn . Se dice que un abierto Ω es un abierto de anulaci´on de la funci´on f si f es igual a 0 en casi todo punto de Ω. Probar que si Ωf es la uni´on de todos los abiertos de anulaci´on de f entonces f = 0 c.s. en Ωf . 23D Sea U un abierto de R que contenga a los racionales del intervalo [0, 1] y tal que m([0, 1] \ U ) > 0 (Probar que tales abiertos existen). (a) Sea P = [0, 1]\U . Demostrar que la funci´on XP es discontinua en cada punto x ∈ P.
236
Integraci´ on
23D
(b) Sea f (x) = d(x, P ) = inf{|x − s| : s ∈ P } y g = X{0} . Probar que f es continua, g es continua c.s, pero g ◦ f no es continua c.s. 23E Una funci´on f : Rn → R se dice Borel-medible si para cada α ∈ R el conjunto {x : f (x) > α} es un Borel. (a) Si fk es una sucesi´on de funciones de Rn en R que converge puntualmente a la funci´on f , probar que {x : f (x) > α} = ∪ ∩ {x : fk (x) > α + 1/p} p,q k≥q
(b) Probar que el l´ımite de una sucesi´on de funciones Borel-medibles es una funci´on Borel-medible. (c) Probar que si f es una funci´on medible existe una funci´on g Borel-medible c.s. tal que f = g.(Ver Ejercicio 21B(b)). 23F Si f, g son funciones integrables ¿son integrables las funciones f ∧g, f ∨g, f g?. 23G Sea f una funci´on medible. (a) Probar que si f es continua y no negativa, entonces Z f = 0 ⇒ f = 0. (b) Probar que si para todo conjunto medible B,
R B
c.s.
f = 0 entonces f = 0.
23H Probar que la gr´ afica de una funci´on medible f : Rn → R es un conjunto de medida nula. ´ n. Gra (f ) ⊂ Ord (f + 1/p) \ Ord (f ). indicacio 23I (a) Utilizar el ejercicio 21C para probar que si s es una funci´on simple inRtegrable, entonces para cada ε > 0 existe una funci´on escalonada α tal que |s − α| < ε. (b) Probar que las funciones escalonadas son densas en L1 . 23J Sean f, g funciones medibles estrictamente positivas. Probar que f ∈ L1 1 + fg
⇔
¡ 1¢ inf f, ∈ L 1. g
23K Demostrar que si f es una funci´on integrable en R y existe limx→∞ f (x) entonces este l´ımite vale 0. Dar alg´ un ejemplo de una funci´on integrable que no admita l´ımite en el infinito.
23M
Integraci´ on
237
23L Demostrar que si f es una funci´on medible no negativa que toma el valor 1 R en un conjunto de puntos de medida infinita, entonces f = ∞. 23M Estudiar la integrabilidad en el intervalo [0, 1] de las funciones f (x) = sen 1/x, g(x) =
x−1 . ln x
Cap´ıtulo 24
Teoremas de Convergencia El teorema de la convergencia mon´otona (Lema 21.3) establece ciertas condiciones sobre una sucesi´ R on de funciones medibles para que se puedan permutar los s´ımbolos “ ” y “ lim ”, es decir para que Z Z (24.1) lim fk = lim fk . En este cap´ıtulo consideraremos otras condiciones bajo las que sea cierta la f´ormula 24.1. A lo largo de ´el hemos de tener presente que siempre que unas determinadas hip´otesis conduzcan a la validez de la igualdad anterior, esas hip´otesis restringidas a un conjunto medible B garantizan tambi´en, si no se dice nada en contra, la validez de la misma sobre B, es decir Z Z (24.2) lim fk = lim fk , B
B
De igual modo, estas hip´otesis s´olo deber´an ser verificadas normalmente en casi todo punto.
Convergencia mon´ otona El teorema de la convergencia mon´ otona para funciones no negativas proporciona, invirtiendo las hip´otesis, un teorema de convergencia para funciones no positivas. Por lo que, hasta aqu´ı, tendr´ıamos un teorema de convergencia para sucesiones no decrecientes de funciones no negativas (0 ≤ fk %), y otro para sucesiones no crecientes de funciones no positivas (0 ≥ fk &). En general las hip´otesis de estos dos teoremas no podr´an ser intercambiadas. As´ı, para una sucesi´on no creciente de funciones no negativas (0 ≤ fk &) no es seguro que la f´ormula 24.1 sea v´alida: 239
240
Teoremas de Convergencia
24.1
Ejemplo 24.1 Sea {fk } la sucesi´on de funciones fk (x) = 1/k. Esta sucesi´on es claramente no decreciente, todas las funciones son no positivas y converge puntualmente a 0. Es inmediato comprobar que Z fk = +∞, ∀k, y por tanto
Z +∞ = lim
Z fk 6=
Z lim fk =
0 = 0.
No obstante, manteniendo la monoton´ıa de la sucesi´on pero sin hacer referencia alguna al signo de las funciones, a´ un es posible obtener un buen teorema de convergencia: Teorema 24.2 (De la convergencia mon´ otona generalizado) Sea {fk } una sucesi´on mon´otona (da igual que sea creciente o decreciente) de funciones medibles. Si alguna de las de esta sucesi´on es integrable, R funciones R entonces las dos expresiones, lim fk y lim fk , existen y Z Z lim fk = lim fk .
on. Supongamos, para concretar, que la sucesi´on es no decrecienDemostraci´ te y que la funci´on fk es integrable. Consideremos entonces la sucesi´on no decreciente de funciones medibles y no negativas, definida c.s., {fs − fk }s≥k . Si llamamos f = lim fs , es claro que 0 ≤ fs − fk % f − fk (c.s.) luego, por el teorema de la convergencia mon´ otona para funciones no negativas, Z Z lim (fs − fk ) = (f − fk ) s→∞
y, por tanto, si fuese cierto que Z Z Z Z Z Z (24.3) (fs − fk ) = fs − fk ; (f − fk ) = f − fk ,
24.3
Teoremas de Convergencia
se tendr´ıa
Z lim
Z fs −
Z fk =
Z f−
241
Z fk ⇒ lim
Z fs =
f.
Veamos pues que 24.3 se verifica: Escribamos fs = (fs − fk ) + fk . Entonces, puesto que fk es integrable y (fs − fk ) ≥ 0, se satisfacen las condiciones de la proposici´on 23.13 para deducir que Z Z Z Z Z Z fs = (fs − fk ) + fk ⇒ (fs − fk ) = fs − fk . R R R De igual modo se demuestra que (f − fk ) = f − fk . El resultado siguiente nos servir´a de lema para la demostraci´on de otro teorema de convergencia muy utilizado, el teorema de la convergencia dominada de Lebesgue. Teorema 24.3 (Lema de Fatou) (a) Si {fk } es una sucesi´on de funciones medibles no negativas, entonces Z Z limfk ≤ lim fk . (b) Si {fk } una sucesi´on de funciones medibles no positivas negativas, entonces Z Z limfk ≥ lim fk . V Demostraci´ on. (a) Sea gk = j≥k fj . Obviamente, {gk } es una sucesi´on no decreciente de funciones medibles y no negativas y lim gk = limfk , luego
Z
Z
Z Z lim gk = lim gk ≤ lim fk , R R donde la desigualdad, lim gk ≤ lim fk , se obtiene as´ı: De la definici´ on de gk se deduce que gk ≤ fj , para cada j ≥ k, por tanto Z Z Z Z Z Z gk ≤ fj , ∀j ≥ k ⇒ gk ≤ inf fj ⇒ lim gk ≤ lim fk . limfk =
j≥k
(b) Resulta de (a) aplicado a la sucesi´on {−fk }.
242
Teoremas de Convergencia
24.4
Convergencia dominada Teorema 24.4 Sea {fk } una sucesi´on de funciones medibles que converge puntualmente a la funci´on f y supongamos que existe una funci´on integrable F tal que |fk | ≤ F , entonces (a) f es integrable. Z Z (b) f = lim fk . Demostraci´ on. De la condici´on |fk | ≤ F y la convergencia puntual de la sucesi´on fk hacia la funci´on f , se deduce trivialmente que |f | ≤ F , lo que implica (por F integrable) que on fk y f son funciones integrables. R R cada funci´ Veamos que f = lim fk . Tenemos por hip´ otesis que −F ≤ fk ≤ F , para todo k. Aplicando entonces el lema de Fatou (a) a la sucesi´ on de funciones no negativas {fk + F }, resulta Z Z Z (f + F ) = lim(fk + F ) ≤ lim (fk + F ), de donde se deduce, haciendo uso de la linealidad del operador integral, que Z Z f ≤ lim fk . An´alogamente, aplicando de nuevo el teorema de Fatou, ahora a la sucesi´on de funciones no positivas {fk − F }, obtendr´ıamos Z Z f ≥ lim fk . y uniendo ambas desigualdades, teniendo en cuenta que el l´ımite inferior de una sucesi´on de numeros reales es menor o igual que el l´ımite superior, se tiene ya Z Z Z Z f ≤ lim
fk ≤ lim
fk ≤
f,
lo que implica que todas las desigualdades anteriores son, en realidad, igualR dades y por tanto, que existe lim f (por coincidir el l´ımite superior y el k R inferior) y es igual a f . El corolario siguiente proporciona una versi´ on “fuerte”del teorema de la convergencia dominada.
24.6
Teoremas de Convergencia
243
Corolario 24.5 Sean {fk } y f como en el teorema anterior. Entonces Z lim |fk − f | = 0.
Demostraci´ on. Vamos a aplicar lo obtenido antes a la sucesi´on {|fk − f |}. Por hip´otesis la sucesi´on de funciones {|fk − f |} converge a 0 en cada uno de los puntos x en que est´en definidas las funciones |fk − f |, luego en c.t.p., pues fk y f son funciones integrables. |fk − f | ≤ 2 F , siendo la funci´on 2 F integrable, luego Z lim
|fk − f | = 0.
En el teorema anterior hemos hecho referencia a una versi´ on fuerte del mismo, pareciendo indicar con ello que Z Z Z lim |fk − f | = 0 ⇒ lim fk = f ? k→∞
k→∞
Z Esto es verdad, pero siempre que existan las integrales
fk , concretamente:
Proposici´ onR 24.6 Sean {fk } y f funciones medibles y supongamos que para cada k, fk 6= ∞ − ∞, entonces Z Z Z Z lim |fk − f | = 0 ⇒ f 6= ∞ − ∞, y lim fk = f. k→∞
k→∞
R Demostraci´ on. Para ε > 0 sea ν ∈ N tal que |fk − f | < ε si k ≥ ν. Supongamos en primer lugarRque todas las fk , k ≥ ν son integrables. R funciones R Entonces, se tiene que (fk − f ) = fk − f , por lo que podemos escribir Z Z Z Z ¯ ¯ ¯ ¯ ¯ fk − f ¯ = ¯ (fk − f )¯ ≤ |fk − f | < ε, R R luego, limk→∞ fk = f . R Supongamos que existe p ≥ ν tal que fp = ∞ y escribamos f = (f − fp ) + fp . De las hip´otesis y del R teorema de aditividad de la integral (Proposici´on 23.13) se deduce que f existe y Z Z Z (24.4) f = (f − fp ) + fp = ∞.
244
Teoremas de Convergencia
24.6
Por otra parte, escribiendo fk = (fk − f ) + f R vemos que fkR = ∞, para todo k ≥ ν. Luego, tambi´en en este caso, R limk→∞ fk = f . R Ejemplos triviales que muestran que laR condici´on limk→∞ |fk − f | = 0 no implica la existencia de las integrales fk , pueden construirse sin m´as que tomar fk = f para todo k, y f una funci´on medible, cuya integral no existe (por ejemplo f (x) = −1, si x ≤ 0; f (x) = 1, si x > 0). R R Por otra parte, el nuevo Rejemplo prueba que la condici´on limk→∞ fk = f no implica que limk→∞ |fk − f | = 0. Ejemplo. Sea fk = −1/k X[−k,0] + 1/k X[0,k] ; f = 0. R Como fk = 0, se tiene que Z Z lim fk = f = 0. k→∞
En cambio,
Z lim
k→∞
|fk − f | = 2 6= 0.
Vamos a ver a continuaci´ on dos casos particulares del teorema de la convergencia dominada: Corolario 24.7 Sea B un conjunto medible y de medida finita, y sea {fk } una sucesi´on de funciones medibles sobre B, que converge puntualmente sobre B a una funci´on f . Supongamos que se satisface una de las dos condiciones siguientes: (i) Existe una constante M tal que |fk (x)| ≤ M , para cada x ∈ B. (ii) La sucesi´on {fk } converge uniformemente en B a la funci´on f . Entonces,
Z lim
k→∞ B
|fk − f | = 0.
on. La condici´on i) significa que Demostraci´ |fk XB | ≤ M XB .
24.9
Teoremas de Convergencia
245
R Puesto que la funci´on F = M XB es integrable ( M XB = M ·m(B) < ∞) y {fk XB } → f , aplicando el teorema de la convergencia dominada, se tiene que Z Z 0 = lim
k→∞
|fk XB − f XB | = lim
k→∞ B
|fk − f |.
De la condici´on ii) se deduce que, dado ε > 0, |fk − f |XB ≤ εXB para k suficientemente grande. Por lo que, aplicando de nuevo el teorema de la convergencia dominada, resulta lo que queremos.
Consecuencias 24.8 Si {fk } es una sucesi´on de funciones medibles, no negativas, entonces Z X XZ fk . fk =
Para probarlo s´olo hay que aplicar el teorema de la convergencia mon´otona on de funciones no negativas y la aditividad del operador integral a la sucesi´ gk =
k X
fi .
i=1
24.9 Si {Bk } es una sucesi´on de conjuntos medibles disjuntos dos a dos, f una funci´on medible sobre ∪Bk , y suponemos que existe su integral sobre ∪Bk , entonces Z XZ f= f. ∪Bk
Bk
Si f ≥ 0, entonces, del resultado anterior y la igualdad X f X∪Bk = f XBk , se deduce que
Z f X∪Bk =
XZ
f XBk =
XZ Bk
f.
246
Teoremas de Convergencia En el caso general, supongamos por ejemplo que Z
Z
Z +
f= ∪Bk
f −
f
∪Bk
−
=
XZ
∪Bk
24.9
R
+
∪Bk
f −
f + < ∞, entonces
XZ
Bk
f −,
Bk
R que nos dice que ∪Bk f es la diferencia de dos series de t´erminos positivos, siendo la primera de ellas convergente. Se tiene entonces que Z Z XZ XZ XZ XZ + − + − f= f − f = ( f − f )= f. ∪Bk
Bk
Bk
Bk
Bk
Bk
Para escribir las igualdades anteriores hemos utilizado el siguiente resultado, cuya demostraci´on constituye un sencillo ejercicio: P P Si ak , bk son dos series de t´erminos positivos, y suponemos que una de ellas es convergente, entonces X
ak −
X
bk =
X (ak − bk ).
24.10 Sea B1 ⊂ B2 ⊂ . . . una sucesi´on no decreciente de conjuntos medibles, y supongamos que f es una funci´on medible cuya integral sobre ∪Bk existe, entonces Z Z f = lim f. ∪Bk
k→∞ Bk
Si f ≥ 0, la demostraci´on resulta de aplicar el teorema de la convergencia mon´otona a la sucesi´on no decreciente {f XBk }. En el caso general se procede como antes. 24.11 Sea B1 ⊃ B2 ⊃ . . . una sucesi´on no creciente de conjuntos medibles, y supongamos que f es una funci´on integrable sobre alg´ un Bk , entonces Z Z f = lim f. ∩Bk
k→∞ Bk
En caso de ser f ≥ 0, la demostraci´ on resultar´a de aplicar el teorema 24.2 a la sucesi´on {f XBk }, de ah´ı la necesidad de la hip´ otesis f integrable sobre alg´ un Bk . El caso general, como en los resultados precedentes.
24.13
Teoremas de Convergencia
247
24.12 Sea {Bk } una sucesi´on de conjuntos medibles, tal que lim m(Bk ) = 0. Entonces, si f es una funci´on integrable, se tiene que Z lim f = 0.
k→∞
k→∞ Bk
on. El resultado es evidentemente cierto si f es una funci´on Demostraci´ acotada, pues entonces Z Z ¯ ¯ ¯ ¯ |f | ≤ c ⇒ f ≤ |f | ≤ cm(Bk ) → 0. Bk
Bk
En general, denotemos por Cα = {x : |f (x)| ≥ α}. Entonces Z
Z
Z
|f | = Bk
Z
|f | +
Por tanto
|f | ≤ c Bk ∩Cα
Bk ∩Cα
Z |f | ≤ Bk
Z lim
|f | , ∀α > 0, Cα
Z |f | ≤
Bk
|f | + αm(Bk ).
Z
lim en particular,
Cα
|f | , ∀p = 1, 2, . . . Cp
R Pero la sucesi´on de integrales, Cp |f |, tiende a 0 en virtud de 24.11, ya que R obviamente C1 ⊃ C2 ⊃ . . .. Se deduce pues que lim Bk |f | = 0. Corolario 24.13 (Continuidad absoluta) Si f es una funci´on integrable, entonces para cada ε > 0 existe un δ > 0 tal que Z ¯ ¯ ¯ m(B) < δ ⇒ f ¯ < ε. B
on. De lo contrario, existir´ıa un ε > 0 y una Demostraci´ ¯ R sucesi´ ¯ on de conjuntos {Bk } tales que m(Bk ) < 1/k, mientras que ¯ Bk f ¯ > ε, lo cual contradice 24.12.
248
Teoremas de Convergencia
24A
Ejercicios 24A Sea f una funci´on integrable y Bp = {x : |f (x)| ≥ p}. (a) Probar que limp→∞ p m(Bp ) = 0. (b) Probar que ∞ X p m(Bp+1 \ Bp )) < +∞. p=0
(c) Probar que la condici´on sobre f en el apartado (a) no implica f integrable. La condici´on en el apartado (b) implica que f es integrable si {x : f (x) 6= 0} es de medida finita. 24B Encontrar sucesiones mon´otonas {fk } que no satisfagan las hip´otesis de ninguno de los teoremas de convergencia mon´otona y tales que R • fk = ∞ − ∞ , ∀k. R R • lim fk 6= lim fk R R • lim fk = lim fk 24C (a) Probar que si {fk } es una sucesi´on de funciones integrables que converge uniformemente a una funci´on f sobre un conjunto B de medida finita, entonces f es integrable sobre B y Z Z f = lim fk . B
B
(b) Demostrar que la condici´on del apartado anterior, B de medida finita, no se puede quitar. (c) Construir una sucesi´on de funciones {fk } que converja uniformemente en un conjunto de medida finita B y tal que para todo k Z fk = ∞ − ∞. B
24D Probar que si Bk y B son conjuntos medibles tales que m(Bk ∆B) → 0, entonces Z Z lim f= k→∞
Bk
B
para toda f integrable. 24E Demostrar que si f es una funci´on integrable entonces Z ∞ 2 lim e−m sen x · f (x) = 0. m→∞
0
24K
Teoremas de Convergencia
249
24F Consideremos la sucesi´on de funciones px2 1 cos . px − y px − y
fp (x, y) =
(a) Probar que se trata de una sucesi´on de funciones medibles que converge c.s. ¿hacia qu´e funci´on? (b) ¿Se puede aplicar el teorema de la convergencia dominada en B = {(x, y) : 0 < y < x < 1}. 24G Probar que si f es una funci´on medible sobre el intervalo [a, b] y para cada Rx c.s. x ∈ [a, b] se tiene que a f =R0, entonces f = 0. ´ n. Observar que I f = 0 para cada semintervalo contenido en [a, b] y indicacio utilizar la continuidad absoluta de la integral. 24H Sea f ∈ L 1 (R) derivable en 0 y tal que f (0) = 0. Probar que la funci´on g(x) = f (x)/x es integrable en R. que converge 24I Sea fk una sucesi´on mon´otona de funciones reales e integrables R puntualmente a una funci´on f . ¿Es cierto entonces que limk→∞ |f − fk | = 0? 24J Sea fk una sucesi´on de funciones mediblesR que converge puntualmente a una R funci´on f . Probar que si existe M > 0 tal que |fk | ≤ M entonces |f | ≤ M . 24K Sea fk una sucesi´on de funciones medibles “no negativas”que converge puntualmente a una funci´on integrable f y sea para cada k, Bk = {x : f (x) ≥ fk (x)}. (a) Probar que
Z lim
k→∞
(b) Probar que
Z
(f − fk ) = 0. Bk
Z |f − fk | =
Z (f − fk ) + 2
(f − fk ). Bk
(c) Deducir de los apartados anteriores que R R si, adem´as de las R hip´otesis iniciales sobre {fk } y f , se tiene que lim fk = f , entonces lim |f − fk | = 0. ¿Puede suprimirse la hip´otesis fk ≥ 0 para cada k? y la hip´otesis f integrable?
Cap´ıtulo 25
Primitivas e Integrales En este cap´ıtulo vamos a trabajar con funciones de una variable. En ´el estableceremos un caso particular del Teorema Fundamental del C´alculo Integral (ver [3] para el caso general), con el que iniciaremos el c´alculo con Rb R integrales. Utilizaremos la notaci´ on a f (t)dt para referirnos a [a,b] f
Las integrales de Riemann y Lebesgue En An´alisis I se estudiaron las funciones Riemann-integrables en un intervalo acotado [a, b]. Nosotros hemos visto ya que todas estas funciones son medibles en el sentido de Lebesgue (Ejemplo 2 de 22.3). Vamos a ver ahora que, en realidad, son Lebesgue-integrables, y, aunque Riemann y Lebesgue difieran en la t´ecnica de integraci´ on, la integral de una funci´ on es la misma tanto como integrable Riemann que como integrable Lebesgue. Proposici´ on 25.1 Si f es una funci´on integrable Riemann en el intervalo [a, b], entonces f es tambi´en integrable Lebesgue y su integral como funci´on Rb integrable Riemann, R a f , coincide con su integral como funci´on integrable Rb Lebesgue, L a f . on. Sin p´erdida de generalidad puede suponerse que la funci´ on Demostraci´ f ∈ R[a, b] es no negativa. Para cada partici´on P : a = t0 < t1 < . . . < tp = b, de [a, b], se tiene (25.1) L(P, f ) =
X
Z mi (ti −ti−1 ) ≤ R 251
b
f ≤ U (P, f ) = a
X
Mi (ti −ti−1 )
252
Primitivas e Integrales
25.1
donde mi = inf{f (t) : t ∈ [ti−1 , ti ]}, Mi = sup{f (t) : t ∈ [ti−1 , ti ]}. Rb Adem´as sabemos que R a f es el u ´nico n´ umero real que satisface 25.1 para todas las particiones. Ahora bien, es evidente que ¡ ¢ L(P, f ) = m ∪ [ti−1 , ti ] × [0, mi ) ¡ ¢ ≤ m(Ord[a,b] f ≤ U (P, f ) = m ∪ [ti−1 , ti ] × [0, Mi ) Rb y, por tanto, el n´ umero real L a f = m(Ord[a,b] f , est´ a comprendido entre cada dos sumas de Riemann, luego Z b Z b R f =L f. a
a
La siguiente proposici´on, junto con el corolario 25.7, nos ser´ au ´til para calcular la integral de funciones acotadas o no, definidas sobre conjuntos acotados o no. En particular, tambi´en establece la relaci´on entre la integral de Lebesgue y la extensi´on de la integral de Riemann a las funciones no acotadas o definidas sobre conjuntos no acotados. Proposici´ on 25.2 Sea f una R b funci´on que admite integral sobre el intervalo (a, b) con a, b ∈ R, es decir a f 6= ∞ − ∞. Entonces, Z b Z y Z y Z b (25.2) f = lim f (t)dt = lim f (t)dt = lim f (t)dt. a
x→a+ y→b−
y→b−
x
Demostraci´ on. Supongamos primero que
a
Rb a
x→a+
x
f = +∞, pero lim
y→b−
Ry a
f (t)dt 6=
+∞,. En ese caso existir´ıa alg´ un n´ umero real M y puntos y tan pr´oximos a b como se quiera (tan grandes como se quiera, si b = +∞), para los que Ry f (t)dt ≤ M . Por lo tanto se podr´ ıa encontrar una sucesi´ on yp % b tal a que Z yp
f ≤ M , ∀p a
lo que implicar´ıa, aplicando 24.10, que Z yp Z b lim f= f ≤M a
a
25.3
Primitivas e Integrales
en contra de que
253
Rb
f = ∞. Rb Ry En el supuesto de que a f fuese finita y distinta de limy→b− a f (t)dt, se tendr´ıa, como antes, alg´ un ε > 0 y una sucesi´on yp % b, para la que a
¯ ¯
Z
Z
b
f− a
yp
¯ f ¯ > ε,
a
Ry Rb lo que contradice el que lim a p f = a f . La prueba de las dem´as igualdades de (25.2) es an´aloga. Nota. Puede ocurrir que alguno de los l´ımites de (25.2) exista y sea finito, Rb mientras que la integral a f no est´e definida. Un ejemplo t´ıpico de esta situaci´on lo constituye la funci´on f (x) =
sen x x
cuya integral en [0, ∞) no existe, y sin embargo (ver Apostol [1]) Z lim
y→∞ 0
y
sen x π = . x 2
Al valor de este l´ımite es habitual llamarlo integral impropia, pudi´endonos encontrar a veces con la notaci´on Z →b Z x f = lim f. a
x→b−
a
Teorema fundamental del c´ alculo integral Parece conveniente enunciar este teorema en t´erminos de primitivas. Definici´ on 25.3 Si F 0 (x) = f (x), para cada x de un intervalo I de R, se dir´a que F es una primitiva de la funci´on f en I. Es bien conocido que 1. Dos primitivas de una misma funci´on en un intervalo se diferencian en una constante. F 0 = G0 en I implica que (F − G)0 = 0, luego F − G es constante en I.
254
Primitivas e Integrales
25.3
2. Si f admite una primitiva en I, entonces f no tiene discontinuidades de salto. Si f es la derivada de alguna funci´on, entonces debe satisfacer la propiedad de los valores intermedios. Es inmediato comprobar que esto est´a re˜ nido con que f presente alg´ un salto. En particular esto implica, obviamente, que muchas funciones integrables Riemann no admiten primitivas. La versi´on m´as cl´asica del teorema fundamental del c´alculo integral es para funciones continuas y puede enunciarse as´ı: 25.4 Si f es una R x funci´on continua sobre un intervalo [a, b] entonces la funci´on, F (x) = a f (t)dt, es una primitiva para la funci´on f en [a, b]. M´as precisamente: Z x 0 G (x) = f (x), ∀x ∈ [a, b] ⇔ G(x) = f + C. a
on y derivaci´ on son pues, en el contexto del teorema Las operaciones integraci´ precedente, inversas una de la otra: R Rx D f a f −→ −→ f continua derivable F clase C 1
D
−→
F0 continua
R
−→
Rx a
F 0 = F (x) − F (a)
Nos proponemos analizar ahora si existen otros casos en los que integraci´on y derivaci´on tambi´en resulten operaciones inversas: Rx Teorema 25.5 Sea f ∈ L 1 [a, b] y F (x) = a f (t)dt, entonces (i) F es continua en cada punto x ∈ [a, b]. (ii) (T. de diferenciaci´ on de Lebesgue) F es derivable en c.t.p. de c.s. [a, b] y F 0 (x) = f (x). En particular, F 0 (x) = f (x) en todo punto x en el que f sea continua. Demostraci´ on. La demostraci´on de (i) es consecuencia directa de la continuidad absoluta del operador integral (Corolario 24.13). En efecto, Z Z ¯ x+h ¯ ¯ ¯ ¯ ¯ ¯ |F (x + h) − F (x)| = f = f ¯ < ε , si m([x, x + h]) = |h| < δ. x
[x,x+h]
25.6
Primitivas e Integrales
255
(ii) El teorema de diferenciaci´on de Lebesgue escapa al contenido de este curso, su demostraci´on puede verse en Kolmogorov [20] y Benedetto [3]. Veamos, no obstante, que F 0 (x) = f (x) cuando f es continua en x. Dado ε > 0, sea δ > 0 el que corresponda por la continuidad de f en x, entonces si |h| < δ se tiene que ¯ ¯ ¯Z ¯ ¯ F (x + h) − F (x) ¯ ¯ 1 ¯¯ x+h ¯ ¯ ¯ − f (x) = f (t)dt − hf (x) ¯ ¯ |h| ¯ ¯ h x ¯ Z x+h ¯ Z x+h Z x+h ¯ 1 ¯¯ 1 = f (t)dt − f (x)dt¯¯ ≤ |f (t) − f (x)|dt ≤ ε. ¯ |h| x |h| h x Se tiene pues que, en las condiciones del teorema anterior, integrando primero y derivando despu´es recuperamos la funci´on en c.t.p.: f integrable
R
−→
Rx
f derivable c.s.
D
−→
a
f (c.s.)
Vamos a analizar ahora lo que sucede cuando invertimos las composiciones, es decir si primero derivamos y despu´es integramos en un contexto m´as general que el de 25.4. F derivable
D
−→
F0 ¿integrable?
R
−→
Rx a
F 0 = F (x) − F (a).
Lo que expresa el diagrama es lo siguiente: El que una funci´on F sea derivable en todo punto no implica que F 0 tenga que ser integrable. Pero si F 0 es integrable, entonces derivando primero y despu´es integrando recuperamos la funci´on en todo punto. Damos a continuaci´on un enunciado preciso de todo esto Teorema 25.6 Supongamos que f es una funci´on que admite una primitiva F en el intervalo [a, b]. Entonces: (a) Es posible que f no sea integrable en [a, b]. (b) Si f es acotada en [a, b] entonces f es integrable en [a, b]. Z x (c) Si f es integrable en [a, b] entonces F (x) = f + C(constante). a
Demostraci´ on. (a) El ejemplo cl´asico lo constituye la derivada de la funci´on F (x) = x2 sen
1 . x2
256
Primitivas e Integrales
25.6
Es inmediato de comprobar que esta funci´on es derivable en todo punto, siendo su derivada la funci´on f (x) = 2xsen
2 1 1 − cos 2 ; f (0) = 0. x2 x x
Para probar que f no es integrable en [a, b] (a pesar de admitir primitiva), bastar´a ver que la funci´ on h(x) = 1/x cos 1/x2 no es integrable en [a, b]. En efecto, puesto que cos
1 1 ≥ , x2 2
si
¡ −π ¢ 1 π ∈ + 2kπ, + 2kπ 2 x 3 3
es f´acil deducir que h+ (x) ≥ 1/2
∞ p X
− π/3 + 2kπ X( √
1 1 ,√ ) π/3+2kπ − π/3+2kπ
k=1
lo que implica (despu´es de algunos c´alculos elementales) que r ¶ Z Xµ 6k − 1 + h ≥ 1/2 1− 6k + 1 X X 1 2 √ √ ¡√ ¢ ≥ 1/2 ≥ 1/2 = ∞. 6k + 1 6k + 1 6k + 1 + 6k − 1 R Rb An´alogamente se demuestra que h− = ∞. Esto prueba pues que a f = ∞ − ∞. (b) Sabemos que toda funci´on medible y acotada es integrable sobre cada conjunto medible de medida finita. Luego para demostrar que, en las condiciones de este apartado, f es integrable sobre [a, b], s´olo hemos de probar que es medible: Puesto que f = F 0 , se tiene ¡ ¢ f (x) = lim n F (x + 1/n) − F (x) n→∞
lo que expresa que f es el l´ımite puntual de la sucesi´on¢de funciones medibles ¡ (ya que F es continua), fn (x) = n F (x + 1/n) − F (x) . Se deduce pues que f es tambi´en medible, como quer´ıamos ver. (c) S´olo haremos la demostraci´on de este apartado para el caso de funciones acotadas. Una demostraci´on, usando t´ecnicas elementales, para el caso no acotado puede verse en Rudin ([25]) o en Cohn ([9]). Supongamos pues que f = F 0 es una funci´ on acotada en [a, b], es decir, para todo x
25.6
Primitivas e Integrales
257
de [a, b] , |f (x)| ≤ M para alg´ un M . Es evidente que para demostrar la igualdad de (c) bastar´a comprobar que Z F (b) − F (a) =
b
f (t)dt (F. de Barrow). a
Consideremos para cada n´ umero natural n la partici´on de [a, b] , a = t0 < t1 < . . . < tp = b, tal que ti+1 − ti = (b − a) /n. Definimos entonces, para cada n, la funci´on simple: sn =
X F (ti+1 ) − F (ti ) ti+1 − ti
X Ji
siendo J0 = [t0 , t1 ], Ji = (ti , ti+1 ](i = 1, 2, . . .). La sucesi´on {sn } verifica entonces lo siguiente: 1. {sn (x)} → f (x). En efecto, sea x ∈ [a, b]. Es f´acil probar, por un lado, que f (x) = F 0 (x) =
lim
y,z→xy
F (z) − F (y) z−y
por otro, sn (x) =
F (ti+1 ) − F (ti ) ti+1 − ti
donde [ti , ti+1 ] es el intervalo de la partici´on de [a, b] asociada a n (y por tanto de longitud (b − a) /n) en el que est´a el punto x. De ambos hecho se deduce ya trivialmente que {sn (x)} converge a F 0 (x). 2. |sn (x)| ≤ M. Como F es derivable en todo punto, del teorema del valor medio se deduce que sn (x) = F 0 (ξ), ξ ∈ (ti , ti+1 ) lo que implica que sn est´a, como F 0 , acotada por M . R 3. Para todo n, sn = F (b) − F (a). Z X sn = (F (ti+1 ) − F (ti )) = F (b) − F (a).
258
Primitivas e Integrales
25.6
La sucesi´on {sn } satisface pues las condiciones del teorema de la convergencia dominada de Lebesgue, por lo que podemos concluir que Z b Z f = lim sn = F (b) − F (a). a
Corolario 25.7 Supongamos que f es una funci´on que admite una primitiva F en el intervalo abierto (a, b), a, b ∈ R y que adem´as es integrable sobre Rb cada intervalo compacto [x, y] ⊂ (a, b). Entonces, si a f 6= ∞ − ∞, se tiene que Z b f = x→a lim (F (y) − F (x)). a
y→b
Demostraci´ on. Basta aplicar la proposici´on 25.2 y tener en cuenta que, R y en estas condiciones, se puede aplicar la f´ormula de Barrow para calcular x f .
Ejercicios 25A ¿Es posible encontrar alguna funci´on f que admita primitiva en todo punto Rb de un intervalo cerrado [a, b] y tal que a f = ∞? 25B Estudiar si la funci´on f (x) = sen 1/x admite una primitiva en [0, 1]. 25C (a) Estudiar la integrabilidad seg´ un los valores de α > 0 de la funci´on f (x) = 1/xα en un entorno de 0 y en un entorno de ∞. (b) Utilizar el apartado anterior para estudiar la integrabilidad en (0, ∞) de las funciones 1 1−x √ √ , , x + x2 x − x2 25D Estudiar la integrabilidad de las funciones ln x ln x e1/x sen x, x ∈ [0, 1]; , √ , x2 − ln x x(1 + x) 1 , x ∈ [e, ∞] x(ln x)2
x ∈ (0, ∞)
25E Estudiar y calcular, cuando sea posible, los siguientes l´ımites Z ∞ Z ∞ k k √ lim , lim 2 k→∞ 0 k→∞ 0 (x + k)2 + kx2 kx + x Z ∞ Z ∞ sen2 kx x , lim lim 3 2 2 k→∞ 0 k→∞ 0 x + k cos x x + k 2 sen2 x
25F
Primitivas e Integrales
259
25F Probar las desigualdades: 1 1 √ p ≤ 1 + √ + . . . + √ ≤ 2 p. p 2 1 1 ln(p + 1) ≤ 1 + + . . . + ≤ ln p + 1. 2 p √ ´ n. Tener en cuenta que las funciones 2 x y ln x son primitivas, respecindicacio √ tivamente, de las funciones 1/ x y 1/x. √
Cap´ıtulo 26
El Teorema de Fubini-Tonelli Veremos en este cap´ıtulo que el c´alculo de una integral m´ ultiple se reduce al de integrales simples. Concretamente se va a probar que si f (x, y) es una funci´on medible de n + k variables, que no cambia de signo o que es integrable, entonces las integrales iteradas Z (26.1)
¡
Z
¢ f (x, y) dy dx ,
Z
¡
Z
¢ f (x, y) dx dy
R existen y son iguales, siendo su valor precisamente f . PorR tanto repitiendo el proceso tantas veces como sea necesario, el c´alculo de f se reducir´a al de ciertas integrales simples.
El teorema de Tonelli El primer caso que vamos a considerar en el que se da la igualdad entre la integral de una funci´on y sus integrales iteradas, es el de funciones medibles no negativas. Teorema 26.1 Sea f : Rn+k → [0, +∞] medible. Entonces: (i) La funci´on de la variable y ∈ Rk , f (x, −) : y → f (x, y), es medible p.c.t. (para casi todo) x ∈ Rn . R (ii) La funci´on g, definida p.c.t. x por g(x) = f (x, y) dy, es medible. R R (iii) g dx = f (es decir la integral de f coincide con sus integrales iteradas). 261
262
El Teorema de Fubini-Tonelli
26.1
La demostraci´on del teorema general puede reducirse al caso particular en que f = XE , la funci´on caracter´ıstica de un conjunto medible, utilizando el siguiente hecho: 26.2 (a) Si una funci´on f ≥ 0 satisface el teorema de Tonelli, entonces tambi´en lo satisface la funci´on c f , cualquiera que sea la constante c ≥ 0. (b) Si {fk } es una sucesi´on de funciones no negativas que P satisfacen el teorema de Tonelli, entonces tambi´en lo satisface la funci´on fk . Demostraci´ on. Ambos apartados se demuestran de forma an´aloga. (b) Denotemos Zk = {x ∈ Rn : fk (x, −) no es medible}. Por hip´otesis cada uno de estos conjuntos es de medida P nula. Es claro entonces que si x 6∈ Z = ∪Zk , la serie de funciones de y, fk (x, −), es medible, R Pluego medible x. La funci´ o n g definida en c.t.p. mediante, g(x) = p.c.t. fk (x, y)dy = PR otesis) y no fk (x, y)dy, es laR suma de las funciones medibles (por hip´ negativas, gk (x) = fk (x, y)dy, y por tanto es una funci´on medible. Por u ´ltimo Z Z X Z X Z XZ XZ g(x)dx = gk (x)dx = gk (x)dx = fk = fk = f. Como consecuencia de este resultado, la demostraci´ on del teorema de Tonelli bastar´ıa hacerla para funciones del tipo f = XE . En efecto, ´este podr´ıa extenderse ya a las funciones simples no negativas. Adem´as si f es una funci´on medible no negativa sabemos que existe una sucesi´ on creciente {sk } de funciones simples no negativas que converge puntualmente a f . Escribiendo entonces ∞ X (sk+1 − sk )(x) f (x) = s1 (x) + k=1
se deduce que f es una suma de funciones simples, y por tanto el teorema se extender´ıa tambi´en a f . Si E es un subconjunto de Rn+k y x ∈ Rn , escribiremos E(x) = {y ∈ (x, y) ∈ E}. An´alogamente E(y). Puesto que el conjunto E es medible si y s´olo si XE es una funci´on medible, el teorema 26.1 para f = XE se enuncia entonces as´ı: Rk :
Lema 26.3 Sea E ⊂ Rn+k un conjunto medible. Entonces (i) El conjunto E(x) es medible p.c.t. x ∈ Rn .
26.3
El Teorema de Fubini-Tonelli
263
(ii) La funci´on g(x) = m∗ (E(x)), es medible. R (iii) m(E) = m∗ (E(x))dx . Demostraci´ on. La haremos en varias etapas: 1. E es un intervalo, es decir E = I × J. Entonces E(x) =
(
J si x ∈ I ∅ si x 6∈ I
⇒
g(x) = m(E(x)) = m(J)XI (x).
g es pues una funci´on simple y su integral,
R
g = m(J) · m(I) = m(E).
2. E es un conjunto abierto. Que el lema se satisfacePen este caso es consecuencia de 26.2, ya que si E es abierto, XE = XEk , para una cierta colecci´on numerable, {Ek }, de semintervalos disjuntos dos a dos. (ver 18.9 para probar que tal colecci´on existe). Observemos que en este caso E(x) es una uni´ on numerable de semintervalos, luego E(x) es un conjunto medible para todo x. 3. E es un conjunto Gδ acotado. Entonces E se puede escribir como intersecci´ on numerable de una sucesi´on decreciente de conjuntos abiertos y acotados. Sea E = ∩Uk . Se tiene: m(E) = lim m(Uk ) ;
E(x) = ∩Uk (x) ;
m(E(x)) = lim m(Uk (x)).
luego E(x) medible, por ser intersecci´ on numerable de medibles. La aplicaci´on g(x) = m(E(x)) es medible, por ser el l´ımite de la sucesi´on (mon´otona) de funciones medibles (integrables por ser Uk acotado), gk (x) = m(Uk (x) y Z Z g(x)dx = lim gk (x)dx = lim m(Uk ) = m(E).
4. E es un conjunto de medida nula acotado. Sea G un conjunto acotado y Gδ tal que E ⊂ G y m(G) = 0. Como G satisface el teorema, entonces Z 0 = m(G) = m(G(x))dx
264
El Teorema de Fubini-Tonelli
26.3
de lo que se deduce que G(x) y tambi´en E(x) ⊂ G(x) son de medida nula p.c.t. x. Por tanto, E(x) R medible p.c.t. x, g(x) = m(E(x)) = 0 c.s., (luego g es medible) y g = 0 = m(E). 5. E es un conjunto medible acotado. Entonces E = G \ Z, donde G es un Gδ y Z ⊂ G de medida nula. Por tanto m(E) = m(G) ; E(x) = G(x) \ Z(x) ; m(E(x)) = m(G(x)) p.c.t. x. c.s.
Luego E(x) medible c.s., g(x) = m(E(x)) = m(G(x)) es medible y Z Z g(x)dx = m(G(x)) = m(G) = m(E).
6. E es un conjunto medible. Se escribe E como uni´on numerable de conjuntos medibles acotados y disjuntos (equivalentemente XE como suma de funciones caracter´ısticas de medibles acotados), y se aplica 26.2.
El teorema de Fubini Como ya se˜ nalamos al principio las integrales iteradas tambi´en coinciden con la integral de la funci´on cuando ´esta es una funci´on integrable. El enunciado preciso de este hecho lo constituye el teorema de Fubini: Teorema 26.4 Sea f : Rn+k → R integrable. Entonces: (i) La funci´on de la variable y ∈ Rk , f (x, −) : y → f (x, y), es integrable p.c.t. x ∈ Rn . R (ii) La funci´on g, definida p.c.t. x por g(x) = f (x, y) dy, es integrable. R R (iii) g dx = f (es decir la integral de f coincide con sus integrales iteradas). on. Sea f = f + − f − . Por hip´otesis f + y f − son integrables y Demostraci´ al ser tambi´en no negativas, satisfacen el teorema de Tonelli, es decir Z Z Z ¡ ¢ f + (x, y) dy dx = f + < +∞ , Z Z Z ¡ ¢ f − (x, y) dy dx = f − < +∞,
26B
El Teorema de Fubini-Tonelli
265
R por tanto, si denotamos por g1 (x) = f + (x, y) dy, se tiene que g1 es una funci´on de x integrable y en consecuencia finita c.s. o lo que es lo mismo f + (x, −) es integrable p.c.t. x.R An´ alogamente se prueba que f − (x, −) es integrable p.c.t. x y g2 (x) = f − (x, y) dy es integrable, luego f (x, −) = f + (x, −) − f − (x, −) es integrable p.c.t. x. La funci´on Z Z Z + g(x) = f (x, y) dy = f (x, y) dy − f − (x, y) dy = g1 (x) − g2 (x) est´a definida c.s. y es integrable, por ser diferencia de dos funciones integrables. Por u ´ltimo, Z Z Z g(x) dx = g1 (x) dx − g2 (x) dx Z Z Z Z Z Z Z ¢ ¢ ¡ ¡ + − + − = f (x, y) dy dx − f (x, y) dy dx = f − f = f. Nota. Para aplicar el teorema de Fubini-Tonelli a funciones cuyo dominio no es todo Rn+k , basta tener en cuenta la f´ormula Z Z f = f XE . E
Por tanto, si f ≥ 0 o integrable sobre el conjunto medible E, se tiene que Z Z Z Z Z Z ¡ ¡ ¢ ¢ f = f XE = f (x, y)dy dx = f (x, y)dy dx, E
E(x)
A
E(x)
donde A = {x ∈ Rn : m(E(x)) > 0}. Los conjuntos A y E(x) son “los l´ımites de integraci´on”, y el proceso descrito para su obtenci´on ser´a el que se seguir´a habitualmente en la pr´ actica.
Ejercicios 26A Sea E un subconjunto medible de Rn+k . Probar que E es de medida nula si y s´olo p.c.t x ∈ Rn , m(E(x)) = 0. 26B Sean A, B subconjuntos cualesquieras de Rn y Rk respectivamente, G un conjunto medible tal que A × B ⊂ G y m∗ (A × B) = m(G) y g(x) = m∗ (G(x)). Probar que A × [0, m∗ (B)] ⊂ Ord (g) y deducir de esto la f´ormula m∗ (A × B) = m∗ (A) · m∗ (B).
266
El Teorema de Fubini-Tonelli
26C
26C Consideremos la funci´on f (x, y) =
y 2 − x2 . (x2 + y 2 )2
Probar las dos integrales iteradas de f sobre el conjunto B = [0, 1] × [0, 1] existen pero son diferentes. 26D Sea f una funci´on medible. Probar que f es integrable si y s´olo si alguna de las integrales iteradas de la funci´on |f | es finita. 26E Determinar el recinto B para que Z Z f (x, y)dxdy =
1
¡
0
B
Z
x
¢ f (x, y)dy dx
x2
26F (a) Probar que en las condiciones de aplicabilidad del teorema de FubiniTonelli, se tiene que Z b Z x Z b Z b ¡ ¢ ¡ ¢ f (x, y)dy dx = f (x, y)dx dy a
a
a
y
(b) Deducir que si f (x, y) = f (y, x) en el rect´angulo B = [a, b] × [a, b] entonces el valor com´ un de las integrales anteriores es Z 1 f (x, y)dxdy. 2 B (c) En particular, demostrar que si a > 0 entonces Z a Z a Z a ¡ f (y) ¢ dy dx = f (x)dx. y 0 x 0 26G Calcular el ´area limitada por las gr´aficas de las funciones 1 f (x) = √ , x 1−x
g(x) =
1 x
y la recta x = 1. 26H Hallar
Z yzdxdydz, D
donde D es el recinto limitado por los planos coordenados y los planos x + y = 1 y z = 4. 26I Calcular
Z sen(x + y)dxdy, B
donde B = {(x, y) : 0 ≤ x ≤ y; 0 ≤ y ≤ 1; x + y ≤ π/2}.
Cap´ıtulo 27
Cambio de Variables en la Integral M´ ultiple En la demostraci´on del teorema del cambio de variable utilizaremos con frecuencia que el car´acter medible de los conjuntos es una propiedad que se mantiene por aplicaciones de clase C 1 . Este resultado es una consecuencia del hecho de que toda aplicaci´on de clase C 1 en un abierto de Rn es lipschitziana sobre cada compacto contenido en ´el:
Transformaci´ on de conjuntos medibles por funciones de clase C 1 Lema 27.1 Sea T : U ⊂ Rn → Rn una aplicaci´on de clase C 1 . Supongamos en Rn la norma k k∞ y sea Q un cubo cerrado contenido en U , entonces (i) Si kDT (u)k ≤ α , para todo u ∈ Q, entonces m∗ (T (Q)) ≤ αn m(Q). (ii) T transforma conjuntos medibles en conjuntos medibles. Demostraci´ on. i) Sea u0 el centro de Q y l el lado. Como Q es convexo, del teorema del valor medio se deduce que kT (u) − T (u0 )k∞ ≤ αku − u0 k,
∀u ∈ Q
lo que nos indica que T es lipschitziana sobre Q de constante α y por tanto i) se deduce del lema 20.6. El apartado ii) se deduce de la proposici´on 20.7, sin m´as que tener en cuenta que toda aplicaci´on de clase C 1 es localmente lipschitziana. 267
268
Cambio de Variables
27.2
Lema 27.2 Si L es una aplicaci´on lineal de Rn en Rn , entonces (27.1)
m∗ (L(E)) = | det L| · m∗ (E).
Demostraci´ on. Si L es singular, L(E) est´a contenido en un subespacio de dimensi´on r < n. Este subespacio ser´a por lo tanto isomorfo al subespacio vectorial, Rr × {0} × . . . × {0}, y como ´el ser´a, seg´ un el resultado anterior, un conjunto de medida nula. Se deduce pues que L(E) es de medida nula y por tanto la f´ormula (27.1) es v´alida en este caso. La demostraci´on en el caso en que L sea no singular, se basa en la existencia de una descomposici´ on de L en t´ermino de aplicaciones lineales elementales de uno de estos tres tipos: (Li,j ) Permutaci´on de dos coordenadas. Li,j (u1 , . . . , ui , . . . , uj , . . . , un ) = (u1 , . . . , uj , . . . , ui , . . . , un ).
(Lci ) Multiplicar una coordenada por un n´ umero real. Lci (u1 , . . . , ui , . . . , un ) = (u1 , . . . , cui , . . . , un ).
(Li+cj ) Sumar a una coordenada otra multiplicada por un n´ umero real. Li+cj (u1 , . . . , un ) = (u1 , . . . , ui + cuj , . . . , un ). (Para simplificar, denotaremos de la misma forma a una aplicaci´on lineal y a su matriz asociada). Es f´acil ver que la matriz de Li,j se obtiene permutando las filas i y j en la matriz identidad, I. Si T es una aplicaci´on lineal, la multiplicaci´ on Li,j T , produce una matriz en la que se han permutado las filas i y j de T . An´alogamente, la matriz Lci se obtiene multiplicando por c la fila i de I. Y la matriz Li+cj sum´andole a la fila i de esta matriz la j multiplicada por c. La multiplicaci´ on Lci T o Li+cj T , produce los efectos anteriores, pero sobre la matriz T en lugar de la I. Vamos a ver que mediante sucesivas transformaciones de los tres tipos anteriores se puede reducir la aplicaci´on lineal L a la identidad. El procedimiento es como el utilizado para obtener ceros en un determinante Paso 1. Conseguir un 1 en el lugar (1,1) de L mediante:
27.2
Cambio de Variables
269
• Transposici´on de dos filas de L, para conseguir un elemento no nulo (por ejemplo, igual a c) en posici´ on (1,1). • Multiplicaci´on de la primera fila de la matriz obtenida por 1/c. Paso 2. Obtener ceros en la primera columna, sin m´ as que restar a cada fila la primera multiplicada por el n´ umero que corresponda. Paso 3. Conseguir de forma an´aloga un 1 en el lugar (2,2) y un 0 en los dem´as t´erminos de la segunda columna. An´alogamente con las dem´as columnas. De esta forma, mediante un n´ umero finito de estas transformaciones, denot´emoslas por ejemplo L1 , L2 , . . . , Lp , hemos reducido (componiendo a la izquierda con L1 , L2 , . . . , Lp ) la aplicaci´ on L a la identidad I, es decir Lp Lp−1 . . . L1 L = I Como L−1 L−1 L−1 i,j = Lj,i , ci = L1/c i , i+cj = Li−cj , se deduce inmediatamente de lo anterior que L es una composici´on de aplicaciones elementales de los tipos descritos. Y puesto que el determinante de un producto de maormula (27.1) s´olo ser´a preciso trices es el producto de los determinantes, la f´ probarla para estas aplicaciones elementales. Q Supongamos primero que E es un semintervalo, E = ni=1 (ai , bi ], y observemos que | det Li,j | = 1 , det Lci = c , det Li+cj = 1. Entonces, 1. Li,j (E) = (a1 , b1 ] × . . . × (aj , bj ] × . . . × (ai , bi ] × . . . × (an , bn ]. Luego m(Li,j (E)) = m(E) = | det Li,j | · m(E).
2. Lci (E) = (a1 , b1 ] × . . . × (cai , cbi ] × . . . × (an , bn ]. Luego m(Lci (E)) = |c|m(E) = | det Lci | · m(E).
3. Veamos, por u ´ltimo, el caso de aplicaciones del tipo Li+cj . Para calcular m(Li+cj (E)) vamos a utilizar el teorema de Fubini. Podemos suponer para concretar y simplificar que i = 2, j = 1. Entonces: F = L(2)+c(1) (E) = {(u1 , u2 + cu1 , u3 , . . . , un ) : ui ∈ (ai , bi ]},
270
Cambio de Variables
27.2
luego Z µZ
Z m(F ) =
dx1 dx2 . . . dxn =
= Z
b1
µZ
F n Y
(bi − ai )
i=3 b2 +cx2
= a1
a2 +cx1
B
Z B
dx1 dx2 =
¶ Z dx2 dx1 =
F (x1 ,x2 )
Z µZ A
B
¶ dx3 dx4 . . . dx1 dx2
¶ (x1 )dx2 dx1
b1
a1
(b2 − a2 )dx1 = (b2 − a2 )(b1 − a1 ).
Se tiene pues que m(Li+cj (E)) = | det Li+cj | · m(E). Sea ahora E un conjunto cualquiera y L una aplicaci´on lineal de uno de los tipos descritos antes. Entonces, para ε > 0, tomemos {Ik } una colecci´on numerable de semintervalos tal que X E ⊂ ∪Ik , m(Ik ) ≤ m∗ (E) + ε. entonces, utilizando la monoton´ıa y la subaditividad de la medida exterior, se tiene: X X ¡ ¢ m∗ (L(E)) ≤ m(L(Ik )) = | det L| m(Ik ) ≤ | det L| m∗ (E) + ε , lo que, debido al car´acter arbitrario de ε, implica que m∗ (L(E)) ≤ | det L|m∗ (E). Puesto que la aplicaci´ on L−1 es del mismo tipo que L, se obtiene la desigualdad contraria: m∗ (E) = m∗ (L−1 L(E)) ≤ | det L−1 |m∗ (L(E)) =
1 m∗ (L(E)), | det L|
por tanto m∗ (L(E)) = | det L|m∗ (E).
El teorema del cambio de variables en la integraci´ on Lebesgue Teorema 27.3 (El teorema del cambio de variables (TCV) Sea T : U → T (U ) un difeomorfismo de clase C 1 entre los abiertos U y T (U ) de
27.3
Cambio de Variables
271
Rn y f una aplicaci´on de T (U ) en R. Entonces para cada conjunto medible E ⊂ U se tiene: Z Z f = (f ◦ T ) | det DT | E
T (E)
(En el sentido de que la existencia de una de las integrales implica la existencia de la otra y la igualdad entre ambas). Obs´ervese en primer lugar que por ser T un difeomorfismo, del lema 27.1 ii) se deduce que la funci´on f es medible sobre T (E) si y s´olo si f ◦T es medible sobre E, y por ser | det DT | continua y 6= 0, si y s´olo si (f ◦ T ) | det DT | es medible. Para la demostraci´on del caso general consideraremos algunas reducciones. En primer lugar, puesto que f es medible si y s´olo si f + y f − lo son, bastar´a demostrar el teorema para funciones no negativas. Por otra parte, ser´a suficiente con probar que Z Z (27.2) f ≤ (f ◦ T ) | det DT | (f ≥ 0), T (E)
E
pues entonces, considerando el difeomorfismo T −1 y la funci´on g = (f ◦ T ) | det DT |, al aplicar (27.2) resulta que Z Z Z −1 −1 g≤ (g ◦ T ) | det DT | = f. E
T (E)
T (E)
Es inmediato comprobar que para la validez de (27.2) s´olo es preciso que ´esta se satisfaga en el caso en que E = U , es decir que Z Z (27.3) f ≤ (f ◦ T ) | det DT | (f ≥ 0), T (U )
U
y a´ un es posible reducir la demostraci´ on de (27.3) al caso particular en que f = XT (Q) donde Q es un semicubo de adherencia contenida en U , es decir a probar que Z (27.4) m(T (Q)) ≤ | det DT |. Q
En efecto, (27.4) se extiende sin dificultad primero a los conjuntos abiertos. A continuaci´on podemos extenderla a conjuntos medibles E que sean subconjuntos de “cubos abiertos”de adherencia contenida en U : Sea Q un cubo abierto tal que Q ⊂ U y E ⊂ Q. Entonces, por la regularidad de la medida
272
Cambio de Variables
27.3
y la continuidad absoluta de la integral, para cada ε > 0 podemos encontrar un δ > 0 y un conjunto abierto O ⊂ Q tales que Z (27.5) m(O \ E) < δ; | det DT | < ε. O\E
De esto se deduce que Z m(T (E)) ≤ m(T (O)) ≤ | det DT | O Z Z Z = | det DT | + | det DT | < | det DT | + ε, E
O\E
E
de lo que resulta, debido al car´ acter arbitrario de ε, que Z m(T (E)) ≤ | det DT |. E
Sea ahora E medible contenido en U , y sea {Qi } una partici´ on numerable de U por semicubos de adherencia contenida en U . Bastar´ a probar que para cada uno de estos semicubos se tiene Z m(T (E ∩ Qi )) ≤ | det DT |. E∩Qi
En efecto, o
o
m(T (E ∩ Qi )) = m(T (E∩ Qi )) + m(T (E ∩ F r (Qi )) = m(T (E∩ Qi )) Z Z ≤ | det DT | = | det DT |. o E∩ Qi
E∩Qi
Por la linealidad de la integral la f´ ormula (27.3) quedar´ıa ya establecida para funciones simples. Con ello, y teniendo en cuenta que toda funci´on medible no negativa, f , puede aproximarse por funciones simples, la desigualdad (27.3) se obtiene para f por el teorema de la convergencia mon´ otona. El teorema del cambio de variable queda s´olo pendiente de la demostraci´on del lema: Lema 27.4 Supongamos que T : U → T (U ) es un difeomorfismo entre los abiertos U y T (U ) y sea Q es un semicubo tal que Q ⊂ U , entonces: i) Para cada ε > 0 existe δ > 0 tal que si C es un semicubo de lado menor igual que δ, contenido en Q, m(T (C)) ≤ (1 + ε)n | det DT (v)| m(C) ,
∀v ∈ C.
27.4
Cambio de Variables
273
Z ii) m(T (Q)) ≤
| det DT |. Q
Demostraci´ on. (En Rn trabajaremos con la norma k k∞ ). i) Puesto que T es un difeomorfismo, es f´acil comprobar que la aplicaci´on, u → DT (u)−1 , es continua sobre U . Por tanto sup kDT (v)−1 k < ∞. v∈Q
Teniendo en cuenta ahora que DT es uniformemente continua sobre Q, dado ε > 0 podemos encontrar un δ > 0 tal que ku1 − u2 k ≤ δ , u1 , u2 ∈ Q ⇒ kDT (u1 ) − DT (u2 )k ≤
ε . supv∈Q kDT (v)−1 k
Sea C ⊂ Q un semicubo de lado menor que δ. Fijemos un punto v ∈ C cualquiera y consideremos el difeomorfismo T1 = DT (v)−1 ◦ T . Utilizando los lemas 27.1 y 27.1, podemos escribir: m(T1 (C)) = | det DT (v)−1 | · m(T (C)) ≤ αn m(C), donde α = supu∈Q kDT1 (u)k. Se deduce pues que m(T (C)) ≤ αn | det DT (v)| · m(C), y como α = sup kDT1 (u)k = sup kDT (v)−1 ◦ DT (u)k u∈Q
u∈Q −1
= sup kI + DT (v)
◦ (DT (u) − DT (v))k
u∈Q
≤ 1 + kDT (v)−1 k · kDT (u) − DT (v)k ≤ 1 + ε, se tiene ya, que m(T (C)) ≤ (1 + ε)n | det DT (v)| · m(C) , ∀v ∈ C ii) Para cada n´ umero natural p tomemos δp , asociado a ε = 1/p en i), tal que la sucesi´on {δp } tienda a 0, y sea {Cip } una partici´on finita de Q mediante semicubos de lado menor o igual que δp . Fijemos vip ∈ Cip . Por i) sabemos que (27.6)
m(T (Cip )) ≤ (1 + 1/p)n | det DT (vip )| · m(Cip ).
274
Cambio de Variables
27.4
Consideremos entonces para cada p la funci´on simple X sp = | det DT (vip )| X Cip . De (27.6) se deduce f´acilmente que Z 1 m(T (Q)). sp ≥ (1 + 1/p)n Por otra parte, la sucesi´on {sp } converge uniformemente (en Q) a la funci´on | det DT |. En efecto, sea δ > 0 asociado a ε por la continuidad uniforme de la funci´on | det DT |. Entonces, si u ∈ Q y Cip es el semicubo de la partici´on en el que est´a u (luego ku − vip k < δp ), se tiene que ¯ ¯ ¯ ¯ ¯sp (u) − | det DT (u)|¯ = ¯| det DT (vip )| − | det DT (u)|¯ < ε , si δp < δ. El teorema de la convergencia dominada nos permite deducir ya Z Z | det DT | = lim sp ≥ m(T (Q)). Q
p→∞
Ejercicios 27A (a) Utilizar coordenadas polares para deducir la f´ormula que da el ´area del c´ırculo (b) Considerar la elipse de ecuaci´on x2 /a2 + y 2 /b2 = 1. Utilizar el cambio de coordenadas x = au; y = bv para demostrar que el ´area limitada por la esta elipse es igual a πab. 27B Sea z = f (y) una funci´on de una variable, A = [a, b] y B = OrdA (f ). (a) Probar que el volumen del s´olido obtenido al girar B en torno al eje Y es Z b V =π f 2 (y)dy. a
(b) Probar que el volumen del s´olido obtenido a girar B en torno al eje Z es Z b V = 2π yf (y)dy. a
´ n. Utilizar coordenadas cil´ındricas. indicacio (c) Obtener el volumen del toro obtenido al girar el c´ırculo z 2 + (y − a)2 ≤ R2 en torno al eje Z (Sol: 2π 2 R2 a).
27N
Cambio de Variables
275
27C Obtener el volumen del recinto D = {(x, y, z) : x2 + y 2 ≤ 9; x2 + z 2 ≤ 9}. 27D Obtener el ´area encerrada por la curva cuya ecuaci´on en polares es r = 3 + 2 sen θ. 27E Obtener el ´area de uno de los segmentos circulares en que divide el eje Y al c´ırculo de ecuaci´on (x − 1)2 + (y − 1)2 ≤ 2. 27F Calcular el ´area de uno de los bucles de la lemniscata (x2 + y 2 )2 = x2 − y 2 . 27G (a) Mediante el cambio a polares para calcular R 2 (b) Utilizar (a) para calcular R e−x dx
R R2
e−(x
2
+y 2 )
dxdy.
27H Calcular el ´area limitada por las curvas: x2 + y 2 = 2x;
27I Calcular
x2 + y 2 = 4x;
Z cos B
y = x;
y = 0.
π¡x − y ¢ dxdy, 2 x+y
donde B es el recinto limitado por los ejes y la recta x + y = 1 (Hacer el cambio x − y = u; x + y = v). 27J Calcular el volumen del cuerpo limitado por la esfera x2 + y 2 + z 2 = 25 y el cilindro (x − 1)2 + (y − 1)2 = 2 27K Calcular
Z D
xz 2 dxdydz, y
siendo D = {(x, y, z) : x2 + y 2 + z 2 ≤ 1; 0 ≤ x ≤ y}. R 27L Calcular D zdxdydz, siendo D = {(x, y, z) : x2 +y 2 +z 2 ≤ 4; z 2 ≥ x2 +y 2 ; 0 ≤ √ z ≤ 3} (Utilizar coordenadas esf´ericas). 27M Calcular el volumen del s´olido que se encuentra fuera del cono de ecuaci´on x2 +y 2 = z 2 y dentro de la esfera de ecuaci´on x2 +y 2 +z 2 = 4z (utilizar coordenadas esf´ericas). 27N Determinar el volumen de la zona interior al cilindro de altura 4, x2 +y 2 = 2y y al paraboloide z = x2 + y 2 .
Bibliograf´ıa [1] Apostol, T., “An´alisis Matem´atico”, Revert´e, Barcelona, 1979. [2] Avez, A., “Calcul Diff´erentiel”, Masson, Paris, 1983. [3] Benedetto, J.J., “Real Variable and Integration ”, B.G. Teubner, Stuttgart, 1976.
[4] Berstein, S., Quelques remarques sur l’interpolation, Math. Ann., 79 (1918), 1 – 12.
[5] Cartan, H., “C´alculo Diferencial”, Ediciones Omega, Barcelona, 1972. [6] Cheney, E.W., “Introduction to Approximation Theory”, McGraw-Hill, New York, 1966.
[7] Choquet, “Topolog´ıa”, Toray-Masson, Barcelona, 1971. [8] Cohen, P.J., A minimal model for set theory, BAMS, 69 (1963), 537 – 540. [9] Cohn, D.L., “Measure Theory”, Birkh¨auser, Boston, 1980. ´, J., “Fundamentos de An´alisis Moderno”, Revert´e, Barcelona, [10] Dieudonne 1966.
[11] Fleming, W.H., “Funciones de Varias Variables”, C.E.C.S.A., 1976. [12] Flett, T.M., “Differential Analysis”, Cambridge University Press, 1980. [13] Gantmacher, F.R., “Th´eorie des Matrices”, Tome 1 Dunod, Paris, 1966. [14] Garnir, H.G., “Teor´ıa de Funciones I”, Marcombo, Barcelona, 1966. [15] Garnir, H.G., “Functions de Variables Reelles”, tome II, Gauthier-Villars, Par´ıs, 1965.
[16] Hewitt, E., Stromberg, K., “Real and Abbstract Analysis”, SpringerVerlag, New York, 1965.
283
bibliograf´ıa [17] Hewitt, E., Ross, K.A., Extensions of Haar measure and of harmonic analysis for locally compact abelian groups, Math. Annalen , 160 (1965), 171 – 194.
[18] Isaacson, E. and Keller, H.B., “Analysis of Numerical Methods”, Dover, New Yory, 1994.
[19] Kakutani, S., Oxtoby, J.C., , Ann. of Math., (2) 52 (1950), 580 – 590. [20] Kolmogorov, A.N., Fomin, S.V., “Elementos de la Teor´ıa de Funciones u, 1975. y del An´alisis Funcional ”, Mir, Mosc´
[21] Moore, G.H., “Zermelo’s Axiom of Choice ”, Springer-Verlag, New York, 1982.
[22] Nachbin, L., “Topology on Spaces of Holomorphic Mappings”, Springer, Berlin, 1969.
[23] Natanson, I.P., “Theory of Functions of a Real Variable ”, Ungar, New York, 1967.
[24] Von Newman, J., “Functional Operators Vol.I: Measures and Integrals”, Princeton Univ. Press, , 1950.
[25] Rudin, W., “An´alisis Real y Complejo”, McGraw Hill, Madrid, 1973. [26] Schwartz, L., “Cours d’Analyse”, Hermann, Paris, 1967. [27] Solovay, R.M., A model of set-theory in which every set of reals is Lebesgue medible, Ann. of Math., 92 (1970), 1 – 56.
[28] Williamsom, J.H., “Integraci´on Lebesgue”, Tecnos, Madrid, 1973. [29] Yosida, K., “Funtional Analysis”, Sspringer, Berlin, 1974. [30] Zaanen, A.C., “Integration”, North-Holland, Amsterdam, 1967.
284