Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées
M202 : Eléments de calcul differentiel Cours dispensé par Pierre Debes
Notes de cours par Clément Boulonne
L2 Mathématiques
2007-2008
Table des matières
2
Chapitre 1 Fonctions à plusieurs variables 1.1
Généralités
Définition 1.1.1. On appelle fonction de n variables, n ∈ N∗ , toute application f d’un domaine U de Rn dans R. U ⊂ Rn → R f: (x1 , ..., xn ) 7→ f (x1 , ..., xn ) Exemple 1.1.1. f:
R2 → R (x, y) 7→ xy
Exemple 1.1.2. Soit T = température et U = pièce de R3 (en trois dimensions). Alors T est une fonction de 3 variables (qui sont les coordonnées d’un point de U ) : T :
U →R (x, y, z) 7→ T (x, y, z)
Exemple 1.1.3. De même la pression P définit une fonction de 3 variables. P :U →R Exemple 1.1.4. Soit h = hauteur, l = largeur et P = profondeur. La mesure associée à une boîte : (h, l, P ) ∈ R+ × R+ × R+ = (R+ )3 Soit V = volume de la boîte correspondante. Alors V est une fonction de 3 variables. V :
(R+ )3 → R (h, l, P ) 7→ V (h, l, P ) = hlP
Exemple 1.1.5. Le volume d’une pyramide peut être vu comme une fonction de deux variables.
Pyramide de côté de base a et de hauteur h 3
Chapitre 1. Fonctions à plusieurs variables
4
V :
(R+ )2 → R (a, h) 7→ 31 a2 h
Remarque. Une fonction f : U ⊂ Rn → R est appelée en physique un champ scalaire. Exemple 1.1.6. Soit le champ scalaire donnant l’altitude en un point M = (x, y) ∈ R2 : h(x, y) = 2y 2 + y + 2x2 − x Altitude au point (−2, 2) = h(−2, 2) = 20
1.1.1
Domaine de définition
Définition 1.1.2. Soit f : U ⊂ Rn → R une fonction de n variables. On note Df le domaine de définition de f . Df = {antécédent de f } = {x ∈ Rn ∃y ∈ R, y = f (x)} Exemple 1.1.7. Soit f (x, y) =
x y
Df = {(x, y), y 6= 0} = R × R∗ Exemple 1.1.8. Soit f (x, y) = √
1 x2 +y 2
√ Df = {(x, y) | x2 + y 2 6= 0} = {(x, y) | x2 + y 2 = 0} = {(x, y) | x 6= 0 ou y 6= 0} = R2 \{0, 0} Exemple 1.1.9. Déterminer et représenter dans R2 le domaine de définition de : g(x, y) =
q √ 1 − x2 + 1 − y 2
√ √ Dg = {(x, y) ∈ R2 | 1 − x2 > 0 et 1 − y 2 > 0} = {(x, y) ∈ R2 | x2 ≤ 1, y 2 ≤ 1} = {(x, y) ∈ R2 | − 1 ≤ x ≤ 1, −1 ≤ y ≤ 1}
1.1.2
Opérations sur les champs de scalaires
Définition 1.1.3. On peut multiplier f : U ⊂ Rn → R par un scalaire α ∈ R, on obtient un nouveau champ scalaire : U →R f: x → α(f (x))
Chapitre 1. Fonctions à plusieurs variables
5
Définition 1.1.4. On peut également additionner et multiplier deux champs scalaires. Soit : f : U ⊂ R2 → R et g : V ⊂ Rn → R f +g : fg :
1.2
U ∩V →R x 7→ f (x) + g(x) U ∩V →R x 7→ f (x)g(x)
Graphe et représentation graphique
Définition 1.2.1. En général, si f : X → Y alos le graphe de f est : Gf = {(x, y) | y = f (x)} = {(x, f (x)) ∈ X × Y }, Gf ⊂ X × Y Dans notre cas : f : Df ⊂ Rn → R On définit :
Gf = {(x1 , ..., xn , y) ∈ Df × R} avec y = f (x1 , ..., xn ) = {(x1 , ..., xn , f (x1 , ..., xn )) ∈ Df ∈ R} ∈ Rn+1
Exemple 1.2.1. Si f : Df ⊂ R2 → R alors Gf ⊂ Df × R ⊂ R3 . Exemple 1.2.2. Représentation graphique (ou tracer le graphe) de la fonction : f (x, y) = 6 − 3x + 2y Rappel. Un plan dans R3 a pour équation : ax + by + c = z
Gf = {(x, y, z) ∈ R3 | z = 6 − 3x + 2y} = {(x, y, z) ∈ R3 | 3x − 2y + z = 6}
3 le graphe de z = 6 − 3x + 2y est le plan orthogonale à 2 et passant par le point (0, 0, 6). 1 Exemple 1.2.3. Tracer le graphe de f (x, y) = x2 : Gf = {(x, y, z) | z = x2 }
Chapitre 1. Fonctions à plusieurs variables
6
Graphe indépendament de y Cela siginifie que n’importe quel plan vertical d’équation y = k coupe le graphe selon une courbe d’équation z = x2 (parabole). Dans la Fig 1.5., la courbe en vert correspondant à l’intersection de Cf avec le plan y = k. On dit que c’est une section (ou trace). En noir, la trace obtenue en coupant Gf par le plan x = k. En bleu, la section par les plans z = k sont soit : • 2 droites parralèles • une droite (axe des y) • ∅
Graphe de z = x2 (“goutière”) Exemple 1.2.4. Déterminer l’allure du graphe f (x, y) = x2 + y 2 en utilisant les sections : Gf ⊂ R3 = {(x, y, z) | z = x2 + y 2 } Les sections avec le plan z = k sont : Ck = {(x, y, z), k = x2 + y 2 } ∅, k < 0 = (0, 0), k = 0 Cercle de rayon klorsque projeté dans le plan (x, y) On peut avoir a priori les courbes définies :
Le plan x = 0 laisse sur Gf une trce d’éqaution z = y 2 (parabole). Donc notre graphe ressemble à :
Définition 1.2.2. Soit f une fonction définie sur U ⊂ Rn . On appelle courbe de niveau de f assoicée au réel k, l’ensemble des points de U vérifiant f (x, y) = k.
Chapitre 1. Fonctions à plusieurs variables
7
Remarque. (i) En cartographie, f = altitude et la courbe est une courbe d’altitude constante. Si f est une température, alors une courbe de niveau est appelée “courbe isothermale” ou “isotherme”.
(ii) La courbe de niveau f (x, y) = k est obtenue par la section avec le plan horizontal z = k sur le plan (x, y).
Exemple 1.2.5. Tracer la courbe de niveau f (x, y) = x2 + y 2 .
Ck = courbe de niveau k = {(x, y) ∈ U | f (x, y) = k} = {(x, y) ∈ R2 | x2 + y 2
Exemple 1.2.6. Même chose pour h(x, y) = x2 − y 2 . On a :
Dh = R
Ch = courbe de niveau k = {(x, y) | k = y 2 − x2 }
Chapitre 1. Fonctions à plusieurs variables
8
Courbe de niveau k de f (x, y) = x2 − y 2
Graphe de f (x, y) = x2 − y 2
1.2.1
Graphes de révolution
Définition 1.2.3. Considérons f (x) =
√
1 − x2 − y 2
Df = {(x, y) | 1 − x2 − y 2 ≥ 0} = {(x, y) | x2 + y 2 ≤ 1} C’est une boule fermée de rayon 1.
Graphe de f (x, y) = x2 − y 2
Chapitre 1. Fonctions à plusieurs variables
9
Les courbes de niveaux :
On peut alors vérifier que Gf est une demie sphère supérieure de rayon r.
√ Le graphe peut être obtenue en faisant tourner la courbe {y = 0, z = 1 − x2 , 0 ≤ x ≤ 1} autout de l’axe de z. On dit que Gf est un graphe de révolution. Généralement, soit U ⊂ R2 → R. On peut exprimer les points de U en coordonées polaires (r, θ).
On exprime les points de U de coordonées polaires (r, θ), r2 = x2 + y 2 ≥ 0. Si l’expression de f (r, θ) est un graphe de révolution qu’on obtient en faisant tourner la courbe z = f (r, 0) avec θ = 0 autour de l’axe des z. Exemple 1.2.7. f (x, y) = x2 + y 2 ou f (r, θ) = r2
Chapitre 1. Fonctions à plusieurs variables
10
Graphe de révolution de f (x, y) = x2 + y 2 avec en rouge la courbe θ = 0, z = f (r, 0)
1.3
Fonctions partielles
Définition 1.3.1. Soit f : R2 → R. Choissons (x0 , y0 ) ∈ R2 . Alors on notre par f (x0 , .) : la faction d’une variable : R→R f (x0 , .) : y 7→ f (x0 , y) De même, on notera : f (., y0 ) =
R→R x 7→ f (x, y0 )
f (x0 , .) et f (., y0 ) sont appelés fonctions partielles. Exemple 1.3.1. f (x, y) = 2x − y 2 . Soit (x0 , y0 ) = (2, 2) :
1.4
f (2, .) =
R→R y 7→ 4 − y 2
f (., 2) =
R→R x 7→ 2x − 4
Champs de vecteurs
Définition 1.4.1. Soit f1 , ..., fn les champs scalaires : fi : U ⊂ R n → R
i = {1, ..., n}
Alors on peut construire une fonction : f = (f1 , ..., fn ) :
U ⊂ Rn → Rm (x1 , ..., xn ) 7→ (f1 (x1 , ..., xn ), ..., fn (x1 , ..., xn ))
Les fi sont appellées les fonctions coordonnées de f . Exemple 1.4.1. T = température, P = pression, U = amphithéâtre ⊂ R3 alors : f:
U → R2 est un champ de vecteurs (x, y, z) 7→ (T (x, y, z), P (x, y, z))
Chapitre 1. Fonctions à plusieurs variables
1.5 1.5.1
11
Limites et continuités Préliminaires topologiques
y1 x1 . . n Définition 1.5.1. Soit R et deux vecteurs x = .. et y = .. . On a : yn xn x.y = x1 y1 + ... + xn yn √
x.x =
q
x21 + ... + x2n = kxk
−→ On dit que d(A, B) = kABk avec d une distance, c’est-à-dire : • d(A, B) ≥ 0 • d(A, B) = 0 si A = B • d(A, B) = d(B, A) • d(A, C) ≤ d(A, B) + d(B, C)
Démonstration. Pour le quatrième point, on se sert de l’Inégalité de Cauchy-Schwarz. ku + vk ≤ kuk + kvk
Définition 1.5.2. Boule ouverte de centre A ∈ Rn et de rayon r ∈ R notée B(A, r) : B(A, r) = {M ∈ Rn | d(M, A) < r} Boule fermée de centre A ∈ Rn et de rayon r ∈ R notée B(A, r) : B(A, r) = {M ∈ Rn | d(M, A) ≤ r} Exemple 1.5.1.
Pour n = 2, D = (A, r) avec D un disque
Chapitre 1. Fonctions à plusieurs variables
12
Pour n = 1, B(A, r) =]A − r, A + r[ Définition 1.5.3. Un sous-ensemble V de Rn est appelée voisinage d’un point a ∈ Rn s’il existe r > 0 tel que B(a, r) ⊂ V .
V est un voisinage du point a Définition 1.5.4. L’intérieur d’un ensemble V est l’ensemble des a ∈ V tel que V est un ◦ voisinage de a. On le note V ◦
Remarque. V = V Exemple 1.5.2. Soit V = [0, 1]
◦
V =]0, 1[. On a mis en rouge les intervalles ] − r, r[ pour le point 0. ∀r, ] − r, r[6⊂ [0, 1], ]1 − r, 1 + r[6⊂ [0, 1]
◦
En rouge, l’intervalle ]a − r, a + r[, a ∈[0, 1] car ]a − r, a + r[⊂ [0, 1] Définition 1.5.5. Un point a ∈ Rn est dit adhérent à un sous-ensenble si “on peut trouver un élément x ∈ A aussi proche que l’on veut de x”, c’est-à-dire : ∀r > 0, B(x, r) ∩ A 6= ∅ On note A l’ensemble des points adhérets de A
Chapitre 1. Fonctions à plusieurs variables
13
a est non adhérent à V . En vert, l’adhérence de A. ◦
Remarque. A⊂ A ⊂ A ◦
Exemple 1.5.3. Si A = [0, 1[ alors A=]0, 1[ et A = [0, 1] Exemple 1.5.4. B(a, r) = B(a, r) ◦
Définition 1.5.6. Le bord de A est l’ensemble A\ A. ◦
Définition 1.5.7. Un sous-ensemble A ⊂ Rn est dit ouvert si A =A, c’est-à-dire A est voisinage de chacun de ses points, c’est-à-dire A ne continent aucun point de son bord. Exemple 1.5.5. Pour n = 1, ]0, 1[ est ouvert. Pour n = 2, B(a, r) est un ouvert. Définition 1.5.8. A est dit fermé si A = A, si A contient son bord. Exemple 1.5.6. B(a, r) est un fermé. Définition 1.5.9. Un point x ∈ Rn est appelé point d’accumulation d’un ensemble A ∈ Rn , à pour tout r > 0. B(x, r) ∩ A contient un autre point que x. Exemple 1.5.7. A = Z
] − r, r[∩Z = {0} pour r <
1 2
⇒ 0 ∈ Z, 0 n’est pas un point d’accumulation. Notation. On note A0 l’ensemble des points d’accumulation. Pour l’Exemple 1.5.7., Z = Z et Z0 = ∅. Définition 1.5.10. On dit qu’un point a ∈ A est isolé de A si ce n’est pas un point d’accumulation, c’est-à-dire il existe r > 0 tel que B(x, r) ∩ A = {x}. Proposition 1.5.1. Soit A ⊂ Rn , si A est ouvert si AC (complémentaire de A dans Rn : Rn \A) est fermé, si A est fermé alors AC est ouvert.
Chapitre 1. Fonctions à plusieurs variables
14
Proposition 1.5.2. Démonstration.
AC
C ◦
= A
◦
et AC = (A)C .
x ∈ AC ⇔ ∀r > 0, B(x, r) ∩ AC 6= 0 ⇔ ∀r > 0, B(x, r) 6⊂ A ⇔ ¬(∃r > 0, B(x, r) ⊂ A) ◦
⇔ x ∈A C ◦
Démonstration de la Proposition 1.5.1. Si A est ouvert ⇔ AC = A fermé. ◦ AC = (A)C = AC donc AC est ouvert.
1.5.2
= AC donc AC est
Limites d’une fonction
Définition 1.5.11. On dit qu’une fonction f (x1 , ..., xn ) a pour toute limite L ∈ R qia,d m = (x1 , ..., xn ) tend vers un point ferme m0 = (a1 , ..., an ) ∈ (Df )0 si :
∀ε > 0, ∃α > 0 | ∀m ∈ Df ,
|x1 ..
− a1 | < α
.
|xn − an | m 6= m
<α
⇒ |f (x1 , ..., xn ) − L| < ε (∗)
0
ou ∀ε > 0, ∃α > 0 | ∀m ∈ Df ,
d(m, m
0)
m
<α
6= m0
⇒ |f (x1 , ..., xn ) − L| < ε
. On écrit : lim
m→m0 ,m6=m0
f =L
Définition 1.5.12 (Variante de la Définition 1.5.11.). On peut prendre un des ai égale à +∞ et −∞. Si ai = +∞, on remplace ”|xi − ai | < α” par xi > α1 . Si ai = −∞, on remplace ”|xi − ai | < α” par x1 < − α1 . On peut aussi parler de limite L = +∞ et L = −∞. L = +∞ : on remplace ”|f (x1 , ..., xn ) − L| < ε” par f (x1 , ..., xn ) > 1ε . L = −∞ : on remplace ”[f (x1 , ..., xn ) − L| < ε” par f (x1 , ..., xn ) < − 1ε .
Chapitre 1. Fonctions à plusieurs variables
15
Proposition 1.5.3. Si f a une limite en m0 , elle est unique. Démonstration. Supposons que (∗) soit vraie pour L = L1 et L = L2 avec L1 6= L2 .
On choisit ε =
|L1 −L2 | 2
alors (∗) pour L1 :
∃α1 > 0 tel que d(m, m0 ) < α1 ⇒ |f (m) − L1 | < ε (∗) pour L2 : ∃α2 > 0 tel que d(m, m0 ) < α2 ⇒ |f (m) − L2 | < ε Soit m tel que d(m, m0 ) < min(α1 , α2 ), on a alors : |L1 − L2 | ≤ |L1 − f (m)| + |f (m) − L2 | ≤ 2ε = |L1 − L2 | Donc : L1 = L2 . Proposition 1.5.4. Si f est une fonction et que lim f = L et si F ⊂ Df tel que m0 ∈ F m→m0
alors m→m lim f |F = L. 0
Démonstration. d(m, m
0)
<α
∀ε > 0, ∃α > 0, ∀m ∈ Df , m 6= m0 w w w
⇒ |f (m) − L| < ε
Logiquement plus fort car F ∈ Df d(m, m
0)
∀ε > 0, ∃α > 0, ∀m ∈ F, m 6= m0
<α
⇒ |f (x) − L| < ε
Critère de non existence de limites Pour montrer que f n’a pas de limites quand m → m0 , il suffit de trouver deux sous-ensemble F1 , F2 du domaine Df tel que : m0 ∈ (F1 )0
lim f |F1 = L1
m→m0
m0 ∈ (F2 )0
lim f |F2 = L2
m→m0
et L1 6= L2 . Exemple 1.5.8. f (x, y) = xy , m0 = (0, 0) F1 = {(x, x) | x 6= 0}, m0 ∈ F1 F2 = {(x, −x) | x 6= 0}, m0 ∈ F2 lim
(x,y)→(0,0)
lim
(x,y)→(0,0)
Donc pas de limite pour f .
x =1 x→0 x x = lim − = −1 x→0 x
f |F1 = lim
f |F2
Chapitre 1. Fonctions à plusieurs variables
16
1.5.3
Calcul des limites
Définition 1.5.13. Si lim f = L et lim g = M alors : m0
m0
lim f + g = L + M m0
lim f × g = LM m 0
f L = si M 6= 0 0 g M Les régles s’étendent aux limites infinies sous les conventions habituelles. lim m
1 1 = ∞ et =0 0+ ∞ Proposition 1.5.5. Soit f (m) (m = (x1 , ..., xn )) une fonction de n variables et g(x) une fonction d’une variable. On suppose que : lim
m→m0 ,m6=0
f (m) = a et x→a lim g(x) = L
Alors on a : lim g ◦ f (m) = L
m→m0
si l’une des deux hypothèses suivantes est vraie : a) a ∈ Dg b) g(a) = L Exemple 1.5.9. lim
(x,y)→(0,0),(x,y)6=(0,0)
E(−x2 − y 2 ) 6=
0 |{z}
= −1
E(−02 −02 )
Exemple 1.5.10. sin(x2 + y 2 ) =1 (x,y)→(0,0) x2 + y 2 lim
pr 0 6∈ Dg Proposition 1.5.6. Soit f (m), g(m), h(m) trois fonctins à n variables tel que : f (m) ≤ g(m) ≤ h(m), ∀m ∈ D ∈ Rn Si f (m) −−−−→ L ∈ R, h(m) −−−−→ L ∈ R alors : g(m) −−−−→ L ∈ R m→m0
m→m0
m6=m0
Chapitre 1. Fonctions à plusieurs variables
1.6 1.6.1
17
Continuité d’une fonction à plusieurs variables Continuité en un point
Définition 1.6.1. Une fonction f (m) est dite continue en un point m0 ∈ Df si : lim f (m) = f (m0 )
m→m0
Proposition 1.6.1. Si f (m) et g(m) sont continues en un point m0 ∈ Df ∩ Dg alors f + g, f × g, fg si g(m0 ) 6= 0 sont continues en m0 . Démonstration. (f + g)(m) k f (m) + g(m)
?
−−−−→
(f + g)(m0 )
−→
k f (m0 ) + g(m0 )
m→m0
Proposition 1.6.2. Si f (m) est continue en m0 et g(x) continue en f (m0 ) alors g ◦ f (m) est continue en m0 . Démonstration. ?
g ◦ f (m) − −−−→ g ◦ f (m0 ) m→m 0
k g(f (m)) m→m0 &
k g(f (m0 ))
−→ f (m0 )
b est satisfaire car g(f (m0 )) =
lim
u→f (m0 )
g(u)
Continuité et suites Theorème 1.6.3. Soit f (m) une fonction de n variables et m0 ∈ Df . Alors f est continue en m0 si et seulement si pour toute suite (m, k)k>0 de Rn tendant vers m0 , on a : lim f (mk ) = f (m0 )
k→+∞
Définition 1.6.2. On doit préalablement étendre la notion de limites et de continuité aux champs. Si : f = (f1 , ..., fp ) =
Df ⊂ Rn → Rp (x1 , ..., xn ) 7→ (f1 (x1 , ..., xn ), ..., fp (x1 , ..., xn ))
est un champ, on dit que lim f (m) = L (L = (L1 , ..., Lp ) ∈ Rp ) c’est-à-dire : m→m0
f1 (m) −−−−→ L1 m→m0 .. .. . . fp (m) − −−−→ Lp m→m 0
Chapitre 1. Fonctions à plusieurs variables
18
Proposition 1.6.4. Il est équivalent de dire que : lim d(f (m), L) = 0
m→m0
Démonstration. a) 0 ≤ |fi (m) − L| ≤ d(f (m), L) b) d(f (m), L) =
q
(f1 (m) − L1 )2 + (f2 (m) − L2 )2 + ... + (fp (m) − Lp )2
Retour au Théorème 1.4.3. Une suite (mk )k≥0 de Rn peut être vue comme un champ : N → Rn k 7→ mk Dire que (mk )k≥0 −−−−→ m0 signifie que c’est vrai pour ce champ, c’est-à-dire : n→+∞
∀ε > 0, ∃N0 > 0, ∀k > N0 , d(mk , m0 ) < ε Démonstration. (⇒) On suppose m→m lim f (m) = f (m0 ). Soit (mk )k≥0 une suite tendant vers 0 m0 , c’est-à-dire lim mk = m0 . On a alors : lim f (mk ) = f (m0 )
k→+∞
(L’hypothèse (b) du théorème du champ est satisfaire) (⇐) On veut montrer que m→m lim f (m) = f (m0 ). Supposons que c’est faux : 0
∃ε > 0, ∀α > 0, ∃ ∈ Df tel que d(m, m0 ) < α et [f (m) − f (m0 )| ≥ ε On prend α =
1 . 2k
On obtient mk ∈ Df tel que : d(mk , m0 ) <
1 et |f (mk ) − f (m0 ) > ε(2) 2k (1)
La suite (mk )k>0 satsfait : (1) mk −−−→ m0 k→∞
(2) f (mk ) ne tend pas vers f (m0 ) Ce qui contredit l’hypothèse.
1.6.2
Continuité sur un ensemble
Définition 1.6.3. On dit que f est continue sur E ⊂ Rn si elle est continue en tout point de E. On dit que f est continue si elle est continue sur son domaine de définition Df . Exemple 1.6.1. x1 continue. E(−x2 − y 2 ) pas continue puisque elle est définie en (0, 0) et pas continue en (0, 0).
Chapitre 1. Fonctions à plusieurs variables
19
Exemples de fonctions continues • polynômes = P (x1 , ..., xn ) P (x1 ,...,xn ) • fractions rationnelles Q(x 1 ,...,xn ) • exp, ln, sin, cos... • Toutes fonctions construites à partir des précédentes en appliquant l’addition, la multiplication, le quotient ou la composition. Theorème 1.6.5. SI f : Df ⊂ Rn → Rp est continue, sous-ensemble A ⊂ Rn fermé et borné alors f (A) est un sous-ensemble de Rp fermé et borné. Définition 1.6.4. On dit qu’un sous-ensemble A ⊂ Rn est fermé et bornée s’il est inclu dans une boule B(a, r).
Chapitre 2 Différenciation 2.1 2.1.1
Différentielle et dérivées partielles Motivation
Problème. Approximation locale (au voisinge) des fonctions.
Cas de fonctions à une variable
(4, 04)2 ≈ 16, (4, 04)2 ≈ 16, 32 (4, 04)2 = (4 + 0, 04)2 = 42 + 2 × 4 × 0, 04 + 0, 0, 042 q
(4, 04) ≈ 2,
q
4, 04 ≈ 2 + 001
f (x0 + h) = f (x0 ) + ε(h) avec ε(h) → 0 si f est continue en x0 . Si f est dérivable : f (x0 + h) + f (x0 ) = f 0 (x0 ) + ε(h) h où ε(h) → 0, c’est-à-dire : f (x0 + h) = f (x0 ) +
f 0 (x0 )h
+ hε(h)
| {z }
| {z }
terme correctif linéaire
erreur
Or : q
4, 04 = q
√ √ 1 4 + √ 0, 04 = 4 + 0, 01 2 4
4, 02 ≈ 2, 005,
q
20
4, 01 ≈ 2, 0025
Chapitre 2. Différenciation
21
Cas de fonctions à deux variables f (x0 + h, y0 + k) = f (x0 , y0 ) + ε(h, k) si f est continue donc ε(h, k) −−−−−→ 0. h→0,k→0
(∗)
f (x0 + h, y0 + k) = f (x0 , y0 ) + ah + bk + k− m−0→ mkε(h)
ε(h, k) −−−−−→ 0. h→0,k→0
Définition 2.1.1. Si (∗) est vraie 1 , on dit que f est différentielle en m0 et on appelle differentielle au point m0 pour l’accroissement h, k le nombre ah + bk. Notation. On note le terme correctif : dfn0 (h, k) (terme correctif déepnd linéairement de h, k) On note dfn0 l’application linéaire : (h, k) → ah + bk
2.1.2
Différenciabilité
Définition 2.1.2. Soit f : U ⊂ Rn → R une fonction de n variables. Soit m0 (x01 , ..., x0n ) ∈ U . On dit que f est différentiable en m0 s’il existe une forme linéaire L ∈ L(Rn , R) pour m ∈ U = (x1 , ..., xn ) : f (m) = f (m0 ) + L(− m−0→ m) + k− m−0→ mkε(m) (∗) où ε(m) −−−→ 0 et : m→0
L:
L → Rn (h1 , ..., hn ) 7→ a1 h1 + ... + an hn
avec hi = xi − x0i pour i ∈ {1, ..., n} 1
pour deux nombres a et b
Chapitre 2. Différenciation
22 Exemple 2.1.1. f (x, y) = xy
f (x0 + h, y0 + k) = (x0 + h)(y0 + k) = x0 y0 + x0 k + y0 h + hk = f (x0 , y0 ) + x0 k + y0 h + hk On a : √ car :
hk −−−−−−→ 0 + k 2 (h,k)→(0,0
h2
hk √ h2 + k 2
|h||k| ≤ √ = |h| k2
Donc : f est différentiable en m0 . Proposition 2.1.1. SI f est différentiable en m0 alors f continue en m0 et la forme linéaire L de la Définition 2.1.2. noté L = dfm0 s’appelle la diffrentielle de f au point m0 . Démonstration. On suppose (∗) : lim f (m) = f (m0 ) + L(0) + k0k.0 = f (m0 )
m→m0
Donc f est continue en m0 . Supposons : f (m) = f (m0 ) + L0 (m0 m) + k− m−0→ mk.ε0 (m)
(∗∗)
avec L0 ∈ L(Rn , R), ε0 (m) − −−−→ 0. Faisons m = 2 alors (∗) − (∗∗) devient : m→m 0
(L0 − L)(m0 m) = (ε(m) − ε0 (m)km0 mk
(N)
√ On a − m−0→ m = (h, k), m0 = (a, b), m 6= (a + h, b + k) et km0 mk = h2 + k 2 alors : (L0 − L)m0 m = ε(m) − ε0 (m) km0 mkde la forme α(h,k)=√h2 +k2 −−−−−−→0 |
{z
}
de la forme(ah+bk)
On a alors :
|
{z
(h,k)→(0,0
}
√ ah + bk = α(h, k) h2 + k 2
On l’applique par (h, k) = λ(u, v) avec u, v fixé et λ → 0, λ > 0. √ aλu + bλv = α(λu, λv)λ u2 + v 2 √ au + bv = α(λu, λv) u2 + v 2 λ → 0 ⇒ au + bv = 0, ∀u, v ∈ R ⇒ (a, b) = (0, 0) c’est-à-dire : L0 − L = 0. Exemple 2.1.2 (Suite de l’Exemple 2.1.1.). On a f (x, y) = xy. On a montré que f est diffrentiable en m0 alors : dfm0 (h, k) = y0 h + x0 k alors :
dfm0 = (h, k) → y0 h + x0 k dfm0 = y0 ((h, k) → h) + x0 (h, k) → k ) |
{z
dx
dfm0 = y0 dx + x0 dy
}
|
{z dy
}
Chapitre 2. Différenciation
23
Généralisation. (h1 , ..., hn ) → hi se note dxi . La forme linéaire (h1 , ..., hn ) → a1 h1 + ... + an hn se note (h1 , ..., hn ) → a1 dx1 + ...an dxn . Remarque. 1) La condition (∗) de différentiabilité se réecrit : f (m) − f (m0 ) = dfm0 (m0 m) + kmm0 kε(m) avec ε(m) −−−→ 0 m→0
2) Pour n = 1, si f (x) est dérivable en x0 : f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )ε(x) avec ε(x) −−−→ 0 x→x0
alors f est différentiable et dfm0 = f (x0 )dx. Proposition 2.1.2. Soit f, g différentiables en m0 et α, β ∈ R. Alors αf + βg est différentiable et : d(αf + βg)m0 = αdfm0 + βdgm0 Application différentielle Définition 2.1.3. Soit f : U ⊂ Rn → R. f est dite differentiable sur U si f est différentiable en tout point de U . Dans ce cas, on obtient une application : df :
U ∈ Rn → L(Rn , R) m 7→ dfm
avec : Rn → R a1 (m)h1 + ... + an (m)hn dfm : (h0 , hn ) 7→ (a1 (m)dx1 + ... + an (m)dxn ) On a df ∈ F(u, L(Rn , R), dfm ∈ L(Rn , R) et dfm (h1 , ..., hm ) ∈ R. Remarque. On peut voir df comme une application : U ⊂ Rn → Rn df : m 7→ (a1 (m), ..., an (m)) |
(*) 2
2
{z
(∗)
}
df est présenté ici comme un champ : le champ des differentiables.
composantes de dfm dans la base {dx1 , ..., dxn } c’est-à-dire dfm = a1 (m)df1 + ... + an (m)dfn
Chapitre 2. Différenciation
24
2.1.3
Généralisation aux champs
Définition 2.1.4. Un champ : f:
U ⊂ Rn → Rp m(x1 , ..., xn ) 7→ (f1 (m), ..., fp (m))
est dit différentiable en m0 ∈ U si il existe L ∈ L(Rn , Rp ) tel que pour tout m ∈ U : f (m) = f (m0 ) + L(m0 m) + km0 mkε(m) où lim ε(m) = (0, ..., 0)
m→m0
avec L(m0 m) est de la forme (L1 (m0 m), ..., Lp (m0 m)) où L1 , ..., Lp sont des formes linéaires sur Rn . La définition est équivalente à dire que chacune des fonctions coordonnées f1 , ..., fp est différentiable en m0 et : dfm0 = d (f1 )m0 , ..., d (fp )m0 Exemple 2.1.3. f (x, y, z) = (xy, x + y + 2z), f : R3 → R2 ((x0 +h)(y0 +k), (x0 +h)+(y0 +k)+2(z0 +l)) = (x0 y0 , x0 +y0 +lz0 )+(x0 h+y0 k, h+k+2l)+(hk, 0) = f (x0 , y0 , z0 ) + df(x0 ,y0 ,z0 ) (h, k, l) + |{z} ∆
erreur
f différentiable en tout m0 (x0 , y0 , z0 ) ∈ R3 et : dfm0 (h, k, l) = (y0 h + x0 k, h + k + 2l) =
h y0 x0 0 k 1 1 2 | {z } l !
(∗)
(∗)
3
Définition 2.1.5. On appelle la matrice représentative de df m0 dans les bases canoniques de R3 et R2 , la matrice jacobienne de f en m0 et on la note Jac(f )m0
2.1.4
Derivées partielles
Définition 2.1.6 (Derivées partielles). Soit : f:
U ⊂ Rn → R m0 (x01 , ..., x0n ) ∈ U
On appelle derivée partielle de f à xi par rapport à xi au point m0 , la derivée quand elle existe de la fonction : xi = f (x01 , ..., x0i−1 , xi , x0i+1 , ..., xn ) |
{z
fixés
}
|
{z
fixés
or : xi = x0i 3
matrice représentative de df m dans les bases canoniques de R3 et R2
}
Chapitre 2. Différenciation
25
Notation. On note la dérivée partielle de f par rapport à xi au point m0 :
∂f (m0 ). ∂xi
Exemple 2.1.4. f (x, y) = x2 y 5 !
∂f (x0 , y0 ) = ∂x !
∂f (x0 , y0 ) = ∂x
2xy 5
x = x0 = 2x0 y05 y = y0
2 4 5x y
x = x0 = 5x20 y06 y = y0
Theorème 2.1.3. Si f : U ⊂ Rn est différentiable en m0 alors f admet des derivées partielles en m0 . De plus : ! ! ∂f ∂f dfm0 = (m0 )dx1 + .... + (m0 ) dxn ∂xi ∂xn Exemple 2.1.5. f (x, y) = xy dfm0 = y0 dx + x0 dy avec
y 0
=
x0
=
∂f (m0 ) ∂x ∂f (m0 ) ∂y
f = (f1 , ..., fp ) ··· . ∂f . i . (m0 ) .. = . ∂xj ···
Jac(f )m0
Démonstration. Pour le cas n = 2, on suppose : f (x0 + h, y0 + k) = f (x0 , y0 ) + ah + bk +
√
h2 + k 2 ε(h, k)
On fait k = 0 : f (x0 + h, y0 ) = f (x0 , y0 ) + ah + |h|ε(h, 0) c’est-à-dire la fonction f (x, y0 ) est dérivable en x = x0 et a est sa derivée c’est-à-dire : !
a=
∂f (m0 ) ∂x
b=
∂f ∂y
De même :
!
(m0 )
On en déduit : f (x0 + h, y0 + k) = f (x0 + y0 ) + dfm0 (h, k) + D’où :
!
dfm0 (h, k) =
∂f ∂f (m0 )h + ∂x ∂y
√
h2 + k 2 ε(h, k)
!
(m0 )k
26
Chapitre 2. Différenciation
Définition 2.1.7. On appelle le gradient de f en m0 , le vecteur −−→ et on note grad f (m0 )
∂f ∂f (m0 ), ..., ∂x (m0 ) ∂x1 n
de Rn
→ − Remarque. Si H = (h1 , ..., hn ) −−→ → − dfm0 (h1 , ..., hn ) = grad f (m0 ). H Theorème 2.1.4. Soit f : U ⊂ Rn → R une fonction et m0 (a1 , ...an ) ∈ U . On suppose que les ∂f dérivées partielles ∂x (x1 , ..., xn ) existent sur U et sont continues en m0 . Alors la fonction est i différentiable en m0 (et (∗)). dfm0 (h1 , ..., hn ) =
∂f ∂f (m0 )h1 + ... + (m0 )hm ∂x1 ∂xn
(∗)
Démonstration dans la cas où n = 2. On veut montrer : f (x0 + h, y0 + k) = f (x0 , y0 ) +
√ ∂f ∂f (m0 )h + (m0 )k + ε(h, k) h2 + k 2 ∂x ∂y
On note : A(h, k) = −f (x0 + h, y0 + k) + f (x0 , y0 ) +
∂f ∂f (m0 )h + (m0 )k ∂x ∂y
On veut alors montrer que : A(h, k) √ −−−−−−→ 0 h2 + k 2 (h,k)→(0,0) f (x0 +h, y0 +k)−f (x0 , y0 ) = f (x0 + h, y0 + k) − f (x0 + h, y0 ) + |
{z
}
accroissement de y→f (x0 +h,y) entre y0 et y0 +k
f (x0 + h, y0 ) − f (x0 , y0 ) |
{z
}
accroissement de x→f (x0 +h,y) entre x0 et x0 +k
Ces deux fonctions sont dérivables. D’après le théorème des accroissements en une variable. f (x0 + h, y0 + k) − f (x0 + h, y0 ) = k
∂f (x0 + h, y0 + θk) ∂y
pour 0 < θ < 1. f (x0 + h, y0 ) − f (x0 , y0 ) = h
∂f (x0 + θ0 h, y0 + k) ∂x
avec θ0 ∈]0, 1[ "
#
"
#
∂f ∂f ∂f ∂f (x0 + θ0 h, y0 ) − (x0 , y0 ) + k (x0 + h, y0 + θk) − (x0 , y0 ) A(h, k) = h ∂x ∂x ∂y ∂y On en déduit : |A(h, k)| |h| √ √ ≤ h2 + k 2 h2 + k 2
∂f (x ∂x 0 |
∂f |k| + θ h, y0 ) − (x0 , y0 ) + √ 2 ∂x h + k2 {z } −−−−−−→0 0
(h,k)→(0,0)
car
∂f ∂x
et
∂f ∂y
∂f (x ∂y 0 |
∂f + h, y0 + θk) − (x0 , y0 ) ∂y {z } −−−−−−→0 (h,k)→(0,0)
sont continues.
Définition 2.1.8. Un champ f : U ⊂ Rn → R est dit de classe C 1 sur U si f est differentiable sur U et si le champ des différentielles est continue sur U .
Chapitre 2. Différenciation
27
Exemple 2.1.6. f = (f1 , ..., fp ), m ∈ U df m = (d(f1 )m , ..., d(fp )m ) → − → − df m (h1 , ..., hm ) = (d(f1 )m ( H ), ..., d(fp )m ( H )) |
{z − → H
}
∂f1 ∂f1 ∂fp ∂fp = (m)h1 + ... + (m)hn , ..., (m)h1 + ... + (m)hn ∂xm ∂xn ∂x1 ∂x1 ∂f1 ∂f1 (m)h1 + ... + (m)hn ∂x1 ∂xn . . = . ∂fp ∂fp (m)h1 + ... + (m)hn ∂xn ∂x1 ∂f1 ∂f1 (m) · · · (m) h 1 ∂x1 ∂x n . . . . . . = . . . ∂fp ∂fp hm (m) · · · (m) ∂x1 ∂xn On note :
!
∂f1 ∂f1 (m) · · · (m) ∂x1 ∂xn .. .. Jac(f )(m) = . . ∂fp ∂fp (m) · · · (m) ∂x1 ∂xn Remarque. Les lignes de la matrice jacobienne est constitué des composantes du gradient de la fonction à un point donné.
Définition 2.1.9. Un champ de différentielle est : U ⊂ Rn → L(Rn , Rp ) m 7→ df m ou ce qui est équivalent au champ : U ⊂ Rn → Rn×p m 7→ Jac(f )m c’est-à-dire le champ des n × p dérivées partielles de f est continue. Remarque. Un champ f : U ∈ Rn → Rp est de classe C 1 si les dérivées partielles des fonctions coordonnées de f existent et sont continues. Exemple 2.1.7. f:
R3 → R2 (x, y, z) 7→ (xyz, exy )
f est différentiable car f1 , f2 admettent des derivées partielles de n’importe quelle ordre. zy xz xy Jac(f )(x, y, z) = xy ye xexy 0
!
! h zy xz xy y0 z0 h + x0 z0 k + x0 y0 l df m0 (x0 ,y0 ,z0 ) (h, k, l) = k = yexy xeyx 0 y0 ex0 y0 h + x0 ex0 y0 k l !
Chapitre 2. Différenciation
28 Exemple 2.1.8. Champs constants : Rn → Rp m 7→ c = (c1 , ..., cp )
f:
df m = 0 (par le calcul des derivées partielles et : f (m) − f (m0 ) = 0 d’où le résultat). Exemple 2.1.9. f ∈ L(Rn , Rp ) df m = f car :
f (m) − f (m0 ) = f (− m−0→ m)
Exemple 2.1.10. f:
R2 → R (x, y) 7→ xy
f est différentiable (de classe C 1 ) sur R2 . dfm = ydx + xdy Le champ des différentielles est : Rn → L(R2 , R) m 7→ dfm Or de façon équivalente : dfm :
R2 → R2 (x, y) 7→ (y, x)
d(dfm ) = d2 fm = dfm Proposition 2.1.5 (Différentielle d’un champ de différentielle). Soit une fonction f : U ⊂ Rn → R supposée C 1 pour tout m ∈ U : dfm =
∂f ∂f (m)dx1 + ... + (m)dxm ∂x1 ∂xn
Le champ des différentielles : dfm :
U ⊂ RN → L(Rn , R) m 7→ dfm
ou de façon équivalente, le champ : ⊂ Rn → Rn ∂f ∂f m 7→ ∂x (m), ..., (m) ∂x n 1 U
∂f ∂f Si ∂x , ..., ∂x sont des derivées partielles continues sur U alors le champ df est C ∞ sur U et n 1 pour tout m ∈ U . ∂ ∂f ∂ ∂f (m) · · · (m) ∂x1 ∂x1 ∂x1 ∂xn . . . . Jac(df )m = . . ∂ ∂f ∂ ∂f (m) · · · (m) ∂xn ∂x1 ∂xn ∂xn Ce qui donne : → − d(dfm )(h1 , ..., hm ) = Jac(df )m . H
Chapitre 2. Différenciation
2.1.5
29
Espaces tangents
Graphe d’une fonction et son plan tangent en vert ∆x est une droite d’équation : z = f (x0 , y0 ) =
∂f (x0 , y0 )(x − x0 ) ∂x
∆y est une droite d’équation : z = f (x0 , y0 ) =
∂f (x0 , y0 )(y − y0 ) ∂y
Le plan P engendré par ∆x et ∆y est appelée plan tangent au graphe f au point m0 (x0 , y0 ). Un vecteur directeur de ∆x est : → − u =
!
∂f (m0 ), 0, 1 ∂x
Un vecteur directeur de ∆y est : !
∂f → − v = 0, (m0 ), 1 ∂y Un vecteur directeru de P est : → − − − n =→ u .→ v =
!
∂f ∂f (m0 ), (m0 ), −1 ∂x ∂y
D’où l’équation de P est : z − f (x0 , y0 ) =
∂f ∂f (m0 )(x − x0 ) + (y − y0 ) ∂x ∂y
Répresentation graphique des différentielles n = 1, f (x), m0 ∈ Df . Tangente de Gf en (x0 , f (x0 )) est la droite d’équation : y − f (x0 ) = f 0 (x0 )(x − x0 ) n = 2, f (x, y), m0 (x0 , y0 ) ∈ Df . Plan tangent en ((x0 , y0 ), f (x0 , y0 )) : plan d’équation : !
z − f (x0 , y0 ) =
∂f ∂f (x0 , y0 )(x − x0 ) − ∂x ∂y
!
(x0 , y0 )(y − y0 )
Chapitre 2. Différenciation
30 Remarque. Pour n = 1, m((x0 + h), f (x0 + h))
d(m, ∆m0 ) =
|f (x0 + h) − f (x0 ) − f (x0 )h| q
1 + f (x0 )2
=
h(ε(h)) | {z }
négligeable devant h
Pour n = 2, M (x0 + h, y0 + k, f (x0 + h, y0 + k)) d(M, Πm0 ) =
2.2 2.2.1
f (x0
∂f (x0 , y0 )h − ∂f (x0 , y0 )k ∂x ∂y ∂f (x0 , y0 )2 + ∂f (x0 , y0 )2 ∂x ∂y
+ h, y0 + k) − f (x0 , y0 ) − q
1+
=
√ |
h2 + k 2 ε(h, k) {z
négligeable devant
√
}
h2 +k2
Propriétés de calcul Champs composés
Theorème 2.2.1. Soient f : U ⊂ Rn → Rm et g : V ⊂ Rm → Rp , deux chmps différentiables sur U et V telle ques f (U ) ⊂ V . Alors le champ composé : g◦f : U → Rn → Rp est différentiable sur U et pour tout m ∈ U : d(g ◦ f )m = dg f (m) ◦ |
{z
L(Rn ,Rp )
}
| {z }
∈L(Rm ,Rp )
df
| {zm}
(∗)
∈L(Rn ,Rm )
Ce qui s’écrit matriciellement : Jac(g ◦ f )m = Jac(g)f (m) × Jac(f )m Remarque. (∗) pour une variable : (g ◦ f )0 (x) = g 0 (f (x)) × f 0 (x) Démonstration. Soit m0 , m ∈ U . On a : f (m) − f (m0 ) = df m0 (− m−0→ m) + k− m−0→ mkα(m) avec α(m) − −−−→ 0. m→m 0
−−→ g(n) − g(n0 ) = dg f (− n−→ 0 n) + kn0 nkβ(n) n0
Chapitre 2. Différenciation
31
Pour n = f (m) et n0 = f (m0 ), on obtient : g(f (m)) − g(f (m0 )) = dg f (m0 ) (f (m) − f (m0 )) +kf (m) − f (m0 )kβ(m0 ) |
{z
}
−−−−−−−−→ f (m0 )f (m)
m−0→ m) + k− m−0→ mkβ(m)) +
df m0 (m0 m) + km0 mkα(m)
× βf (m = dg f (m0 ) (df m0 (−
!
df (m0 m)
m−0→ m) + k− m−0→ mk dg f (m0 ) (α(m)) + m−0−→ = dg f (m0 ) (df m0 (− + α(m)
× β
km mk
0
|
{z
=B(m)
Pour montrer que d(g ◦ f )m0 = dg f (m0 ) × df m0 , il reste à montrer que :
B(m) =
df (m0 m)
m0 dg f (m ) (α(m)) + 0
k− m−0→ mk | {z
A(m)
+ α(m) × β(f (m))
}
tend vers 0 quand m → m0 . dg f (m0 ) (α(m)) −−−−→ 0 m→m0
β(f (m)) − −−−→ 0 m→m 0
A(m) ≤
−→
df (−
m0 m0 m)
+ kα(m)k
| {z }
− m−0→ m
−m→m −−−→0 0
On peut conclure que B(m) −−−−→ 0 si on montre que kdf m0 (− m−0→ m)k ≤ Ck− m−0→ mk pour C ∈ R m→m0 indépendant de m. df m0 (m0 m) m-uplet de la forme :
n X
a1j hj, ...,
j=1
n X
amj hj
j=1
avec − m−0→ m = (h1 , ..., hm ) et : k− m−0→ mk = Alors :
df m
0
−→)
(− mm 0
q
h21 + ... + h2n
=
v 2 2 u u X n X u n t a1j hj , ..., amj hj
≤
j=1 v j=1 2 2 u u X n n X u at hj , ..., hj j=1
avec a =
max
1≤i≤m,1≤j≤n
(∗) ≤
j=1
|aij |.
v 2 u n √ u u X a mt hj j=1
v n √ u uX ≤ a mt |hj |2 + 2
X
j=1
1≤i,j≤n,i6=j
On utilise ensuite : 2|hi ||hj | ≤ |hi |2 + |hj |2
2|hi ||hj |
(∗0 )
Chapitre 2. Différenciation
32
v uX √ √ u n 0 (∗ ) ≤ a mt |hj |2 (1 + m − 1) ≤ a mnk− m−0→ mk j=1
√ Donc C = a mn et m représente la dimension de l’espace d’arrivée de f et non le point considéré.
2.2.2
Produit de deux fonctions différentielles
Theorème 2.2.2. Si f : U ⊂ Rn → R et g : U ⊂ Rn → R sont différentiables en m0 ∈ U alors f × g est différentiable en m0 et : d(f × g)m0 = g(m0 )dfm0 + f (m0 )dgm0 Démonstration. Soient : φ:
U ⊂ Rn R2 → R , p: m 7→ (f (m), g(m)) (x, y) 7→ xy
On a : (f × g)(m) = p ◦ φ(m). De plus : p est différentiable sur R2 et dp(x,y) = ydx + xdy et φ est différentiable (car f, g le sont) et dφm = (dfm , dgm ). D’après le Théorème 2.2.1., f × g = p ◦ φ est différentiable. d(f × g)m0 = dpφ(m0 ) ◦ dφm0 → − → − d(f × g)m0 ( H ) = dpφ(m) (dφ(m)( H ) → − → − = dpφ(m0 ) (dfm0 ( H ), dgm0 ( H )) → − → − = g(m0 )dfm0 ( H ) + f (m0 )dgm0 ( H ) On obtient : d(f × g)m0 = g(m0 )dfm0 + f (m0 )dgm0
2.2.3
Récapitulatif
L’opérateur d qui à une fonction f : U ⊂ Rn → Rm associe df vérifie : (1) si f = f (x1 , ..., xn ), df = alors :
∂f ∂x1
dx1 + ... +
∂f ∂xn
dxn et inversement si df = a1 dx1 + ...an dxn
!
ai =
∂f , i = {1, ..., n} ∂xi
Cas spécial pour n = 1, df = f 0 (x)dx. (2) d(αf + βg) = αdf + βdg (α, β ∈ R) (3) d(f × g) = gdf + f dg (4) Si x1 , ..., xn sont fonctions d’autres variables u1 , ..., un alors le Théorème 2.2.1. permet de reporter la décomposition des dxi en fonction des duj dans la décomposition de df en fonction des dxi pour obtenir la décompotions de df en fonction des duj . Voir Exemple 2.2.1.
Chapitre 2. Différenciation
33
Exemple 2.2.1. Soit z = z(x, y) ∈ R avec : x
= x(u, v) y = y(u, v) (u, v) → (x(u, v), y(u, v)) → z(x(u, v), y(u, v)) |
On cherche
∂z ∂z , , ∂u ∂v
{z
z en fonction de u,v
}
différentielle du champ composé z en fonction de u, v.
Première méthode : par les matrices jacobiennes
h |
"
∂z ∂x
∂z ∂y
{z
i ∂x }
| Jac(z)(x,y)
∂x ∂v ∂y ∂v
∂u ∂y ∂u
{z
Jac(f )
#
∂z ∂x ∂z ∂y + ∂x ∂u ∂y ∂u = |
{z ∂z ∂u
}
}
∂z ∂x ∂z ∂y + ∂x ∂y ∂y ∂z
|
{z
}
∂z ∂v
Deuxième méthode : par les régles de calculs (1) − (4)
dz = Or : x = x(u, v), y = y(u, v) donc : dx = ∂z dz = ∂x
∂z ∂z dx + dy ∂x ∂y
∂x du ∂u
+
∂x dv, ∂v
!
∂x ∂z ∂x du + dv + ∂u ∂v ∂y
dy =
D’où :
+
∂y dv. ∂v
∂y ∂y du + dv ∂u ∂v
!
dz =
∂y du ∂u
Donc :
!
!
∂z partialx ∂z ∂z ∂x ∂z ∂y + ∂y∂v du + + dv ∂x ∂u ∂y ∂x ∂v ∂y ∂v ∂z ∂x ∂z ∂y ∂z = + ∂u ∂x ∂u ∂y ∂u ∂z ∂z ∂x ∂z ∂y = + ∂v ∂x ∂v ∂y ∂v
Exemple 2.2.2. f : U ⊂ R2 → R de classe C 1 , m0 (x0 , y0 ) ∈ u, u = (a, b) ∈ R2 . Soit g définie de la manière suivante : I → R2 g: t 7→ (x0 + ta, y0 + tb) g est différentiable et dgt = (adt, bdt) et f est de classe C 1 . Considérons maintenant la fonction ϕ: I⊂R→R ϕ: t → f (x0 + ta, y0 + tb) On a alors ϕ = f ◦ g et ϕ différentiable sur I c’est-à-dire est dérivable sur I. dϕt = dfg(t) ◦ dgt = ∂f (g(t))adt + ∂f (g(t))bdt ∂x ∂y h i ∂f ∂f = ∂x (x0 + ta, y0 + tb)a + ∂y (x0 + ta, y0 + tb)b dt = ϕ(t)dt
Chapitre 2. Différenciation
34 d’où !
ϕ0 (t) =
∂f ∂f (x0 + ta, y0 + tb)a + (x0 + ta, y0 + tb)b ∂x ∂y !
ϕ0 (0) =
∂f ∂f (m0 )a + (m0 )b ∂x ∂y
− ϕ0 (0) s’apelle la dérivée directionelle.de f dans la direction de → u au point m0 . On peut noter − − → → − ϕ0 (0) = grad f (m0 ) v . Pour : → − − • → u = i , ϕ0 (0) = ∂f (m0 ) ∂x → − 0 → − ∂f • u = j , ϕ (0) = ∂y (m0 )
2.3 2.3.1
Premières applications Approximations numériques - Calcul d’incertitudes A = (1, 9992)2 × 3, 0012 ≈ 12 = f (x0 + h, y0 + k) x
0 = 2 avec f (x, y) = x2 y, y0 = 3 rentielle de df(x0 ,y0 ) , on a :
h
= 0, 008 , k = 0, 0012
. Si on néglige le terme d’erreur dans la diffé-
f (x0 + h, y0 + k) ≈ f (x0 , y0 ) + df(x0 ,y0 ) (h, k) = 12 + 2x0 y0 h + x20 k = 12 + (−0, 0096) + 0, 0048 = 11, 9952 Soit à calculer la valeur de f (x1 , y1 ) d’une fonction f pour des valeurs x1 , y1 connues avec une incertitude.
x1 = x 0 + ∆ x y1 = y0 + ∆y
avec
|∆x | ≤ Ix et x0 , x1 valeurs mesurées |∆y | ≤ Iy
f (x1 , y1 ) ≈ f (x0 , y0 ). L’erreur comise ∆f lors de cette approximation peut être remplacée par : df(x0 ,y0 ) (∆x , ∆y ) On écrit : |∆f | = |df (x0 ,y0 ) (∆x , ∆y )| ∂f (x , y )∆ + (x , y )∆ = ∂f 0 0 x y ∂x ∂y 0 0 ∂f ∂f ≤ (x , y )∆x + (x , y )∆ ∂y 0 0 y ∂x 0 0 |
{z
}
incertitude du résultat→f (x1 ,y1 )∈[f (x0 ,y0 −If ,f (x0 ,y0 )+If ]
Chapitre 2. Différenciation
35
Rayon de lumière traversant un dioptre plan. Exemple 2.3.1 (Changement de milieux (optique géométrique)). La loi de Descartes : n1 sin i1 = n2 sin i2 . Prenons alors n1 = 1 qui est l’indice de réfraction de l’air. On veut calculer l’indice de refraction du verre. L’exprience donne i1 = 30◦ , i2 = 20◦ . I1 = I2 = 3◦ /. On déduit que : n2 =
n1 sin i1 0, 5 = = 1, 46 sin i2 0, 342
L’incertitude In sur n2 = 1, 46 se calcule de façon suivante : In ≤
sin 30◦ ◦ sin 30◦ cos 20◦ ◦ |2 | + |2 | |{z} ◦ |{z} ◦2
sin 20
sin 20
2π 180
≤ 0, 23
2π 180
Conclusion l’indice de verre n2 est : 1, 46 − 0, 23 ≤ n2 ≤ 1, 46 + 0, 23
2.3.2
Utilisation géométrique du gradient
Soit f : U ⊂ R2 → R différentielle sur U , m0 (x0 , y0 ) ∈ U . !
df(x0 ,y0 ) (h, k) =
∂f ∂f (m0 )h + ∂x ∂y
!
−−→ → − (m0 )k = grad f (m0 ). H
→ − où H = (h, k). D’après l’inégalité de Cauchy-Schwartz, on a : −−→ −−→ → − → − |grad f (m0 ). H | ≤ kgrad f (m0 )k.k H k −−→ → − avec égalité si et seulement si grad f (m0 )// H −−→ → − • Si grad f (m0 ) et H sont parallèles et de même sens alors : −−→ −−→ → − → − grad f (m0 ). H = kgrad f (m0 )k.k H k −−→ → − • Si grad f (m0 ) et H sont parallèles et de sens opposés alors : −−→ −−→ → − → − grad f (m0 ). H = kgrad f (m0 )k.k H k
Chapitre 2. Différenciation
36 Si on fait l’approximation :
∆f = f (x0 + h, y0 + k) − f (x0 , y0 ) ≈ df(x0 ,y0 ) (h, k) −−→ → − on obtient que ∆f est maximale pour : H (h, k) parrallèle et de même sens que grad f (x0 , y0 ).
Exemple d’utilisation géométrique du gradient avec f (x, y) = 1 − x2 − y 2 −−→ −−→ Exemple 2.3.2. f (x, y) = 1 − x2 − y 2 , grad f (x0 , y0 ) = (−2x0 , −2y0 ). Le vecteur grad f (x0 , y0 ) indique à partir de m0 (x0 , y0 ) la direction où la pente correspondante sur le graphe est la plus −−→ grande au point M0 (x0 , y0 , f (x0 , y0 )). En conséquence, grad f (m0 ) est un vecteur nomal à la tangente de la ligne de niveau passant par m0 .
2.4 2.4.1
Propriétés fondamentales Théorème des accroissements finies
Rappel (1 variable). f : [a, b] → R continue et dérivable sur ]a, b[ alors : f (a) − f (b) = (b − a)f 0 (c) pour c ∈]a, b[. Theorème 2.4.1 (Théorème des accroissements finies pour une fonction de n variables). Soit f : U ⊂ Rn → R différentiable sur U . Soient a, b ∈ U tel que [a, b] ⊂ U avec a = (a1 , ..., an ) et b = (b1 , ..., bn ). Alors il existe θ ∈]0, 1[ tel que : f (b) − f (a) =
∂f ∂f (a + θ(b − a))(b1 − a1 ) + ... + (a + θ(b − a))(bn − an ) ∂x1 ∂xn
Démonstration. On considére la fonction : ϕ:
R 7→ f (U ) ⊂ Rn t 7→ f (a + t(b − a))
La fonction ϕ(t) est dérivable car c’est la composée de deux fonctions différentiables et : dϕt = dfg(t) ◦ dgt
Chapitre 2. Différenciation
37
ce qui donne : !
!
∂f ∂f (a + t(b − a))(b1 − a1 ) + ... + (a + t(b − a))(bn − an ) ∂x1 ∂xn
0
ϕ (t) =
D’après le théorème des accroissements finies en une variable entre 0 et 1, il existe θ ∈]0, 1[ tel que : ϕ(1) − ϕ(0) = (1 − 0)ϕ0 (0) et donc : !
f (b) − f (a) =
!
∂f ∂f (a + θ(b − a))(b1 − a1 ) + ... + (a + θ(b − a))(bn − an ) ∂x1 ∂xn
Theorème 2.4.2 (Théorème des accroissements finis pour un champ). En appliquant le théorème des accroissements finies à chaque fi , on obtient : !
fi (a) − fi (b) =
!
∂fi ∂fi (a + θ(b − a))(b1 − a1 ) + ... + (a + θ(b − a))(bn − an ) ∂x1 ∂xn
On déduit : |fi (b) − fi (a)| ≤
n ∂f X i sup (m) |bi 1≤i≤p,1≤j≤n,m∈[a,b] ∂xj
− ai |
i=1
Remarque. On a : n X
|bi − ai | =
i=1
≤
v u n u X t |b v i=1 uX u n t |bi
!2 i
− ai | +
i=1
≤
− ai X
2|bi − ai ||bj − aj |
1≤i≤n,1≤j≤n
v u n uX t |b
i
− ai |2 (1 + n − 1)
i=1
√ → − ≤ nk abk Conclusion : On obtient pour le champ f : |fi (b) − fi (a)| ≤
∂f √ → − i sup × nk abk 1≤i≤n,1≤j≤p,m∈[a,b] ∂xj
Application 2.4.1. Si f a toutes ses dérivées partielles nulles sur U convexe, f est constante. Démonstration. Soient a, b ∈ U |fi (b) − fi (a)| = 0 ⇔ fi (a) = fi (b)
Theorème 2.4.3. Soit f : U ⊂ Rn → Rp différentielle en un point a ∈ U . On suppose : a) f : U → f (U ) bijective, continue ainsi que sa réciproque f −1 . b) df a : Rn → Rp est bijectif (ce qui oblige que n = p).
Chapitre 2. Différenciation
38
Alors l’application f −1 : f (U ) → U est différentiable en b = f (a) et : d(f −1 )b = (df a )−1
(∗)
Remarque. (a) Pour voir que dfa est bijective, on vérifie que det(Jac(f )a ) 6= 0 (b) (∗) généralise la formule pour n = 1 (f −1 )(b) =
1 f 0 (f −1 (b))
(c) (∗) résulte de : f −1 ◦ f = Id qui se différentie par : df −1 ◦ df a = d Ida = Id f (a) Définition 2.4.1. On appelle C 1 -difféomorphisme, tout champ f : U ⊂ Rn → Rn tel que : (a) f : U → f (U ) est continue bijective ainsi que sa réciproque. (b) f est de classe C 1 sur U . (c) f −1 : f (U ) → U C 1 sur f (U ). Critère pratique Il suffit de vérifier : (a) Math 101, 102 (b) que les dérivées partielles de f existent et sont continues. (c) det(Jac(f )a ) 6= 0 pour tout a ∈ U . Theorème 2.4.4 (Théorème d’inversion locale). Soit f : U ⊂ Rn → Rn un champ différentiable sur U et a ∈ U tel que les dérivés partielles de f sont continues en a. On suppose que df a est bijectif. Alors il existe deux ouverts V et W tel que a ∈ V et f (a) ∈ W et f |W V (f : V → W et un C 1 -difféomorphisme. Exemple 2.4.1. n = 1, f : I ⊂ R → R non injectif.
Chapitre 2. Différenciation
39
−−→ = kOM k Définition 2.4.2 (Coordonnées polaires). → − −−→ θ = ( i , OM ) −−→ → − → − On a : OM = ρ cos i + ρ sin θ j d’où : p
x y
, coordonnées polaires.
= ρ cos θ = ρ sin θ
Le changement de coordonnées correspond au champ : Φ:
R2 → R2 (ρ, θ) 7→ (ρ cos θ, ρ sin θ)
Mais Φ n’est pas injective car (ρ, θ) et (ρ, θ + 2π) est le même point. det(Jac(Φ)(ρ,θ) ) =
cos θ sin θ
−ρ sin θ =ρ ρ cos θ
Conclusion : en tout (ρ, θ) = (0, 0), Φ est un difféomorphisme local.
Définition 2.4.3 (Coordonnées cylindriques). φ:
R3 → R3 (ρ, θ, z) 7→ (ρ cos θ, ρ sin θ, z)
det(Jac(φ)(ρ,θ,z) ) =
cos θ sin θ 0
−ρ sin θ 0 ρ cos θ 0 = ρ 0 1
Conclusion : tout point tel que ρ 6= 0, φ est un difféomorphisme local.
Chapitre 2. Différenciation
40 Définition 2.4.4 (Coordonnées sphériques). −−→ = kOM k → − −−→ θ = ( i , OM ) −→ −−→ ϕ = (− Om, OM ) r
− −→ Om
→ − → − = r cos ϕ(cos θ i + sin θ j ) −−→ → − −−→ Om OM = r cos ϕ − −→ + r sin ϕ k kOmk
→ − −−→ → − → − ⇔ OM = r cos ϕ cos θ i + r cos ϕ sin θ j + r sin ϕ k |
{z x
}
|
{z y
}
|
{z z
}
Le changement de coordonnées correspond au champ :
Ψ:
R3 → R3 (r, θ, ϕ) = r cos ϕ cos θ, r cos ϕ sin θ, r sin ϕ)
det(Jac(Ψ)(r,θ,ϕ) ) = = = =
cos ϕ cos θ cos ϕ sin θ sin ϕ
Conclusion : Ψ est un difféomorphisme local en tout point hors de l’axe Oz.
2.4.2
Théorème des fonctions implicites
Motivation
−r cos ϕ sin θ −r sin ϕ cos θ r cos ϕ cos θ −r sin ϕ sin θ 0 r cos ϕ sin ϕ(r2 sin ϕ cos ϕ) + r cos ϕ(r cos2 ϕ) r2 cos ϕ(sin2 ϕ + cos2 ϕ) r2 cos ϕ
Chapitre 2. Différenciation
41
ϕ n’est pas le graphe d’une fonction f (x) car elle ne satisfait pas le “test” des droites verticales. F (x, y) = 0 < y = f (x) Pour (x, y) ∈ U , F (x, y) = 0 ⇔ y = f (x). Theorème 2.4.5 (Fonctions implicites). Soient F : U R2 → R une fonction différentiable et ∂F sont continues en et m0 (x0 , y0 ) un point tel que F (x0 , y0 ) = 0. On suppose que ∂f ∂x ∂y ∂F m0 et que ∂y (m0 ) 6= 0. Alors il existe r > 0, un voisinage V ouvert de m0 et une fonction ϕ :]x0 − r, x0 + r[→ R tel que : F (x, y)
=0 (x, y) ∈ V
⇔
y
= ϕ(x) x ∈]x0 − r, x0 + r[
De plus, ϕ(x) est dérivable et : 0
ϕ (x) = −
∂F (m0 ) ∂x ∂F (m0 ) ∂y
Remarque. (a) ϕ(x0 ) = y0 (b) F (x, ϕ(x)) = 0 pour tout x ∈]x0 − r, x0 + r[. On a : F 0 (x, ϕ(x)) = 0 car : z = F (x, y) avec y = ϕ(x) dz = d’où :
∂F ∂F dx + dy ∂x ∂y
dz = ∂F dx + ∂F ϕ0 (x)dx ∂y ∂x ∂F 0 = ∂F + ϕ (x) dx ∂x ∂y 0 = z (x)dx
d’où : z 0 (x) =
∂F ∂F (x, ϕ(x)) + (x, ϕ(x))ϕ0 (x) ∂x ∂y
. z 0 (x) = 0 donne : ∂F
(x, ϕ(x)) (x, ϕ(x)) ∂y
∂x ϕ0 (x) = − ∂F
42 (c) On peut échanger les rôles de x et y.
Chapitre 2. Différenciation
Chapitre 3 Optimisation 3.1
Extrema libres
On s’intéresse ici aux extrema relatifs d’une fonction, c’est-à-dire, aux points m0 du domaine où f prend une valeur qui soit extrémale, c’est-à-dire, maximale ou minimale, au voisinage de m0 .
3.1.1
Définitions
Exemple 3.1.1. Soit f la fonction dont le graphe est representé ci dessous :
• La fonction f a un minimum relatif en 1 et −3 qui vaut −4. La valeur −4 est aussi le minimum absolu de f . • La fonction f a troix maxim relatifs : +1 atteint en −2, +3 atteint en 2 et 5 atteint en −5. Le maximum absolu de f est +5.
Exemple 3.1.2. La fonction f a deux maxima relatifs. 43
Chapitre 3. Optimisation
44
Définition 3.1.1. Une fonction f : U → Rn → R a un minimum (resp. maximum) absolu en un point m0 ∈ U si f (m0 ) ≥ f (m) (resp. f (m0 ) ≤ f (m)) pour tout m ∈ U . Définition 3.1.2. On dit que f a un maximum relatif en m0 s’il existe r > 0 tel que f |B(m0 ,r) a un maximum absolu.
3.1.2
Conditions du premier ordre
Theorème 3.1.1. Si f (x1 , ..., xn ) a un extremum relatif en un point reflatif m0 intérieur du domaine Df et que f a de dérivées partiels en m0 alors : !
∂f (m0 ) = 0, ∀i ∈ {1, ..., n} ∂xi c’est-à-dire :
−−→ → − grad f (m0 ) = 0
(∗)
(∗)
Démonstration pour le cas où (n = 2). La fonction f (x0 , y0 ) a un extremum relatif en x = x0 d’où f 0 (x0 , y0 ) = 0. (∗) s’appelle la condition du premier ordre, nécessaire pour l’existence d’un extremum relatif en x0 . Ce n’est pas une condition suffisante. (Exemple : f (x) = x3 ). Condition (∗) ⇔ le plan tangent d’équation z = f (x0 , y0 ) est horizontale. Pour l’existence d’un extremum, il faut en plus que Gf reste (localement) du même côté du plan tangent. −−→ → − Définition 3.1.3. Un point stationnaire est un point m0 ∈ Df tel que grad f (m0 ) = 0 .
3.1.3
Exemples de points stationnaires
Exemple 3.1.3. f (x, y) = x2 + y 2 , Df ∈ R2 . ∂f
∂x ∂f ∂y
= 2x = 2y
⇒ 1 point stationnaire : O(0, 0)
Chapitre 3. Optimisation
45
Exemple 3.1.4. f (x, y) = x2 − y 2 a un maximum relatif en O(0, 0) Exemple 3.1.5. f (x, y) = −(x2 + y 2 ) a un point stationnaire en (0, 0). Il n’y a, en O(0, 0), ni maximum, ni minimum. On dit qu’il y a un col (ou un point selle) en un point m0 s’il existe deux sections verticales du graphe présentant, l’un un minimum et l’autre un maximum.
3.1.4
Formule de Taylor-Young à l’ordre 2 (pour n = 2)
% %
∂f ∂x
∂2f (x, y) ∂x2
& ∂2f (x, y) ∂x∂y
f (x, y) ∂2f (x, y) ∂y∂x
&
% ∂f ∂y
& ∂2f (x, y) ∂y 2 2
2
∂ f ∂ f Theorème 3.1.2 (Théorème de Schwartz). Si ∂x∂y et ∂y∂x existent et sont continues en m0 alors : ∂ 2f ∂f (m0 ) = ∂y∂x ∂x∂y ∂y
Chapitre 3. Optimisation
46
Theorème 3.1.3 (Taylor-Young à l’ordre 2). Sous les hypothèses du théorème de Schwartz : #
"
∂f ∂f (x0 , y0 ) + (x0 , y0 ) f (x0 + h, y0 + k) = f (x0 , y0 ) + ∂x ∂y |
1 + 2
{z
dfm0 (h,k) 2
} !
∂ 2f ∂ 2f 2 ∂ f 2 (x0 , y0 )hk + 2 ∂y (x0 , y0 )k 2 + (h2 + k 2 )ε(h, k) (x0 , y0 )h + 2 2 ∂x ∂x∂y ∂ f
Supposons que m0 (x0 , y0 ) soit un point stationnaire, c’est-à-dire : ∂f ∂f (m0 ) = (m0 ) = 0 ∂x ∂y Posons r =
∂2f (m0 ), ∂x2
s=
∂2f , ∂x∂y
t=
∂2f . ∂y 2
La formule de Taylor-Young se réduit :
1 f (x0 + h, y0 + k) = f (x0 , y0 ) + (rh2 + 2shk + tk 2 ) + (h2 + k 2 )ε(h, k) 2 avec (h, k) −−−−−−→ 0. (h,k)→(0,0)
Theorème 3.1.4 (Condition du deuxième ordre). Sous les hypothèses du théorème de Schartz. Soit m0 (x0 , y0 ) un point stationnaire. On charche s2 − rt. • si s2 − rt < 0, il y a un extremum relatif en m0 ∗ si r > 0 : c’est un minimum. ∗ si r < 0 : c’est un maximum. • si s2 − rt > 0, il y a ni un maximum relatif, ni minimum relatif, il y a un col. • si s2 − rt < 0, la méthode ne permet pas de conclure. Démonstration. On cherche à connaître le signe de f (x0 + h, y0 + k) − f (x0 , y0 ) = H pour h et k assez petits. On a : H = 21 (rh2 + 2shk + tk 2 ) + (h2 + k 2 )ε(h, k). rh2 + 2shk + th2 = r(h2 + 2s hk + rt k 2 ) r 2 = r((h + rs l)2 − rs2 k 2 + rt k 2 ) 2 2 = r((h + rs k)2 − s r−rt 2 k ) 1er cas : s2 − rt > 0 et r > 0 On chosit un nombre α > 0 assez petit pour que les nombre r0 = r − α et t0 = t − α soient de même signe que r et t vérifiant s2 − r0 t0 < 0 (grâce à la continuité de s2 −rt). D’après le calcul précédent, r0 h2 +2shk +t0 k 2 est de signe de r c’est-à-dire > 0. On obitnet : rh2 + 2shk + tk 2 ≥ α(h2 + k 2 ) Conclusion, on obtient : H≥
α 2 (h + k 2 ) + (h2 + k 2 )ε(h, k) ≥ (h2 + k 2 ) 2
α + ε(h, k) 2 | {z }
≥0 pour (h,k) suffisament petit
On a trouvé que H ≥ 0 pour (h, k) suffisament petit. Il y a donc un minimum relatif en m0 . Les deux autres cas sont similaires. Exemple 3.1.6. f (x, y) = x2 y −
x2 2
− y 2 . Extrema de f ? Df = R2
Chapitre 3. Optimisation
47
• Etape 1 : Recherche de points stationnaires : ∂f
∂x
∂f
∂y
= 2xy − x = 0 = x2 − 2y = 0
On résout : 2xy
x(2y
−x=0 x2 − 2y = 0
⇔
x
=0 ⇔ x2 = 2y
− 1) = 0 x − 2y = 0 2
y
= 12 ou x2 = 2y
Les points stationnaires sont : O(0, 0), A(1, 12 ), B(−1, 12 ). • Etape 2 : Conditions du deuxième ordre : ∂ 2f = 2y − 1 ∂x2 r
= −1 ∗ en O(0, 0), s = 0 t = −2
∂ 2f = 2x ∂x∂y
∂ 2f = −2 ∂y 2
.
s2 − rt = 0 − (−1)(−2) = −2, r < 0 O est un point maximum (relatif car f (x) → ∞ quand x → ∞). r = 0 1 ∗ en A(1, 2 ), s = 2 t = −2 s2 − rt = 22 − 2 × 0 = 4 A est un col. ∗ en B(−1,
1 ), 2
=0 s = −2 t = −2 r
s2 − rt = 4 B est un col. Exemple 3.1.7. f (x, y) = x4 + y 4 . Point stationnaire : O(0, 0). 2 ∂ f )12x2 ∂x22
∂ f =0 ∂x∂y 2 ∂ f2 = 12y 2 ∂y
r
=0 , s=0 t=0
, s2 − rt = 0
f (0, 0) = 0 ≤ x4 + y 4 = f (x, y) donc maximum absolu.
Chapitre 3. Optimisation
48
3.2
Extrema liés et méthode de Lagrange
Problème. Trouver les etrema relatifs d’une fonction f (x, y) vérifie une contrainte g(x, y) = 0. Exemple 3.2.1. f (x, y)
= xy g(x, y) = x + y − 8
−−−−−−−−−→ pour (x,y)=(4,4)
f (x, y)
= 16 g(x, y) = 0
Theorème 3.2.1. Soit m0 (x0 , y0 ) un point. On suppose que les dérivées partielles de f et g −−→ existent et sont continues en m0 . On suppose que grad g(m0 ) 6= 0. Si f a un extremum en m0 sous la contrainte g(m0 ) = 0. Alors : −−→ −−→ grad f (m0 ) k grad g(m0 )
(∗)
(∗) ⇔ (∗∗) il existe λ ∈ R tel que : ∂f (m
0) ∂x ∂f (m0 ) ∂y
(∗) ⇔ (∗ ∗ ∗) :
∂f (m ) 0 ∂x ∂f [m0 ) ∂y
∂g (m0 ) ∂x ∂g (m0 ) ∂y
∂g = λ ∂x (m0 ) ∂g = λ ∂y (m0 )
= 0. Les points satisfaisants (∗), (∗∗), (∗ ∗ ∗) sont appelés les
points stationnaires de f sous contraite g = 0. m0 solution du problème ⇒ m0 stationnaire. Mais la réciproque est fausse. Exemple 3.2.2. f (x, y)
= xy g(x, y) = x + y − 8 1) Recherche des points stationnaires, on résout : x + y = 8 y 1 =0 x 1
=y−x
On obtient un point stationnaire A(4, 4). 2) Etude des points stationnaires. En notant que g(x, y) = 0 ⇔ y = 8 − x, on a que le problème revient à étudier les extrema de H(x) := x(8 − x). h0 (x) = 8 − 2x x −∞ 4 +∞ h (x) + 0 − 0
h(x)
%
&
Conclusion : il y a un maximum absolu en x = 4. Exemple 3.2.3. n
f (x, y) = y g(x, y) = y 3 + y + x2
Chapitre 3. Optimisation
1)
y3 0 1
+ y + x2 = 0
2x 0 = 2x 3y 2 + 1
⇔
49
y(y 2
+ 1) = 0 x = 0
. Un point stationnaire : O(0, 0).
2) Etude du point stationnaire O(0, 0). ∂g ∂g (0, 0) 6= 0 ⇔ (0, 0) = 3y 2 |x=0,y=0 = 1 6= 0 ∂y ∂y Donc d’après le Théorème 2.4.5. (Fonctions implicites), il existe r > 0, V un voisinage de O(0, 0) et une fonction dérivable : y :] − r, r[→ R tel que : g(x, y)
=0 (x, y) ∈ V
y
⇔
= ϕ(x) x ∈] − r, r[
Décider s’il y a un extremum local de f sous contrainte g = 0 équivaut à déc ider si x = 0 est un extemum relatif de f (x, ϕ(x)) = ϕ(x). On étudier la variation de ϕ localement au voisinage de x = 0. −2x ϕ(x) = 3ϕ(x)2 + 1 x ϕ (x)
0 + 0 −
ϕ(x)
%
0
&
Conclusion : il y a un maximum relatif pour ϕ en x = 0 c’est-à-dire un maximum relatif pour f sous contrainte g = 0 en O(0, 0). Remarque. L’équation y 3 +y+x2 = 0 a une unique racine réelle ϕ(x), ∀x ∈ R, en effet y → 7 y 3 +y est strictement croissante donc atteint la valeur −x2 en un unique y = ϕ(x) ∈ R. ϕ est ainsi définie dans R : −2x ϕ0 (x) = 3ϕ(x)2 + 1 x −∞ 0 +∞ ϕ0 (x) + 0 − ϕ(x)
%
&
Exemple 3.2.4. f (x, y)
= x2 + 8y g(x, y) = x2 + y 2 − 25 1) Points stationnaire : on résout : x2 + y 2 = 25 2x 2x =0 8 2y
x2
+ y 2 = 25 ⇔ 4xy − 16x = 0
Chapitre 3. Optimisation
50 On obtient : 1
2
x
=0 x2 + y 2 = 25
=4 x + y 2 = 25 y
2
⇔ Points stationnaires : A(0, 5), B(0, −5) ⇔ Points stationnaires : C(3, 4), D(−3, 4)
2) Etude des points stationnaires : le problème revient à étudier les extrema de f sur le cercle C(0, 5). Rappel. Soit f : U ⊂ R2 → R une fonction continue et K ⊂ U un ensemble fermé et borné. Alors f (K) est un sous-ensemble fermé de R. En conséquence f a un minimum asolu et un maximum absolu sur K = C(0, 5) borné et fermé. Les extrema absolus peuvent être des points stationnaires : f (A) = 40, f (B) = −40, f (C) = 41, f (D) = 41 Conclusion : le maximum absolue en C et en D et le miminum absolu en B. Mais que se passe-il en A ? On résout localement en y l’équation g(x, y) = 0 grâce au théorème des fonctions implicites. ∂g (A) = 2y|y=5 = 10 6= 0 ∂x donc il existe r > 0, un voisinage ouvert V de A et une fonction ϕ :] − r, r[→ R : g(x, y)
=0 (x, y) ∈ V
⇔
y
= ϕ(x) x ∈] − r, r[
Le problème se ramène à l’étude de f (x, ϕ(x)) = x2 + 8ϕ(x) localement au voisnage de x = 0. Si h(x) = x2 + 8ϕ(x) alors h0 (x) = 2x + 8ϕ0 (x). ∂g
(x, ϕ(x)) 16x = 2x − 8 × 2ϕ(x) (x, ϕ(x)) ∂y
h0 (x) = 2x − 8 ∂x ∂g On calcule h00 (0) :
16 × 2ϕ(x) − 2ϕ0 (x)16x h00 (x) = 2 − 4ϕ(x)2 "
h00 (x) = 2 −
32 × 5 − 0 8 2 =2− = 2 4×5 5 5 localement
←→ 0
x ϕ00 (x) ϕ0 (x)
+ 25 + − 0 +
ϕ(x)
&
Conclusion : il y a un minimum relatif en A. Généralisation (Lagrangien généralisé).
%
#
Chapitre 3. Optimisation
51
Problème. Extrema relatif de f (x1 , ..., xn ) sous contrainte g(x1 , ...xn ) Définition 3.2.1. L(x1 , ..., xn , λ) = f (x1 , ..., xn ) + λg(x1 , ..., xn ). L s’appelle le lagrangien du problème. Le système à résoudre pour touver les points stationnaires : −−→ −−→ (∗∗) : grad f = λgrad g pour un λ ∈ R est équivaut à écrire : ∂L
∂xi ∂L ∂λ
=0 =0
i = 1, .., n
Problème plus général extrema de f (x1 , ..., xn ) sous les contraintes : g (x , ..., xn ) 1 1
=0 .. . g (x , ..., x ) = 0 p 1 n Le lagrangien est : L(x1 , ..., xn , λ1 , ..., λp ) = f (x1 , ..., xn ) −
p X
λi gi (x1 , ..., xn )
i=1
∂L
∂xi ∂L ∂λj
=0 =0
i = 1, .., n et j = 1, ..., p
Exemple 3.2.5. f (x)
= xyz g1 (x) = x + y + z − 2 g2 (x) = xy + yz + zx − 1 Les points soltuions sont à chercher parmi les points stationnaires du problème, lesquels sont les solutions du système.
Annexe A Preuve du théorème de Lagrange On suppose que m0 (x0 , y0 ) est un extremum relatif de f (x, y) sous contrainte g(x, y) avec −−→ → − ∂g f, g de classe C 1 et grad g(x0 , y0 ) 6= 0 . Supposons par exemple que ∂y (x0 , y0 ) 6= 0. D’après le théorème des fonctions implicites, il existe un voisinage V de m0 , il existe r > 0 et une fonction : y :]x0 − r, x0 + r[→ R dérivable tel que : g(x, y) (x, y)
=0 ∈V
⇔
y x
= y(x) ∈]x0 − r, x0 + r[
Remarque. g(x, y(x)) = 0 L’hypothèse de départ signifie que x = x0 est un extremum local de f (x, y(x)). Donc : f (x, y(x))|x=x0 = 0. Dérivée de f (x, y(x)) ? On pose z = f (x, y(x)) = f (x, w) avec w = y(x). !
dz =
!
∂f ∂f dx + dw ∂x ∂w dw = y 0 (x)dx
d’où :
!
!
∂f ∂f dz = dx + y 0 (x)dx ∂w " ∂x ! ! # ∂f ∂f 0 = + y (x) dx ∂x ∂w d’où :
!
∂f ∂f (x, y(x)) + ∂x ∂y
0
z (x) = 0
0
On sait que z (x0 ) = 0 et y (x0 ) = −
∂g (x0 , y0 ) ∂x . ∂g (x0 , y0 ) ∂y
(x, y(x))y 0 (x)
D’où :
!
∂f ∂f (x0 , y0 ) − ∂x ∂y ⇔
!
!
∂g (x0 , y0 ) ∂x (x0 , y0 ) ∂g (x0 , y0 ) ∂y
∂g ∂f ∂f ∂g (x0 , y0 ) (x0 , y0 ) − (x0 , y0 ) (x0 , y0 ) = 0 ∂y ∂x ∂y ∂x 52
Annexe A. Preuve du théorème de Lagrange
⇔
∂f (x , y ) ∂x 0 0 ∂f (x0 , y0 ) ∂y
Ce qui démontre le théorème.
53
∂g (x0 , y0 ) ∂x ∂g (x0 , y0 ) ∂y
=0