École AVOSZ

196. Calculez le polynôme minimal d’une matrice

Rédigé par Yannis TRIANTAPHYLIDESon 13/12/202129/04/2024| Niveau Prépa

Considérez la matrice suivante $A = \begin{pmatrix}1 & 1 & 2 \\ 1 & -1 & 1 \\ 1& 1 & -1\end{pmatrix}.$

Il s’agit de déterminer le polynôme unitaire de plus petit degré annulant une telle matrice.

Calculez les matrices $A^2$ et $A^3$

Via le théorème de Cayley-Hamilton, vous savez que la matrice $A$ est annulée par un polynôme de degré $3.$

Vous calculez donc les puissances de la matrice $A$ jusqu’à un exposant égal à $3$, ce qui aboutit à :

A^2 = \begin{pmatrix}4 & 2 & 1 \\ 1 & 3 & 0\\ 1 & -1 & 4 \end{pmatrix}

A^3 = \begin{pmatrix}7 & 3 & 9 \\ 4 & -2 & 5\\ 4 & 6 & -3 \end{pmatrix}.

Formez la matrice augmentée

Considérez les matrices $I$, $A$, $A^2$ et $A^3$ que vous écrivez ligne par ligne.

Vous obtenez la matrice suivante :

\begin{pmatrix} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1\\ 1 & 1 & 2 & 1 & -1 & 1 & 1& 1 & -1\\ 4 & 2 & 1 & 1 & 3 & 0 & 1 & -1 & 4 \\ 7 & 3 & 9 & 4 & -2 & 5 & 4 & 6 & -3 \end{pmatrix}.

Afin de garder la trace à tout instant des opérations qui seront menées, il est commode d’y rajouter la matrice identité, ce qui fournit en tout et pour tout ceci la matrice $B$ suivante :

B = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 1 & 1 & 2 & 1 & -1 & 1 & 1& 1 & -1 & 0 &1 & 0 & 0\\ 4 & 2 & 1 & 1 & 3 & 0 & 1 & -1 & 4 & 0 & 0 & 1 & 0\\ 7 & 3 & 9 & 4 & -2 & 5 & 4 & 6 & -3 & 0 & 0 & 0 & 1 \end{array}\end{pmatrix}.

Déterminez le degré du polynôme minimal

Il s’agit dans un premier temps de manipuler par des opérations élémentaires sur les lignes de $B$ seulement les deux premières lignes de $B$.

Vous effectuez l’opération élémentaire $L_2\leftarrow L_2-L_1$ et obtenez la matrice suivante :

B_1 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 4 & 2 & 1 & 1 & 3 & 0 & 1 & -1 & 4 & 0 & 0 & 1 & 0\\ 7 & 3 & 9 & 4 & -2 & 5 & 4 & 6 & -3 & 0 & 0 & 0 & 1 \end{array}\end{pmatrix}.

Les deux premières lignes vous donnent les coefficients des matrices $I$ et $A-I.$

Montrez que ces deux matrices sont linéairement indépendantes.

Soit en effet deux scalaires $a$ et $b$ tels que $aI + b(A-I) = 0.$

Alors $a\begin{pmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{pmatrix} + b\begin{pmatrix}0 & 1 & 2 \\ 1 & -2 & 1 \\ 1 & 1 & -2\end{pmatrix} = 0.$

L’identification du premier coefficient en haut à gauche fournit $a=0$ immédiatement.

Puis, l’identification du coefficient de la ligne 1 à la colonne 2 fournit $b=0.$

Les deux matrices $I$ et $A-I$ appartiennent à l’espace vectoriel engendré par les matrices $I$ et $A$, qui est donc de dimension $2.$ Donc les matrices $I$ et $A$ sont linéairement indépendantes. Donc le polynôme minimal de $A$ est de degré supérieur ou égal à $2.$

Effectuez alors l’opération élémentaire $L_3\leftarrow L_3-4L_1$ à partir de la matrice $B_1$, qui fournit la matrice $B_2$ suivante :

B_2 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 0 & 2 & 1 & 1 & -1 & 0 & 1 & -1 & 0 & -4 & 0 & 1 & 0\\ 7 & 3 & 9 & 4 & -2 & 5 & 4 & 6 & -3 & 0 & 0 & 0 & 1 \end{array}\end{pmatrix}.

Vous effectuez alors l’opération élémentaire suivante $L_3\leftarrow L_3-2L_2$ qui fournit une nouvelle matrice :

B_3 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 0 & 0 & -3 & -1 & 3 & -2 & -1 & -3 & 4 & -2 & -2 & 1 & 0\\ 7 & 3 & 9 & 4 & -2 & 5 & 4 & 6 & -3 & 0 & 0 & 0 & 1 \end{array}\end{pmatrix}.

Ce calcul montre que les matrices $I$, $I-A$ et $A^2-2A-2I$ sont linéairement indépendantes.

En effet, soient trois scalaires $a$, $b$ et $c$ tels que $aI+b(I-A)+c(A^2-2A-2I) = 0.$

Cela s’écrit :

$a\begin{pmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{pmatrix} + b\begin{pmatrix}0 & 1 & 2 \\ 1 & -2 & 1 \\ 1 & 1 & -2\end{pmatrix} + c \begin{pmatrix}0 & 0 & -3 \\ -1 & 3 & -2 \\ -1 & -3 & -4\end{pmatrix}= 0.$

L’identification du coefficient de la ligne $1$ et de la colonne $1$ fournit $a=0.$

L’identification du coefficient de la ligne $1$ et de la colonne $2$ fournit $b=0.$

L’identification du coefficient de la ligne $1$ et de la colonne $3$ fournit $c=0.$

Par suite, l’espace vectoriel engendré par les matrices $I$, $A$ et $A^2$ contient une famille libre de 3 matrices, donc cet espace vectoriel est de dimension supérieure ou égale à $3$. Par suite, les matrices $I$, $A$ et $A^2$ sont linéairement indépendantes, donc le degré du polynôme minimal est supérieur ou égal à $3.$

Pour continuer, vous effectuez l’opération élémentaire $L_4\leftarrow L_4-7L_1$ depuis la matrice $B_3$ ce qui fournit :

B_4 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 0 & 0 & -3 & -1 & 3 & -2 & -1 & -3 & 4 & -2 & -2 & 1 & 0\\ 0 & 3 & 9 & 4 & -9 & 5 & 4 & 6 & -10 & -7 & 0 & 0 & 1 \end{array}\end{pmatrix}.

Vous effectuez alors l’opération élémentaire $L_4\leftarrow L_4-3L_2$ ce qui fournit :

B_5 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 0 & 0 & -3 & -1 & 3 & -2 & -1 & -3 & 4 & -2 & -2 & 1 & 0\\ 0 & 0 & 3 & 1 & -3 & 2 & 1 & 3 & -4 & -4 & -3 & 0 & 1 \end{array}\end{pmatrix}.

Vous effectuez alors l’opération élémentaire $L_4\leftarrow L_4+L_3$ ce qui fournit :

B_5 = \begin{pmatrix}\begin{array}{ccccccccc|cccc} 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0\\ 0 & 1 & 2 & 1 & -2 & 1 & 1& 1 & -2 & -1 &1 & 0 & 0\\ 0 & 0 & -3 & -1 & 3 & -2 & -1 & -3 & 4 & -2 & -2 & 1 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & -6 & -5 & 1 & 1 \end{array}\end{pmatrix}.

Ce dernier calcul montre que $A^3+A^2-5A-6I = 0$ compte tenu de la dernière ligne.

Notez $P(X) = X^3+X^2-5X-6.$ Ce polynôme est unitaire et est celui de degré minimal annulant la matrice $A.$

Ainsi, c’est le polynôme minimal de $A.$

195. Inversibilité d’une matrice

Rédigé par Yannis TRIANTAPHYLIDESon 13/12/202113/12/2021| Niveau Prépa

Soit $A$ une matrice carrée d’ordre $n$ où $n$ désigne un entier naturel non nul, à coefficients dans un corps $\K.$

Supposez qu’il existe une matrice $B$ telle que $AB=I$ où $I$ désigne la matrice identité d’ordre $n.$

Vous allez démontrer que le produit $BA$ est aussi égal à $I$, ce qui établira que $AB=BA=I$ et donc que $A$ est inversible, avec $A^{-1} = B.$

Justifiez l’existence d’un polynôme annulateur de $A$

La matrice $A$ fait partie de l’ensemble des matrices carrées à $n$ éléments, qui est un $\K$-espace vectoriel de dimension $n^2.$ La famille $(I, A, …, A^{n^2})$ est donc liée. D’où l’existence d’un polynôme $P\in\K[X]$ non nul tel que $P(A)=0.$

Vous considérez donc l’ensemble $Q$ des entiers naturels $m$ tels qu’il existe un polynôme de degré $m$ annulant la matrice $A.$ D’après ce qui précède cet ensemble est une partie de $\N$ non vide, donc $Q$ admet un plus petit élément noté $p.$

Vous noterez dans la suite $\pi\in\K[X]$ un polynôme non nul, de degré $p$, tel que $\pi(A)=0.$

Démontrez que la matrice $B$ est un polynôme en $A$

Notez $\pi(X)=\sum_{k=0}^p \alpha_k X^k$, avec $\forall k\in\N, 0\leq k \leq p \implies \alpha_k\in\K.$

Vous avez $0 = \pi(A) = \sum_{k=0}^p \alpha_k A^k.$

Supposez un instant que $p = 0.$ Cela s’écrit $\alpha_0 I = 0$ donc $\alpha_0 = 0.$ Donc $\pi$ est le polynôme nul. Contradiction.

Donc $p\geq 1$ ce qui s’écrit $\alpha_0 I + \sum_{k=1}^p \alpha_k A^k = 0.$

Supposez alors que $\alpha_0 = 0.$

Vous déduisez $0 = \sum_{k=1}^p \alpha_k A^k.$ Multipliez à droite par $B.$

$0 = \sum_{k=1}^p \alpha_k A^kB$ et comme $AB = I$ il vient $0 = \sum_{k=1}^p \alpha_k A^{k-1}.$ Vous avez trouvé un polynôme de degré strictement inférieur à $p$ qui annule la matrice $A.$ Cela ne peut se produire, pour ne pas contredire la définition de $p$, que si ce polynôme est nul. Vous déduisez donc $\forall k\in\N, 1\leq k \leq p \implies \alpha_k = 0.$ Et comme $\alpha_0 = 0$ vous déduisez que $\pi$ est le polynôme nul. Contradiction.

C’est donc que $\alpha_0 \neq 0.$

Du coup, vous déduisez $I = \sum_{k=1}^p \frac{-\alpha_k}{\alpha_0} A^k.$ Multipliez à droite par $B$, vous déduisez $B =\sum_{k=1}^p \frac{-\alpha_k}{\alpha_0} A^{k-1}$ ce qui prouve l’existence d’un polynôme $R\in\K[X]$ tel que $B = R(A).$

Concluez

Comme $AB = I$, vous avez $AR(A) = I.$ Or par commutation de polynômes de matrices, vous avez $R(A)A = I$ ce qui s’écrit $BA = I.$

Prolongement

Pourriez-vous démontrer que, si vous supposez l’existence d’une matrice $B$ carrée telle que $BA = I$, alors vous avez aussi $AB =I$ ?

194. Déterminez la forme de Jordan d’une matrice avec des opérations élémentaires

Rédigé par Yannis TRIANTAPHYLIDESon 04/12/202128/04/2023| Niveau Prépa

Soit la matrice suivante :

\begin{align*} A = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &4 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

Comment obtenir sa forme de Jordan ?

Note. La matrice $A$ est triangulaire supérieure avec uniquement des zéros sur sa diagonale principale. Elle est donc nilpotente : il existe un entier $k$ tel que $A^k=0.$ (Vous pouvez vérifier que $A^7$ est la matrice nulle.)

Première étape : utilisez des dilatations pour changer le $4$ en $1$ dans la dernière colonne

Vous effectuez les deux opérations élémentaires sur la matrice $A$ : $L_2 \leftarrow 1/4 L_2$ et $C_2\leftarrow 4C_2$ ce qui fournit :

\begin{align*} A_1 = \begin{pmatrix} 0 & 4 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

Puis vous effectuez les deux opérations élémentaires sur la matrice $A_1$ : $L_1\leftarrow 1/4 L_1$ et $C_1\leftarrow 4C_1$ ce qui fournit :

\begin{align*} A_2 = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

En notant $D_1$ la première matrice de dilatation, vous avez :

$\begin{aligned} D_1 = \begin{pmatrix}1 & 0 & 0 & 0 &0 &0 &0 \\0 &4 &0 &0 &0 &0 &0 \\0 &0 &1 &0 &0 &0 &0 \\0 &0 &0 &1 &0 &0 &0 \\0 &0 &0 &0 &1 &0 &0 \\0 &0 &0 &0 &0 &1 &0\\0 &0 &0 &0 &0 &0 &1\end{pmatrix}.\end{aligned}$

Alors $D_1^{-1}AD_1 = A_1.$

En notant $D_2$ la deuxième matrice de dilatation, vous avez :

\begin{align*} D_2 = \begin{pmatrix} 4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix}. \end{align*}

Alors $D_2^{-1}A_1D_2 = A_2.$

Soit $D_2^{-1}D_1^{-1}AD_1D_2 = A_2.$

Deuxième étape : utilisez des transvections pour n’avoir qu’un seul $1$ dans la dernière colonne

L’idée consiste à partir du $1$ du dessus, associé à un bloc de Jordan de taille maximale, pour éliminer les autres.

Partez de la matrice $A_2$ ci-dessous :

\begin{align*} A_2 = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

Effectuez alors les opérations élémentaires $L_6\leftarrow L_6-L_2$ et $C_2\leftarrow C_2+C_6$ ce qui fournit :

\begin{align*} A_3 = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

Selon le positionnement des $1$ à éliminer, plusieurs transvections peuvent être utilisées. Dans le cas présent, une seule suffit.

La matrice de transvection associée est :

\begin{align*} T = \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &1 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix}. \end{align*}

Vous avez $T^{-1}A_2T = A_3$ et $T^{-1}D_2^{-1}D_1^{-1}AD_1D_2T = A_3.$

Troisième et dernière étape : utilisez une matrice de permutation pour obtenir la matrice de Jordan

Repartez de la matrice suivante :

\begin{align*} A_3 = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

Appliquez la matrice de permutation suivante :

\begin{align*} P = \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 & 0 & 0 & 1 &0 &0 &0 \\ 0 & 0 & 0 & 0 &1 &0 &0 \\ 0 & 0 & 0 & 0 &0 &1 &0 \\ 0 & 0 & 0 & 0 &0 &0 &1 \\ 0 & 0 & 1 & 0 &0 &0 &0 \end{pmatrix}. \end{align*}

Vous obtenez alors :

P^{-1}A_3P = J = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0 \\ 0 &0 &0 &0 &0 &0 &0\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix}.

Calculez la matrice de passage associée au processus et son inverse

Vous cherchez une matrice inversible $Q$ telle que $Q^{-1}AQ = J.$

D’après ce qui précède, vous pouvez choisir $Q = D_1D_2TP$, ce qui est égal à $ID_1D_2TP$ où $I$ est la matrice identité.

Pour obtenir $Q$ vous partez donc de la matrice identité et effectuez les opérations élémentaires suivantes dans cet ordre : $C_2\leftarrow 4C_2$, $C_1\leftarrow 4C_1$, $C_2\leftarrow C_2+C_6$ et la dernière qui place la colonne 7 à la place de la troisième et décale toutes les autres sur la droite, à savoir $(C_1,C_2,C_3,C_4,C_5,C_6,C_7)\rightarrow (C_1,C_2,C_7, C_3,C_4,C_5,C_6).$

\begin{align*} I = \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} &\xrightarrow[C_2\leftarrow 4C_2]{} \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 &4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} \xrightarrow[C_1\leftarrow 4C_1]{} \begin{pmatrix} 4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix}\\ &\xrightarrow[C_2\leftarrow C_2+C_6]{} \begin{pmatrix} 4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &1 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} \\ &\xrightarrow[(C_1,C_2,C_3,C_4,C_5,C_6,C_7)\rightarrow (C_1,C_2,C_7, C_3,C_4,C_5,C_6)]{} Q=\begin{pmatrix} 4 & 0&0 & 0 & 0 &0 &0 \\ 0 &4&0 &0 &0 &0 &0 \\ 0 &0&0 &1 &0 &0 &0 \\ 0 &0&0 &0 &1 &0 &0 \\ 0 &0&0 &0 &0 &1 &0 \\ 0 &1&0 &0 &0 &0 &1 \\ 0 &0&1 &0 &0 &0 &0 \end{pmatrix}. \end{align*}

D’après ce qui précède, vous avez $Q^{-1} = (D_1D_2TP)^{-1} = P^{-1}T^{-1}D_2^{-1}D_1^{-1}$, ce qui est égal à $P^{-1}T^{-1}D_2^{-1}D_1^{-1}I.$

Pour obtenir $Q^{-1}$ vous partez donc de la matrice identité et effectuez les opérations élémentaires suivantes dans cet ordre : $L_2\leftarrow 1/4 L_2$, $L_1\leftarrow 1/4 L_1$, $L_6\leftarrow L_6-L_2$ et la dernière qui place la ligne 7 à la place de la troisième et décale toutes les autres sur le fond, à savoir $(L_1,L_2,L_3,L_4,L_5,L_6,L_7)\rightarrow (L_1,L_2,L_7, L_3,L_4,L_5,L_6).$

\begin{align*} I = \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} &\xrightarrow[L_2\leftarrow 1/4 L_2]{} \begin{pmatrix} 1 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1/4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} \xrightarrow[L_1\leftarrow 1/4 L_1]{} \begin{pmatrix} 1/4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1/4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix}\\ &\xrightarrow[L_6\leftarrow L_6-L_2]{} \begin{pmatrix} 1/4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1/4 &0 &0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &-1/4 &0 &0 &0 &1 &0\\ 0 &0 &0 &0 &0 &0 &1 \end{pmatrix} \\ &\xrightarrow[(L_1,L_2,L_3,L_4,L_5,L_6,L_7)\rightarrow (L_1,L_2,L_7, L_3,L_4,L_5,L_6)]{} Q^{-1}=\begin{pmatrix} 1/4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1/4 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &-1/4 &0 &0 &0 &1 &0 \end{pmatrix}. \end{align*}

Concluez

Vous avez obtenu $Q^{-1}AQ = J$ avec :

\begin{align*} A = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &4 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix} \qquad J = \begin{pmatrix} 0 & 1 & 0 & 0 &0 &0 &0 \\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &0 &0 &0 &0 &1 &0 \\ 0 &0 &0 &0 &0 &0 &0\\ 0 &0 &0 &0 &0 &0 &0 \end{pmatrix} \end{align*}

\begin{align*} Q = \begin{pmatrix} 4 & 0&0 & 0 & 0 &0 &0 \\ 0 &4&0 &0 &0 &0 &0 \\ 0 &0&0 &1 &0 &0 &0 \\ 0 &0&0 &0 &1 &0 &0 \\ 0 &0&0 &0 &0 &1 &0 \\ 0 &1&0 &0 &0 &0 &1 \\ 0 &0&1 &0 &0 &0 &0 \end{pmatrix} \qquad Q^{-1} = \begin{pmatrix} 1/4 & 0 & 0 & 0 &0 &0 &0 \\ 0 &1/4 &0 &0 &0 &0 &0 \\ 0 &0 &0 &0 &0 &0 &1\\ 0 &0 &1 &0 &0 &0 &0 \\ 0 &0 &0 &1 &0 &0 &0 \\ 0 &0 &0 &0 &1 &0 &0 \\ 0 &-1/4 &0 &0 &0 &1 &0 \end{pmatrix}. \end{align*}

193. Un ensemble qui n’admet pas de plus grand élément

Rédigé par Yannis TRIANTAPHYLIDESon 03/12/202103/12/2021| Niveau Prépa

Considérez la partie $A$ suivante de l’ensemble des rationnels $\Q$, définie par :

$A=\left\{\frac{m}{n}, m\in\N, n\in\N^{*}\text{ et } \left(\frac{m}{n}\right)^2<2\right\}.$

Vous allez montrer que $A$ n’admet pas de plus grand élément.

En effet, soient deux entiers $m\in\N$, $n\in\N^{*}$ tels que $ \left(\frac{m}{n}\right)^2<2.$

Considérez le rationnel $q$ défini par $q = \frac{3m+4n}{2m+3n}$, bien défini puisque $2m+3n \geq 3n\geq 3.$

Montrez que $q$ est strictement supérieur à $\frac{m}{n}$

Vous avez les inégalités suivantes :

$\begin{aligned} m^2&<2n^2 \\2m^2 &< 4n^2\\2m^2+3mn &< 4n^2+3mn\\m(2m+3n) &< n(4n+3m)\\\frac{m}{n} &< \frac{4n+3m}{2m+3n}\\\frac{m}{n} &< q.\end{aligned}$

Montrez que $q$ appartient à l’ensemble $A$

Vous avez déjà $4n+3m\in\N$ et $2m+3n\in\N^{*}.$

Calculez la différence suivante :

$\begin{aligned} \left(\frac{4n+3m}{2m+3n}\right)^2 -2 &= \frac{(4n+3m)^2}{(2m+3n)^2}-2 \\&= \frac{(4n+3m)^2-2(2m+3n^2)}{(2m+3n)^2} \\&= \frac{ 16n^2+9m^2+24mn -2(4m^2+9n^2+12mn)}{(2m+3n)^2} \\&= \frac{ 16n^2+9m^2+24mn -8m^2-18n^2-24mn}{(2m+3n)^2} \\&= \frac{m^2 -2n^2}{(2m+3n)^2}.\end{aligned}$

Elle est strictement négative vu que $m^2 < 2n^2.$

D’où $q\in A.$

Concluez

Vous avez montré que pour tout nombre appartenant à $A$, il existe un nombre appartenant à $A$ qui lui est strictement supérieur.

Donc l’ensemble $A$ n’admet pas de plus grand élément.

Prolongement

En suivant une démarche similaire, pourriez-vous prouver aussi que l’ensemble défini par :

$B=\left\{\frac{m}{n}, m\in\N, n\in\N^{*}\text{ et } \left(\frac{m}{n}\right)^2<3\right\}$

n’admet pas de plus grand élément ?

192. Le théorème de Heine

Rédigé par Yannis TRIANTAPHYLIDESon 28/11/202118/03/2022| Niveau Agrégation, Niveau Capes, Niveau Prépa

Ce théorème est attribué à Eduard Heine et date de 1872. Il s’énonce ainsi.

Quels que soient les réels $a$ et $b$ tels que $a<b$ et quelle que soit $f: [a,b]\to \R$ une fonction continue, $f$ est uniformément continue sur $[a,b].$

Continuité et continuité uniforme

Le fait que $f$ soit continue sur $[a,b]$ s’exprime ainsi :

$\begin{aligned} \forall x\in [a,b], \forall \varepsilon > 0, \exists \delta >0, \forall y\in[a,b], \lvert y-x \rvert\leq \delta \implies \lvert f(y)-f(x)\rvert \leq \varepsilon.\end{aligned}$

Il s’agit démontrer sous cette hypothèse la continuité uniforme de $f$ sur $[a,b]$, à savoir :

$\begin{aligned} \forall \varepsilon > 0, \exists \delta >0, \forall x\in [a,b], \forall y\in[a,b], \lvert y-x \rvert\leq \delta \implies \lvert f(y)-f(x)\rvert \leq \varepsilon.\end{aligned}$

De nombreuses démonstrations se basent sur des suites, des suites extraites et le raisonnement par l’absurde. D’autres utilisent la notion de compacité du segment $[a,b]$, qui, recouvert par des ouverts bien choisis, et extraction d’un sous-recouvrement fini, permettent d’aboutir à une démonstration.

Dans cet article vous utiliserez une preuve directe reposant sur la propriété de la borne supérieure des réels : toute partie non vide et majorée de $\R$ admet une borne supérieure, c’est-à-dire un plus petit majorant pour cette partie.

Fixez deux réels $a$ et $b$ tels que $a<b.$ Soit $f: [a,b]\to \R$ une fonction continue et $\varepsilon$ un réel strictement positif.

Une notation utile

On dit que $f$ possède la propriété $P$ sur un intervalle $I\subset[a,b]$, si et seulement si : $\exists \delta > 0, \forall z,z’\in I, \lvert z-z’\rvert\leq \delta \implies \lvert f(z)-f(z’)\rvert \leq \varepsilon.$

De cette définition, on tire immédiatement le fait que si $J$ est un sous-intervalle d’un intervalle $I\subset[a,b]$ et si $f$ possède la propriété $P$ sur $I$, alors $f$ possède la propriété $P$ sur $J.$

Lemme $1$ : caractère local de la propriété $P$

Soit $c$ un réel appartenant à l’intervalle $[a,b].$

Alors il existe un réel $r$ strictement positif tel que $f$ possède la propriété $P$ sur l’intervalle $[a,b]\cap [c-r, c+r].$

En effet, $f$ est continue en $c.$

Il existe donc un réel $r$ strictement positif tel que $\forall x\in[a,b], \lvert x-c\rvert \leq r \implies \lvert f(x)-f(c)\rvert \leq \frac{\varepsilon}{2}.$

Soient maintenant $z$ et $z’$ deux réels de l’intervalle $[a,b]\cap [c-r, c+r].$

Comme $\lvert z-c\rvert \leq r$ et $\lvert z’-c\rvert \leq r$ il vient $\lvert f(z)-f(c)\rvert \leq \frac{\varepsilon}{2}$ et $\lvert f(z’)-f(c)\rvert \leq \frac{\varepsilon}{2}.$

D’après l’inégalité triangulaire :

$\begin{aligned} \lvert f(z)-f(z’) \rvert &\leq \lvert f(z)-f(c) \rvert + \lvert f(z’)-f(c) \rvert\\&\leq \frac{\varepsilon}{2} + \frac{\varepsilon}{2}\\&\leq \varepsilon.\end{aligned}$

Ce qui conclut.

Le lemme suivant sera aussi très utile dans la suite.

Lemme $2$ : recollement d’intervalles

Supposez que $u$, $v$ et $w$ sont trois réels de l’intervalle $[a,b]$ tels que $u<v<w$, de sorte que : $f$ ait la propriété $P$ sur l’ intervalle $[u,v]$ et $f$ ait aussi la propriété $P$ sur l’intervalle $[v,w].$

Vous allez montrer que $f$ possède la propriété $P$ sur l’intervalle $[u,w].$

Vous avez tout d’abord l’existence de deux réels strictement positifs $\delta_1$ et $\delta_2$ tels que :

$\forall z,z’\in [u,v], \lvert z-z’\rvert\leq \delta_1 \implies \lvert f(z)-f(z’)\rvert \leq \varepsilon.$

$\forall z,z’\in [v,w], \lvert z-z’\rvert\leq \delta_2 \implies \lvert f(z)-f(z’)\rvert \leq \varepsilon.$

Le recollement va être dû à la continuité de $f$ en $v$.

En effet, il existe $\delta_3>0$ tel que $\forall x\in [a,b], \lvert x-v\rvert\leq \delta_3 \implies \lvert f(x)-f(v)\rvert \leq \frac{\varepsilon}{2}.$

Posez alors $\delta = \mathrm{Min}(\delta_1, \delta_2,\delta_3).$

Considérez deux réels $z$ et $z’$ appartenant à l’intervalle $[u,w]$ et tels que $\lvert z-z’\rvert\leq \delta.$

1er cas : $z\in[u,v]$ et $z’\in[u,v].$ Comme $\lvert z-z’\rvert\leq \delta \leq \delta_1$ il vient $\lvert f(z)-f(z’)\rvert \leq \varepsilon.$

2ème cas : $z\in[u,v]$ et $z’\notin[u,v].$ Alors $z’\in[v,w].$ Alors :

$\lvert z-v\rvert \leq \lvert z-z’\rvert\leq \delta \leq \delta_3.$

De même :

$\lvert z’-v\rvert \leq \lvert z-z’\rvert\leq \delta \leq \delta_3.$

Donc $\lvert f(z)-f(v)\rvert \leq \frac{\varepsilon}{2}$ et $\lvert f(z’)-f(v)\rvert \leq \frac{\varepsilon}{2}.$

L’inégalité triangulaire fournit :

$\begin{aligned} \lvert f(z)-f(z’) \rvert &\leq \lvert f(z)-f(v) \rvert + \lvert f(z’)-f(v) \rvert\\&\leq \frac{\varepsilon}{2} + \frac{\varepsilon}{2}\\&\leq \varepsilon.\end{aligned}$

3ème cas : $z\notin[u,v]$ et $z’\in[u,v].$ Alors $z\in[v,w].$ Il s’agit du cas numéro 2 où $z$ et $z’$ ont été échangés. Vous obtenez alors $\lvert f(z)-f(z’) \rvert \leq \varepsilon.$

4ème cas : $z\notin[u,v]$ et $z’\notin[u,v].$ Alors $z,z’\in[v,w].$ Comme $\lvert z-z’\rvert\leq \delta \leq \delta_2$ il vient $\lvert f(z)-f(z’)\rvert \leq \varepsilon.$

Ainsi $f$ possède bien la propriété $P$ sur l’intervalle $[u,w].$

Passez maintenant à la démonstration du théorème de Heine

Considérez pour cela l’ensemble $A = \{x\in[a,b],$ $f$ possède la propriété $P$ sur l’intervalle $[a,x].\}$

Montrez que $A$ contient un élément strictement supérieur à $a$

En appliquant le lemme $1$, avec $c=a$ vous avez l’existence d’un réel $r>0$ tel que $f$ possède la propriété $P$ sur l’intervalle $[a,b]\cap[a-r, a+r].$

Posez $a_0 = a+ \mathrm{Min}(b-a, r)$. Alors $a<a_0\leq b$ et $f$ possède la propriété $P$ sur l’intervalle $[a, a_0].$

Donc $a_0\in A.$

Montrez que $A$ admet une borne supérieure

La partie $A$ est une partie de $\R$ non vide (puisqu’elle contient $a_0$) et qui est majorée par $b.$

Donc elle admet une borne supérieure $\alpha.$

Comme $a_0\in A$ il vient $a_0\leq \alpha$ puisque la borne supérieure de $A$ est un majorant de $A.$

Le nombre $b$ majore $A$, or le plus petit des majorants de $A$ est $\alpha$, donc $\alpha\leq b.$

Ainsi $a<a_0\leq \alpha \leq b.$

Montrez que la borne supérieure $\alpha$ est égale à $b$

Ce point est délicat.

Raisonnez par l’absurde en supposant $\alpha \neq b.$ Alors $a < \alpha < b.$

Appliquez le lemme $1$ avec $c=\alpha.$ Il existe un réel $r’>0$ tel que $f$ possède la propriété $P$ sur l’intervalle $[a,b]\cap[\alpha-r’, \alpha+r’].$

Posez alors $r = \mathrm{Min}(r’, b-\alpha, \alpha-a)>0.$ Alors $a\leq \alpha-r\leq \alpha+r\leq b.$

Alors $f$ possède la propriété $P$ sur $[\alpha-r, \alpha+r].$

Or $\alpha-r < \alpha$, donc $\alpha-r$ ne peut majorer $A$ donc il existe $d\in A$ tel que $\alpha-r<d.$ Comme $f$ possède la propriété $P$ sur $[a, d]$ vous déduisez que $f$ possède aussi la propriété $P$ sur $[a, \alpha-r].$

Utilisant le lemme $2$ de recollement, vous déduisez que $f$ admet la propriété $P$ sur $[a, \alpha+r]$, donc $\alpha+r\in A.$

Or $\alpha$ majore $A$ donc $\alpha+r \leq \alpha$ donc $r\leq 0$ contradiction.

Concluez

D’après ce qui précède, la borne supérieure de $A$ est égale à $b.$

Or, en appliquant le lemme $1$ à $c=b$ vous déduisez l’existence d’un réel $r’>0$ tel que $f$ possède la propriété $P$ sur $[a,b]\cap [b-r’, b+r’].$

Posez alors $r = \mathrm{Min}(r’,b-a)> 0.$ Vous avez $a\leq b-r < b.$

La fonction $f$ possède la propriété $P$ sur l’intervalle $[b-r, b]\subset [a,b]\cap [b-r’, b+r’].$

Or $b-r < b$ donc $b-r$ ne peut majorer $A$ donc il existe $d\in A$ tel que $b-r< d.$

La fonction $f$ possède la propriété $P$ sur l’intervalle $[a,d]$ donc $f$ possède aussi la propriété $P$ sur l’intervalle $[a,b-r].$

Utilisant le lemme $2$ de recollement vous déduisez que $f$ possède la propriété $P$ sur l’intervalle $[a,b].$

Cela termine la démonstration du théorème de Heine.

191. Calcul de la somme de la suite formée par les dérivées des termes consécutifs d’une suite géométrique

Rédigé par Yannis TRIANTAPHYLIDESon 23/11/202127/11/2021| Niveau Prépa

Soit $q$ un nombre réel positif tel que $q<1.$

Pour tout entier naturel $n\geq 3$, vous considérez $u_n = 1+2q+3q^2+4q^3+\cdots+(n+1)q^n.$

Autrement dit, pour tout $n\geq 0$ vous avez $u_n = \sum_{k=0}^n (k+1)q^k.$

Le but de cet article est de montrer que la limite $\lim_{n\to +\infty} u_n$ existe et de calculer sa valeur.

Ramenez-vous à une suite géométrique

Soit $n$ un entier naturel supérieur ou égal à $1.$

$\begin{aligned} q\times u_n &= \sum_{k=0}^n (k+1)q^{k+1} \\&= \sum_{k=1}^{n+1} kq^{k}\\&= \sum_{k=1}^{n} kq^{k} + (n+1)q^n.\end{aligned}$

Or $u_n = 1 + \sum_{k=1}^n (k+1)q^k.$

Il vient :

$\begin{aligned} u_n-q\times u_n &= \sum_{k=1}^n (k+1)q^k -\sum_{k=1}^{n} kq^{k} + 1 – (n+1)q^n\\&=\sum_{k=1}^n q^k + 1 – (n+1)q^n\\&=\sum_{k=0}^n q^k – (n+1)q^n\\&=\frac{1-q^{n+1}}{1-q} – (n+1)q^n\end{aligned}$

Vous déduisez $u_n=\frac{\frac{1-q^{n+1}}{1-q} – (n+1)q^n}{1-q}.$

Déduisez la valeur de la somme

Soit $x$ un nombre réel positif et $n$ un entier supérieur ou égal à $2.$

Le développement de $(1+x)^n$ par la formule du binôme fournit l’inégalité $(1+x)^n \geq \frac{n(n-1)}{2}x^2.$

Par suite, comme $1/q$ est strictement supérieur à $1$, vous avez $1/q = 1+x$ avec $x>0$ et $\frac{(1/q)^n}{n} \geq \frac{n-1}{2}x^2$ donc $\lim_{n\to +\infty} \frac{(1/q)^n}{n} = +\infty$ soit $\lim_{n\to +\infty} nq^n = 0.$

Comme $0\leq q^n \leq nq^n$ vous retrouvez par le théorème des gendarmes que $\lim_{n\to +\infty} q^n = 0.$

Vous déduisez $\lim_{n\to +\infty} (n+1)q^n =0$ et $\lim_{n\to +\infty} q^{n+1} =0.$

Il vient immédiatement $\lim_{n\to +\infty} u_n = \frac{1}{(1-q)^2.}$

Il est ainsi prouvé que pour tout $q\in[0,1[, \boxed{\sum_{k=0}^{+\infty} (k+1)q^k = \frac{1}{(1-q)^2}.}$

Prolongement

Justifiez que le résultat s’étend à un intervalle plus large.

Montrez que pour tout $q\in]-1,1[, \sum_{k=0}^{+\infty} (k+1)q^k = \frac{1}{(1-q)^2}.$

190. Les équations de Cauchy-Riemann avec les parties réelles et imaginaires

Rédigé par Yannis TRIANTAPHYLIDESon 22/11/202122/11/2021| Niveau Agrégation, Niveau Capes, Niveau Prépa

Dans cet article, $z_0$ désigne un nombre complexe fixé.

Il s’écrit sous la forme unique $z_0=x_0+iy_0$ où $x_0$ et $y_0$ sont deux nombres réels.

Supposez qu’il existe un nombre réel $r$ strictement positif tel que $f$ soit une fonction définie sur $B = \{z\in\C, \lvert z-z_0\rvert<r\}$ (boule ouverte de centre $z_0$ et de rayon $r$) à valeurs dans $\C.$

Supposez de plus que la fonction $f$ est dérivable au sens complexe en $z_0$, autrement dit il existe un nombre complexe noté $f'(z_0)$ tel que :

$\begin{aligned} \forall \varepsilon > 0, \exists \delta > 0, \forall h\in \C, 0<\lvert h \rvert < \mathrm{Min}(\delta,r) \implies \left\lvert\frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right\rvert \leq \varepsilon.\end{aligned}$

Ceci est noté $\lim_{\substack{h\to 0\\h\in\C}} \frac{f(z_0+h)-f(z_0)}{h} = f'(z_0).$

Avant de commencer les démonstrations proprement dites sur les équations de Cauchy-Riemann il sera très utile de faire le lien entre les parties réelles et imaginaires.

Un petit lemme sur les parties réelles et imaginaires

Soit $z$ un nombre complexe. Il existe un unique couple de réels $(x,y)$ tel que $z = x+iy.$

On note $x = \mathrm{Re}(z)$ et $y = \mathrm{Im}(z)$.

Notez que $iz = -y + ix = – \mathrm{Im}(z) + i \mathrm{Re}(z).$

Vous obtenez alors le résultat suivant, valable pour tout nombre complexe $z$ :

$\boxed{\mathrm{Re}(iz) = -\mathrm{Im}(z)}$ et $\boxed{\mathrm{Im}(iz) = \mathrm{Re}(z).}$

Définissez les fonctions de deux variables qui correspondent à la partie réelle et à la partie imaginaire

Notez :

$\begin{aligned} C = \left\{(x_0+h, y_0+k), (h,k)\in\left]\frac{-r\sqrt{2}}{2}, \frac{r\sqrt{2}}{2}\right[^2\right\}\end{aligned}$

qui est un carré centré en $(x_0,y_0)$ avec $C\subset \R^2.$

Il convient de remarquer que $\forall (x,y)\in C, x+iy\in U.$

Cela conduit aux définitions suivantes.

Pour tout $(x,y)\in C$ vous posez $\boxed{u(x,y) = \mathrm{Re}(f(x+iy))}$ et $\boxed{v(x,y) = \mathrm{Im}(f(x+iy)).}$

Démontrez la première relation de Cauchy-Riemann $\frac{\partial u}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0)$

Il s’agit de démontrer que la fonction $u$ admet une dérivée partielle par rapport à la première variable en $(x_0,y_0)$, notée $\frac{\partial u}{\partial x}(x_0,y_0)$ puis de démontrer que la fonction $v$ admet aussi une dérivée partielle par rapport à la seconde variable, notée $\frac{\partial v}{\partial y}(x_0,y_0)$ puis d’arriver à l’égalité $\frac{\partial u}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0).$

Soit $\varepsilon$ un nombre réel strictement positif.

Il existe alors un nombre réel $\delta$ strictement positif tel que:

$\begin{aligned} \forall h\in \C, 0<\lvert h \rvert < \mathrm{Min}(\delta,r) \implies \left\lvert\frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right\rvert \leq \varepsilon.\end{aligned}$

Soit maintenant $h$ un réel tel que $0 < \lvert h \rvert < \mathrm{Min}\left(\delta,\frac{r\sqrt{2}}{2}\right).$

$\begin{aligned} \left\lvert \frac{u(x_0+h,y_0)-u(x_0,y_0)}{h}-\mathrm{Re}(f'(z_0))\right\rvert &\leq \left\lvert \frac{\mathrm{Re}(f(x_0+h+iy_0))-\mathrm{Re}(f(x_0+iy_0))}{h}-\mathrm{Re}(f'(z_0))\right\rvert \\ &\leq \left\lvert \mathrm{Re}\left(\frac{f(x_0+h+iy_0)-f(x_0+iy_0)}{h}\right) -\mathrm{Re}(f'(z_0)) \right\rvert\\ &\leq \left\lvert \mathrm{Re}\left(\frac{f(z_0+h)-f(z_0)}{h}\right) -\mathrm{Re}(f'(z_0)) \right\rvert\\&\leq \left\lvert \mathrm{Re}\left(\frac{f(z_0+h)-f(z_0)}{h} – f'(z_0)\right) \right\rvert\\&\leq \left\lvert \frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right\rvert\\&\leq \varepsilon.\end{aligned}$

Il est ainsi démontré que la fonction $u$ admet une dérivée partielle par rapport à la première variable en $(x_0,y_0)$ et que $\boxed{\frac{\partial u}{\partial x}(x_0,y_0) = \mathrm{Re}(f'(z_0)).}$

Il s’agit maintenant de passer à la fonction $v.$

Remarquez que $\lvert ih \rvert = \lvert h \rvert$ donc:

$\begin{aligned} \left\lvert\frac{f(z_0+ih)-f(z_0)}{ih} – f'(z_0) \right\rvert \leq \varepsilon.\end{aligned}$

Il vient les majorations suivantes:

$\begin{aligned} \left\lvert \frac{v(x_0,y_0+h)-v(x_0,y_0)}{h}-\mathrm{Re}(f'(z_0))\right\rvert &\leq \left\lvert \frac{\mathrm{Im}(f(x_0+iy_0+ih))-\mathrm{Im}(f(x_0+iy_0))}{h}-\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \frac{\mathrm{Im}(f(x_0+iy_0+ih)-f(x_0+iy_0))}{h}-\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Im}\left(\frac{f(x_0+iy_0+ih)-f(x_0+iy_0)}{h}\right) -\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Im}\left(\frac{f(z_0+ih)-f(z_0)}{h}\right) -\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Im}\left(i\times \frac{f(z_0+ih)-f(z_0)}{ih}\right) -\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Re}\left( \frac{f(z_0+ih)-f(z_0)}{ih}\right) -\mathrm{Re}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Re}\left( \frac{f(z_0+ih)-f(z_0)}{ih}-f'(z_0)\right) \right\rvert \\&\leq \left\lvert \frac{f(z_0+ih)-f(z_0)}{ih}-f'(z_0) \right\rvert \\&\leq \varepsilon.\end{aligned}$

Il est ainsi démontré que la fonction $v$ admet une dérivée partielle par rapport à la deuxième variable en $(x_0,y_0)$ et que $\boxed{\frac{\partial v}{\partial y}(x_0,y_0) = \mathrm{Re}(f'(z_0)).}$

Vous en déduisez que $\boxed{\frac{\partial u}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0).}$

Démontrez la deuxième relation de Cauchy-Riemann $\frac{\partial u}{\partial y}(x_0,y_0) = -\frac{\partial v}{\partial x}(x_0,y_0)$

Il s’agit de démontrer que la fonction $u$ admet une dérivée partielle par rapport à la deuxième variable en $(x_0,y_0)$, notée $\frac{\partial u}{\partial y}(x_0,y_0)$ puis de démontrer que la fonction $v$ admet aussi une dérivée partielle par rapport à la première variable, notée $\frac{\partial v}{\partial x}(x_0,y_0)$ puis d’arriver à l’égalité $\frac{\partial u}{\partial y}(x_0,y_0) = -\frac{\partial v}{\partial x}(x_0,y_0).$

Soit $\varepsilon$ un nombre réel strictement positif.

Il existe alors un nombre réel $\delta$ strictement positif tel que:

$\begin{aligned} \forall h\in \C, 0<\lvert h \rvert < \mathrm{Min}(\delta,r) \implies \left\lvert\frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right\rvert \leq \varepsilon.\end{aligned}$

Soit maintenant $h$ un réel tel que $0 < \lvert h \rvert < \mathrm{Min}\left(\delta,\frac{r\sqrt{2}}{2}\right).$ Notez encore que $\lvert ih \rvert = \lvert h \rvert$ donc:

$\begin{aligned} \left\lvert\frac{f(z_0+ih)-f(z_0)}{ih} – f'(z_0) \right\rvert \leq \varepsilon.\end{aligned}$

Il vient successivement:

$\begin{aligned} \left\lvert \frac{u(x_0,y_0+h)-u(x_0,y_0)}{h}-\left[-\mathrm{Im}(f'(z_0))\right]\right\rvert &\leq \left\lvert \frac{\mathrm{Re}(f(x_0+iy_0+ih))-\mathrm{Re}(f(x_0+iy_0))}{h}+\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \frac{\mathrm{Re}(f(z_0+ih))-\mathrm{Re}(f(z_0))}{h}+\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Re} \left(\frac{f(z_0+ih)-f(z_0)}{h}\right) +\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Re} \left(i\times \frac{f(z_0+ih)-f(z_0)}{ih}\right) +\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert -\mathrm{Im} \left( \frac{f(z_0+ih)-f(z_0)}{ih}\right) +\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Im} \left( f'(z_0) – \frac{f(z_0+ih)-f(z_0)}{ih} \right) \right\rvert \\&\leq \left\lvert f'(z_0) – \frac{f(z_0+ih)-f(z_0)}{ih} \right\rvert \\&\leq \left\lvert \frac{f(z_0+ih)-f(z_0)}{ih} – f'(z_0) \right\rvert \\&\leq \varepsilon.\end{aligned}$

Il est ainsi démontré que la fonction $u$ admet une dérivée partielle par rapport à la deuxième variable en $(x_0,y_0)$ et que $\boxed{\frac{\partial u}{\partial y}(x_0,y_0) = -\mathrm{Im}(f'(z_0)).}$

$\begin{aligned} \left\lvert \frac{v(x_0+h,y_0)-v(x_0,y_0)}{h}-\mathrm{Im}(f'(z_0))\right\rvert &\leq \left\lvert \frac{\mathrm{Im}(f(x_0+h+iy_0))-\mathrm{Im}(f(x_0+iy_0))}{h}-\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \frac{\mathrm{Im}(f(z_0+h))-\mathrm{Im}(f(z_0))}{h}-\mathrm{Im}(f'(z_0))\right\rvert \\&\leq \left\lvert \mathrm{Im}\left( \frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right)\right\rvert \\&\leq \left\lvert\frac{f(z_0+h)-f(z_0)}{h} – f'(z_0) \right\rvert \\&\leq \varepsilon.\end{aligned}$

Il est ainsi démontré que la fonction $v$ admet une dérivée partielle par rapport à la première variable en $(x_0,y_0)$ et que $\boxed{\frac{\partial v}{\partial x}(x_0,y_0) = \mathrm{Im}(f'(z_0)).}$

Vous en déduisez que $\boxed{\frac{\partial u}{\partial y}(x_0,y_0) = -\frac{\partial v}{\partial x}(x_0,y_0).}$

189. Théorème de Mertens sur les séries

Rédigé par Yannis TRIANTAPHYLIDESon 20/11/202123/01/2022| Niveau Agrégation, Niveau Capes, Niveau Prépa

Dans cet article vous allez prouver un résultat attribué à un mathématicien allemand Franz Mertens, qui a prouvé une propriété de convergence sur les séries de nombres complexes.

Soient $\sum_{n\geq 0} a_n$ et $\sum_{n\geq 0} b_n$ deux séries de nombres complexes.

Supposez que $\sum_{n\geq 0} b_n$ converge vers un nombre complexe $b$ noté $\sum_{n=0}^{+\infty} b_n$ et que la série $\sum_{n\geq 0} a_n$ est absolument convergente, autrement dit $\sum_{n = 0}^{+\infty} \lvert a_n \rvert < +\infty.$

Alors la série $\sum_{n\geq 0} a_n$ est convergente, vous notez $a = \sum_{n= 0}^{+\infty} a_n.$

Pour tout entier naturel $n$ vous posez $c_n =\sum_{k=0}^n a_kb_{n-k}.$ La série $\sum_{n \geq 0} c_n$ est appelée produit de Cauchy des séries $\sum_{n\geq 0} a_n$ et $\sum_{n\geq 0} b_n.$

Sous les hypothèses ci-dessus, vous allez démontrer que la série $\sum_{n \geq 0} c_n$ est convergente et que sa somme $\sum_{n =0}^{+\infty} c_n$ est égale au produit $ab = \left(\sum_{n = 0}^{+\infty} a_n\right)\left(\sum_{n = 0}^{+\infty} b_n\right).$

Trouvez une écriture convenable pour la somme $\sum_{p=0}^n c_p$

Calculez les premiers termes :

$\begin{aligned} c_0 &= a_0b_0\\c_1 &= a_0b_1+a_1b_0\\c_2 &= a_0b_2+a_1b_1+a_2b_0.\end{aligned}$

Si bien que :

$\begin{aligned} c_0 +c_1+c_2&= a_0(b_0+b_1+b_2)+a_1(b_0+b_1)+a_2b_0.\end{aligned}$

Pour tout entier naturel $n$, posez $\boxed{B_n = \sum_{p=0}^n b_p.}$

Vous obtenez :

$\begin{aligned} c_0 +c_1+c_2&= a_0B_2+a_1B_1+a_2B_0.\end{aligned}$

Généralisez avec une récurrence.

Pour tout entier naturel $n$, notez $P(n)$ la propriété suivante : « $\sum_{p=0}^n c_p = \sum_{p=0}^n a_pB_{n-p}$. »

Initialisation. Pour $n=0$ :

$\begin{aligned} \sum_{p=0}^n c_p &= c_0 \\ &= a_0b_0 \\ &= a_0B_0 \\ &= \sum_{p=0}^n a_pB_{n-p}.\end{aligned}$

Hérédité. Soit $n$ un entier naturel fixé tel que $P(n)$ soit vérifiée.

$\begin{aligned} \sum_{p=0}^{n+1} c_p &= \sum_{p=0}^{n} c_p + c_{n+1}\\&= \sum_{p=0}^n a_pB_{n-p} +c_{n+1}\\&= \sum_{p=0}^n a_pB_{n-p} +\sum_{p=0}^{n+1} a_p b_{n+1-p}\\&= \sum_{p=0}^n a_pB_{n-p} +\sum_{p=0}^{n} a_p b_{n+1-p} + a_{n+1}b_0\\&= \sum_{p=0}^n a_p (B_{n-p} + b_{n+1-p}) + a_{n+1}b_0\\&= \sum_{p=0}^n a_p (B_{n-p} + b_{n-p+1}) + a_{n+1}b_0\\&= \sum_{p=0}^n a_p \left(\sum_{k=0}^{n-p} b_k + b_{n-p+1}\right) + a_{n+1}b_0\\&= \sum_{p=0}^n a_p \left(\sum_{k=0}^{n-p+1} b_k\right) + a_{n+1}b_0\\&= \sum_{p=0}^n a_p B_{n+1-p} + a_{n+1}b_0\\&= \sum_{p=0}^n a_p B_{n+1-p} + a_{n+1}B_0\\&= \sum_{p=0}^{n+1} a_p B_{n+1-p}.\end{aligned}$

Donc $P(n+1)$ est vérifiée.

Conclusion. Par récurrence vous avez établi que :

$\begin{aligned} \boxed{\forall n\in\N, \sum_{p=0}^n c_p = \sum_{p=0}^n a_pB_{n-p}.}\end{aligned}$

Démontrez que $\lim_{n\to +\infty} \sum_{p=0}^n c_p = ab$

Par définition de la suite $(B_n)_{n\geq 0}$ vous avez $\lim_{n\to +\infty} B_n = b.$ Cette suite étant convergente, elle est bornée : il existe un réel $M$ strictement positif tel que, pour tout $n\in\N$, $\lvert B_n \rvert \leq M.$

Soit maintenant $\varepsilon$ un réel strictement positif.

Comme $\lim_{n\to +\infty} \sum_{p=0}^n a_p = a$, il existe un entier naturel $N_1$ tel que, pour tout $n\geq N_1$, $\left\lvert \sum_{p=0}^n a_p -a \right\rvert\leq \frac{\varepsilon / 3}{\lvert b \rvert +1}.$

Comme $\sum_{k=0}^{+\infty} \lvert a_k \rvert < +\infty$, il existe un entier naturel $N_2$ tel que, pour tout $n\geq N_2$, $\sum_{k=n}^{+\infty} \lvert a_k \rvert \leq \frac{\varepsilon / 3}{M + \lvert b \rvert }.$

Comme $\lim_{n\to +\infty}B_n = b $, il existe un entier naturel $N_3$ tel que, pour tout $n\geq N_3$, $\left\lvert B_n -b \right\rvert \leq \frac{\varepsilon / 3}{1+ \sum_{k=0}^{+\infty} \lvert a_k \rvert}.$

Notez $N = \mathrm{Max}(N_1,N_2,N_3, 1)$.

Supposez que $n$ est un entier naturel tel que $n\geq 2N.$

$\begin{aligned} \left\lvert \sum_{p=0}^n c_p – ab \right\rvert &\leq \left\lvert \sum_{p=0}^n a_pB_{n-p}- ab \right\rvert \\ &\leq \left\lvert \sum_{p=0}^n a_p(B_{n-p} – b) \right\rvert + \left\lvert \sum_{p=0}^n ba_p – ab \right\rvert \\&\leq \left\lvert \sum_{p=0}^n a_p(B_{n-p} – b) \right\rvert + \left\lvert b \right\rvert \left\lvert \sum_{p=0}^n a_p – a \right\rvert \\&\leq \left\lvert \sum_{p=0}^n a_p(B_{n-p} – b) \right\rvert + \left\lvert b \right\rvert \times \frac{\varepsilon / 3}{\lvert b \rvert +1} \\&\leq \left\lvert \sum_{p=0}^n a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \left\lvert \sum_{p=0}^N a_p(B_{n-p} – b) \right\rvert + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \sum_{p=0}^N \lvert a_p\rvert \lvert B_{n-p} – b\rvert + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \sum_{p=0}^N \left(\lvert a_p\rvert \times \frac{\varepsilon / 3}{1+ \sum_{k=0}^{+\infty} \lvert a_k \rvert}\right) + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon / 3}{1+ \sum_{k=0}^{+\infty} \lvert a_k \rvert} \times \sum_{p=0}^N \lvert a_p\rvert + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon / 3}{1+ \sum_{k=0}^{+\infty} \lvert a_k \rvert} \times \sum_{p=0}^{+\infty} \lvert a_p\rvert + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + \left\lvert \sum_{p=N+1}^{n} a_p(B_{n-p} – b) \right\rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + \sum_{p=N+1}^{n} \lvert a_p \rvert (M + \lvert b \rvert) + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + (M + \lvert b \rvert) \sum_{p=N+1}^{n} \lvert a_p \rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + (M + \lvert b \rvert) \sum_{p=N+1}^{+\infty} \lvert a_p \rvert + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + (M + \lvert b \rvert) \times \frac{\varepsilon / 3}{M + \lvert b \rvert } + \frac{\varepsilon}{3} \\&\leq \frac{\varepsilon}{3} + \frac{\varepsilon}{3} + \frac{\varepsilon}{3} \\&\leq \varepsilon.\end{aligned}$

Cela termine la démonstration.

Résumez et concluez

Si deux séries $\sum_{n\geq 0} a_n$ et $\sum_{n\geq 0} b_n$ sont convergentes et que l’une d’entre elles est absolument convergente, alors la série du produit de Cauchy $\sum_{n\geq 0} \left(\sum_{k=0}^n a_kb_{n-k}\right)$ est convergente et de plus :

$\begin{aligned} \boxed{\sum_{n= 0}^{+\infty} \left(\sum_{k=0}^n a_kb_{n-k} \right)= \left(\sum_{n= 0}^{+\infty} a_n\right)\left(\sum_{n= 0}^{+\infty} b_n\right).}\end{aligned}$

Prolongement

Soit $q$ un nombre complexe tel que $\lvert q \rvert < 1.$

Pourriez-vous démontrer que la série $\sum_{n\geq 0} (n+1)q^n$ est convergente ?

Montrez alors que sa somme est donnée par $\sum_{n=0}^{+\infty} (n+1)q^n = \frac{1}{(1-q)^2}.$

188. Toute fonction réelle continue sur un segment est bornée

Rédigé par Yannis TRIANTAPHYLIDESon 18/11/202119/11/2021| Niveau Capes, Niveau Prépa

Considérez deux nombres réels $a$ et $b$ tels que $a<b.$ Soit $f: [a,b]\to \R$ une fonction continue.

Autrement dit, pour tout $x\in[a,b]$ et pour tout réel $\varepsilon$ strictement positif, il existe un nombre réel $\delta$ strictement positif tel que, pour tout $y\in[a,b]$, $x-\delta<y<x+\delta \implies f(x)-\varepsilon < f(y) < f(x)+\varepsilon.$

Le but de ce document est de démontrer que la fonction $f$ est bornée : il existe un nombre réel $M$ strictement positif tel que, pour tout $x\in[a,b], -M\leq f(x) \leq M.$

Utilisez la borne supérieure d’un ensemble

Soit $A$ l’ensemble défini par $\{x\in[a,b], \exists M> 0, \forall u\in[a,x], -M\leq f(u)\leq M\}.$

Pour dégrossir la définition, si $x\in A$, alors la restriction de la fonction $f$ à l’intervalle $[a,x]$ est bornée.

Posez $M = 1+ \lvert f(a) \rvert$ pour obtenir $M>0$. Comme $-M\leq f(a) \leq M$ vous déduisez que $\forall u\in[a,a], -M\leq f(u)\leq M$, ce qui prouve $a\in A$ donc l’ensemble $A$ est non vide.

Par définition de $A$, vous avez $\forall x\in A, x\in[a,b]$ donc $b$ est un majorant de l’ensemble $A.$

Comme $A$ est une partie de $\R$ vous déduisez que $A$ admet une borne supérieure, que vous allez noter $c.$

Démontrez que la borne supérieure $c$ est strictement supérieure à $a$

La fonction $f$ est continue sur l’intervalle $[a,b]$, vous choisissez $\varepsilon = 1$ et écrivez la continuité en $a.$

Il existe donc un nombre réel $\delta$ strictement positif, tel que, pour tout $y\in[a,b]$, $a-\delta<y<a+\delta \implies f(a)-1 < f(y) < f(a)+1.$ Posez $M = \lvert f(a) \rvert +1$. Il vient $M>0$ et $\forall y\in[a,b], a-\delta<y<a+\delta \implies -M \leq f(y)\leq M.$

Posez $\delta’ = \mathrm{Min}\left(\frac{\delta}{2}, b-a\right).$ Alors $\delta’ > 0.$ Comme $[a, a+\delta’]\subset [a,a+\delta[ \cap [a,b]$ vous déduisez $\forall x\in[a, a+\delta’], -M\leq f(x) \leq M.$ Du coup $a+\delta’\in A$. Par définition de la borne supérieure $c$ qui est un majorant de $A$ vous déduisez $a+\delta’ \leq c.$ Or $a+\delta’ > a$ donc $a < c.$

Démontrez que la borne supérieure $c$ est égale à $b$

Raisonnez par l’absurde et supposez que $c\neq b.$ Comme $b$ est un majorant de $A$ et comme la borne supérieure $c$ est le plus petit majorant de $A$, il vient $c\leq b$ et par suite $c<b.$

De ce qui précède, vous avez $a<c<b.$

Or, par continuité de la fonction $f$ en $c$ en prenant $\varepsilon =1$, il existe un nombre réel $\delta$ strictement positif tel que $\forall x\in[a,b], c-\delta < x < c+\delta\implies f(c)-1 < f(x) < f(c)+1.$ Posez $M = \lvert f(c) \rvert +1$ de sorte que $M>0$ et $\forall x\in[a,b], c-\delta < x < c+\delta\implies -M < f(x) < M.$

Posez $\delta’ = \mathrm{Min}\left(c-a, b-c, \frac{\delta}{2}\right).$ De part les positions de $a$, $b$ et $c$, vous avez $\delta’ > 0.$

De plus, $[c-\delta’, c+\delta’]\subset]c-\delta,c+\delta[ \cap [a,b]$ de sorte que $\forall x\in [c-\delta’, c+\delta’], -M < f(x) < M.$

D’autre part, $c-\delta’$ est strictement inférieur à $c$. Donc $c-\delta’$ est strictement inférieur au plus petit des majorants de l’ensemble $A$. Donc $c-\delta’$ n’est pas un majorant de $A$. Donc il existe $u\in A$ tel que $c-\delta’ < u.$

Comme $u\in A$, il existe $N> 0$ tel que $\forall x\in[a,u], -N\leq f(x)\leq N.$

Comme $[a, c-\delta’]\subset [a, u]$ il vient $\forall x\in[a,c-\delta’], -N\leq f(x)\leq N.$

Soit maintenant $x\in[a, c+\delta’].$ Si $x\in[a,c-\delta’]$ alors $-N-M < -N \leq f(x) \leq N \leq N+M$ donc $-N-M\leq f(x) \leq N+M.$ Sinon, c’est que $x\in]c-\delta’, c+\delta’]$, et dans ce cas alors $-N-M < -M \leq f(x) \leq M < N+M.$

Ainsi $\forall x\in[a, c+\delta’], -N-M\leq f(x) \leq N+M$ donc $c+\delta’ \in A.$ Comme $c$ est une borne supérieure de $A$ il vérifie $c\geq c+\delta’$ ce qui est absurde puisque $c+\delta’ > c$ compte tenu de la stricte positivité de $\delta’.$

De cette analyse, vous déduisez que $c=b.$

Concluez

La fonction $f$ est continue en $b$, donc il existe $\delta > 0$ tel que $\forall x\in[a,b], b-\delta<x<b+\delta \implies f(b)-1<f(x)<f(b)+1.$

Posez $\delta’=\mathrm{Min}\left(\frac{\delta}{2}, b-a\right) > 0$ et $M = \lvert f(b) \rvert +1$ pour avoir $M>0.$

Alors $\forall x\in[b-\delta’, b], -M\leq f(x)\leq M.$

Or $b-\delta’$ ne peut majorer l’ensemble $A$ puisque $b$ est une borne supérieure de $A.$

Donc il existe $u\in A$ tel que $b-\delta’ < u.$

Comme $u\in A$, il existe $N>0$ tel que $\forall x\in[a,u], -N\leq f(x)\leq N.$

Soit maintenant $x\in [a,b].$

Si $x\in[a,b-\delta’]$, alors $x\in[a,u]$ donc $-N-M<-N\leq f(x) \leq N < N+M$ donc $-N-M\leq f(x)\leq N+M.$

Sinon, c’est que $x\in]b-\delta’,b]$ donc $-N-M< -M \leq f(x) \leq M < M+N$ donc $-N-M\leq f(x) \leq N+M.$

Dans tous les cas il est établi que $-N-M\leq f(x) \leq N+M$ ce qui prouve que $f$ est bornée sur $[a,b]$ et que $b\in A.$ Comme $b$ est une borne supérieure de $A$, vous déduisez au passage que $b$ est le maximum de $A.$

Prolongement

Soient $a$ et $b$ deux réels tels que $a<b$ $f: [a,b]\to \R$ une fonction continue, telle que $f(a)<0$ et $f(b)>0.$ En utilisant l’ensemble $A = \{x\in[a,b], \forall u\in[a,x], f(u) < 0\}$ pourriez-vous démontrer qu’il existe un nombre réel $c\in]a,b[$ tel que $f(c)=0$ ?

187. Le lemme de Bernoulli

Rédigé par Yannis TRIANTAPHYLIDESon 15/11/202125/06/2022| Niveau Prépa, Niveau Terminale

Soit $x$ un réel strictement supérieur à $-1$, de sorte que $1+x$ soit un réel strictement positif.

Vous allez démontrer que, pour tout entier naturel $n$, $(1+x)^n \geq 1+nx.$

D’où provient l’idée de ce lemme ?

Lorsque $x$ est positif, vous avez les minorations suivantes, après développement :

$\begin{aligned} (1+x)^2 &\geq 1+2x+x^2 \geq 1+2x\\(1+x)^3 &\geq 1+3x+3x^2+x^3 \geq 1+3x\\(1+x)^4 &\geq 1+4x+6x^2+4x^3+x^4 \geq 1+4x\\(1+x)^5 &\geq 1+5x+10x^2+10x^3+5x^4+x^5 \geq 1+5x.\end{aligned}$

Pour tout entier naturel $n$ et tout réel $x$ positif, le développement de $(1+x)^n$ fournit immédiatement le lemme de Bernoulli.

Il est remarquable que celui-ci subsiste aussi lorsque $x$ appartient à l’intervalle $]-1,0[.$

En effet, soit $x$ un réel fixé appartenant à $]-1,0[$.

Partez de $3+x \geq 0$, alors après multiplication par $x^2$ qui est positif, $3x^2+x^3 \geq 0$ et par suite $1+3x+3x^2+x^3\geq 1+3x$ d’où $(1+x)^3\geq 1+3x.$

Pour le degré $4$, partez du fait que $x^2+4x+6 = (x+2)^2+2$ du coup $x^2+4x+6\geq 0$ et après multiplication par $x^2$, il vient $x^4+4x^3+6x^2\geq 0$ et par suite $x^4+4x^3+6x^2+4x+1 \geq 4x+1$ donc $(1+x)^4\geq 1+4x.$

Pour le degré $5$, il va falloir trouver un argument pour justifier que le réel $10+10x+5x^2+x^3$ va être positif… c’est encore possible en étudiant la fonction $f$ définie par $f(t) = 10+10t+5t^2+t^3$ sur l’intervalle $[-1,0].$

Vous avez $f'(t) = 10+5t+3t^2$ qui est un polynôme de degré $2$ possédant un discriminant strictement négatif et de coefficient dominant positif, par suite la fonction $f’$ est positive, donc $f$ est croissante sur $[-1,0]$ donc $f(x)\geq f(-1).$ Or, $f(-1)=4$ donc $f(x)\geq 0.$

Après multiplication de l’inégalité $10+10x+5x^2+x^3 \geq 0$ par $x^2$ et ajout de $1+5x$ vous obtenez enfin $(1+x)^5\geq 1+5x.$

Il semble donc cohérent de conjecturer que l’inégalité $(1+x)^n\geq 1+nx$ est valable pour tout entier naturel $n.$

Mais comment unifier une démonstration unique pour toutes les valeurs de l’entier $n$ ?

La récurrence va être l’outil adéquat.

Utilisez une récurrence

Pour tout entier naturel $n$, notez $P(n)$ la propriété suivante : « pour tout réel $x$ strictement supérieur à $-1$, $(1+x)^n\geq 1+nx.$ »

Initialisation. Posez $n=0$ et fixez un réel $x$ strictement supérieur à $-1.$ Alors $x+1$ est un réel strictement positif, donc $(1+x)^0 = 1.$ Comme $1+0x = 1$ vous obtenez bien $(1+x)^0\geq 1+0x.$ Donc la propriété $P(0)$ est vérifiée.

Hérédité. Soit $n$ un entier naturel fixé tel que la propriété $P(n)$ soit vérifiée.

Soit $x$ un nombre réel strictement supérieur à $-1.$

Partez du fait que $(1+x)^{n+1} = (1+x)^n(1+x).$

Par hypothèse de récurrence, $(1+x)^n\geq 1+nx.$ Or, $1+x$ est positif, donc après multiplication :

$\begin{aligned} (1+x)(1+x)^n &\geq (1+nx)(1+x) \\&\geq 1+(n+1)x+nx^2\\&\geq 1+(n+1)x.\end{aligned}$

La dernière inégalité provient du fait que $n$ est positif et que $x^2$ en tant que carré d’un nombre réel, est positif aussi.

Ainsi $(1+x)^{n+1}\geq 1+(n+1)x$ ce qui montre que la propriété $P(n+1)$ est vérifiée.

Concluez

Il a été établi la propriété suivante, baptisée « lemme de Bernoulli« : pour tout entier naturel $n$ et pour tout réel $x$ strictement supérieur à $-1$, $(1+x)^n\geq 1+nx.$

Note. La positivité de $1+x$ a été utilisée dans la récurrence au moment de la multiplication de l’inégalité $(1+x)^n\geq 1+nx$ par $1+x.$ Le fait que $x = -1$ soit rejeté dans le lemme sert d’un point de vue technique à l’initialisation pour éviter le cas litigieux « $0^0$ » et aussi parce que dans ce cas-là, $(1+x)^n$ serait nul, ce qui ne présente pas beaucoup d’intérêt.

Prolongement

Dans quel cas peut être utilisé le lemme de Bernoulli ? Allez jeter un oeil dans l'article 186 et dans l'article 250.