Votre navigateur n'accepte pas le Javascript.La navigation sur ce site risque de ne pas fonctionner correctement.

088. Trois théorèmes qui appellent le PGCD et le PPCM

Pour cet article :

  • Un rappel de ce que sont les PGCD et les PPCM, qui sont indispensables pour ajouter ou soustraire des fractions ou les simplifier.
  • Soient $a$ et $b$ deux entiers naturels différents de $0$. Vous allez établir le théorème selon lequel le produit $\mathrm{PGCD}(a,b) \times \mathrm{PGCD}(a,b)$ est égal au produit $ab.$ On rencontre souvent ce résultat mais sans aucune preuve, c’est ce que cet article vient préciser pour vous dans la section « un peu d’arithmétique ». Dans cette section sera démontrée aussi un théorème important : si $d =\mathrm{PGCD}(a,b)$, alors les entiers $\frac{a}{d}$ et $\frac{b}{d}$ sont premiers entre eux.
  • Peut-on se passer de l’algorithme d’Euclide pour calculer un $\mathrm{PGCD}$ avec des petits nombres, en utilisant les nombres premiers et les critères de divisibilité ? La réponse est oui et vous verrez comment, ce qui constitue le dernier théorème de cet article.
  • Fin avec des prolongements.

Que signifient $\mathrm{PGCD}$ et $\mathrm{PPCM}$ ?

$\mathrm{PGCD}$ pour « plus grand commun diviseur »

Soient $a$ et $b$ deux entiers naturels différents de $0$. Notez que $a$ et $b$ sont des multiples de $1$. L’ensemble des entiers naturels $n\in\N^{*}$ tels que $a$ soit un multiple de $n$ et $b$ un multiple de $n$ est non vide.

Si $n$ est un entier naturel non nul qui divise $a$ il existe un entier naturel $m$ tel que $a=nm$. $a$ étant non nul, $m$ est non nul donc $1\leq m$ et aussitôt $n \leq nm$ donc $n\leq a.$

L’ensemble $\{n\in\N^{*}, n\vert a\text{ et }n\vert b\}$ est une partie de $\N$ non vide et majorée (par $a$).

Son plus grand élément est noté $\mathrm{PGCD}(a,b).$

$\mathrm{PPCM}$ pour « plus petit commun multiple »

Soient $a$ et $b$ deux entiers naturels différents de $0$. Notez que le produit $ab$, non nul, est à la fois un multiple de $a$ et de $b$. L’ensemble des entiers naturels $n\in\N^{*}$ qui sont des multiples de $a$ et de $b$ est non vide.

L’ensemble $\{n\in\N^{*}, a\vert n\text{ et }b\vert n\}$ est une partie de $\N$ non vide.

Son plus petit élément est noté $\mathrm{PPCM}(a,b).$

Un peu d’arithmétique

Soient $a$ et $b$ deux entiers naturels différents de $0$.

Vous allez démontrer que :

\boxed{\mathrm{PGCD}(a,b)\times \mathrm{PPCM}(a,b) = ab.}

Pour plus de commodité notez $d = \mathrm{PGCD}(a ,b)$ et $\mu=\mathrm{PPCM}(a ,b).$

Partez de la définition du $\mathrm{PPCM}$. Il existe deux entiers naturels $k$ et $\ell$ tels que $\mu = ak = b\ell.$ Pour pouvoir tirer quelque chose d’intéressant de cette relation, vous cherchez à appliquer le théorème de Gauss.

Sauf que $a$ et $b$ ne sont pas forcément premiers entre eux.

Mais $d$ est un diviseur commun à $a$ et à $b$. Il existe deux entiers naturels $a’$ et $b’$ tels que $a=da’$ et $b=db’$. $a$ et $b$ étant non nuls, il en est de même de $a’$ et de $b’.$

De $ak = b\ell$ vous déduisez $da’k=db’\ell$ soit $d(a’k-b’\ell)=0$ et par intégrité de l’anneau $\Z$, $a’k-b’\ell=0$ soit $a’k=b’\ell.$

Notez $d’=\mathrm{PGCD}(a’ ,b’).$

L’entier $d’$ est supérieur ou égal à $1$ par définition.

Il existe deux entiers naturels $a^{\prime\prime}$ et $b^{\prime\prime}$ non nuls tels que $a’ = d’a^{\prime\prime}$ et $b’=d’b^{\prime\prime}.$

Vous en déduisez que $a = dd’a^{\prime\prime}$ et $b = dd’b^{\prime\prime}$ donc $dd’$ est un diviseur commun à $a$ et à $b$.

Par définition de $d$, le produit $dd’$ est inférieur ou égal à $d$. Aussitôt $d’$ est inférieur ou égal à $1$.

Vous déduisez que $d’=1$.

Les entiers $a’$ et $b’$ sont premiers entre eux, et $a’$ est un diviseur de $b’\ell.$ Par le théorème de Gauss, $a’$ est un diviseur de $\ell.$

Il existe un entier $m$ non nul tel que $\ell = a’m.$

De $\mu = b\ell = ba’m$ vous déduisez que $ba’\geq \mu.$

Or, $ba’$ est un multiple de $b$. Comme $ba’=db’a’ = b’a$, vous déduisez que $ba’$ est un multiple de $a$. Par définition de $\mu$, vous avez $\mu \leq ba’$.

Ainsi $ba’ = \mu$. En multipliant par $d$, vous obtenez le résultat annoncé : $ab = d\mu.$

Calculez le $\mathrm{PGCD}$ sans utiliser l’algorithme d’Euclide pour des petits nombres

Pour fixer les idées, seule la situation du $\mathrm{PGCD}$ de trois entiers sera traitée.

Soient $a$, $b$ et $c$ trois entiers naturels non nuls.

On définit de la même façon le $\mathrm{PGCD}$ de trois entiers naturels, c’est le plus grand entier supérieur ou égal à $1$ qui est un diviseur de $a$, $b$ et $c$.

Pour les petits nombres, on peut calculer le $\mathrm{PGCD}$ en utilisant des nombres premiers.

Soit $p$ un nombre premier. On rappelle qu’un nombre premier désigne un entier naturel non nul qui admet exactement deux diviseurs. Par conséquent, $1$ n’est pas un nombre premier.

Supposez que $p$ divise les trois entiers $a$, $b$ et $c$

Vous notez $(a’,b’,c’)\in(\N^{*})^3$ tel que $a=pa’$, $b=pb’$ et $c=pc’$. Alors :

\boxed{\mathrm{PGCD}(a, b, c)=p \times\mathrm{PGCD}(a',b',c').}

En effet, notez $d =\mathrm{PGCD}(a, b, c)$ et $d’=\mathrm{PGCD}(a’, b’, c’).$

$d’$ divise $a’$ donc $pd’$ divise $pa’$ donc $pd’$ divise $a$.
Vous procédez de la même façon avec $b$ et $c$, et déduisez que $pd’$ est un diviseur commun à $a$, $b$ et $c$, ce qui montre que $pd’\leq d$.

Avant de poursuivre, montrez que $p$ divise $d$…

Pour cela considérez le $\mathrm{PGCD}(d,p)$. Comme $p$ est premier, le $\mathrm{PGCD}$ précédent au $1$ ou $p$.

Supposez que $\mathrm{PGCD}(d,p)=1$. Comme $d$ divise $a$, $d$ divise $pa’$ et par le théorème de Gauss, $d$ divise $a’$. Répétez le même raisonnement avec $b$ et $c$, vous déduisez que $d$ divise $a’$, $b’$ et $c’$ donc, par définition de $d’$, $d\leq d’$ donc $pd\leq pd’ \leq d$ et donc $p\leq 1$, contradiction avec le fait que $p$ est premier.

Il en résulte que $\mathrm{PGCD}(d,p)=p$ et donc $p$ divise $d$.

Notez $\delta\in\N^{*}$ tel que $d = p\delta.$ Vous allez montrer que $d\leq pd’$. Comme $d$ divise $a$, $p\delta$ divise $pa’$ donc $\delta$ divise $a’$. Répétez ce raisonnement sur $b$ et $c$, vous déduisez que $\delta$ est un diviseur commun à $a’$, $b’$ et $c’$ donc $\delta\leq d’$. Multipliez par $p$, vous obtenez $d \leq pd’.$

Supposez que $p$ divise l’entier $a$ mais que $p$ ne divise pas l’entier $b$

Vous notez $a’\in\N^{*}$ tel que $a=pa’.$ Dans ce cas, le $\mathrm{PGCD}$ n’est pas modifié :

\boxed{\mathrm{PGCD}(a, b, c)=  \mathrm{PGCD}(a',b,c).}

En effet, notez $d=\mathrm{PGCD}(a, b, c)$ et $\delta = \mathrm{PGCD}(a’,b, c).$

Comme $\delta$ divise $a’$, $\delta$ divise aussi $pa’$ donc $a$.
$\delta$ est un diviseur commun à $a$, $b$ et $c$ donc $\delta\leq d.$

Dans l’autre sens, vous avez déjà $d$ qui divise $pa’$.

Considérez $\mathrm{PGCD}(d,p)$. Si ce $\mathrm{PGCD}$ vaut $1$, vous appliquez le théorème de Gauss et aussitôt $d$ divise $a’$, puis $b$, puis $c$ et donc $d\leq \delta$ et le résultat annoncé est démontré.

Comme $p$ est premier, la seule autre valeur possible du $\mathrm{PGCD}$ de $d$ et de $p$ est $p$. Supposez que $\mathrm{PGCD}(d,p)=p.$ Dans ce cas-là, $p$ diviserait $d$. Or $d$ divise $b$, donc par transitivité $p$ diviserait $b$ ce qui est absurde. Le cas où $\mathrm{PGCD}(d,p)=p$ est exclu et le résultat annoncé est finalisé.

Un exemple de calcul du $\mathrm{PGCD}$

Pour des petits nombres, la connaissance du début de la suite des nombres premiers $2$, $3$, $5$, $7$ suffit dans la plupart des situations du collège et du lycée.

Soit à calculer $\mathrm{PGCD}(12, 36, 50).$

$2$ divise tout le monde : $12$, $36$ et $50$.

Donc $\mathrm{PGCD}(12, 36, 50) = 2\times \mathrm{PGCD}(6, 18, 25)$

$2$ divise $6$ mais pas $25$ donc $\mathrm{PGCD}(6, 18, 25)=\mathrm{PGCD}(3, 18, 25)$.

De la même façon, $2$ divise $18$ mais pas $3$ donc $\mathrm{PGCD}(3, 18, 25)=\mathrm{PGCD}(3, 9, 25).$

$3$ divise $3$ mais pas $25$, donc $\mathrm{PGCD}(3, 9, 25)=\mathrm{PGCD}(1, 9, 25)$

Comme le chiffre $1$ apparaît, vous déduisez que $\mathrm{PGCD}(1,9,25)=1.$

Conclusion : $\mathrm{PGCD}(12, 36, 50)=2.$

Prolongements

[q1] Calculez le $\mathrm{PGCD}$ des nombres $20$, $36$ et $38$ en vous inspirant de la méthode décrite ci-dessus qui n’utilise pas l’algorithme d’Euclide.

[q2] Vrai ou faux ? Quels que soient les entiers naturels non nuls $a$, $b$ et $c$, $\mathrm{PGCD}(a , b, c)\times \mathrm{PPCM}(a ,b, c) = abc$ ?

087. Une partie réelle qui vérifie la propriété de Heine-Borel est fermée et bornée

Un peu de topologie… soit $F$ une partie de $\R$ qui vérifie la propriété dite de Heine-Borel :

Tout recouvrement ouvert de $F$ admet un sous-recouvrement fini.

Vous allez démontrer que $F$ est une partie fermée et bornée.

Quelques notations pratiques

Pour toute partie $A\subset \R$, notez son complémentaire $\overline{A} = \{x\in\R, x\notin A\}.$ La notation « barre » n’a rien à voir avec la notion d’adhérence que l’on peut trouver ailleurs dans des notions topologiques.

Démontrez que $F$ est bornée

Pour tout entier naturel $n$, notez $I_n = \left]-n-1 ;n+1\right[.$

Comme $\R$ est recouvert par l’ensemble des $I_n$ pris pour $n\in\N$, il en est de même de $F$.

Appliquant la propriété de Heine-Borel à $F$, vous déduisez qu’il existe $r$ entiers naturels $n_1$, $\dots$, $n_r$ tels que $F \subset I_{n_1} \cup \cdots \cup I_{n_r}.$

Notez $m$ le plus grand entier naturel parmi $n_1$, $\dots$, $n_r$. Vous déduisez que $F \subset I_m$ ce qui prouve que la partie $F$ est bornée.

Démontrez que $F$ est fermée

Soit $x\in \overline{F}.$ Il s’agit de démontrer qu’il existe un intervalle ouvert inclus dans $\overline{F}$ et contenant $x$.

Pour tout entier naturel $n$, notez $I_n = \left[x-\dfrac{1}{n+1} ; x+\dfrac{1}{n+1}\right].$

L’intersection des $(I_n)$ est réduite à un singleton : $\bigcap_{n\in\N} I_n = \{x\}$. Comme $x\notin F$, il en résulte que $\left(\bigcap_{n\in\N} I_n\right)\cap F = \emptyset.$

Vous déduisez $ F\subset \bigcup_{n\in\N} \overline{I_n}.$

Pour tout entier naturel $n$, les ensembles $\overline{I_n}$ sont ouverts. Vous appliquez la propriété de Heine-Borel à $F$. Vous déduisez qu’il existe $r$ entiers naturels $n_1$, $\dots$, $n_r$ tels que $F \subset I_{n_1} \cup \cdots \cup I_{n_r}.$

Notez $m$ le plus petit entier naturel parmi $n_1$, $\dots$, $n_r$. Vous déduisez que $F \subset \overline{I_m}$ et par suite $I_m\subset \overline{F}$ donc l’ouvert $\left]x-\dfrac{1}{m+1}; x+\dfrac{1}{m+1}\right[$ est inclus dans $\overline{F}$ et contient $x$.

La partie $F$ est donc fermée.

Prolongement

La propriété établie dans ce document est-elle valable si on considère que $F$ est cette fois une partie d’un espace métrique $E$ ou lieu d’une partie de $\R$ ?

086. Une caractérisation du triangle équilatéral

Soient $A$, $B$ et $C$ les points du plan d’affixes respectives $a$, $b$ et $c$ telles que :

$\left\{\begin{array}{l}
\vert a \vert = \vert b \vert = \vert c \vert \\
a\neq b.
\end{array}\right.$

Vous supposez ainsi que le triangle contient au moins deux points distincts.

Vous allez démontrer l’équivalence suivante :

Caractérisation du triangle équilatéral par des affixes, où le centre du cercle circonscrit est placé à l’origine du repère :

$a+b+c = 0 \Longleftrightarrow \vert a-b \vert =\vert b-c \vert=\vert c-a \vert$

Remarques avant de commencer, l’esprit de ce document

La caractérisation ci-dessus du triangle équilatéral peut être traduite autrement (avec le centre de gravité notamment) et démontrée sans faire appel aux nombres complexes.

Ce document vous propose une démonstration où les principaux outils utilisés sont les nombres complexes, même si on peut s’en passer. Le choix privilégié ici c’est de manipuler les nombres complexes et d’exhiber un cas où leur utilisation est non triviale.

Le nombre complexe $j$

Notez $j = \e^{i\frac{2\pi}{3}}$. Alors $j=-\dfrac{1}{2}+i\dfrac{\sqrt{3}}{2}$ et $j^3 = e^{2i\pi} = 1.$

Or $j^3-1 = (j-1)(j^2+j+1)$. Comme $j\neq 1$, vous déduisez l’importante relation $\boxed{1+j+j^2=0.}$

Premier sens, supposez que $a+b+c=0$

Montrez l’égalité de deux côtés $\vert a -b\vert = \vert b-c\vert $

Notez $R = \vert a \vert = \vert b \vert = \vert c \vert.$

Comme $c=-a-b$, vous en tirez $\vert c\vert ^2 = \vert a+b\vert^2.$

Aussitôt :

\begin{aligned}
c\overline{c} &= (a+b)(\overline{a}+\overline{b})\\
R^2&=R^2+a\overline{b}+\overline{a}b+R^2\\
a\overline{b}+\overline{a}b+R^2&=0.
\end{aligned}

Multipliez par 2 et séparez.

\begin{aligned}
2a\overline{b}+2\overline{a}b+2R^2&=0\\
a\overline{b}+b\overline{a}&=-b\overline{a}-R^2-a\overline{b}-R^2\\
a\overline{b}+b\overline{a}&=b(-\overline{a}-\overline{b})+\overline{b}(-a-b)\\
a\overline{b}+b\overline{a}&=b\overline{c}+c\overline{b}\\
R^2-a\overline{b}-b\overline{a}+R^2 &=R^2-b\overline{c}-c\overline{b}+R^2\\
(a-b)(\overline{a}-\overline{b}) &= (b-c)(\overline{b}-\overline{c})\\
\vert a-b\vert^2 &= \vert b-c\vert^2.
\end{aligned}

Montrez que $ABC$ est équilatéral

Par permutation circulaire des affixes $a$, $b$, $c$ la condition $a+b+c=0$ est encore satisfaite. Vous déduisez de ce qui précède $\vert b -c\vert = \vert c-a\vert.$

Aussitôt $\vert a -b\vert = \vert b-c\vert = \vert c-a\vert.$

Démontrez l’autre sens, supposez que les 3 côtés du triangle $ABC$ sont égaux

Supposez donc que $\vert a-b \vert = \vert b-c \vert = \vert c-a \vert.$

Notez encore $R = \vert a \vert = \vert b \vert = \vert c \vert.$

Posez les hypothèses, s’ensuivent les premières déductions

De l’égalité $\vert b-c \vert^2 = \vert c-a \vert^2$ vous développez avec le conjugué et trouvez que :

\begin{aligned}
(b-c)(\overline{b}-\overline{c}) &=(c-a)(\overline{c}-\overline{a})\\
R^2-b\overline{c}-c\overline{b}+R^2 &= R^2-c\overline{a}-a\overline{c}+R^2\\
b\overline{c}+c\overline{b} &=c\overline{a}+a\overline{c}.
\end{aligned}

De même, développez l’égalité $\vert c-a \vert^2 = \vert a-b \vert^2$, vous aboutissez à $c\overline{a}+a\overline{c} =a\overline{b}+b\overline{a}.$

Utilisez la forme trigonométrique d’un nombre complexe non nul

Comme $a$ et $b$ sont différents, l’un d’entre eux n’est pas nul. Comme $a$, $b$ et $c$ sont de même module, les trois nombres complexes $a$, $b$ et $c$ sont tous non nuls et admettent une forme trigonométrique.

Il existe trois réels $\alpha$, $\beta$ et $\gamma$ tels que :

\begin{aligned}
a &= R\e^{i\alpha}\\
b&= R\e^{i\beta}\\
c &= R\e^{i\gamma}.
\end{aligned}

Les relations précédentes s’écrivent :

\begin{aligned} R^2\e^{i(\beta-\gamma)}+R^2\e^{i(\gamma-\beta)}&=R^2\e^{i(\gamma-\alpha)}+R^2\e^{i(\alpha-\gamma)}\\
R^2\e^{i(\alpha-\gamma)}+R^2\e^{i(\gamma-\alpha)}&=R^2\e^{i(\alpha-\beta)}+R^2\e^{i(\beta-\alpha)}
\end{aligned}

d’où, après simplification par $R^2$ et par $2$ :

\begin{aligned}
\cos (\beta-\gamma)&=\cos(\gamma-\alpha)\\
\cos(\gamma-\alpha) &=\cos(\alpha-\beta).
\end{aligned}

Trouvez la valeur commune des cosinus

Posez $x = \cos (\beta-\gamma) = \cos (\gamma-\alpha) = \cos (\alpha-\beta) =\cos (\beta-\alpha).$

Remarquez que $x$ ne peut jamais être égal à $1$

Si tel était le cas, vous auriez :

\begin{aligned}
\alpha-\beta &= 0 \mod (2\pi)\\
\beta-\gamma &= 0 \mod (2\pi)\\
\end{aligned}

donc

\begin{aligned}
\alpha &= \beta \mod (2\pi)\\
\beta &= \gamma \mod (2\pi)\\
\end{aligned}

$b = R\e^{i\beta} = R\e^{i\alpha} =a$, contradiction.

Dans toute la suite, on utilisera le fait que $x\neq 1$.

Remarquez que $\beta-\alpha = (\beta-\gamma) + (\gamma-\alpha).$

Comme les cosinus $\cos(\beta-\gamma)$ et $\cos(\gamma-\alpha)$ sont égaux, les sinus $\sin(\beta-\gamma)$ et $\sin(\gamma-\alpha)$ sont égaux ou opposés. Le produit $\sin(\beta-\gamma)\sin(\gamma-\alpha)$ est donc égal à $\sin^2(\beta-\gamma)=1-x^2$ ou bien à $-\sin^2(\beta-\gamma)=x^2-1.$

Premier cas, si les deux sinus sont égaux

\begin{aligned}
\cos(\beta-\alpha)&= \cos(\beta-\gamma)\cos(\gamma-\alpha)-\sin(\beta-\gamma)\sin(\gamma-\alpha)\\
x &= x^2-(1-x^2)\\
x &= 2x^2-1\\
0 &= 2x^2-x-1\\
0 &= (2x+1)(x-1).
\end{aligned}

Comme $x\neq 1$, vous déduisez $x=-\dfrac{1}{2}.$

Du coup, $\cos (\beta-\gamma) = -\dfrac{1}{2}$ donc il y a deux possibilités, soit $\beta = \gamma + \dfrac{2\pi}{3} \mod 2\pi$, soit $\beta = \gamma + \dfrac{4\pi}{3} \mod 2\pi$

  • si $\beta = \gamma + \dfrac{2\pi}{3} \mod 2\pi$

Notez que vous ne pouvez pas avoir $\gamma = \alpha + \dfrac{4\pi}{3} \mod 2\pi$. Cela entraînerait $\beta = \alpha \mod 2\pi$ et par suite $x=\cos(\beta-\alpha)$ serait égal à $1$ et non à $-\dfrac{1}{2}.$

Comme $x = \cos (\gamma-\alpha) = -\dfrac{1}{2}$, la seule possibilité est $\gamma = \alpha + \dfrac{2\pi}{3} \mod 2\pi$

Ainsi, vous en tirez que $c = R\e^{i(\gamma)} = R\e^{i(\alpha)}\e^{i\frac{2\pi}{3}} = aj$ et que $b = R\e^{i(\beta)} = R\e^{i(\alpha)}\e^{i\frac{4\pi}{3}} = aj^2$

Par suite, $a+b+c = a+aj^2+aj=a(1+j+j^2)=0.$

  • si $\beta = \gamma + \dfrac{4\pi}{3} \mod 2\pi$

Notez que vous ne pouvez pas avoir $\gamma = \alpha + \dfrac{2\pi}{3} \mod 2\pi$. Cela entraînerait $\beta = \alpha \mod 2\pi$ et par suite $x=\cos(\beta-\alpha)$ serait égal à $1$ et non à $-\dfrac{1}{2}.$

Comme $x = \cos (\gamma-\alpha) = -\dfrac{1}{2}$, la seule possibilité est $\gamma = \alpha + \dfrac{4\pi}{3} \mod 2\pi$

Ainsi, vous en tirez que $c = R\e^{i(\gamma)} = R\e^{i(\alpha)}\e^{i\frac{4\pi}{3}} = aj^2$ et que $b = R\e^{i(\beta)} = R\e^{i(\alpha)}\e^{i\frac{8\pi}{3}} = R\e^{i(\alpha)}\e^{i\frac{2\pi}{3}} = aj$

Par suite, $a+b+c = a+aj+aj^2=a(1+j+j^2)=0.$

Second cas, si les deux sinus étaient opposés

\begin{aligned}
\cos(\beta-\alpha)&= \cos(\beta-\gamma)\cos(\gamma-\alpha)-\sin(\beta-\gamma)\sin(\gamma-\alpha)\\
x &= x^2-(x^2-1)\\
x &= 1
\end{aligned}

Vous avez vu précédemment que ce cas ne peut se produire, vu que $x\neq 1$.

Concluez

Vous venez de constater que dans tous les cas $a+b+c = 0.$

Prolongement

Démontrez le résultat suivant : le triangle $ABC$ est équilatéral si et seulement si, $a^2+b^2+c^2=ab+bc+ca.$

085. Le polynôme caractéristique par la méthode de Faddeev

Vous allez voir une belle application des sommes de Newton vues dans l’article précédent. Toutes les matrices considérées seront à coefficients dans un corps de caractéristique nulle.

Le but de cette section est de construire un algorithme qui calcule petit à petit les coefficients du polynôme caractéristique d’une matrice $A$.

Vous découvrirez le lien entre la trace, les racines d’un polynôme, le polynôme caractéristique d’une matrice, avec effet graduel :

  • dans le cas où $A$ est une matrice carrée d’ordre $2$ triangulaire supérieure,
  • dans le cas où $A$ est une matrice carrée d’ordre $3$ triangulaire supérieure,
  • dans le cas où $A$ est une matrice carrée d’ordre $n\geq 1$ triangulaire supérieure,
  • dans le cas général, $A$ étant une matrice carrée d’ordre $n\geq 1.$

La méthode dans le cas où $A$ est carrée d’ordre $2$ et triangulaire supérieure

Les notations

Pour bien comprendre, vous allez supposer que la matrice $A$ est triangulaire supérieure. Notez $\lambda_1$ et $\lambda_2$ les coefficients diagonaux de $A$.

$A = \begin{pmatrix} \lambda_1 & \times \\ 0 & \lambda_2 \end{pmatrix}.$

Notez $P$ le polynôme caractéristique de $A$, défini par $P(x) = \det(xI-A) = (x-\lambda_1)(x-\lambda_2).$

En développant ce polynôme, il existe deux scalaires $\alpha_1$ et $\alpha_2$ tels que $P(x)=x^2+\alpha_1x+\alpha_2.$

Les sommes de Newton sont définies par :

$N_1 = \lambda_1+\lambda_2$

$N_2 = \lambda_1^2+\lambda_2^2$

et elles vérifient les relations fondamentales :

$N_1+\alpha_1 = 0$

$N_2+\alpha_1N_1+2\alpha_2 = 0.$

Le calcul des coefficients avec la trace

Prenez la première relation $N_1+\alpha_1 = 0$.

Comment obtenir $N_1$ ?

Vu l’expression de la matrice $A$ :

$A = \begin{pmatrix} \lambda_1 & \times \\ 0 & \lambda_2 \end{pmatrix}.$

Vous avez immédiatement $\tr(A) = N_1$. Par conséquent, $\alpha_1 = -\tr(A).$

Prenez la seconde relation $N_2+\alpha_1N_1+2\alpha_2 = 0.$

Considérez les coefficients diagonaux de la matrice $A(A+\alpha_1I)$ :

\begin{align*}A(A+\alpha_1I) &= \begin{pmatrix} \lambda_1 & \times \\ 0 & \lambda_2\end{pmatrix}\begin{pmatrix} \lambda_1+\alpha_1 & \times \\ 0 & \lambda_2+\alpha_1\end{pmatrix} \\
&=\begin{pmatrix} \lambda_1(\lambda_1+\alpha_1) & \times \\ 0 & \lambda_2(\lambda_2+\alpha_1)\end{pmatrix} \\
&=\begin{pmatrix} \lambda_1^2+\alpha_1\lambda_1 & \times \\ 0 & \lambda_2^2+\alpha_1\lambda_2\end{pmatrix}.
\end{align*}

Aussitôt : $\tr(A(A+\alpha_1I))=N_2+\alpha_1N_1=-2\alpha_2$

Vous en déduisez que :

\left\{\begin{align*}
\alpha_1 &= -\tr(A)\\
\alpha_2 &= -\dfrac{1}{2}\tr(A(A+\alpha_1I)).
\end{align*}\right.

La méthode dans le cas où $A$ est carrée d’ordre $3$ et triangulaire supérieure

Dans ce cas là il y a un coefficient de plus sur la diagonale principale. Notez $\lambda_1$, $\lambda_2$ et $\lambda_3$ les coefficients diagonaux de $A$.

$A = \begin{pmatrix} \lambda_1 & \times & \times \\ 0 & \lambda_2 & \times \\ 0 & 0 & \lambda_3 \end{pmatrix}.$

Notez $P$ le polynôme caractéristique de $A$, défini par $P(x) = \det(xI-A) = (x-\lambda_1)(x-\lambda_2)(x-\lambda_3).$

En développant ce polynôme, il existe trois scalaires $\alpha_1$, $\alpha_2$ et $\alpha_3$ tels que $P(x)=x^3+\alpha_1x^2+\alpha_2x+\alpha_3.$

Les sommes de Newton sont définies par :

$N_1 = \lambda_1+\lambda_2+\lambda_3$

$N_2 = \lambda_1^2+\lambda_2^2+\lambda_3^2$

$N_3 = \lambda_1^3+\lambda_2^3+\lambda_3^3$

et elles vérifient les relations fondamentales :

$N_1+\alpha_1 = 0$

$N_2+\alpha_1N_1+2\alpha_2 = 0.$

$N_3+\alpha_1N_2+\alpha_2N_1+3\alpha_3 = 0.$

Appliquez la trace sur des matrices bien choisies

Comme $A = \begin{pmatrix} \lambda_1 & \times & \times \\ 0 & \lambda_2 & \times \\ 0 & 0 & \lambda_3 \end{pmatrix},$ vous tirez $\tr(A) = N_1 = -\alpha_1$, du coup $\alpha_1 = -\tr(A).$

De même :

\begin{aligned}
A(A+\alpha_1I) &= \begin{pmatrix} \lambda_1 & \times & \times \\ 0 & \lambda_2 & \times \\ 0 & 0 & \lambda_3 \end{pmatrix}\begin{pmatrix} \lambda_1+\alpha_1 & \times & \times \\ 0 & \lambda_2+\alpha_1 & \times \\ 0 & 0 & \lambda_3+\alpha_1 \end{pmatrix}\\
&= \begin{pmatrix} \lambda_1(\lambda_1+\alpha_1) & \times & \times \\ 0 & \lambda_2(\lambda_2+\alpha_1) & \times \\ 0 & 0 & \lambda_3(\lambda_3+\alpha_1) \end{pmatrix} \\
&= \begin{pmatrix} \lambda_1^2+\alpha_1\lambda_1 & \times & \times \\ 0 & \lambda_2^2+\alpha_1\lambda_2 & \times \\ 0 & 0 & \lambda_3^2+\alpha_1\lambda_3 \end{pmatrix} \\
\end{aligned}

Aussitôt, pas de souci, $\tr(A(A+\alpha_1I) =N_2+\alpha_1N_1 = -2\alpha_2$ et par suite, vous avez encore $\alpha_2=-\dfrac{1}{2}\tr(A(A+\alpha_1I)).$

Maintenant que $\alpha_2$ est calculé :

$A(A+\alpha_1I) + \alpha_2 I = \begin{pmatrix} \lambda_1^2+\alpha_1\lambda_1 +\alpha_2& \times & \times \\ 0 & \lambda_2^2+\alpha_1\lambda_2 +\alpha_2& \times \\ 0 & 0 & \lambda_3^2+\alpha_1\lambda_3 +\alpha_2\end{pmatrix} $

et donc

$A(A(A+\alpha_1I) + \alpha_2 I) = \begin{pmatrix} \lambda_1^3+\alpha_1\lambda_1^2 +\alpha_2\lambda_1& \times & \times \\ 0 & \lambda_2^3+\alpha_1\lambda_2^2 +\alpha_2\lambda_2& \times \\ 0 & 0 & \lambda_3^3+\alpha_1\lambda_3^2 +\alpha_2\lambda_3\end{pmatrix}$

Vous reprenez la trace.

$\tr( A(A(A+\alpha_1I)+\alpha_2I )) = N_3+\alpha_1N_2+\alpha_2N_1 = -3\alpha_3$, du coup :

$\alpha_3 = -\dfrac{1}{3}\tr(A(A(A+\alpha_1I)+\alpha_2I )).$

Utilisez des notations adaptées

Les parenthèses commencent à s’enchaîner. Plutôt que de les combiner, vous allez définir une suite de matrices et de scalaires.

Posez $A_1 = A$ et $\beta_1 = -\tr(A_1)$,

$A_2 = A(A_1+\beta_1I)$ et $\beta_2 = -\dfrac{1}{2}\tr(A_2)$ et

$A_3 = A(A_2+\beta_2I)$ et $\beta_3 = -\dfrac{1}{3}\tr(A_3).$

Alors il est établi que pour tout entier naturel $i$ compris entre $1$ et $3$, $\beta_i = \alpha_i$ et le polynôme caractéristique de $A$ est égal à $x^3+\beta_1x^2+\beta_2x+\beta_3.$

Et maintenant, la démonstration dans le cas où la matrice $A$ est carrée d’ordre $n\geq 1$, triangulaire supérieure

La situation

Soit $n$ un entier naturel non nul.

Soit $A$ une matrice carrée d’ordre $n$ triangulaire supérieure.

On définit la suite finie $(A_i)_{1\leq i\leq n}$ de matrices et la suite finie $(\beta_i)_{1\leq i \leq n}$ de scalaires de la façon suivante.

On pose artificiellement $A_0 = 0$ et $\beta_0=1.$

Pour tout $i$ compris entre $1$ et $n$, $A_i = A(A_{i-1} +\beta_{i-1}I )$ et $\beta_i = -\dfrac{1}{i}\tr(A_i).$

Notez qu’on a bien $A_1 = A$ et $\beta_1 = -\tr(A_1)$ ce qui justifie a posteriori le fait de poser $A_0=0$ et $\beta_0=1.$

Notez $\lambda_1$, …, $\lambda_n$ les coefficients diagonaux de la matrice $A$.

A = \begin{pmatrix}
\lambda_1 & \times & \times \\
0 & \cdots & \times\\
0 & 0 & \lambda_n
\end{pmatrix}.

Notez $P(x)=\det(xI-A)=\Pi_{i=1}^n (x-\lambda_i)$ le polynôme caractéristique de $A$. En le développant, il existe $n$ scalaires $\alpha_1$, …, $\alpha_n$ tels que $P(x) = x^n+\alpha_1x^{n-1}+\cdots + \alpha_{n-1}x+\alpha_n.$ Posez $\alpha_0 = 1$. De façon plus formelle, $P(x)=\sum_{i=0}^n\alpha_ix^{n-i}.$

Vous définissez $n$ sommes de Newton en posant, pour tout entier $k$ compris entre $1$ et $n$, $N_k = \sum_{i=1}^n \lambda_i^k.$

Pour tout entier $k$ compris entre $1$ et $n$, vous avez les $n$ relations de Newton :

$\sum_{i=0}^{k-1} \alpha_iN_{k-i} + k\alpha_k=0.$

Effectuez une récurrence limitée

Pour tout entier naturel $k$ compris entre $1$ et $n$, notez $Q(k)$ la propriété : « $\alpha_k = \beta_k$ et pour tout $j$ compris entre $1$ et $n$, le coefficient diagonal situé à la ligne $j$ et à la colonne $j$ de la matrice $A_k$ est égal à $\sum_{i=0}^{k-1}\beta_i\lambda_j^{k-i}.$ »

Initialisation : $k=1$. Prenez la première relation de Newton. $N_1+\alpha_1=0.$

Il a été vu ci-dessus que $A_1 = A$ et $\beta_1 = -\tr(A_1)$ donc $\beta_1 = -\tr(A) =- \sum_{i=1}^n \lambda_i = -N_1 = -(-\alpha_1) = \alpha_1.$

Soit $j$ un entier compris entre $1$ et $n$. Comme $A_1 = A$, le coefficient diagonal situé à la ligne $j$ et à la colonne $j$ de $A_1$ est le même que celui situé à la ligne $j$ et à la colonne $j$ de $A$ qui est $\lambda_j =\beta_0 \lambda_j=\sum_{i=0}^{0}\beta_i\lambda_j^{1-i}$, donc la propriété $Q(1)$ est vérifiée.

Hérédité. Soit $k$ un entier compris entre $1$ et $n-1$. Supposez $Q(1)$, …, $Q(k)$ et montrez $Q(k+1)$.

D’une part, on a la relation de Newton :

$\sum_{i=0}^{k} \alpha_iN_{k+1-i} + (k+1)\alpha_{k+1}=0.$

D’après l’hypothèse de récurrence, celle-ci s’écrit :

$\sum_{i=0}^{k} \beta_iN_{k+1-i} + (k+1)\alpha_{k+1}=0.$

D’autre part, $A_{k+1} = A(A_{k} +\beta_{k}I ).$

Soit $j$ un entier compris entre $1$ et $n$. La matrice $A_k + \beta_k I$ est triangulaire supérieure, son coefficient diagonal situé à la ligne $j$ et à la colonne $j$ est, d’après l’hypothèse de récurrence : $\sum_{i=0}^{k-1}\beta_i\lambda_j^{k-i}$ augmenté de $\beta_k$ soit $\sum_{i=0}^{k-1}\beta_i\lambda_j^{k-i} + \beta_k.$ Les deux matrices $A$ et $A_k + \beta_k I$ étant triangulaires supérieures, le coefficient diagonal situé à la ligne $j$ et à la colonne $j$ de $A_{k+1}$ est égal à $\lambda_j$ multiplié par $\sum_{i=0}^{k-1}\beta_i\lambda_j^{k-i} + \beta_k$, soit :

\begin{aligned}
\lambda_j\left(\sum_{i=0}^{k-1}\beta_i\lambda_j^{k-i} + \beta_k\right) &= \sum_{i=0}^{k-1}\beta_i\lambda_j^{k+1-i} + \beta_k\lambda_j\\
&= \sum_{i=0}^{k}\beta_i\lambda_j^{k+1-i}.
\end{aligned}

Calculez maintenant la trace de $A_{k+1}$.

\begin{aligned}
\tr(A_{k+1}) &= \sum_{j=1}^n \sum_{i=0}^{k}\beta_i\lambda_j^{k+1-i}\\
&= \sum_{i=0}^{k} \sum_{j=1}^n\beta_i\lambda_j^{k+1-i}\\
&= \sum_{i=0}^{k}\left(\beta_i \sum_{j=1}^n\lambda_j^{k+1-i}\right)\\
&=\sum_{i=0}^{k} \beta_i N_{k+1-i}\\
&=-(k+1)\alpha_{k+1}.
\end{aligned}

Or $\beta_{k+1}=-\dfrac{1}{k+1}\tr(A_{k+1})$, il vient aussitôt $\alpha_{k+1}=\beta_{k+1}.$

La propriété $Q(k+1)$ est vérifiée.

Par récurrence, vous venez de démontrer que, pour tout $k$ compris entre $1$ et $n$, les scalaires $\alpha_k$ et $\beta_k$ sont égaux.

Et maintenant, le cas général

Vous avez établi un lemme que vous pouvez généraliser

Pour toute matrice $A$ carrée d’ordre $n$ triangulaire supérieure à coefficients dans un corps de caractéristique nulle, vous posez $A_0 = 0$ et $\beta_0=1.$

Pour tout $i$ compris entre $1$ et $n$, définissez $A_i = A(A_{i-1} +\beta_{i-1}I )$ et $\beta_i = -\dfrac{1}{i}\tr(A_i).$

Alors le polynôme caractéristique de $A$ défini par $P(x)=\det(xI-A)$ est égal à $\sum_{i=0}^n\beta_ix^{n-i}.$

Il reste à enlever l’hypothèse « triangulaire supérieure »

Vous y arrivez par conjugaison. Soit $n$ un entier naturel non nul.

Soit $A$ une matrice carrée d’ordre $n$ à coefficients dans un corps de caractéristique nulle.

Son polynôme caractéristique admet un corps de rupture $\K$ dans lequel il est scindé.

Il existe donc une matrice inversible $P$ à coefficients dans $\K$ telle que $P^{-1}AP = T$ où $T$ est triangulaire supérieure.

Appliquez la méthode de Faddeev à la matrice $T$ (elle calcule bien le polynôme caractéristique de $T$.)

Vous posez $T_0 = 0$ et $\beta_0=1.$

Pour tout $i$ compris entre $1$ et $n$, vous définissez $T_i = T(T_{i-1} +\beta_{i-1}I )$ et $\beta_i = -\dfrac{1}{i}\tr(T_i).$

Alors le polynôme caractéristique de $T$ est égal à $\sum_{i=0}^n\beta_ix^{n-i}.$

Comme $T$ et $A$ sont semblables, elles ont le même polynôme caractéristique. Il reste à voir pourquoi, si on applique l’algorithme de Faddeev directement sur la matrice $A$, on trouvera le même polynôme.

Maintenant posez $A_0 = 0$ et $\gamma_0=1.$

Pour tout $i$ compris entre $1$ et $n$, définissez $A_i = A(A_{i-1} +\gamma_{i-1}I )$ et $\gamma_i = -\dfrac{1}{i}\tr(A_i).$

Vous allez montrer par récurrence limitée que les nombres $\gamma_i$ et $\beta_i$ sont égaux.

Pour tout $i$ compris entre $0$ et $n$ notez $R(i)$ la propriété : « $\gamma_i = \beta_i.$ et $P^{-1}A_iP = T_i$ »

Initialisation : pour $i=0$, $\gamma_0=1$ et $\beta_0=1$. Comme $A_0 = T_0 = 0$, $P^{-1}A_0P=0$, donc $R(1)$ est vérifiée.

Hérédité. Soit $i$ un entier compris entre $0$ et $n-1$. Supposez $R(i)$. Vous allez montrer $R(i+1)$.

\begin{aligned}
P^{-1}A_{i+1}P &= P^{-1} A(A_{i} +\gamma_{i}I )P\\
&=P^{-1} A(A_{i} +\beta_{i}I )P\\
&=(P^{-1} AP)(P^{-1}(A_{i} +\beta_{i}I )P)\\
&=T(P^{-1}(A_{i} +\beta_{i}I )P)\\
&=T(P^{-1}A_iP+\beta_i P^{-1}IP)\\
&=T(T_i+\beta_iI)\\
&=T_{i+1}
\end{aligned}

\begin{aligned}
\beta_{i+1} &=-\dfrac{1}{i+1}\tr(T_{i+1})\\
&=-\dfrac{1}{i+1}\tr(P^{-1}A_{i+1}P)\\
&=-\dfrac{1}{i+1}\tr(A_{i+1}PP^{-1})\\
&=-\dfrac{1}{i+1}\tr(A_{i+1})\\
&=\gamma_{i+1}
\end{aligned}

Donc $R(i+1)$ est vérifiée.

Comment calculer le polynôme caractéristique avec la méthode de Faddeev ?

Pour tout entier naturel $n\geq 1$, pour toute matrice $A$ carrée d’ordre $n$ à coefficients dans un corps de caractéristique nulle, posez $A_0 = 0$ et $\alpha_0=1.$

Pour tout $i$ compris entre $1$ et $n$, définissez $A_i = A(A_{i-1} +\alpha_{i-1}I )$ et $\alpha_i = -\dfrac{1}{i}\tr(A_i).$

Alors le polynôme caractéristique de $A$ défini par $P(x)=\det(xI-A)$ est égal à $\sum_{i=0}^n\alpha_ix^{n-i}.$

084. Les sommes de Newton

Dans cet article, vous trouverez :

  • la définition d’une somme de Newton associée à un polynôme,
  • les relations qu’il y a entre les sommes de Newton et les coefficients dudit polynôme avec un moyen efficace de les mémoriser,
  • une démonstration de ces relations qui fait appel à la division euclidienne et à la dérivation d’un polynôme scindé.

Qu’entend-on par sommes de Newton vis-à-vis d’un polynôme ?

Soit $P$ un polynôme à coefficients dans un corps $\K$, de degré $n\geq 1$.

Il existe des coefficients $(a_0,a_1,\dots,a_n)$ tels que $P(x)=a_0x^n+a_1x^{n-1}+\cdots+a_{n-1}x+a_n.$

Notez que, contrairement à beaucoup de notations usuelles sur les polynômes, le coefficient dominant de $P$ est noté $a_0$.

Il existe un surcorps $\L$ de $\K$ dans lequel $P$ est scindé.

Il existe donc $n$ racines appartenant à $\L$, certaines étant éventuellement répétées, notées $\lambda_1$, … , $\lambda_n$, telles que $P(x)=a_0(x-\lambda_1)\cdots(x-\lambda_n).$

Les sommes de Newton, notées $N_1$ pour « Newton 1 », …, $N_n$ pour « Newton $n$ », sont définies de la façon suivante :

$N_1 = \lambda_1+\cdots+\lambda_n = \sum_{k=1}^n\lambda_k$,

$N_2 = \lambda_1^2+\cdots+\lambda_n^2= \sum_{k=1}^n\lambda_k^2$,

$\dots$

$N_n = \lambda_1^n+\cdots+\lambda_n^n=\sum_{k=1}^n\lambda_k^n.$

Autrement dit, pour tout entier $i$ compris entre $1$ et $n$,

$N_i = \displaystyle\sum_{k=1}^n\lambda_k^i.$

Note : vous trouverez aussi des sommes de Newton définies pour $i\geq n+1$. Elles ne seront pas traitées dans cet article, le point de difficulté à lever étant de comprendre le lien entre les premières relations.

Comment mémoriser efficacement les relations qui lient les sommes de Newton ?

La relation fondamentale

Soit $k$ un entier compris entre $1$ et $n$.

Comme $\lambda_k$ est une racine de $P$, vous déduisez :

$a_0\lambda_k^n+a_1\lambda_k^{n-1}+\cdots+a_{n-1}\lambda_k+a_n=0.$

Pour plus de clarté, on écrira le dernier coefficient fois $1$.

$a_0\lambda_k^n+a_1\lambda_k^{n-1}+\cdots+a_{n-1}\lambda_k+a_n\times 1=0.$

Maintenant sommez ces $n$ relations.

\begin{aligned}
\sum_{k=1}^n \left(a_0\lambda_k^n+a_1\lambda_k^{n-1}+\cdots+a_{n-1}\lambda_k+a_n\times 1\right)&=0\\
a_0\sum_{k=1}^n \lambda_k^n + a_1 \sum_{k=1}^n \lambda_k^{n-1}+\cdots + a_{n-1}\sum_{k=1}^n\lambda_k + a_n \sum_{k=1}^n 1 &= 0\\
\end{aligned}

Vous obtenez la relation de base fondamentale qui lie toutes les sommes.

$\boxed{a_0N_n+a_1N_{n-1}+\cdots+a_{n-1}N_1+na_n=0.}$

$\boxed{\sum_{i=0}^{n-1} a_iN_{n-i} + na_n=0.}$

Comment se souvenir des autres relations ?

Considérez le polynôme de degré $1$ qui n’utilise que les premiers coefficients de $P$ en commençant par son coefficient dominant.

Posez $P_1(x) = a_0x+a_1$. Le polynôme $P_1$ n’a qu’une seule racine $\lambda’_1$. Si vous appliquez la relation fondamentale avec sa somme de Newton $N’_1 = \lambda’_1$, vous obtenez $a_0N’_1+a_1=0.$

Ce qui est remarquable c’est que cette relation reste valable pour la somme $N_1$ associée au polynôme de départ $P$ : $a_0N_1+a_1=0.$

De même pour le degré $2$. Posez $P_2(x)=a_0x^2+a_1x+a_2$. Notez $\lambda’_1$ et $\lambda’_2$ les deux racines de $P_2$, posez $N’_1 = \lambda’_1+\lambda’_2$ et $N’_2 = {\lambda’}_1^2$ $+{\lambda’}_2^2$.

D’après la relation fondamentale $a_0N’_2+a_1N’_1+2a_2=0.$

Cette relation se transpose aussi.

Vous avez $a_0N_2+a_1N_1+2a_2=0$ où $N_1$ et $N_2$ sont les deux premières sommes de Newton associées au polynôme de départ $P$.

Vous en déduisez toutes les relations liant les sommes de Newton. Il y en a $n$ au total.

\begin{aligned}
a_0N_1+a_1 &= 0\\
a_0N_2+a_1N_1+2a_2 &=0\\
a_0N_3+a_1N_2+a_2N_1+3a_3 &=0\\
\cdots & \cdots\\
a_0N_n+a_1N_{n-1}+\cdots+a_{n-1}N_1+na_n &=0.
\end{aligned}

Conclusion : toutes les formules de Newton avec des sigmas

Pour tout entier $k$ compris entre $1$ et $n$ :

$\boxed{\sum_{i=0}^{k-1} a_iN_{k-i} + ka_k=0.}$

Et maintenant, démontrez les relations qu’il y a entre les sommes de Newton et les coefficients du polynôme

Ecartez d’office le cas où $P$ est de degré $1$. Il y a une seule racine $\lambda_1$ qui vérifie $a_0\lambda_1+a_1=0$, or $N_1 = \lambda_1.$

Dans la suite $n$ désignera un entier naturel supérieur ou égal à $2$.

A partir du polynôme $P$ défini par $P(x)=a_0x^n+a_1x^{n-1}+\cdots+a_{n-1}x+a_n$, vous allez définir les polynômes tronqués $P_0$, $P_1$, …, $P_n$ de la façon suivante :

\begin{aligned}
P_0(x) &= a_0\\
P_1(x) &= a_0x+a_1\\
P_2(x) &= a_0x^2+a_1x+a_2\\
\cdots & \cdots\\
P_n(x) &= a_0x^n+a_1x^{n-1}+\cdots+a_{n-1}x+a_n.
\end{aligned}

Soit $i$ un entier compris entre $1$ et $n$.

Quand vous effectuez la division euclidienne de $P(x)$ par $x-\lambda_i$ dans le corps $\L(x)$, vous obtenez $P(x)=(x-\lambda_i)\left(P_0(\lambda_i)x^{n-1} + P_1(\lambda_i)x^{n-2} + \cdots + P_{n-1}(\lambda_i)\right) + P_n(\lambda_i).$

Faites une disgression et voyez pourquoi on obtient une telle relation par division euclidienne

Comment bien comprendre le processus ?

Supposez temporairement que le polynôme $P$ est de degré $3$ dans $\L[x]$, $P(x)=a_0x^3+a_1x^2+a_2x+a_3$. Soit $\lambda$ un élément de $\L$.

Vous allez effectuer la division de $P$ par $x-\lambda$, pas à pas.

\begin{aligned}
a_0x^3+a_1x^2+a_2x+a_3 &=a_0x^2\times x + a_1x^2+a_2x+a_3\\
&=a_0x^2( (x-\lambda)+\lambda)+a_1x^2+a_2x+a_3\\
&=(x-\lambda)(a_0x^2) +(a_0\lambda+a_1)x^2+a_2x+a_3\\
&=(x-\lambda)(a_0x^2) +(a_0\lambda+a_1)x\times x+a_2x+a_3\\
&=(x-\lambda)(a_0x^2) +(a_0\lambda+a_1)x\times ((x-\lambda)+\lambda)+a_2x+a_3\\
&=(x-\lambda)(a_0x^2) +(a_0\lambda+a_1)x(x-\lambda) + (a_0\lambda^2+a_1\lambda) x+a_2x+a_3\\
&=(x-\lambda)(a_0x^2+(a_0\lambda+a_1)x) + (a_0\lambda^2+a_1\lambda +a_2) x+ a_3\\
&=(x-\lambda)(a_0x^2+(a_0\lambda+a_1)x) + (a_0\lambda^2+a_1\lambda +a_2) ((x-\lambda)+\lambda)+ a_3\\
&=(x-\lambda)(a_0x^2+(a_0\lambda+a_1)x+(a_0\lambda^2+a_1\lambda +a_2)) + ((a_0\lambda^2+a_1\lambda +a_2))\lambda)+ a_3\\
&=(x-\lambda)(a_0x^2+(a_0\lambda+a_1)x+(a_0\lambda^2+a_1\lambda +a_2)) +P(\lambda).\\
\end{aligned}

Note. Dans le processus vous pouvez reconnaître la méthode de Hörner pour calculer $P(\lambda)$.

La division euclidienne pour tout degré $n\geq 2$

Supposez que le polynôme $P$ soit de degré $n\geq 2$ à coefficients dans $\L$. Soit $\lambda$ un élément de $\L$.

L’exemple précédent suggère de poser $Q(x)=\sum_{k=0}^{n-1}\sum_{i=0}^k a_i\lambda^{k-i}x^{n-1-k}$ comme polynôme qui va être le quotient de la division euclidienne de $P(x)$ par $x-\lambda$. Le reste de cette division doit être $P(\lambda).$

Vérifiez-le en effectuant le développement de l’expression $E$ définie par $E(x)=Q(x)(x-\lambda)+P(\lambda).$

Par développement du $x$ et du $\lambda$ dans le sigma, vous obtenez :

$E(x) = \sum_{k=0}^{n-1}\sum_{i=0}^k a_i\lambda^{k-i}x^{n-k}-\sum_{k=0}^{n-1}\sum_{i=0}^k a_i\lambda^{k+1-i}x^{n-1-k} + P(\lambda).$

Maintenant vous isolez le terme pour $i=0$ du premier sigma et le terme pour $i=n-1$ du deuxième sigma. Aussitôt :

$E(x) =a_0x^n + \sum_{k=1}^{n-1}\sum_{i=0}^k a_i\lambda^{k-i}x^{n-k}-\sum_{k=0}^{n-2}\sum_{i=0}^k a_i\lambda^{k+1-i}x^{n-1-k} – \sum_{i=0}^{n-1} a_i\lambda^{n-i}+ P(\lambda).$

Une première simplification apparaît dans le terme constant de $E(x)$.

$E(x) =a_0x^n + \sum_{k=1}^{n-1}\sum_{i=0}^k a_i\lambda^{k-i}x^{n-k}-\sum_{k=0}^{n-2}\sum_{i=0}^k a_i\lambda^{k+1-i}x^{n-1-k} +a_n.$

Maintenant, dans le premier sigma qui est double, vous allez isoler $i=k$ du reste.

$E(x) =a_0x^n + \sum_{k=1}^{n-1}\left(a_kx^{n-k}+ \sum_{i=0}^{k-1} a_i\lambda^{k-i}x^{n-k}\right)-\sum_{k=0}^{n-2}\sum_{i=0}^k a_i\lambda^{k+1-i}x^{n-1-k} +a_n.$

Vous poursuivez le développement du premier sigma.

$E(x) =a_0x^n + \sum_{k=1}^{n-1}a_kx^{n-k}+ \sum_{k=1}^{n-1}\sum_{i=0}^{k-1} a_i\lambda^{k-i}x^{n-k}-\sum_{k=0}^{n-2}\sum_{i=0}^k a_i\lambda^{k+1-i}x^{n-1-k} +a_n.$

Dans le second double sigma, vous effectuez un changement de variable, en posant $k’=k+1$.

$E(x) =a_0x^n + \sum_{k=1}^{n-1}a_kx^{n-k}+ \sum_{k=1}^{n-1}\sum_{i=0}^{k-1} a_i\lambda^{k-i}x^{n-k}-\sum_{k’=1}^{n-1}\sum_{i=0}^{k’-1} a_i\lambda^{k’-i}x^{n-k’} +a_n.$

Il apparaît une somme téléscopique. Les deux doubles sigmas se simplifient. Vous déduisez :

$E(x) = a_0x^n + \sum_{k=1}^{n-1}a_kx^{n-k} + a_n$.

$E(x)$ coïncide avec $P(x)$.

Aussitôt $\boxed{P(x) =(x-\lambda)\left( \sum_{k=0}^{n-1}\left(\sum_{i=0}^k a_i\lambda^{k-i}\right)x^{n-1-k}\right)+P(\lambda).}$

Maintenant, revenez au calcul des sommes de Newton

Comme $\lambda_i$ est racine de $P$, $P_n(\lambda_i)=P(\lambda_i)=0.$ Aussitôt :

$\dfrac{P(x)}{x-\lambda_i} = P_0(\lambda_i)x^{n-1} + P_1(\lambda_i)x^{n-2} + \cdots + P_{n-1}(\lambda_i).$

Vous sommez cette relation sur toutes les racines.

\begin{aligned}
\displaystyle\sum_{i=1}^n \dfrac{P(x)}{x-\lambda_i} &= \left(\sum_{i=1}^n P_0(\lambda_i)\right)x^{n-1} &+ \left(\sum_{i=1}^n P_1(\lambda_i)\right)x^{n-2} &+ \cdots &+ \left(\sum_{i=1}^n P_{n-1}(\lambda_i)\right)\\
&= na_0x^{n-1} &+ (a_0N_1+na_1)x^{n-2} &+ \cdots &+ (a_0N_{n-1}+a_1N_{n-2}+\cdots+a_{n-2}N_1+na_{n-1})
\end{aligned}

Partant de $P(x) = a_0(x-\lambda_1)\cdots(x-\lambda_n)$, en dérivant :

$P'(x)=\displaystyle\sum_{i=1}^n \prod_{j\neq i} a_0(x-\lambda_j) = \sum_{i=1}^n \dfrac{P(x)}{x-\lambda_i}$

Du coup :

\begin{aligned}
P'(x) &= na_0x^{n-1} &+ (a_0N_1+na_1)x^{n-2} &+ \cdots &+ (a_0N_{n-1}+a_1N_{n-2}+\cdots+a_{n-2}N_1+na_{n-1})\\
na_0x^{n-1}+(n-1)a_{1}x^{n-2}+\cdots+a_{n-1}&= na_0x^{n-1} &+ (a_0N_1+na_1)x^{n-2} &+ \cdots &+ (a_0N_{n-1}+a_1N_{n-2}+\cdots+a_{n-2}N_1+na_{n-1}).
\end{aligned}

Par identification des coefficients à partir du deuxième à gauche, il vient :

\begin{aligned}
\forall i\in \N, 1\leq i\leq n-1&\Rightarrow ia_{n-i} =a_0 N_{n-i}+a_1N_{n-i-1}+\cdots +a_{n-i-1}N_1 +na_{n-i}\\
&\Rightarrow a_0 N_{n-i}+a_1N_{n-i-1}+\cdots +a_{n-i-1}N_1 +(n-i)a_{n-i}=0
\end{aligned}

Effectuez le changement de variable $k=n-i$. Quand $i$ varie entre $1$ et $n-1$, $k$ varie de $1$ à $n-1$ aussi.

Pour tout entier naturel $k$ compris entre $1$ et $n-1$, vous avez :

$a_0 N_{k}+a_1N_{k-1}+\cdots +a_{k-1}N_1 +ka_{k}=0.$

Avec un sigma, cela s’écrit $\sum_{i=0}^{k-1} a_iN_{k-i} + ka_k=0.$

Comme la relation $\sum_{i=0}^{n-1} a_iN_{n-i} +na_n=0$ a déjà été établie, vous en déduisez que :

Pour tout $k$ compris entre $1$ et $n$, $\sum_{i=0}^{k-1} a_iN_{k-i} + ka_k=0.$

Le lien entre les sommes de Newton et les coefficients du polynôme associé est maintenant établi.

Pensez aux résultats qui en découlent

Les sommes de Newton serviront à établir une démonstration de la méthode de Faddeev, qui constitue une amélioration de la méthode de Leverrier. Vous pourrez par la suite calculer le polynôme caractéristique d’une matrice ainsi que l’inverse de cette matrice le cas échéant.

Prolongement

Pour observer comment les liens entre les sommes de Newton sont construits sur un exemple, allez lire le contenu rédigé dans l'article 316.

083. La décomposition LU d’une matrice inversible

Dans cet article, vous trouverez :

  • comment construire la décomposition $LU$ de la matrice $A=\begin{pmatrix} 2 & 7 & 1 \\4 & 13 & 1\\ -2 & -10 & -7\end{pmatrix}$ en utilisant une méthode se ramenant à des matrices de tailles inférieures ;
  • une condition nécessaire et suffisante pour qu’une matrice $A$ admette une telle décomposition $LU.$

Qu’est-ce que la décomposition $LU$ d’une matrice ?

On dit qu’une matrice $A$ admet une décomposition $LU$ lorsqu’il existe deux matrices $L$ et $U$ de même taille que $A$, telles que :

  • le produit matriciel $LU$ est égal à $A$ ;
  • la matrice $L$ (comme « low ») est triangulaire inférieure ;
  • la matrice $L$ a tous ses coefficients diagonaux égaux à $1$ ;
  • la matrice $U$ (comme « up ») est triangulaire supérieure.

Trouvez une décomposition $LU$ pour la matrice $A$

Il s’agit de trouver $L = \begin{pmatrix} 1 & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix}$ et $U = \begin{pmatrix} \times & \times & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}$ pour que l’on ait $A=LU.$

Pour répondre à cette question et ne pas s’embrouiller, il s’agit de résoudre cela avec méthode, de façon progressive. Vous allez vous en tirer en considérant les mineurs principaux de la matrice $A$. Ce sont les sous-matrices de $A$, carrées, construites à partir de son premier coefficient en haut à gauche.

La matrice $A$ possède trois mineurs principaux :

  • la matrice $1\times 1$ à un coefficient : $\begin{pmatrix} 2 \end{pmatrix}$ ;
  • la matrice $2\times 2$ suivante : $\begin{pmatrix} 2& 7 \\4 & 13\end{pmatrix}$ ;
  • la matrice $3\times3$ égale à la matrice $A$ elle-même.

L’idée de base lors de la décomposition $LU$ c’est que, pour une taille donnée, les mineurs de $A$ sont égaux au produit des mineurs de $L$ et de $U$. Cette constatation est immédiate compte tenu de la structure triangulaire des matrices $L$ et $U$.

Regardez ce que donnent les mineurs $1\times1$

Pour la matrice $A$ vous n’avez besoin que de son premier mineur. Tous les autres coefficients de $A$ sont masqués.

$ \begin{pmatrix} \boxed{2} & \times & \times \\\times & \times & \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} \boxed{1} & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} \boxed{\times} & \times & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}$

$2 = 1 \times 2$, donc pas le choix, vous déduisez :

$ \begin{pmatrix} \boxed{2} & 7 & 1 \\4 & 13 & 1\\ -2 & -10 & -7\end{pmatrix}= \begin{pmatrix} \boxed{1} & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} \boxed{2} & \times & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}.$

Regardez ce que donnent les mineurs $2\times 2$

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & \times & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}$

Vous allez pouvoir compléter un coefficient du mineur de taille $2\times2$ de la matrice $U$. En commençant par celui du haut.

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & \boxed{\times} & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}$

$7$ est égal à $1$ fois $\boxed{\times}$ plus 0. Donc :

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ \times & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}.$

Passez au coefficient suivant :

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ \boxed{\times} & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}.$

$2$ fois $\boxed{\times}$ plus 0 est égal à $4$. Donc :

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \times \\0 & \times & \times\\ 0 & 0 & \times\end{pmatrix}.$

Et maintenant le dernier coefficient des mineurs de taille $2\times 2.$

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \times \\0 & \boxed{\times} & \times\\ 0 & 0 & \times\end{pmatrix}$

Or $7$ fois $2$ plus $1$ fois $\boxed{\times}$ est égal à $13.$ Donc :

$ \begin{pmatrix} 2 & 7& \times \\4& 13& \times\\ \times & \times & \times\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \times \\0 & -1 & \times\\ 0 & 0 & \times\end{pmatrix}.$

Regardez ce que donnent les mineurs $3\times 3$

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & \boxed{\times} \\0 & -1 & \boxed{\times}\\ 0 & 0 & \times\end{pmatrix}$

Or $1$ fois $\boxed{\times}$ plus $0$ est égal à $1$. Donc la première croix doit être remplacée par 1.

$2$ fois $1$ plus $1$ fois la seconde $\boxed{\times}$ est égal à $1.$

Vous déduisez :

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \times & \times & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & 1 \\0 & -1 & -1\\ 0 & 0 & \times\end{pmatrix}.$

Maintenant vous passez aux deux autres coefficients.

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ \boxed{\times} & \boxed{\times} & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & 1 \\0 & -1 & -1\\ 0 & 0 & \times\end{pmatrix}$

Or $2$ fois $\boxed{\times}$ plus $0$ est égal à $2$. Donc la première croix doit être remplacée par $-1$.

$7$ fois $-1$ plus $-1$ fois la seconde $\boxed{\times}$ est égal à $-10.$

Vous déduisez :

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ -1 & 3 & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & 1 \\0 & -1 & -1\\ 0 & 0 & \times\end{pmatrix}.$

Puis, vous finissez avec le dernier coefficient.

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ -1 & 3 & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & 1 \\0 & -1 & -1\\ 0 & 0 & \boxed{\times}\end{pmatrix}$

$-1$ fois $1$ plus $3$ fois $-1$ plus $1$ fois $\boxed{\times}$ est égal à $1$.

Vous déduisez :

$ \begin{pmatrix} 2 & 7& 1\\4& 13& 1\\ -2& -10& -7\end{pmatrix}= \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0\\ -1 & 3 & 1\end{pmatrix} \begin{pmatrix} 2 & 7 & 1 \\0 & -1 & -1\\ 0 & 0 & -3\end{pmatrix}.$

Quand, et seulement quand, une matrice inversible $A$ admet une décomposition $LU$ ?

Analyse

Soit $n$ un entier naturel non nul et $A$ une matrice inversible de taille $n\times n$ admettant une décomposition $LU$.

Alors $\det A = \det L \times \det U.$ Comme $\det A\neq 0$ et $\det L = 1$, vous déduisez $\det U \neq 0.$

Notez $u_{11}$, …, $u_{nn}$ les coefficients diagonaux de $U$.

Comme $\det U = u_{11}\times \dots \times u_{nn}$, vous déduisez $\forall i\in\llbracket, 1, n\rrbracket, u_{ii} \neq 0.$

Soit $k$ un entier naturel compris entre $1$ et $n$. Notez $A_k$ le mineur principal de $A$ de taille $k$. Notez $L_k$ le mineur principal de $L$ de taille $k$. Notez $U_k$ le mineur principal de $U_k$ de taille $k$. En effectuant un produit par blocs :

$\begin{pmatrix} A_k & \times \\ \times &\times \end{pmatrix} = \begin{pmatrix} L_k & 0 \\ \times &\times \end{pmatrix} \begin{pmatrix} U_k & \times \\ 0 &\times \end{pmatrix}$

vous constatez que $A_k = L_kU_k$ donc $\det A_k = \det L_k \times \det U_k$ et par suite $\det A_k = u_{11}\times \cdots\times u_{kk}$, donc $\det A_k\neq 0.$

Donc tous les mineurs principaux de $A$ sont inversibles.

Note : on désigne parfois par le mot « mineur » le déterminant d’une sous-matrice de $A$ au lieu de cette sous-matrice.

Synthèse

Pour tout entier naturel $n$ non nul, notez $P(n)$ la propriété « pour toute matrice $A$ d’ordre $n$ inversible ayant ses mineurs principaux inversibles, $A$ admet une décomposition $LU$. »

Initialisation. Prenez $n=1$. Supposez que $A$ soit une matrice d’ordre $1$ ayant des mineurs principaux tous inversibles. Comme $A$ n’admet qu’un seul coefficient $a$, vous posez $L = (1)$ et $U=(a)$ et vous déduisez $A=LU$. Donc $P(1)$ est vérifiée.

Hérédité. Soit $n$ un entier naturel non nul. Supposez $P(n)$. Vous allez montrer $P(n+1)$.

Soit $A$ une matrice carrée d’ordre $n+1$ ayant tous ses mineurs principaux inversibles.

Notez $A’$ le mineur principal de $A$ d’ordre $n$.

Il existe une matrice ligne $v_L$ et une matrice colonne $v_C$ et un scalaire $s$ tels que $A = \begin{pmatrix}A’ & v_C \\ v_L & s\end{pmatrix}.$

D’après l’hypothèse, $A’$ admet une décomposition $L’U’.$

Soient $\alpha_L$ une matrice ligne à $n$ coefficients, $\alpha_C$ une matrice colonne à $n$ coefficients et un scalaire $\beta$ que l’on choisira plus tard.

Posez $L = \begin{pmatrix} L’ & 0 \\\alpha_L & 1\end{pmatrix}$ et $U=\begin{pmatrix} U’ & \alpha_C \\ 0 & \beta \end{pmatrix}.$

Le produit $LU$ est égal à $\begin{pmatrix} L’U’ &L’\alpha_C \\ \alpha_LU’ & \alpha_L\alpha_C+\beta\end{pmatrix}.$

Comme $A’$ est inversible, $\det A’ \neq 0$. Or $\det L’ \det U’ =\det A’$ donc les deux matrices $L’$ et $U’$ sont inversibles.

Choisissez $\alpha_C$, $\alpha_L$ et $\beta$ pour que $L’\alpha_C = v_C$ et $\alpha_L U’ = v_L$ et $\beta = s-\alpha_L\alpha_C.$

Vous avez $A = LU$. $L$ est bien triangulaire inférieure avec des coefficients diagonaux égaux à $1$. $U$ est bien une matrice triangulaire supérieure. $A$ admet donc une décomposition $LU$. Donc $P(n+1)$ est vérifiée.

Par récurrence, vous avez montré que pour tout entier naturel $n$ non nul, $P(n)$ est vérifiée.

Concluez

Une matrice $A$ inversible admet une décomposition $LU$, si et seulement si, tous ses mineurs principaux sont inversibles.

082. La matrice I-AB est inversible, si et seulement si, la matrice I-BA est inversible

Dans cet article, vous allez faire des calculs matriciels.

Notez qu’il suffit de montrer que, si $I-BA$ est inversible, alors $I-AB$ l’est. En effet, en échangeant les matrices $A$ et $B$, vous déduisez le résultat « dans l’autre sens », stipulant que si $I-AB$ est inversible, alors $I-BA$ l’est aussi.

Passez à l’analyse, ce qui est le plus intéressant

Supposez que la matrice $I-BA$ soit inversible. Vous disposez d’une matrice inversible $J = (I-BA)^{-1}$, telle que :

\begin{aligned}
(I-BA)J&=I\\
J(I-BA)&=I.
\end{aligned}

Développez, vous avez $J-JBA = I$ et $J-BAJ=I.$

Vous cherchez à montrer que $I-AB$ est inversible, ce qui fait que vous cherchez une matrice $K$ telle que :

\begin{aligned}
(I-AB)K&=I\\
K(I-AB)&=I.
\end{aligned}

Toujours en développant, vous cherchez une matrice $K$ telle que $K-KAB=I$ et $K-ABK=I.$

Le but du jeu c’est de trouver une expression de $K$ en fonction de $A$, $B$ et $J$.

La relation $K-KAB=I$ permet d’écrire $K=I+KAB.$

Maintenant, il faut bien faire quelque chose à partir des relations existant avec la matrice $J$. Il faut utiliser les matrices $JBA$ ou $BAJ$ et elles ne vont pas apparaître toutes seules ! C’est parti, utilisez la méthode de la force.

De $K=I+KAB$, vous multipliez à droite par $AJ$.

$KAJ=AJ+KABAJ$.

De $J-BAJ=I$ vous avez $BAJ = J-I$. Du coup, $KAJ=AJ+KA(J-I).$

Développez : $KAJ=AJ+KAJ-KA$ et vous avez $0=AJ-KA$ soit $AJ=KA$.

Substituez dans $K=I+KAB$ et vous avez $\boxed{K=I+AJB}.$

Démontrez en bonne intelligence que les matrices $I-AB$ et $I+AJB$ sont inverses l’une de l’autre

L’analyse vous a permis de savoir pourquoi il fallait choisir $I+AJB$.

Maintenant que le plus dur est fait, développez :

\begin{aligned}
(I-AB)(I+AJB) &= I-AB+AJB+A(BAJ)B\\
&= I-AB+AJB-A(J-I)B\\
&=I-AB+AJB-AJB+AB\\
&=I.
\end{aligned}

Et dans l’autre sens.

\begin{aligned}
(I+AJB)(I-AB) &= I-AB+AJB-A(JBA)B\\
&= I-AB+AJB-A(J-I)B\\
&=I-AB+AJB+AJB+AB\\
&=I.
\end{aligned}

Vous voyez des prolongements ?

Ce résultat vous montre que $1$ est valeur propre de la matrice $AB$, si et seulement si, $1$ est valeur propre de la matrice $BA$.

Vous pouvez montrer que, pour tout scalaire $\lambda$, $\lambda I – AB$ est inversible, si et seulement si, $\lambda I -BA$ est inversible.

A vous de jouer !

081. Polynômes caractéristiques de AB et de BA

Dans cet article, vous considérez deux matrices carrées $A$ et $B$ à coefficients dans un corps $\K$, lorsque $\K = \R$ ou $\K=\C.$ Notez $I$ la matrice identité.

Que peut-on dire, en général, des polynômes caractéristiques des matrices $AB$ et $BA$ ?

Les deux polynômes sont égaux quand $A$ est inversible

Supposez que $A$ soit inversible.

Les matrices $AB$ et $BA$ sont semblables :
$A^{-1}(AB)A = (A^{-1}A)(BA) = IBA = BA.$

De ce fait elles ont le même polynôme caractéristique.

Que faire lorsque la matrice $A$ n’est pas inversible ?

Vous disposez d’un argument de topologie pour y répondre.

Notez $P(x) = \det(xI-A)$ le polynôme caractéristique de $A$. C’est un polynôme non constant à coefficients dans $\K$. Il est scindé dans $\C$ et admet un nombre fini de racines.

  • Soit $0$ est sa seule racine. Dans ce cas, pour tout $x\in ]0,+\infty[$, $P(x)\neq 0$. En particulier $\forall x\in ]0,1[, P(x)\neq 0.$
  • Soit il admet une ou plusieurs racines différentes de $0$. Notez $r>0$ le plus petit module de toutes ces racines. Alors $\forall x\in ]0,r[, P(x)\neq 0.$

Vous constatez que dans les deux cas énumérés ci-dessus il existe toujours un réel $\alpha>0$ tel que $\forall x\in ]0,\alpha[, P(x)\neq 0.$

Vous en déduisez que $\forall x\in ]0,\alpha[, A-xI$ est inversible.

D’après la partie précédente, pour tout $y$ tel que $0<y<\alpha$, $(A-yI)B$ et $B(A-yI)$ ont le même polynôme caractéristique.

Vous en déduisez que $\forall x\in\K, \forall y\in]0,r[$, $\det(xI-(A-yI)B)=\det(xI-B(A-yI)).$

Les deux déterminants ci-dessus sont des polynômes à deux variables en $x$ et $y$. Ce sont, en particulier, des fonctions continues à deux variables. Fixez $x\in\K$ et passez à la limite dans l’égalité $\det(xI-(A-yI)B)=\det(xI-B(A-yI))$ en faisant tendre $y$ vers $0$.

Vous obtenez l’égalité $\det(xI-AB)=\det(xI-BA).$

Concluez

Quelles que soient les matrices réelles ou complexes $A$ et $B$, les matrices $AB$ et $BA$ ont le même polynôme caractéristique.

80. Méthode de Le Verrier

Cherchez les valeurs propres de $A$

Considérez la matrice suivante : $A = \begin{pmatrix}
6 & -3 & -2 \\
4 & -1 & -2 \\
10 & -5 & -3
\end{pmatrix}.$

Comment trouver ses valeurs propres ? Supposez que vous ne connaissez rien, mais absolument rien, au concept du déterminant… De même, résoudre $AX = \lambda X$ avec $X\neq 0$ serait possible, mais vous voulez trouver autre chose…

Pour accéder aux valeurs propres, mieux vaut se placer dans $\C$, puisque vous savez que dans ce corps, tous les polynômes non constants sont scindés.

Cette propriété implique que la matrice $A$ est trigonalisable. Autrement dit, il existe une matrice inversible $P$ à coefficients complexes, trois nombres complexes, $\lambda_1$, $\lambda_2$ et $\lambda_3$ tels que $P^{-1}AP = \begin{pmatrix}
\lambda_1 &\times & \times \\
0 & \lambda_2 &\times \\
0 & 0 & \lambda_3 \\
\end{pmatrix}$

Et maintenant, la trace

La somme des valeurs propres

La trace de $A$ est égale à la somme des coefficients diagonaux de $A$, on la note $\tr(A)$ et bien-sûr $\tr(A)=2.$

La trace a une propriété très importante : quelles que soient les matrices complexes $C$ et $D$, $\tr(CD)=\tr(DC).$

Aussitôt, deux matrices semblables ont la même trace, d’où l’on déduit que $\boxed{\lambda_1+\lambda_2+\lambda_3=2}.$

La somme des carrés des valeurs propres

Après calcul, vous trouvez que $A^2 = \begin{pmatrix}
4 & -5 & 0 \\
0 & -1 & 0 \\
10 & -10 & -1
\end{pmatrix}.$

Comme $P^{-1}A^2P = \begin{pmatrix}
\lambda_1^2 &\times & \times \\
0 & \lambda_2^2 &\times \\
0 & 0 & \lambda_3^2 \\
\end{pmatrix}$

En prenant la trace, vous trouvez $\boxed{\lambda_1^2+\lambda_2^2+\lambda_3^2=2}.$

La somme des cubes des valeurs propres

Après calcul, vous trouvez que $A^3 = \begin{pmatrix}
4 & -7 & 2 \\
-4 & 1 & 2 \\
10 & -15 & 3
\end{pmatrix}.$

Comme $P^{-1}A^3P = \begin{pmatrix}
\lambda_1^3 &\times & \times \\
0 & \lambda_2^3 &\times \\
0 & 0 & \lambda_3^3 \\
\end{pmatrix}$

En prenant la trace, vous trouvez $\boxed{\lambda_1^3+\lambda_2^3+\lambda_3^3=8}.$

Les sommes de Newton et les fonctions symétriques

Les valeurs propres sont les racines du polynôme caractéristique de $A$ défini par $P(x)=(x-\lambda_1)(x-\lambda_2)(x-\lambda_3).$

En développant $P(x)$ vous obtenez : $P(x) = x^3 – (\lambda_1+\lambda_2+\lambda_3)x^2+(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)x-\lambda_1\lambda_2\lambda_3.$

Introduisez les fonctions symétriques :

\begin{aligned}
\sigma_1 &= \lambda_1+\lambda_2+\lambda_3\\
\sigma_2 &=\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3 \\
\sigma_3 &=\lambda_1\lambda_2\lambda_3.
\end{aligned}

Introduisez les sommes de Newton :

\begin{aligned}
N_1 &= \lambda_1+\lambda_2+\lambda_3\\
N_2 &=\lambda_1^2+\lambda_2^2+\lambda_3^2 \\
N_3 &=\lambda_1^3+\lambda_2^3+\lambda_3^3.
\end{aligned}

Vous connaissez les valeurs de $N_1$, $N_2$, $N_3$. Vous cherchez les valeurs de $\sigma_1$, $\sigma_2$ et $\sigma_3.$ C’est possible. Voilà comment procéder.

Vous avez déjà $\boxed{\sigma_1 = N_1}.$

Pour faire apparaître $\sigma_2$ une idée consiste à élever au carré la somme $\lambda_1+\lambda_2+\lambda_3.$

\begin{aligned}
(\lambda_1+\lambda_2+\lambda_3)^2 &= \lambda_1^2+\lambda_2^2+\lambda_3^2+2 \lambda_1\lambda_2 + 2\lambda_1\lambda_3+2\lambda_2\lambda_3\\
N_1^2 &=N_2 + 2\sigma_2
\end{aligned}

Aussitôt : $\boxed{2\sigma_2 = N_1^2-N_2}.$

Pour faire apparaître $\sigma_3$, c’est plus long mais le principe reste le même. Vous élevez au cube la somme $\lambda_1+\lambda_2+\lambda_3.$

\begin{aligned}
(\lambda_1+\lambda_2+\lambda_3)^3 &= \lambda_1^3+\lambda_2^3+\lambda_3^3+3 \lambda_1^2\lambda_2 + 3 \lambda_1^2\lambda_3+3 \lambda_2^2\lambda_1 +3 \lambda_2^2\lambda_3+3\lambda_3^2\lambda_1+3\lambda_3^2\lambda_2+6\lambda_1\lambda_2\lambda_3\\
N_1^3 &=N_3+6\sigma_3+3 (\lambda_1^2\lambda_2 + \lambda_1^2\lambda_3+ \lambda_2^2\lambda_1 +\lambda_2^2\lambda_3+\lambda_3^2\lambda_1+\lambda_3^2\lambda_2).
\end{aligned}

Il reste à calculer la somme $\lambda_1^2\lambda_2 + \lambda_1^2\lambda_3+ \lambda_2^2\lambda_1 +\lambda_2^2\lambda_3+\lambda_3^2\lambda_1+\lambda_3^2\lambda_2.$ Vous développez le produit $Q=(\lambda_1+\lambda_2+\lambda_3)(\lambda_1^2+\lambda_2^2+\lambda_3^2)$ qui se sépare en 3 termes (ceux au cube) avec 6 autres termes.

\begin{aligned}
Q &= \lambda_1^3+\lambda_1\lambda_2^2+\lambda_1 \lambda_3^2 \\&\quad+\lambda_1^2\lambda_2 +\lambda_2^3+\lambda_2\lambda_3^2 \\
&\quad+ \lambda_1^2\lambda_3 +\lambda_2^2 \lambda_3 + \lambda_3^3\\
N_1N_2 &= N_3 + \lambda_1^2\lambda_2 + \lambda_1^2\lambda_3+\lambda_2^2\lambda_1 +\lambda_2^2\lambda_3+\lambda_3^2\lambda_1+\lambda_3^2\lambda_2.
\end{aligned}

Du coup, $\lambda_1^2\lambda_2 + \lambda_1^2\lambda_3+ \lambda_2^2\lambda_1 +\lambda_2^2\lambda_3+\lambda_3^2\lambda_1+\lambda_3^2\lambda_2 = N_1N_2-N_3$, que l’on substitue plus haut, donnant :

\begin{aligned}
N_1^3 &=N_3+6\sigma_3+3(N_1N_2-N_3)\\
&=6\sigma_3 +3N_1N_2-2N_3.
\end{aligned}

Aussitôt $\boxed{6\sigma_3 = N_1^3+2N_3-3N_1N_2}.$

Calculez les fonctions symétriques

Vous avez successivement :
\begin{aligned}
\sigma_1 &= N_1 = 2\\
2\sigma_2 &= N_1^2-N_2 = 4-2=2\\
6\sigma_3 &=N_1^3+2N_3-3N_1N_2 = 8+16-12 = 12.
\end{aligned}

Aussitôt :

$\left\{\begin{align*}
\sigma_1 & = 2\\
\sigma_2 & = 1\\
\sigma_3 & = 2.\\
\end{align*}\right.$

Ecrivez le polynôme caractéristique

\begin{aligned}
P(x) &= x^3-\sigma_1x^2+\sigma_2x-\sigma_3\\
&= x^3-2x^2+x-2.
\end{aligned}

Les valeurs propres de $A$ sont les racines du polynôme $P$, il y en a trois qui annulent $P$, ce sont $2$, $i$ et $-i$.

Un prolongement…

Quelles que soient les matrices $A$ et $B$, selon vous, est-ce que $AB$ et $BA$ ont le même polynôme caractéristique ?

079. Un endomorphisme réel non diagonalisable

Considérez l’endomorphisme $f$ de $\R^3$ dont la matrice, dans la base canonique, est $A=\begin{pmatrix}6 & -3 & -2 \\ 4 & -1 & -2 \\ 10 & -5 & -3\end{pmatrix}.$

Pour savoir s’il est diagonalisable ou non, vous allez suivre les étapes suivantes :

  1. Calculez le polynôme caractéristique de la matrice $A$,
  2. Déterminez les valeurs propres de $A$,
  3. Déterminez la dimension des sous-espaces propres de $A$ avec le théorème du rang,
  4. Effectuer la somme des dimensions de ces sous-espaces propres ;
    si elle est égale à la dimension de $\R^3$, l’endomorphisme $f$ sera diagonalisable, sinon, il ne le sera pas.

Calculez le polynôme caractéristique de $A$

Effectuez des opérations élémentaires sur les lignes et/ou les colonnes pour calculer le polynôme caractéristique de $A.$

\begin{aligned}
\det (xI-A) &= \begin{vmatrix}x-6 & 3 & 2 \\ -4 & x+1 & 2\\ -10 & 5 & x+3\end{vmatrix} \\
&= \begin{vmatrix}x-2 & -x+2 & 0 \\ -4 & x+1 & 2\\ -10 & 5 & x+3\end{vmatrix} \\
&= (x-2)\begin{vmatrix}1 & -1 & 0 \\ -4 & x+1 & 2\\ -10 & 5 & x+3\end{vmatrix} \\
&= (x-2)\begin{vmatrix}1 & 0 & 0 \\ -4 & x-3 & 2\\ -10 &-5 & x+3\end{vmatrix} \\
&= (x-2)\begin{vmatrix} x-3 & 2\\ -5 & x+3\end{vmatrix} \\
&= (x-2)(x^2-9+10)\\
&=(x-2)(x^2+1).
\end{aligned}

Trouvez les valeurs propres de $A$

Ce sont les solutions de l’équation $(x-2)(x^2+1)=0.$

Il s’ensuit, comme $x$ est un nombre réel, que $x^2+1\neq 0$.
L’équation $(x-2)(x^2+1)=0$ admet $x=2$ pour solution unique.

La matrice $A$ admet exactement une seule valeur propre $2.$

Calculez la dimension des sous-espaces propres de $A$

Etudiez le seul espace propre associé à la valeur propre $2$. Vous formez la matrice : $$A-2I=\begin{pmatrix}4 & -3 & -2 \\ 4 & -3 & -2 \\ 10 & -5 & -5\end{pmatrix}.$$

Vous cherchez à déterminer la dimension du noyau de $A-2I$.

Vous constatez que les lignes $L_1$ et $L_2$ sont identiques et que les lignes $L_1$ et $L_3$ ne sont pas proportionnelles, donc le rang de la matrice $A$ est égal à $2$.

Par le théorème du rang, la dimension du noyau de $A-2I$ est égale à $1$.

En bonus, vous en déduisez que le sous espace propre associé à la valeur propre $2$ est la droite engendrée par le vecteur $u$ qui admet $\begin{pmatrix}1 \\ 0 \\ 2\end{pmatrix}$ dans la base canonique.

Concluez sur la diagonalisabilité de l’endomorphisme $f$

La somme de la dimension de tous les espaces propres (en fait il n’y en a qu’un seul) est égale à 1. Or $\R^3$ est de dimension $3$.

Aussitôt, l’endomorphisme $f$ de $\R^3$ n’est pas diagonalisable.

Remarque : par d’autres arguments, vous pouvez savoir que cet endomorphisme $f$ n’est pas diagonalisable. S’il l’était, il admettrait une base de diagonalisation. Comme il n’a qu’une seule valeur propre $2$, on en déduit que $f$ serait égal à deux fois l’application identité de $\R^3$. Mais alors la matrice $A$ serait égale à $A=2I$, ce qui n’est pas le cas.