École AVOSZ

338. Une fonction qui admet une dérivée seconde positive est nécessairement convexe

Rédigé par Yannis TRIANTAPHYLIDESon 16/09/202430/11/2024| Niveau Prépa

Soit $f$ une fonction définie sur $\R$ et deux fois dérivable sur $\R$, de sorte que $f^{\pprime}$ soit une fonction positive. Soient $a$ et $b$ deux réels tels que $a<b.$

Soit $t$ un réel de l’intervalle $[0,1].$

Remarque liminaire

On constate déjà que si $t=0$, alors :

\begin{align*} f(ta+(1-t)b) &= f(b)\\ tf(a)+(1-t)f(b) &= 1\times f(b) = f(b). \end{align*}

Vous en déduisez que l’inégalité $f(ta+(1-t)b) \leq tf(a)+(1-t)f(b)$ est satisfaite pour $t=0.$

De même, si $t=1$, alors :

\begin{align*} f(ta+(1-t)b) &= f(a)\\ tf(a)+(1-t)f(b) &= 1\times f(a) = f(a). \end{align*}

Vous en déduisez que l’inégalité $f(ta+(1-t)b) \leq tf(a)+(1-t)f(b)$ est satisfaite pour $t=1.$

Lorsque $t$ est différent de $0$ et différent de $1$ qu’en est-il ?

Supposez maintenant que $t\notin\{0,1\}.$ Vous posez $c = ta+(1-t)b.$

D’une part :

\begin{align*} b-c &=b -ta+(t-1)b\\ &=b-ta+tb-b\\ &=t(b-a). \end{align*}

Comme $b-a > 0$ et $t> 0$ il vient $b-c> 0$ et donc $c<b.$

D’autre part :

\begin{align*} c-a &=ta+(1-t)b-a\\ &=ta+b-tb-a\\ &=a(t-1)+b(1-t)\\ &=-a(1-t)+b(1-t)\\ &=(1-t)(b-a). \end{align*}

Comme $b-a > 0$ et $1-t>0$ il vient $c-a> 0$ et donc $a<c.$

En définitive, le nombre $c$ vérifie les inégalités :

\boxed{a< c < b.}

Construisez des polynômes interpolateurs

Vous posez :

P_a(X)=\frac{(X-b)(X-c)}{(a-b)(a-c)}.

Vous déduisez :

\left\{\begin{align*} P_a(a) &=1\\ P_a(b) &=0\\ P_a(c) &=0. \end{align*} \right.

Vous posez :

P_b(X)=\frac{(X-a)(X-c)}{(b-a)(b-c)}.

Vous déduisez :

\left\{\begin{align*} P_b(a) &=0\\ P_b(b) &=1\\ P_b(c) &=0. \end{align*} \right.

Enfin, vous posez :

P_c(X)=\frac{(X-a)(X-b)}{(c-a)(c-b)}.

Vous déduisez :

\left\{\begin{align*} P_c(a) &=0\\ P_c(b) &=0\\ P_c(c) &=1. \end{align*} \right.

Maintenant, vous définissez un polynôme $P$ de la façon suivante, en posant :

P(X) = f(a)P_a(X)+f(b)P_b(X)+f(c)P_c(X).

Vous avez l’évaluation suivante :

\begin{align*} P(a) &= f(a)P_a(a)+f(b)P_b(a)+f(c)P_c(a)\\ &=f(a)\times 1 + f(b)\times 0+f(c)\times 0\\ &=f(a). \end{align*}

Puis :

\begin{align*} P(b) &= f(a)P_a(b)+f(b)P_b(b)+f(c)P_c(b)\\ &=f(a)\times 0 + f(b)\times 1+f(c)\times 0\\ &=f(b). \end{align*}

Enfin :

\begin{align*} P(c) &= f(a)P_a(c)+f(b)P_b(c)+f(c)P_c(c)\\ &=f(a)\times 0 + f(b)\times 0+f(c)\times 1\\ &=f(c). \end{align*}

Utilisez le théorème de Rolle plusieurs fois

Pour tout réel $x$, vous posez $g(x) = f(x)-P(x).$

D’après ce qui précède, vous avez $g(a) = 0$ et $g(c)=0$, si bien que $g(a)=g(c).$ La fonction $g$ est dérivable sur $\R$ comme différence de la fonction $f$ et de la fonction polynôme $P$ qui le sont. Ainsi, $g$ est continue sur $[a,c]$ et dérivable sur $]a,c[.$ D’après le théorème de Rolle, il existe un réel $\alpha\in]a,c[$ tel que $g'(\alpha)=0.$

De même, vous avez $g(c) = 0$ et $g(b)=0$ si bien que $g(c)=g(b).$ La fonction $g$ est dérivable sur $\R$ donc elle est dérivable sur $]c,b[$ et elle est continue sur $[c,b].$ D’après le théorème de Rolle, il existe un réel $\beta\in]c,b[$ tel que $g'(\beta)=0.$

Notez que $\alpha < c <\beta$ si bien que $\alpha < \beta.$

De plus, pour tout réel $x$, il vient $g'(x) = f'(x)-P'(x).$ Comme $f$ est deux fois dérivable sur $\R$, $f’$ est bien dérivable sur $\R.$ La fonction polynôme $P’$ est elle aussi dérivable sur $\R.$ Par différence, $g’$ est dérivable sur $\R.$ En particulier, $g’$ est continue sur $[\alpha, \beta]$ et dérivable sur $]\alpha, \beta[.$ Comme $g'(\alpha) = g'(\beta)$ le théorème de Rolle fournit l’existence d’un réel $\xi\in]\alpha, \beta[$ tel que $g^{\pprime}(\xi) = 0.$

Or, pour tout réel $x$, $g^{\pprime}(x) = f^{\pprime}(x)-P^{\pprime}(x).$

En évaluant pour $x=\xi$, vous déduisez $f^{\pprime}(\xi)-P^{\pprime}(\xi) = 0$ soit $f^{\pprime}(\xi)=P^{\pprime}(\xi).$

La dérivée seconde de $f$ étant positive sur $\R$ tout entier, vous déduisez $\boxed{P^{\pprime}(\xi) \geq 0.}$

Calculez la dérivée seconde du polynôme $P$

Il a été vu que:

P(X) = f(a)P_a(X)+f(b)P_b(X)+f(c)P_c(X).

En dérivant deux fois, il vient:

P^{\pprime}(X) = f(a)P_a^{\pprime}(X)+f(b)P_b^{\pprime}(X)+f(c)P_c^{\pprime}(X).

Maintenant:

P_a(X)=\frac{(X-b)(X-c)}{(a-b)(a-c)}.

En dérivant une première fois, vous avez:

P_a^{'}(X)=\frac{1\times (X-c)+(X-b)\times 1}{(a-b)(a-c)}.

En dérivant encore une fois:

P_a^{\pprime}(X) = \frac{2}{(a-b)(a-c)}.

Vous recommencez avec le polynôme $P_b$ ce qui fournit:

P_b(X)=\frac{(X-a)(X-c)}{(b-a)(b-c)}.

Puis:

P_b^{'}(X)=\frac{1\times (X-c)+(X-a)\times 1}{(b-a)(b-c)}.

Soit:

P_b^{\pprime}(X) = \frac{2}{(b-a)(b-c)}.

Vous terminez avec le polynôme $P_c$ ce qui fournit:

P_c(X)=\frac{(X-a)(X-b)}{(c-a)(c-b)}.

Puis:

P_c^{'}(X)=\frac{1\times (X-b)+(X-a)\times 1}{(c-a)(c-b)}.

Soit:

P_c^{\pprime}(X) = \frac{2}{(c-a)(c-b)}.

L’ensemble étant réuni, il se trouve que:

\boxed{P^{\pprime}(X) = \frac{2f(a)}{(a-b)(a-c)}+\frac{2f(b)}{(b-a)(b-c)}+ \frac{2f(c)}{(c-a)(c-b)}.}

Note. Le polynôme $P$ ayant un degré inférieur ou égal à $2$, on retrouve que $P’$ est de degré inférieur ou égal à $1$ et donc $P^{\pprime}$ est bien constant.

Concluez

En évaluant en $X=\xi$ et en tenant compte de l’inégalité $P^{\pprime}(\xi)\geq 0$ vous déduisez:

\frac{2f(a)}{(a-b)(a-c)}+\frac{2f(b)}{(b-a)(b-c)}+ \frac{2f(c)}{(c-a)(c-b)} \geq 0.

Après division par $2$, il vient:

\frac{f(a)}{(a-b)(a-c)}+\frac{f(b)}{(b-a)(b-c)}+ \frac{f(c)}{(c-a)(c-b)} \geq 0.

Vous cherchez à isoler $f(c).$ Donc:

\frac{f(a)}{(a-b)(a-c)}+\frac{f(b)}{(b-a)(b-c)}\geq - \frac{f(c)}{(c-a)(c-b)}.

Comme $(a-b)(a-c) = (b-a)(b-c)$, et $-(c-b) = b-c$ vous déduisez:

\frac{f(a)}{(b-a)(c-a)}+\frac{f(b)}{(b-a)(b-c)}\geq \frac{f(c)}{(c-a)(b-c)}.

Comme $a<c<b$ les trois nombres $b-c$ puis $c-a$ et $b-a$ sont strictement positifs.

Par produit, il en résulte que $(b-a)(b-c)(c-a)>0.$ En multipliant la dernière inégalité par ce nombre et après simplification, il vient:

(b-c)f(a)+(c-a)f(b) \geq (b-a)f(c).

Or, il a été vu à la première section de cet article que:

\left\{\begin{align*} b-c&=t(b-a)\\ c-a &=(1-t)(b-a). \end{align*} \right.

La précédente inégalité s’écrit ainsi:

t(b-a)f(a)+(1-t)(b-a)f(b) \geq (b-a)f(c).

Comme $b-a > 0$ vous pouvez diviser par ce nombre et simplifier. Vous obtenez:

tf(a)+(1-t)f(b) \geq f(c).

Comme $c = ta+(1-t)b$, il vient:

f(ta+(1-t)b)\leq tf(a)+(1-t)f(b).

Il a donc été montré que:

\forall t\in]0,1[, f(ta+(1-t)b)\leq tf(a)+(1-t)f(b).

En tenant compte de la remarque liminaire, vous avez montré que:

\forall t\in[0,1], f(ta+(1-t)b)\leq tf(a)+(1-t)f(b).

Épilogue

Pour toute fonction $f$ définie sur $\R$ et deux fois dérivable sur $\R$ et de dérivée seconde positive, il a été montré que quels que soient les réels $a$ et $b$ tels que $a<b$ vous avez l’inégalité :

\boxed{\forall t\in[0,1], f(ta+(1-t)b)\leq tf(a)+(1-t)f(b).}

Autrement dit, la fonction $f$ est convexe sur $\R.$

337. Une série convergente donne une fonction intégrable au sens de Henstock-Kurzweil

Rédigé par Yannis TRIANTAPHYLIDESon 01/08/202427/08/2024| Niveau Agrégation, Niveau Capes, Niveau Licence

Motivation

Pour tout entier naturel $k$, vous posez :

c_k = 1-\frac{1}{2^k} = \frac{2^k-1}{2^k}.

La suite $(c_k)_{k\geq 0}$ est strictement croissante et converge vers $1.$ D’autre part, pour tout entier naturel $k$, $c_k\neq 1.$

Note. La démonstration de ces résultats est laissée au lecteur et ne sera pas traitée dans cet exposé.

01/08/2024 - 2024.08.01 les termes de la suite (cp)

Soit $\sum_{k\geq 1} a_k$ une série réelle convergente.

Vous notez sa limite ainsi :

\boxed{A=\sum_{k=1}^{+\infty} a_k.}

Notez que la suite $(a_k)_{k\geq 1}$ converge alors vers $0.$ Il en est de même de la suite $(\vert a_k \vert)_{k\geq 1}$. En tant que suite positive convergente, elle est majorée.

Il existe un réel $\boxed{M>0}$ tel que $\boxed{\forall k\geq 1, \vert a_k \vert \leq M.}$

A cette série, vous associez la fonction $h: [0,1]\to \R$ définie de la façon suivante :

\boxed{\left\{\begin{align*} &\forall k\geq 1, \forall x\in[c_{k-1}, c_k[, h(x) = 2^ka_k\\ &h(1)=0. \end{align*} \right. }

Remarquez que $\lim_{n\to +\infty} \sum_{k=1}^{n} a_k = A$ si bien que $\lim_{n\to +\infty} \sum_{k=n+1}^{+\infty} a_k =0.$

Soit $k\geq 1.$ La longueur de l’intervalle $[c_{k-1},c_k]$ est égale à :

\begin{align*} c_k-c_{k-1} &= \frac{2^k-1}{2^k}-\frac{2^{k-1}-1}{2^{k-1}} \\ &= \frac{2^k-1}{2^k}-\frac{2^{k}-2}{2^{k}} \\ &=\frac{1}{2^k}. \end{align*}

D’autre part, la fonction $h$ est constante sur l’intervalle $[c_{k-1},c_k[$ et prend pour valeur $2^k a_k.$ Le graphique ci-dessous illustre une représentation possible de la fonction $h$ sur l’intervalle $[0 ; 15/16[.$ Par contre la représentation de $h$ sur l’intervalle $[15/16, 1[$ a été omise, compte tenu du nombre infini d’intervalles qu’il faudrait représenter.

02/08/2024 - 2024.08.02 l'aire sous la courbe correspond à la série

Graphiquement, il semble légitime de considérer que l’aire du domaine délimité par l’axe des abscisses, la courbe de la fonction $h$, l’axe des ordonnées et la droite verticale d’équation $x=1$ est égale à:

\sum_{k=1}^{+\infty} (c_k-c_{k-1}) 2^k a_k = \sum_{k=1}^{+\infty} a_k.

Avant d’affirmer la validité de cette égalité, il convient de procéder aux démonstrations requises.

Objectif principal

Quelques définitions : notion de subdivision étiquetée

On appelle subdivision étiquetée $P$ de l’intervalle $[0,1]$ tout ensemble fini tel que :

il existe un entier $n\geq 1$ ;
et il existe $(x_0,\dots,x_n)\in\R^{n+1}$ tel que $x_0 < \dots < x_n$ avec $x_0=0$ et $x_n = 1$ ;
et il existe $(t_1,\dots,t_n)\in\R^n$ tel que $\forall i\in\llbracket 1, n\rrbracket, t_i\in[x_{i-1},x_i]$ tels que :
$P = \{ ([x_{i-1}, x_i], t_i), 1\leq i \leq n\}.$

La subdivision $P$ étant définie, les intervalles $[x_{i-1},x_i]$ sont appelés intervalles de la subdivision $P$ et les réels $t_i$ sont appelés les étiquettes de la subdivision $P.$ Pour chaque intervalle $[x_{i-1},x_i]$, le réel $t_i$ est son étiquette.

Pour plus de commodité dans la suite, la somme $\sum_{i=1}^n h(t_i)(x_i-x_{i-1})$ sera appelée somme de Riemann de $h$ associée à la subdivision étiquetée $P$ et sera notée :

S(h,P)=\sum_{i=1}^n h(t_i)(x_i-x_{i-1}).

Notion de subdivision fine

Soit $n$ un entier tel que $n\geq 1.$ Soit $\delta: [0,1]\to \R_{+}^{*}$ une fonction strictement positive sur $[0,1]$ et soit $P = \{ ([x_{i-1}, x_i], t_i), 1\leq i \leq n\}$ une subdivision étiquetée de l’intervalle $[0,1].$

La subdivision $P$ est dite $\delta$-fine si et seulement si :

\forall i\in\llbracket 1, n\rrbracket, [x_{i-1},x_i]\subset [t_i-\delta(t_i), t_i+\delta(t_i)].

Intégrabilité au sens de Henstock-Kurzweil

Dans ce qui suit, il sera démontré en détail que la fonction $h$ est intégrable au sens de Henstock-Kurzweil sur $[0,1]$ et que son intégrale est bien égale à la somme de la série précitée :

\int_{0}^1 h(t)\dt = A.

Cela signifie que, pour tout réel $\varepsilon$ strictement positif, il existe une fonction $\delta: [0,1]\to \R_{+}^{*}$ (appelée jauge) strictement positive telle que pour toute subdivision étiquetée $P$ de l’intervalle $[0,1]$ qui soit $\delta$-fine, vous ayez la majoration :

\left\vert S(h,P) - A \right\vert \leq \varepsilon.

Analyse et construction d’une jauge

Soit $\varepsilon$ un réel strictement positif fixé.

Vous considérez une fonction $\delta: [0,1]\to \R_{+}^{*}$, appelée jauge.

Soit maintenant et $n\in\NN$ et $P = \{ ([x_{i-1}, x_i], t_i), 1\leq i \leq n\}$ une subdivision étiquetée de l’intervalle $[0,1]$ qui soit $\delta$-fine.

Choisissez la jauge pour que l’étiquette $t_1$ soit égale à $0$

Vous allez imposer la propriété suivante pour la jauge $\delta$ :

\boxed{\forall t\in]0,1], \delta(t) \leq \frac{t}{2}.}

Supposez que $t_1$ soit non nul.

Vous avez $t_1\in[x_0,x_1]$ avec $[x_0,x_1]\subset[0,1]$ donc $t_1\in]0,1].$

Comme $x_0=0$ vous avez :

\begin{align*} [0,x_1] \subset [t_1-\delta(t_1), t_1+\delta(t_1)]. \end{align*}

Du coup :

\begin{align*} t_1-\delta(t_1)&\leq 0 \\ t_1&\leq\delta(t_1)\\ t_1&\leq \frac{t_1}{2}. \end{align*}

Comme $t_1$ est strictement positif, en divisant par $t_1$ il vient :

1\leq \frac{1}{2}

ce qui est absurde.

Du coup il est établi que :

\boxed{t_1 = 0.}

Choisissez la jauge pour que $[x_0,x_1]\subset[0,1/4]$

Bien que non indispensable, vous allez choisir une valeur de $\delta(0)$ pour que l’inclusion $[x_0,x_1]\subset[0,1/4]$ soit vérifiée.

Puisque $0$ est l’étiquette de l’intervalle $[x_0,x_1]$, vous avez l’inclusion suivante :

[x_0,x_1] \subset[0-\delta(0), 0+\delta(0)].

Ainsi, $x_1\leq \delta(0).$

Vous choisissez alors $\delta(0)$ tel que :

\boxed{\delta(0)\leq\frac{1}{4}.}

Forcez la dernière étiquette à être égale à $1$

Par définition de la subdivision $P$, l’étiquette $t_n$ appartient à l’intervalle $[x_{n-1}, x_n].$

Vous allez imposer la propriété suivante pour la jauge $\delta$ :

\boxed{\forall t\in[0,1[, \delta(t) \leq \frac{1-t}{2}.}

Supposez maintenant que $t_n \neq 1.$ Alors $t_n\in[0,1[$ et vous avez ce qui suit:

\delta(t_n)\leq \frac{1-t_n}{2}.

Comme $[x_{n-1}, x_n]\subset [t_n-\delta(t_n), t_n+\delta(t_n)]$ vous avez $1\in [t_n-\delta(t_n), t_n+\delta(t_n)]$ donc :

\begin{align*} 1&\leq t_n +\delta(t_n)\\ 2&\leq 2t_n+2\delta(t_n)\\ 2&\leq 2t_n+1-t_n\\ 1&\leq t_n. \end{align*}

Ce résultat est contradictoire avec $t_n \in [0,1[.$

Grâce à ce raisonnement par l’absurde, vous avez établi que:

\boxed{t_n =1.}

Définissez une utile fonction $\varphi$

Vous notez $\boxed{E = \{ c_k, k\in\N\}.}$ Soit maintenant un réel $x$ appartenant à l’ensemble $]0,1[\setminus E.$ L’ensemble $B = \{ \vert x-c_k\vert, k\in\N \}$ est une partie de $\R.$ Prenant $k=0$, il apparaît que $\vert x-c_0\vert \in B$ donc $B$ est non vide. D’autre part, $\forall k\in\N, \vert x-c_k\vert \geq 0$ donc $0$ minore $B.$

Il en résulte que $B$ admet une borne inférieure, qui sera notée $\varphi(x).$

Par définition:

\boxed{\forall x\in]0,1[\setminus E, \varphi(x) = \inf \{ \vert x-c_k\vert, k\in\N \}.}

ll s’agit maintenant de caractériser $\varphi(x)$ et de montrer que c’est un réel strictement positif.

En raisonnant par l’absurde, supposez que:

\forall k\in\N, c_k\leq x.

En passant à la limite, quand $k\to +\infty$ on aurait $1\leq x$ ce qui contredit le fait que $x \in]0,1[.$

Donc il existe un nombre $\ell \in \N$ tel que $x<c_{\ell}.$

L’ensemble $\{k\in\N, x<c_k\}$ est une partie de $\N$ qui est non vide puisqu’elle contient $\ell.$ Elle admet un plus petit élément qui sera noté $m(x).$

Si $m(x)=0$, alors $x<c_{m(x)}$ fournit $x<c_0$ soit $x<0$ ce qui est absurde. Donc $m(x)\neq 0$ et par suite $m(x)\geq 1.$ Comme $m(x)-1$ est un entier naturel qui est strictement inférieur au minimum de l’ensemble $\{k\in\N, x<c_k\}$, vous déduisez que $c_{m(x)-1}\leq x.$ Du coup, $c_{m(x)-1}\leq x < c_{m(x)}.$

Soit $k\in\N.$ Si $k\geq m(x)$ par croissance de la suite $(c_i)_{i\geq 0}$ il vient $c_{m(x)}\leq c_k$ donc $x < c_{m(x)} \leq c_k$ donc $\vert x-c_k\vert \geq \vert x-c_{m(x)}\vert.$

Si $k < m(x)$ alors $k\leq m(x)-1.$ Toujours par croissance de la suite $(c_i)_{i\geq 0}$ il vient $c_k\leq c_{m(x)-1}\leq x$ donc $\vert x-c_k\vert \geq \vert x-c_{m(x)-1}\vert.$

Vous déduisez que:

\forall k\in\N, \vert x-c_k\vert\geq \min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\}.

Le nombre $\min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\}$ minore l’ensemble $B.$ Comme $\varphi(x)$ est le plus grand des minorants de $B$, vous avez obtenu:

\min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\} \leq \varphi(x).

Comme $m(x)$ est un entier naturel, $\vert x-c_{m(x)}\vert \in B.$ Comme $\varphi(x)$ est un minorant de $B$, vous déduisez $\varphi(x)\leq \vert x-c_{m(x)}\vert.$

Comme $m(x)-1$ est un entier naturel, $\vert x-c_{m(x)-1}\vert \in B.$ Comme $\varphi(x)$ est un minorant de $B$, vous déduisez $\varphi(x)\leq \vert x-c_{m(x)-1}\vert.$

Comme $\min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\}$ est nécessairement égal à l’un des deux nombres parmi $\vert x-c_{m(x)-1}\vert$ et $\vert x-c_{m(x)}\vert$ vous déduisez:

\varphi(x) \leq \min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\}.

Il a donc été démontré que:

\boxed{\forall x\in]0,1[\setminus E, \varphi(x) = \min\{\vert x-c_{m(x)}\vert, \vert x-c_{m(x)-1}\vert\}.}

Soit $x\in]0,1[\setminus E.$ Supposez que $\varphi(x)=0.$ Alors soit $\vert x-c_{m(x)} \vert=0$ ce qui fournit $x = c_{m(x)}$ et donc $x\in E$ ce qui est absurde. Soit $\vert x-c_{m(x)-1} \vert=0$ ce qui fournit $x = c_{m(x)-1}$ et donc $x\in E$ ce qui est absurde.

Ainsi:

\boxed{\forall x\in]0,1[\setminus E, \varphi(x) >0.}

Choisissez la jauge pour obtenir une propriété sur les intervalles de la subdivision $P$ dont l’étiquette n’appartient pas à $E$

Il a déjà été établi que $0$ et $1$ sont des étiquettes.

Soit $i\in\llbracket 1, n\rrbracket$ un indice tel que $t_i\in]0,1[$ soit une étiquette pour un intervalle $[x_{i-1},x_i]$ de la subdivision $P.$ Supposez que $t_i \notin E.$

Vous allez imposer la propriété suivante pour la jauge $\delta$ :

\boxed{\forall t\in]0,1[\setminus E, \delta(t) \leq \frac{\varphi(t)}{2}.}

Il a été vu que:

\forall x\in]0,1[\setminus E, c_{m(x)-1}\leq x < c_{m(x)}.

En particulier, pour $x=t_i$ vous déduisez:

c_{m(t_i)-1}\leq t_i < c_{m(t_i)}.

Comme $t_i\notin E$, vous avez $t_i\neq c_{m(t_i)-1}$ d’où:

c_{m(t_i)-1} < t_i < c_{m(t_i)}.

D’autre part:

\begin{align*} [x_{i-1},x_i] &\subset [t_i-\delta(t_i), t_i+\delta(t_i)]\\ [x_{i-1},x_i] &\subset [t_i-\varphi(t_i)/2, t_i+\varphi(t_i)/2]. \end{align*}

Vous avez les inégalités suivantes :

\begin{align*} x_i&\leq t_i+\frac{\varphi(t_i)}{2} \\ t_i-\frac{\varphi(t_i)}{2}&\leq x_{i-1}. \end{align*}

Or :

\begin{align*} \varphi(t_i) &= \min\{\vert t_i-c_{m(t_i)}\vert, \vert t_i-c_{m(t_i)-1}\vert\} \\ &=\min\{c_{m(t_i)}-t_i, t_i-c_{m(t_i)-1}\}. \end{align*}

Du coup :

\begin{align*} x_i&\leq t_i+\frac{c_{m(t_i)}-t_i}{2} \\ t_i-\frac{t_i-c_{m(t_i)-1}}{2}&\leq x_{i-1}. \end{align*}

Ce qui fournit :

\begin{align*} x_i&\leq \frac{c_{m(t_i)}+t_i}{2} < \frac{c_{m(t_i)}+c_{m(t_i)}}{2}\\ \frac{c_{m(t_i)-1}+c_{m(t_i)-1}}{2} < \frac{c_{m(t_i)-1}+t_i}{2}&\leq x_{i-1}. \end{align*}

Il en résulte que $[x_{i-1},x_i]\subset ]c_{m(t_i)-1}, c_{m(t_i)}[.$

Cette section a établi le résultat suivant:

\boxed{\forall i\in\llbracket 1, n\rrbracket, t_i\in]0,1[\setminus E \implies [x_{i-1},x_i]\subset ]c_{m(t_i)-1}, c_{m(t_i)}[.}

Choisissez la jauge de sorte que tout intervalle de $P$ (excepté le dernier) qui contient une valeur $c_k$ pour k entier naturel non nul a son étiquette qui est égale à $c_k$

Ce résultat sera prouvé en deux temps. Tout d’abord vous prouvez un résultat plus faible.

Vous établissez d’abord que tout intervalle de $P$ (excepté le dernier) contenant une valeur $c_k$ pour k entier naturel non nul a son étiquette qui appartient à $E.$

Puisque $[x_0,x_1]\subset [0,1/4]$, il est impossible d’avoir $n=1$ donc la partition $P$ comprend au moins deux intervalles, c’est-à-dire $\boxed{n\geq 2.}$

Soit $k\in\NN$ tel qu’il existe un entier $i\in \llbracket 1, n-1\rrbracket$ vérifiant $c_k\in[x_{i-1},x_i].$

Supposez que l’étiquette $t_i$ de l’intervalle $[x_{i-1},x_i]$ n’appartienne pas à $E.$

Si $t_i = 0$ alors c’est que $i=1.$ Vous avez $[x_0,x_1]\subset[0,1/4]$ et par conséquent $c_k \in [0, 1/4]$, ce qui entraîne que $c_k = 0$ et $k=0$, contradiction avec $k\in\NN.$

Donc $t_i > 0.$ Comme $t_i\leq x_{i} < x_n$ vous avez $t_i\in]0,1[.$

Puisque $t_i\in]0,1[\setminus E$ vous déduisez que $[x_{i-1},x_i]\subset ]c_{m(t_i)-1}, c_{m(t_i)}[.$

Comme $c_k\in [x_{i-1},x_i]$ il en résulte que $c_{m(t_i)-1}<c_k < c_{m(t_i)}.$

Comme la suite $(c_m)_{m\geq 0}$ est strictement croissante, il vient $m(t_i)-1< k < m(t_i).$

Comme $k$ et $m(t_i)-1$ sont des entiers, l’inégalité $m(t_i)-1<k$ entraîne $m(t_i)\leq k$ ce qui contredit $k<m(t_i).$

Du coup, $t_i\in E.$

Il est établi que :

(\exists k\in \N, \exists i\in\llbracket 1, n-1\rrbracket, c_k\in [x_{i-1},x_i] )\implies t_i\in E.

Note. A ce stade, il est tout à fait possible qu’un intervalle de la subdivision $P$ contienne plusieurs valeurs de $E.$

Vous allez ajuster la jauge pour que cela ne puisse pas se produire.

Vous choisissez maintenant la jauge pour que toute tout intervalle de $P$ (excepté le dernier) qui contient une valeur $c_k$ pour k entier naturel non nul, ait son étiquette égale à $c_k.$

Soit $k\in\NN$ tel qu’il existe un entier $i\in \llbracket 1, n-1\rrbracket$ vérifiant $c_k\in[x_{i-1},x_i].$

Il a été vu que $t_i \in E$ donc il existe un entier naturel $\ell$ tel que $t_i = c_{\ell}.$

Si $c_{\ell}\neq c_k$, alors $k\neq \ell$ et deux cas se présentent.

1er cas. $k < \ell$ soit $k+1\leq \ell.$ Donc il existe un entier naturel $\zeta$ tel que $\ell = k+1+\zeta.$

\begin{align*} \vert c_k-c_{\ell}\vert &= \left\vert 1-\frac{1}{2^k} -1 + \frac{1}{2^{\ell}} \right\vert\\ &= \left\vert -\frac{1}{2^k} + \frac{1}{2^{\ell}} \right\vert\\ &= \left\vert \frac{1}{2^k} - \frac{1}{2^{\ell}} \right\vert \\ &= \left\vert \frac{2^{1+\zeta}}{2^{k+1+\zeta}} - \frac{1}{2^{k+1+\zeta}} \right\vert \\ &= \frac{2^{1+\zeta}-1}{2^{k+1+\zeta}}\\ &= \frac{2^{1+\zeta}-1}{2^{\ell}} \end{align*}

Comme $2^{1+\zeta}\geq 2$, il a été obtenu ce qui suit :

\begin{align*} \frac{1}{2^{\ell}} \leq \vert c_k-c_{\ell}\vert. \end{align*}

Or, $[x_{i-1},x_i]\subset [t_i-\delta(t_i), t_i+\delta(t_i)]$ donc en prenant les longueurs :

\frac{1}{2^{\ell}} \leq \vert c_k-c_{\ell}\vert \leq x_i-x_{i-1}\leq 2 \delta(t_i).

Vous allez donc choisir la jauge $\delta$ sur l’ensemble $E$ pour avoir :

\boxed{\forall \ell\in\N, \delta(c_\ell) \leq \frac{1}{3\times 2^\ell}.}

Alors :

2 \delta(c_{\ell}) \leq \frac{2}{3\times 2^{\ell}} < \frac{1}{2^{\ell}}.

Ceci est absurde. Donc le 1er cas ne se produit pas.

2ème cas. $k > \ell$ soit $k\geq \ell+1.$ Ainsi il existe un entier naturel $\eta$ tel que $k = \ell+1+\eta.$

\begin{align*} \vert c_k-c_{\ell}\vert &= \left\vert -\frac{1}{2^k} + \frac{1}{2^{\ell}} \right\vert\\ &= \left\vert \frac{1}{2^{\ell}} - \frac{1}{2^{k}} \right\vert \\ &= \left\vert \frac{2^{1+\eta}}{2^{\ell+1+\eta}} - \frac{1}{2^{\ell+1+\eta}} \right\vert \\ &= \frac{2^{1+\eta}-1}{2^{\ell+1+\eta}}. \end{align*}

Or, $2^{\eta}\geq 1$ donc $2\times2^{\eta} \geq 2^{\eta}+1$ et par suite $2^{1+\eta}-1 \geq 2^{\eta}.$

Du coup :

\begin{align*} \vert c_k-c_{\ell}\vert &\geq \frac{2^{\eta}}{2^{\ell+1+\eta}}\\ & \geq \frac{1}{2^{\ell +1}} \\ & \geq \frac{1}{2\times 2^{\ell}}. \end{align*}

Comme précédemment, il vient :

\frac{1}{2\times 2^{\ell}} \leq \vert c_k-c_{\ell}\vert \leq x_i-x_{i-1}\leq 2 \delta(t_i).

Vous allez donc choisir la jauge $\delta$ sur l’ensemble $E$ pour pouvoir garder la condition précédente. Vous prenez par exemple :

\boxed{\forall \ell\in\N, \delta(c_\ell) \leq \frac{1}{6\times 2^\ell}.}

Du coup :

\begin{align*} 2\delta(c_\ell) &\leq \frac{2}{6\times 2^\ell} \\ &\leq \frac{1}{3\times 2^\ell} \\ & < \frac{1}{2\times 2^\ell}. \end{align*}

Cette dernier résultat est encore absurde.

L’hypothèse $c_{\ell}\neq c_k$ est donc fausse. Il en résulte que $t_i = c_{\ell} = c_k.$

Il est ainsi prouvé ce qui suit :

\boxed{(\exists k\in \N, \exists i\in\llbracket 1, n-1\rrbracket, c_k\in [x_{i-1},x_i] )\implies t_i = c_k.}

Ainsi, si un intervalle de la subdivision $P$ possède un élément de $E$, alors cet élément est nécessairement l’étiquette de l’intervalle considéré.

Majorez les valeurs absolues de $h(c_{k-1})-h(c_k)$ et de $h(c_k)$ pour $k$ entier naturel non nul

Soit $k\in\NN.$ Vous avez, par définition de la fonction $h$ :

\left\{\begin{align*} h(c_k) &= 2^{k+1}a_{k+1}\\ h(c_{k-1}) &= 2^ka_k. \end{align*} \right.

Donc :

\begin{align*} \vert h(c_k) - h(c_{k-1}) \vert &= \vert 2^{k+1}a_{k+1} - 2^ka_k \vert \\ &= 2^k \vert 2a_{k+1}-a_k\vert. \end{align*}

Utilisant l’inégalité triangulaire et la propriété sur le réel $M$ défini en tout début de cet exposé :

\begin{align*} \vert h(c_k) - h(c_{k-1}) \vert &\leq 2^k ( 2\vert a_{k+1}\vert + \vert a_k\vert) \\ &\leq 2^k (2M+M)\\ &\leq 3M\times 2^k. \end{align*}

Pour la valeur absolue de $h(c_k)$ vous obtenez aussi :

\begin{align*} \vert h(c_k) \vert &\leq 2^k \times 2\vert a_{k+1}\vert \\ &\leq 2^k \times 2M\\ &\leq 3M\times 2^k. \end{align*}

Pour conclure :

\boxed{\forall k\in\NN, \vert h(c_k) - h(c_{k-1}) \vert \leq 3M\times 2^k \text{ et } \vert h(c_k)\vert\leq 3M\times 2^k.}

Montrez que l’écart entre la somme de Riemann et le début de la série est faible

Pour comprendre le phénomène, supposez que la subdivision $P$ soit comme indiquée ci-dessous :

La subdivision $P$ est formée de 9 intervalles : :

P = \{([x_{i-1},x_i],t_i), 1\leq i \leq 9\}.

Il a déjà été établi plus haut que nécessairement, à cause de la jauge $\delta$ :

\left\{\begin{align*} t_1&=0\\ t_9&=1. \end{align*} \right.

Vous remarquez que $c_4\in]x_8,x_9]$ et que $c_3\notin ]x_8,x_9].$

La suite $(c_k)_{k\geq 4}$ étant strictement croissante et convergente vers $1=x_9$ vous déduisez que :

\forall k\geq 4, x_8 < c_k <1.

Le dernier intervalle de la subdivision $P$ contient presque toutes les valeurs de la suite $(c_k)_{k\geq 0}.$ De plus, comme $h(1)=0$ vous déduisez que :

h(1)(x_9-x_8)=0.

La somme de Riemann de la subdivision $P$ est égale à :

\begin{align*} S(h,P)&=\sum_{i=1}^9 h(t_i)(x_i-x_{i-1})\\ & =\sum_{i=1}^8 h(t_i)(x_i-x_{i-1}) + h(1)(x_9-x_8)\\ &=\sum_{i=1}^8 h(t_i)(x_i-x_{i-1}). \end{align*}

Comme $t_2$ et $t_3$ appartiennent à l’intervalle $[c_0,c_1[$, vous avez $h(0)=h(t_1) = h(c_0)=h(t_2)=h(t_3).$

Donc, en factorisant:

h(t_1)(x_1-x_0)+h(t_2)(x_2-x_1)+h(t_3)(x_3-x_2) = h(c_0)(x_3-x_0).

Vous décomposez la valeur de $h(t_4)(x_4-x_3)$ en deux, vu que $[x_3,x_4]$ contient une étiquette appartenant à $E$ :

\begin{align*} h(t_4)(x_4-x_3) &= h(c_1)(x_4-x_3)\\ &= h(c_1)(x_4-c_1) + h(c_1)(c_1-x_3). \end{align*}

Comme $t_5$ appartient à l’intervalle $[c_1,c_2[$, vous avez $h(t_5)=h(c_1).$

\begin{align*} h(t_5)(x_5-x_4) &= h(c_1)(x_5-x_4). \end{align*}

Vous décomposez la valeur de $h(t_6)(x_6-x_5)$ en deux, vu que $[x_5,x_6]$ contient une étiquette appartenant à $E$ :

\begin{align*} h(t_6)(x_6-x_5) &= h(c_2)(x_6-x_5)\\ &= h(c_2)(x_6-c_2) + h(c_2)(c_2-x_5). \end{align*}

Comme $t_7$ appartient à l’intervalle $[c_2,c_3[$, vous avez $h(t_7)=h(c_2).$

\begin{align*} h(t_7)(x_7-x_6) &= h(c_2)(x_7-x_6). \end{align*}

Vous décomposez la valeur de $h(t_8)(x_8-x_7)$ en deux, vu que $[x_7,x_8]$ contient une étiquette appartenant à $E$ :

\begin{align*} h(t_8)(x_8-x_7) &= h(c_3)(x_8-x_7)\\ &= h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7). \end{align*}

La somme de Riemann vaut donc :

\begin{align*} S(h,P)&=h(c_0)(x_3-x_0) \\ &\qquad +h(c_1)(x_4-c_1) + h(c_1)(c_1-x_3)\\ &\qquad +h(c_1)(x_5-x_4)\\ &\qquad +h(c_2)(x_6-c_2) + h(c_2)(c_2-x_5)\\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad + h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7). \end{align*}

Vous forcez l’apparition du réel $a_1 = h(c_0)(c_1-c_0).$

\begin{align*} S(h,P)&=h(c_0)(x_3-c_0) \\ &\qquad + h(c_0)(c_1-x_3) + (h(c_1)-h(c_0))(c_1-x_3) +h(c_1)(x_4-c_1) \\ &\qquad +h(c_1)(x_5-x_4)\\ &\qquad +h(c_2)(x_6-c_2) + h(c_2)(c_2-x_5)\\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad + h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7)\\ &= a_1 + (h(c_1)-h(c_0))(c_1-x_3) +h(c_1)(x_4-c_1) \\ &\qquad +h(c_1)(x_5-x_4)\\ &\qquad +h(c_2)(x_6-c_2) + h(c_2)(c_2-x_5)\\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad + h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7). \end{align*}

De même vous préparez l’apparition du réel $a_2 = h(c_1)(c_2-c_1).$

\begin{align*} S(h,P)&= a_1 + (h(c_1)-h(c_0))(c_1-x_3) +h(c_1)(x_4-c_1) \\ &\qquad +h(c_1)(x_5-x_4)\\ &\qquad +h(c_1)(c_2-x_5) + (h(c_2)-h(c_1))(c_2-x_5) +h(c_2)(x_6-c_2) \\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad + h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7). \end{align*}

Et vous déduisez ce qui suit :

\begin{align*} S(h,P)&= a_1 +a_2+ (h(c_1)-h(c_0))(c_1-x_3) \\ &\qquad + (h(c_2)-h(c_1))(c_2-x_5) +h(c_2)(x_6-c_2) \\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad + h(c_3)(x_8-c_3) + h(c_3)(c_3-x_7). \end{align*}

Vous préparez maintenant l’apparition de $a_3 = h(c_2)(c_3-c_2).$

\begin{align*} S(h,P)&= a_1 +a_2+ (h(c_1)-h(c_0))(c_1-x_3) \\ &\qquad + (h(c_2)-h(c_1))(c_2-x_5) +h(c_2)(x_6-c_2) \\ &\qquad +h(c_2)(x_7-x_6)\\ &\qquad +h(c_2)(c_3-x_7) + ( h(c_3) - h(c_2))(c_3-x_7) + h(c_3)(x_8-c_3) . \end{align*}

Et finalement :

\begin{align*} S(h,P)&= a_1 +a_2+ a_3+(h(c_1)-h(c_0))(c_1-x_3) \\ &\qquad + (h(c_2)-h(c_1))(c_2-x_5) \\ &\qquad + ( h(c_3) - h(c_2))(c_3-x_7) + h(c_3)(x_8-c_3) . \end{align*}

Comme la subdivision $P$ est $\delta$-fine, vous avez :

\left\{\begin{align*} c_1-x_3 &\leq \delta(c_1)\\ c_2-x_5 &\leq \delta(c_2)\\ c_3-x_7 &\leq \delta(c_3)\\ x_8-c_3 &\leq \delta(c_3). \end{align*} \right.

Vous choisissez des valeurs de la jauge très petites sur l’ensemble $E$ en imposant ce qui suit :

\boxed{\forall k\in\N, \delta(c_k) \leq \frac{\min\{\varepsilon, M\}}{12M\times 4^k }.}

Il apparaît que :

\begin{align*} \vert S(h,P) - (a_1 +a_2+ a_3) \vert &\leq \vert h(c_1)-h(c_0)\vert\ \delta(c_1) \\ &\qquad + \vert h(c_2)-h(c_1)\vert \ \delta(c_2) \\ &\qquad + \vert h(c_3) - h(c_2)\vert\ \delta(c_3) + \vert h(c_3)\vert \delta(c_3)\\ &\leq 3M \times 2\delta(c_1)+3M\times 4\delta(c_2)+3M\times8\delta(c_3) + 3M\times8\delta(c_3)\\ &\leq 3M\left(\frac{2\varepsilon}{12M\times 4}+\frac{2^2\varepsilon}{12M \times 4^2}+ \frac{2^3\varepsilon}{12M\times 4^3}+ \frac{2^3\varepsilon}{12M\times 4^3}\right)\\ &\leq \frac{3\varepsilon}{12}\left(\frac{2}{4}+\frac{2^2}{4^2}+ \frac{2^3}{4^3}+ \frac{2^3}{4^3}\right)\\ &\leq \frac{\varepsilon}{4}\left(\frac{2}{4}+\frac{2^2}{4^2}+ \frac{2^3}{4^3}+ \frac{2^3}{4^3}\right)\\ &\leq \frac{2\varepsilon}{4}\left(\frac{2}{4}+\frac{2^2}{4^2}+ \frac{2^3}{4^3}\right)\\ &\leq \frac{\varepsilon}{2}\left(\frac{1}{2}+\frac{1}{2^2}+ \frac{1}{2^3}\right)\\ &\leq \frac{\varepsilon}{2}\times\sum_{k=1}^{+\infty}\frac{1}{2^k}\\ &\leq \frac{\varepsilon}{2}. \end{align*}

Note. Dans le cas où il existerait un nombre $i\in\NN$ et nombre $j\in\N$ tels que $c_i\in [x_{j-1},x_j]$ et $c_i\in [x_j, x_{j+1}]$, alors ces deux intervalles adjacents ont la même étiquette qui est $c_i = x_j$ si bien que la majoration ci-dessus reste valable.

Majorez l’écart entre la somme de Riemann et la valeur $A$

Il s’agit de majorer par $\varepsilon$ le nombre $\vert S(h,P)-A \vert.$

Dans l’exemple précédent, il a été vu que $\vert S(h,P) – (a_1 +a_2+ a_3)\vert \leq \frac{\varepsilon}{2}.$

Cette majoration n’est valable toutefois que pour les subdivisions $\delta$-fines, pour lesquelles vous aviez :

\begin{align*} &\forall k\geq 4, c_k\in]x_{n-1}, x_n] \\ &\forall k\in\llbracket 0,3\rrbracket, c_k\in[x_0, x_{n-1}]. \end{align*}

Comme $\lim_{m\to +\infty} \sum_{k=m+1}^{+\infty} a_k =0$, il existe un entier $N$ tel que :

\forall m\geq N, \left\vert \sum_{k=m+1}^{+\infty} a_k \right\vert \leq \frac{\varepsilon}{2}.

Vous souhaitez ajuster la valeur de $\delta(1)$ pour qu’il existe un nombre $\xi\in\NN$ de sorte que :

\begin{align*} &\forall k\geq \xi, c_k\in]x_{n-1}, x_n] \\ &\forall k\in\llbracket 0,\xi-1\rrbracket, c_k\in[x_0, x_{n-1}]. \end{align*}

Si $P$ est une subdivision $\delta$-fine, vous avez, puisque $t_n=1$ :

[x_{n-1},x_n]\subset [1-\delta(1), 1].

En prenant les longueurs de ces intervalles : $x_n-x_{n-1}\leq \delta(1).$

D’une part, $x_{n-1}< x_n$ avec $x_n=1$ donc $x_{n-1} < 1.$

D’autre part, la suite $(c_k)_{k\geq 0}$ converge vers $1$ donc il existe un entier $\ell \geq 0$ tel que $x_{n-1} < c_{\ell}.$

L’ensemble $\{k\in\N, x_{n-1}< c_k\}$ est une partie de $\N$ qui est non vide. Vous notez $\mu$ son plus petit élément.

Comme $x_{n-1}\geq 1/4$ vous déduisez $x_{n-1} \geq c_0.$ Par suite, $0$ n’appartient pas à $\{k\in\N, x_{n-1}< c_k\}$ donc $\mu\neq 0$ et comme $\mu\in\N$ il vient $\mu \geq 1.$

Pour tout $k\in\llbracket 0, \mu-1\rrbracket$, $k$ est un entier naturel strictement inférieur à $\mu$, le plus petit élément de $A$. Donc $k$ n’appartient pas à $A$ et par suite $x_{n-1}\geq c_k.$

\boxed{\forall k\in\llbracket 0, \mu-1\rrbracket, c_k \leq x_{n-1} < c_{\mu}.}

Si $\mu = 1$, alors comme $c_1 = \frac{1}{2}$, vous avez $1/2 \in ]x_{n-1},x_n].$ Du coup :

1/2\leq \vert 1/2-x_n\vert \leq x_n-x_{n-1}\leq 1-x_{n-1}\leq\delta(1).

Il suffit de choisir $\delta(1)$ tel que :

\boxed{\delta(1)\leq \frac{1}{3}.}

Il y a alors contradiction et donc $\mu \geq 2.$

Il vient donc :

\begin{align*} \vert S(h,P) -A\vert &\leq \left\vert S(h,P) -\sum_{k=1}^{\mu-1}a_k \right\vert + \left\vert \sum_{k=\mu}^{+\infty}a_k \right\vert\\ &\leq \frac{\varepsilon}{ 2 } + \left\vert \sum_{k=\mu}^{+\infty}a_k \right\vert. \end{align*}

Il reste à justifier que $\mu-1$ est supérieur ou égal à $N.$

Si tel n’était pas le cas, vous auriez $\mu-1<N$ c’est-à-dire $\mu \leq N.$

Or, $c_{\mu} \in ]x_{n-1},x_n]$ donc $1-c_{\mu} \leq \delta(1)$ donc $\frac{1}{2^{N}} \leq \frac{1}{2^\mu}\leq \delta(1).$

Il vous suffit de choisir $\delta(1)$ tel que :

\boxed{\delta(1)\leq \frac{1}{3\times 2^{N}}.}

A ce moment, une contradiction apparaît : d’une part $\delta(1) < \frac{1}{2^N}$ et d’autre part $\frac{1}{2^{N}}\leq \delta(1).$

C’est donc que $\mu-1 \geq N.$ Il vient $\left\vert \sum_{k=\mu}^{+\infty}a_k \right\vert \leq \frac{\varepsilon}{2}.$

Par somme, vous déduisez :

\begin{align*} \vert S(h,P) -A\vert &\leq \frac{\varepsilon}{ 2 } + \left\vert \sum_{k=\mu}^{+\infty}a_k \right\vert \\ &\leq \frac{\varepsilon}{ 2 }+\frac{\varepsilon}{ 2 }\\ &\leq \varepsilon. \end{align*}

Récapitulez et concluez

Il existe un réel $\boxed{M>0}$ tel que $\boxed{\forall k\geq 1, \vert a_k \vert \leq M.}$

Soit $E$ l’ensemble défini par $E = \{ c_k, k\in\N\}.$ Il est défini sur $]0,1[\setminus E$ une fonction strictement positive $\varphi$ en posant:

\forall x\in]0,1[\setminus E, \varphi(x) = \inf \{ \vert x-c_k\vert, k\in\N \}.

Soit $\varepsilon$ un réel strictement positif.

Il existe un entier $N$ tel que:

\forall m\geq N, \left\vert \sum_{k=m+1}^{+\infty} a_k \right\vert \leq \frac{\varepsilon}{2}.

Vous définissez une jauge $\delta : [0,1]\to \R_{+}^{*}$ en posant :

\left\{\begin{align*} &\delta(1) = \frac{1}{3\times 2^{N}}\\ &\forall k\in\N, \delta(c_k) = \frac{\min\{\varepsilon, M\}}{12M\times 4^k }\\ &\forall t\in]0,1[\setminus E, \delta(t) = \frac{\min (\varphi(t), t, 1-t)}{2}.\\ \end{align*} \right.

Alors, pour toute subdivision étiquetée $P$ de $[0,1]$ qui est $\delta$-fine :

\vert S(h,P)-A \vert \leq \varepsilon.

La fonction $h$ est Henstock-Kurweil intégrable sur l’intervalle $[0,1]$ et son intégrale correspondante est égale à :

\boxed{\int_0^1h(t)\dt = A.}

Prolongement

Pourriez-vous expliciter une fonction réelle $h$ définie sur l’intervalle $[0,1]$ de sorte que $h$ soit Henstock-Kurzweil intégrable, mais de sorte que la valeur absolue $\vert h \vert$ ne le soit pas ?

336. Le théorème de Gauss-Lucas et le cas des polynômes réels

Rédigé par Yannis TRIANTAPHYLIDESon 20/05/202412/07/2024| Niveau Prépa

Le théorème de Gauss-Lucas énonce que les racines complexes du polynôme dérivé d’un polynôme complexe non constant sont toutes situées à l’intérieur de la région convexe délimitée par les racines du polynôme initial. Vous en trouverez une démonstration rédigée dans le contenu de l'article 320.

Autrement dit, si vous visualisez les racines du polynôme complexe comme des points sur un plan complexe, alors les racines du polynôme dérivé sont nécessairement contenues à l’intérieur du polygone formé par ces points.

Si vous vous cantonnez au cas réel, le résultat précédent peut devenir faux. C’est l’objet de cet article : les racines réelles de la dérivée d’un polynôme non constant ne sont pas nécessairement toutes situées à l’intérieur de la région convexe délimitée par les racines réelles du polynôme initial.

Utilisez un polynôme réel non scindé

Soit $r$ un nombre réel non nul qui sera choisi plus tard. Vous définissez un polynôme $P\in\R[X]$ en posant :

P(X) = (X-1)(X-2)(X^2+rX+r^2).

Le discriminant du trinôme $X^2+rX+r^2$ est égal à :

\Delta = r^2-4r^2=-3r^2.

Ainsi, $\Delta$ est strictement négatif. Du coup, $X^2+rX+r^2$ n’a pas de racine réelle et par suite, le polynôme $P$, en tant qu’élément de $\R[X]$ n’est pas scindé.

Il admet $1$ et $2$ pour racines, les deux autres étant complexes non réelles.

La région convexe délimitée par les racines réelles de $P$ est l’intervalle $[1,2].$ Il sera montré dans la suite que le polynôme $P’$ admet une racine réelle n’appartenant pas cet intervalle.

Calculez le polynôme dérivé

Vous utilisez la formule de dérivation d’un produit composé de trois facteurs.

Il vient :

\begin{align*} P'(X) &= (X-2)(X^2+rX+r^2) + (X-1)(X^2+rX+r^2)+(X-1)(X-2)(2X+r) \\ &=(2X-3)(X^2+rX+r^2)+(X^2-3X+2)(2X+r)\\ &=2X^3+2rX^2+2r^2X-3X^2-3rX-3r^2\\ &\quad + 2X^3-6X^2+4X+rX^2-3rX+2r\\ &=4X^3+(3r-9)X^2+(2r^2-6r+4)X+(-3r^2+2r). \end{align*}

Analysez la situation pour effectuer un bon choix

Supposez que $r$ soit choisi pour que le polynôme $P’$ admette exactement deux racines réelles. Ce choix est motivé par le fait que les deux racines précédentes sont rapidement calculables en fonction des coefficients de ce polynôme.

Vous notez $u\in\R$ et $v\in\R$ les deux racines réelles de $P’$ avec $u\neq v.$

Vous effectuez la division euclidienne de $P’$ par $X-u.$ Puisque $u$ est racine de $P’$, il existe un polynôme réel $Q$ de degré $2$ tel que :

P'(X) = (X-u)Q(X)

En évaluant cette expression en $v$, il vient $0 = (v-u)Q(v).$ Ainsi $Q(v) = 0.$

Vous effectuez la division euclidienne de $Q$ par $X-v$ et déduisez l’existence d’un polynôme réel $S$ de degré $1$ tel que :

Q(X) = (X-v)S(X).

Du coup :

P'(X) = (X-u)(X-v)S(X).

Par identification du coefficient dominant de $P’$ avec celui du polynôme $(X-u)(X-v)S(X)$ vous déduisez que le coefficient dominant de $S$ est égal à $4.$ En appelant $w\in\R$ le coefficient constant du polynôme $S$, il vient :

P'(X) = (X-u)(X-v)(4X+w).

Cela conduit à :

P'\left(\frac{-w}{4}\right) = 0.

Si vous aviez :

\frac{-w}{4}\not\in\{u,v\}

Alors le polynôme $P’$ admettrait trois racines réelles, ce qui est exclu.

Donc $\frac{-w}{4}\in\{u,v\}.$

1er cas. Si $u = \frac{-w}{4}$ vous écrivez :

\begin{align*} P'(X) & = 4(X-u)(X-v)\left(X+\frac{w}{4}\right)\\ &= 4(X-u)(X-v)(X-u). \end{align*}

$P’$ admet donc une racine double.

En notant $\Delta$ le discriminant du polynôme $P’$, il vient $\Delta = 0.$

2nd cas. Si $v = \frac{-w}{4}$ vous écrivez :

\begin{align*} P'(X) & = 4(X-u)(X-v)\left(X+\frac{w}{4}\right)\\ &= 4(X-u)(X-v)(X-v). \end{align*}

$P’$ admet encore une racine double.

A nouveau, le discriminant du polynôme $P’$ est nul.

En suivant les notations du contenu rédigé dans l'article 146 vous posez :

\begin{align*} N_1 &= \frac{9-3r}{4}\\ N_2 &=\frac{2r^2-6r+4}{4}\\ N_3 &=\frac{3r^2-2r}{4}. \end{align*}

Cet article montre que le discriminant se calcule par l’expression suivante :

\Delta = N_1^2N_2^2-4N_1^3N_3-4N_2^3+18N_1N_2N_3-27N_3^2.

Avec l’étude précédente vous déduisez :

N_1^2N_2^2-4N_1^3N_3-4N_2^3+18N_1N_2N_3-27N_3^2 = 0.

Vous développez les termes de cette expression les uns après les autres de façon à trouver une équation satisfaite par $r.$

Procédez au calcul détaillé des termes du discriminant du polynôme $P’$ de degré $3$

Premier terme

\begin{align*} N_1^2N_2^2 &=\frac{(9-3r)^2}{16}\times \frac{(2r^2-6r+4)^2}{16}\\ &= \frac{9(r^2-6r+9) \times 4 (r^2-3r+2)^2}{16\times 4\times 4}\\ &= \frac{9(r^2-6r+9)(r^2-3r+2)^2}{64}\\ &= \frac{9(r^2-6r+9)(r^4+9r^2+4-6r^3+4r^2-12r)}{64}\\ &= \frac{9(r^2-6r+9)(r^4-6r^3+13r^2-12r+4)}{64}\\ \end{align*}

Vous procédez au développement suivant :

\begin{align*} (r^2-6r+9)(r^4-6r^3+13r^2-12r+4) &= r^6-6r^5+13r^4-2\times 6r^3+4r^2\\ &\qquad -6r^5+36r^4-13\times 6 r^3+72r^2-24r\\ &\qquad \qquad \quad+9r^4-9\times 6r^3+117 r^2-108r+36\\ &=r^6-12r^5+58r^4-24\times 6r^3+193r^2-132r+36\\ &=r^6-12r^5+58r^4-12\times 12r^3+193r^2-132r+36\\ &=r^6-12r^5+58r^4-144r^3+193r^2-132r+36. \end{align*}

Du coup :

\boxed{ N_1^2N_2^2 = \frac{9(r^6-12r^5+58r^4-144r^3+193r^2-132r+36)}{64}. }

Deuxième terme

\begin{align*} N_1^3N_3 &= \frac{(9-3r)^3}{16\times 4}\times \frac{3r^2-2r}{4}\\ &= \frac{27(3-r)^3(3r^2-2r)}{256}. \end{align*}

Vous procédez au développement suivant :

\begin{align*} (3-r)^3(3r^2-2r) &= (-r^3+9r^2-27r+27)(3r^2-2r)\\ &= -3r^5+27r^4-81r^3+81r^2\\ &\qquad +2r^4-18r^3+54r^2-54r\\ &=-3r^5+29r^4-99r^3+135r^2-54r. \end{align*}

Du coup :

N_1^3N_3 = \frac{27(-3r^5+29r^4-99r^3+135r^2-54r)}{256}.

D’où :

\boxed{ -4N_1^3N_3 = \frac{27(3r^5-29r^4+99r^3-135r^2+54r)}{64}. }

Troisième terme

\begin{align*} N_2^3 &= \frac{(2r^2-6r+4)^3}{4\times 4\times 4}\\ &=\frac{2^3(r^2-3r+2)^3}{4\times 4\times 4}\\ &=\frac{4\times 2(r^2-3r+2)^3}{4\times 4\times 2\times 2}\\ &=\frac{(r^2-3r+2)^3}{4\times 2}\\ &=\frac{(r^2-3r+2)^3}{8}. \end{align*}

Vous procédez au développement suivant :

\begin{align*} (r^2-3r+2)^3 &= (r^2-3r+2)^2 (r^2-3r+2)\\ &= (r^4+9r^2+4-6r^3+4r^2-12r)(r^2-3r+2)\\ &= (r^4-6r^3+13r^2-12r+4)(r^2-3r+2)\\ &= r^6-6r^5+13r^4-12r^3+4r^2\\ &\qquad -3r^5+18r^4-39r^3+36r^2-12r\\ &\qquad \qquad +2r^4-12r^3+26r^2-24r+8\\ &=r^6-9r^5+33r^4-63r^3+66r^2-36r+8. \end{align*}

Du coup :

N_2^3 =\frac{r^6-9r^5+33r^4-63r^3+66r^2-36r+8}{8}.

D’où :

\boxed{ -4N_2^3 =\frac{-r^6+9r^5-33r^4+63r^3-66r^2+36r-8}{2}. }

Quatrième terme

\begin{align*} N_1N_2N_3 &= \frac{9-3r}{4} \times \frac{2r^2-6r+4}{4} \times \frac{3r^2-2r}{4} \\ &=\frac{3(3-r)\times 2(r^2-3r+2)(3r^2-2r)}{16\times 2\times 2}\\ &=\frac{3(3-r)(r^2-3r+2)(3r^2-2r)}{32}. \end{align*}

Vous procédez au développement suivant :

\begin{align*} (3-r)(r^2-3r+2)(3r^2-2r) &= (3r^2-9r+6-r^3+3r^2-2r)(3r^2-2r) \\ &= (-r^3+6r^2-11r+6)(3r^2-2r)\\ &=-3r^5+18r^4-33r^3+18r^2\\ &\qquad +2r^4-12r^3+22r^2-12r\\ &=-3r^5+20r^4-45r^3+40r^2-12r. \end{align*}

Du coup :

N_1N_2N_3 =\frac{3(-3r^5+20r^4-45r^3+40r^2-12r)}{32}.

D’où :

\boxed{ 18N_1N_2N_3 =\frac{27(-3r^5+20r^4-45r^3+40r^2-12r)}{16}. }

Cinquième terme

\begin{align*} N_3^2 &=\frac{(3r^2-2r)^2}{16}\\ &=\frac{9r^4-12r^3+4r^2}{16}. \end{align*}

D’où :

\boxed{-27N_3^2 = \frac{27(-9r^4+12r^3-4r^2)}{16}.}

Déterminez une équation satisfaite par le réel $r$

La condition $N_1^2N_2^2-4N_1^3N_3-4N_2^3+18N_1N_2N_3-27N_3^2 = 0$ fournit :

\begin{align*} 0 &= \frac{9(r^6-12r^5+58r^4-144r^3+193r^2-132r+36)}{64}\\ &\qquad+ \frac{27(3r^5-29r^4+99r^3-135r^2+54r)}{64}\\ &\qquad +\frac{-r^6+9r^5-33r^4+63r^3-66r^2+36r-8}{2} \\ &\qquad +\frac{27(-3r^5+20r^4-45r^3+40r^2-12r)}{16}\\ &\qquad +\frac{27(-9r^4+12r^3-4r^2)}{16}. \end{align*}

Vous réduisez au même dénominateur :

\begin{align*} 0 &= \frac{9(r^6-12r^5+58r^4-144r^3+193r^2-132r+36)}{64}\\ &\qquad+ \frac{27(3r^5-29r^4+99r^3-135r^2+54r)}{64}\\ &\qquad +\frac{32(-r^6+9r^5-33r^4+63r^3-66r^2+36r-8)}{64} \\ &\qquad +\frac{4\times 27(-3r^5+20r^4-45r^3+40r^2-12r)}{64}\\ &\qquad +\frac{4\times 27(-9r^4+12r^3-4r^2)}{64}. \end{align*}

Il en résulte ce qui suit :

\begin{align*} 0 &= 9(r^6-12r^5+58r^4-144r^3+193r^2-132r+36)\\ &\qquad+ 27(3r^5-29r^4+99r^3-135r^2+54r)\\ &\qquad +32(-r^6+9r^5-33r^4+63r^3-66r^2+36r-8) \\ &\qquad +4\times 27(-3r^5+20r^4-45r^3+40r^2-12r)\\ &\qquad +4\times 27(-9r^4+12r^3-4r^2). \end{align*}

Vous développez :

\begin{align*} 0 &= 9r^6-108^5+522 r^4-1296r^3+1737 r^2-1188 r+324\\ &\qquad+ 81r^5-783 r^4+2673 r^3-3645 r^2+1458r\\ &\qquad -32r^6+288r^5-1056 r^4+2016 r^3-2112 r^2+1152 r-256 \\ &\qquad -324 r^5+2160 r^4-4860 r^3+4320 r^2-1296 r\\ &\qquad -972r^4+1296 r^3-432r^2. \end{align*}

Puis vous réduisez :

\begin{align*} 0 &= (9-32) r^6+(-108+81+288-324)^5+(522-783-1056+2160-972) r^4\\ &\qquad +(-1296+ 2673+ 2016-4860+ 1296)r^3+(1737-3645-2112+ 4320-432)r^2\\ &\qquad +(-1188+ 1458+ 1152-1296)r+(324-256). \end{align*}

Vous obtenez :

-23r^6-63r^5-129r^4-171r^3-132r^2+126r+68=0.

En définitive, le réel $r$ est solution de l’équation de degré $6$ suivante qui sera appelée condition (*) :

\boxed{23r^6+63r^5+129r^4+171r^3+132r^2-126r-68=0.}

Existence d’un unique réel compris entre $0$ et $1$ satisfaisant la condition (*)

Pour tout réel $x$, vous posez :

f(x) = 23 x^6 + 63 x^5 + 129 x^4 + 171 x^3 + 132 x^2 - 126 x - 68.

$f$ est une fonction polynôme de degré $6$ deux fois dérivable sur $\R.$

Pour tout réel $x$ :

\begin{align*} f'(x) &= 138 x^5 + 315 x^4 + 516 x^3 + 513 x^2 + 264 x - 126\\ f''(x) &= 690 x^4 +1260 x^3 + 1548 x^2 + 1026 x + 264. \end{align*}

Dès que $x\in[0,1]$ vous avez $f »(x)\geq 264>0.$

La fonction $f’$ est strictement croissante sur $[0,1].$ Or $f'(0) = -126$ et $f'(1) = 1620.$ Comme $f’$ est une fonction polynôme, elle est continue sur l’intervalle $[0,1].$ Donc la fonction $f’$ réalise une bijection de $[0,1]$ vers $[-126,1620].$ Il existe unique réel $\zeta\in[0,1]$ tel que $f'(\zeta) = 0.$

La stricte croissance de $f’$ sur $[0,1]$ implique alors que $f’$ est strictement négative sur $[0, \zeta[$ et strictement positive sur $]\zeta, 1].$

La fonction $f$ est par conséquent strictement décroissante sur $[0, \zeta]$ et elle est strictement croissante sur $[\zeta, 1].$ Comme $f(0) =-68 $, $f(0)$ est strictement négatif et $f(\zeta)$ l’est aussi.

$f$ étant continue sur $[\zeta, 1]$ et strictement croissante sur cet intervalle, $f$ réalise une bijection de $[\zeta, 1]$ vers $[f(\zeta), f(1)].$ Comme $f(1)=324$, vous avez $f(\zeta)<0<324.$ Il en résulte qu’il existe un unique réel $\eta$ appartenant à $[\zeta, 1]$ tel que $f(\eta)=0.$

$f$ étant décroissante sur $[0, \zeta]$ avec $f(0)<0$ vous déduisez que pour tout $x\in[0,\zeta], f(x) < 0.$ En particulier la fonction $f$ ne s’annule pas sur $[0,\zeta].$

En définitive, il existe un unique réel (qui est $\eta$) appartenant à l’intervalle $[0, 1]$ qui annule la fonction $f.$

Dans la suite, vous définissez $r$ comme étant l’unique réel de l’intervalle $[0,1]$ tel que :

\boxed{23r^6+63r^5+129r^4+171r^3+132r^2-126r-68=0.}

Etude d’un polynôme dérivé

Le réel $r$ étant défini comme indiqué ci-dessus, il est rappelé que :

P(X) = (X-1)(X-2)(X^2+rX+r^2).

Le polynôme dérivé de $P$ est :

P'(X) = 4X^3+(3r-9)X^2+(2r^2-6r+4)X+(-3r^2+2r).

Comme :

\left\{\begin{align*} \lim_{X\to +\infty} P'(X) &= +\infty \\ \lim_{X\to -\infty} P'(X) &= -\infty \end{align*} \right.

vous pouvez appliquer le théorème des valeurs intermédiaires à la fonction $P’$ continue sur $\R.$

Il existe donc un réel $a$ tel que $P'(a)=0.$

En effectuant la division euclidienne de $P’$ par $X-a$, vous déduisez l’existence d’un polynôme réel $M$ de degré $2$ tel que :

P'(X) = (X-a)M(X).

Vous allez supposer dans la suite que $M$ n’admet pas de racine réelle.

Le polynôme $M$ admet, en tant que polynôme non constant, une racine complexe $\alpha.$

En identifiant les coefficients dominants de $P’$ et de $(X-a)M(X)$ vous déduisez qu’il existe deux réels $k$ et $\ell$ tels que :

M(X) = 4X^2+kX+\ell.

En évaluant en $\alpha$ vous avez :

4\alpha^2+k\alpha+\ell = 0.

En conjuguant, il vient :

4(\overline{\alpha})^2+k\overline{\alpha}+\ell = 0.

Du coup, $M(\overline{\alpha}) = 0.$

Le polynôme $P’$ admet pour racines $a$, $\alpha$ et $\overline{\alpha}.$

Comme $a\in\R$ et comme $\alpha\notin\R$ vous avez $a\neq \alpha$ et $a\neq \overline{\alpha}.$

D’autre part, comme $\alpha\not\in\R$ vous avez $\alpha \neq \overline{\alpha}.$

Les 3 nombres complexes $a$, $\alpha$ et $\overline{\alpha}$ étant deux à deux distincts, le polynôme $P’$ se factorise ainsi :

P'(X) = 4(X-a)(X-\alpha)(X-\overline{\alpha}).

Le discriminant de $P’$ est donc égal à :

((a-\alpha)(a-\overline{\alpha})(\alpha-\overline{\alpha}))^2 = ((a-\alpha)(a-\overline{\alpha}))^2 (\alpha - \overline{\alpha})^2.

D’une part :

\begin{align*} (a-\alpha)(a-\overline{\alpha}) &= (a-\alpha)(\overline{a-\alpha}) \\ &= \vert a-\alpha\vert^2 \end{align*}

D’autre part :

\begin{align*} (\alpha-\overline{\alpha}))^2 &= (2i \mathrm{Im}(\alpha))^2\\ &=-4 (\mathrm{Im}(\alpha))^2 \end{align*}

Le discriminant de $P’$ calculé avec ses coefficients, fournit :

\begin{align*} \vert a-\alpha\vert^4 (-4 ) (\mathrm{Im}(\alpha))^2 &= \frac{9(r^6-12r^5+58r^4-144r^3+193r^2-132r+36)}{64}\\ &\qquad+ \frac{27(3r^5-29r^4+99r^3-135r^2+54r)}{64}\\ &\qquad +\frac{-r^6+9r^5-33r^4+63r^3-66r^2+36r-8}{2} \\ &\qquad +\frac{27(-3r^5+20r^4-45r^3+40r^2-12r)}{16}\\ &\qquad +\frac{27(-9r^4+12r^3-4r^2)}{16} \\ &=\frac{-23r^6-63r^5-129r^4-171r^3-132r^2+126r+68}{64}\\ &=-\frac{23r^6+63r^5+129r^4+171r^3+132r^2-126r-68}{64}\\ &=0. \end{align*}

Du coup, le produit suivant est nul :

\vert a-\alpha\vert^4 (\mathrm{Im}(\alpha))^2 = 0.

Comme $\alpha \not\in\R$ vous déduisez $\mathrm{Im}(\alpha) \neq 0.$ Du coup vous avez :

\begin{align*} \vert a-\alpha\vert^4 = 0\\ \vert a-\alpha\vert = 0. \end{align*}

Donc $\alpha = a$ et $\alpha\in\R$ contradiction.

Donc le polynôme $M$ admet au moins une racine réelle $b.$

Vous divisez maintenant le polynôme réel $M$ par $X-b.$

Le coefficient dominant de $M$ étant égal à $4$, vous déduisez l’existence d’un réel $c$ tel que :

M(X) = (X-b)(4X+c)

Du coup :

\begin{align*} P'(X) &= (X-a)(X-b)(4X+c)\\ &= 4 (X-a)(X-b)(X+c/4). \end{align*}

Vous vous intéressez aux trois réels $a$, $b$ et $-c/4.$

Comme le discriminant de $P’$ est nul, deux des réels précédents parmi les trois sont égaux.

Donc $P’$ est scindé sur $\R[X]$ et admet une racine double.

Déterminez les racines de $P’$

Il est rappelé que :

P'(X) = 4X^3+(3r-9)X^2+(2r^2-6r+4)X+(-3r^2+2r).

D’après la section précédente, il existe un réel $\mu$ et un réel $\xi$ tels que :

\begin{align*} P'(X) &= 4(X-\xi)^2(X-\mu) \\ &= (X-\xi)^2(4X-4\mu) \end{align*}

Par identification du terme de degré $2$, vous obtenez les égalités :

\begin{align*} 3r-9 &= -4\mu-8\xi\\ 3r-9+8\xi &= -4\mu. \end{align*}

Donc :

P'(X) = (X-\xi)^2(4X+3r-9+8\xi).

Pour calculer $\xi$, vous allez choisir $x\in\R$ ne dépendant pas de $\xi$ tel que :

\begin{align*} -8(x-\xi)&=4x+3r-9+8\xi\\ -8x+8\xi &= 4x+3r-9+8\xi\\ 9-3r&=12x\\ 3-r&=4x. \end{align*}

Les égalités suivantes vont donner une expression de $\xi$ :

\begin{align*} P'\left(\frac{3-r}{4}\right) &= \left(\frac{3-r}{4}-\xi\right)^2 (-8)\left(\frac{3-r}{4}-\xi\right) \\ P'\left(\frac{3-r}{4}\right) &= (-8) \left(\frac{3-r}{4}-\xi\right)^3\\ \sqrt[3]{P'\left(\frac{3-r}{4}\right) }&= (-2) \left(\frac{3-r}{4}-\xi\right)\\ -\frac{1}{2}\sqrt[3]{P'\left(\frac{3-r}{4}\right) }&= \frac{3-r}{4}-\xi. \end{align*}

En définitive :

\boxed{\begin{align*} \xi&= \frac{3-r}{4}+\frac{1}{2}\sqrt[3]{P'\left(\frac{3-r}{4}\right) }\\ \mu &= \frac{-3r+9-8\xi}{4} . \end{align*} }

Concluez

Vous allez déterminer un encadrement de $r$ au dixième.

Numériquement :

\begin{align*} -37 &< f(0,6)<-36 \\ 11 &< f(0,7)<12 \end{align*}

$f(0,6)$ et $f(0,7)$ étant de signes contraires, vous déduisez :

\boxed{0,6< r < 0,7.}

Pour obtenir un encadrement de $\xi$, vous allez d’abord calculer $P’\left(\frac{3-r}{4}\right)$ :

P'\left(\frac{3-r}{4}\right) = 4\left(\frac{3-r}{4}\right)^3+(3r-9)\left(\frac{3-r}{4}\right)^2+(2r^2-6r+4)\left(\frac{3-r}{4}\right)+(-3r^2+2r).

Le membre de droite est formé de termes que vous développez.

\begin{align*} 4\left(\frac{3-r}{4}\right)^3 &=4\times\frac{(3-r)^3}{4^3}\\ &=\frac{(3-r)^3}{16}\\ &=\frac{-r^3+ 9r^2-27r+27 }{16}. \end{align*}

\begin{align*} (3r-9)\left(\frac{3-r}{4}\right)^2 &=3(r-3)\times \frac{(r-3)^2}{16}\\ &=\frac{3(r-3)^3}{16}\\ &=\frac{3(r^3-9r^2+27r-27)}{16}\\ &=\frac{3r^3-27r^2+81r-81}{16}. \end{align*}

\begin{align*} (2r^2-6r+4)\left(\frac{3-r}{4}\right) &= (r^2-3r+2)\times \frac{3-r}{2}\\ &=\frac{(r^2-3r+2)(3-r)}{2}\\ &=\frac{3r^2-9r+6-r^3+3r^2-2r}{2}\\ &=\frac{-r^3+6r^2-11r+6}{2}\\ &=\frac{-8r^3+48r^2-88r+48}{16}. \end{align*}

\begin{align*} -3r^2+2r &= \frac{-48r^2+32r}{16}. \end{align*}

Par somme, vous avez :

\begin{align*} P'\left(\frac{3-r}{4}\right) &= \frac{-r^3+ 9r^2-27r+27 }{16}+\frac{3r^3-27r^2+81r-81}{16}\\ &\qquad \frac{-8r^3+48r^2-88r+48}{16}+ \frac{-48r^2+32r}{16}\\ &=\frac{-6r^3-18r^2-2r-6}{16}\\ &=\frac{-3r^3-9r^2-r-3}{8}\\ &=-\frac{3r^3+9r^2+r+3}{8}. \end{align*}

Vous passez aux encadrements :

\begin{align*} 0,6&< r < 0,7\\ 0,36&< r^2 < 0,49\\ 0,216&< r^3 < 0,343\\ \end{align*}

\begin{align*} 0,6&< r < 0,7\\ 3,24&< 9r^2 < 4,41\\ 0,648&< 3 r^3 < 1,029\\ \end{align*}

Par somme :

\begin{align*} 0,648+3,24+0,6+3&< 3r^3+9r^2+r+3<1,029+4,41+0,7+3\\ 7,488&< 3r^3+9r^2+r+3 < 9,139\\ 0,936&< \frac{3r^3+9r^2+r+3}{8} < 1,14238\\ -1,14238 &< P'\left(\frac{3-r}{4}\right) < -0,936\\ \sqrt[3]{-1,14238} &< \sqrt[3]{P'\left(\frac{3-r}{4}\right) }< \sqrt[3]{ -0,936 }\\ -1,0454 &< \sqrt[3]{P'\left(\frac{3-r}{4}\right) }<-0,9781\\ -0,5227 &< \frac{1}{2}\sqrt[3]{P'\left(\frac{3-r}{4}\right) }<-0,4890. \end{align*}

Or :

\begin{align*} 0,6&< r < 0,7\\ -0,7&< -r < -0,6\\ 2,3&< 3-r < 2,4\\ 0,575&< \frac{3-r}{4} < 0,6. \end{align*}

Par somme :

0,575-0,5227<\xi < 0,6-0,4890

Du coup :

\boxed{0,0523<\xi<0,1110.}

Comme $\xi$ est une racine du polynôme $P’$, il a bien été prouvé que $\xi \notin[1,2].$

Il existe une racine réelle de $P’$ qui n’est pas comprise entre la plus grande racine réelle de $P$ et la plus petite racine de $P.$ Le théorème de Gauss-Lucas ne peut pas être cantonné au cas réel.

335. Surjectivité de l’exponentielle de matrice

Rédigé par Yannis TRIANTAPHYLIDESon 13/05/202423/05/2024| Niveau Prépa

Soit $A$ la matrice réelle définie par :

A= \begin{pmatrix} 3 & 0 & 1\\ 1&-1&-2\\ -1&0&1 \end{pmatrix}.

Le but de cet article est d’expliciter une matrice complexe $B$ dont l’exponentielle est égale à la matrice $A$, soit :

\exp B =A.

Une fois la matrice $B$ trouvée, vous vérifierez par le calcul qu’elle convient.

Calculez la matrice $A^n$ pour tout entier $n\in\NN$

Cette étape a été traitée dans le contenu rédigé dans l'article 334. Il a été montré ce qui suit :

\boxed{\begin{align*} \forall n\in\NN, A^n &= \frac{(3n-2)2^n+2(-1)^n}{18}A^2+ \frac{(-3n+8)2^n - 8 (-1)^n}{18}A+\frac{(-6n+10)2^n+8(-1)^n}{18}I. \end{align*}}

Inspirez vous du logarithme népérien d’un réel strictement positif

Soit $a$ un réel strictement positif.

La fonction réelle $x\mapsto a^x$ est définie sur $\R$ et pour tout réel $x$, la dérivée est la fonction $x\mapsto (\ln a)a^x.$

Du coup, $\ln a$ est obtenu en dérivant la fonction $x\mapsto a^x$ et en évaluant l’expression obtenue en $0.$

Le problème qui se pose ici concerne l’évaluation de $(-1)^x$ lorsque $x$ est un réel. Pour contourner cette difficulté, vous utilisez la relation d’Euler, à savoir $-1 = \e^{i\pi}.$

Du coup, la fonction réelle $x\mapsto \e^{i\pi x}$ est bien définie et dérivable sur $\R$, de dérivée $x\mapsto i\pi \e^{i\pi x}.$

Formez une expression matricielle

D’après ce qui précède, vous posez, pour tout réel $x$ :

f(x) = \frac{(3x-2)2^x+2 \e^{i\pi x}}{18}A^2+ \frac{(-3x+8)2^x - 8 \e^{i\pi x}}{18}A+\frac{(-6x+10)2^x+8\e^{i\pi x}}{18}I.

En dérivant, il vient, pour tout réel $x$ :

\begin{align*} f'(x) &= \frac{3\times 2^x + (3x-2)\ln 2 \times 2^x+2i\pi \e^{i\pi x}}{18}A^2 \\&\qquad+ \frac{-3\times 2^x+(-3x+8)\ln 2\times 2^x - 8i\pi \e^{i\pi x}}{18}A\\ &\qquad+\frac{-6\times 2^x+(-6x+10)\ln2 \times 2^x+8i\pi\e^{i\pi x}}{18}I. \end{align*}

En évaluant en $0$ :

\begin{align*} f'(0) &= \frac{3 - 2\ln 2 +2i\pi }{18}A^2 + \frac{-3+8\ln 2 - 8i\pi }{18}A+\frac{-6+10\ln2 +8i\pi}{18}I. \end{align*}

Déduisez-en une expression de la matrice $B$

D’après ce qui précède, vous posez :

\begin{align*} B &= \frac{3 - 2\ln 2 +2i\pi }{18}A^2 + \frac{-3+8\ln 2 - 8i\pi }{18}A+\frac{-6+10\ln2 +8i\pi}{18}I \\ &= \frac{3 - 2\ln 2 +2i\pi }{18} \begin{pmatrix} 8 & 0 & 4\\ 4 & 1 & 1\\ -4 & 0 & 0 \end{pmatrix} +\frac{-3+8\ln 2 - 8i\pi }{18} \begin{pmatrix} 3 & 0 & 1\\ 1&-1&-2\\ -1&0&1 \end{pmatrix}\\&\qquad+\frac{-6+10\ln2 +8i\pi}{18} \begin{pmatrix} 1 & 0 & 0\\ 0&1&0\\ 0&0&1 \end{pmatrix} \\ &=\frac{1}{18}\begin{pmatrix} 24 - 16\ln 2 +16i\pi & 0 & 12 - 8\ln 2 +8i\pi\\ 12 - 8\ln 2 +8i\pi&3 - 2\ln 2 +2i\pi&3 - 2\ln 2 +2i\pi\\ -12 + 8\ln 2 -8i\pi&0&0 \end{pmatrix}\\&\qquad+\frac{1}{18}\begin{pmatrix} -9+24\ln 2 - 24i\pi & 0 & -3+8\ln 2 - 8i\pi\\ -3+8\ln 2 - 8i\pi& 3-8\ln 2 + 8i\pi & 6-16\ln 2 + 16i\pi\\ 3-8\ln 2 + 8i\pi&0&-3+8\ln 2 - 8i\pi \end{pmatrix}\\ &\qquad+ \frac{1}{18} \begin{pmatrix} -6+10\ln2 +8i\pi & 0 & 0\\ 0&-6+10\ln2 +8i\pi&0\\ 0&0&-6+10\ln2 +8i\pi \end{pmatrix}\\ &=\frac{1}{18}\begin{pmatrix} 9+18\ln 2 & 0 & 9\\ 9&18i\pi&9-18\ln2 +18i\pi\\ -9&0&-9+18\ln2 \end{pmatrix}. \end{align*}

Après simplification par $9$, il vient :

\boxed{B=\frac{1}{2}\begin{pmatrix} 1+2\ln 2 & 0 & 1\\ 1&2i\pi&1-2\ln2 +2i\pi\\ -1&0&-1+2\ln2 \end{pmatrix}.}

Vérifiez que l’exponentielle de $B$ est bien égale à $A$

Calculez le polynôme caractéristique de $B$

\begin{align*} \det(X I - B) &=\begin{vmatrix} X+\frac{-1-2\ln 2}{2} & 0 & \frac{-1}{2}\\ \frac{-1}{2} & X-i\pi & \frac{-1+2\ln2 -2i\pi}{2}\\ \frac{1}{2} & 0 & X+\frac{1-2\ln2}{2} \end{vmatrix}\\ &=(X-i\pi)\begin{vmatrix} X+\frac{-1-2\ln 2}{2} & 0 & \frac{-1}{2}\\ \frac{-1}{2} & 1 & \frac{-1+2\ln2 -2i\pi}{2}\\ \frac{1}{2} & 0 & X+\frac{1-2\ln2}{2} \end{vmatrix}\\ &=(X-i\pi)\begin{vmatrix} X+\frac{-1-2\ln 2}{2} & \frac{-1}{2}\\ \frac{1}{2} & X+\frac{1-2\ln2}{2} \end{vmatrix}\\ &=\frac{1}{4}(X-i\pi)\begin{vmatrix} 2X-1-2\ln 2 &-1\\ 1 & 2X+1-2\ln2 \end{vmatrix} \\ &=\frac{1}{4}(X-i\pi)\begin{vmatrix} 2X-2\ln 2 &2X-2\ln2\\ 1 & 2X+1-2\ln2 \end{vmatrix} \\ &=\frac{1}{4}(X-i\pi)(2X-2\ln 2)\begin{vmatrix} 1 &1\\ 1 & 2X+1-2\ln2 \end{vmatrix} \\ &=\frac{1}{4}(X-i\pi)(2X-2\ln 2)\begin{vmatrix} 1 &1\\ 0 & 2X-2\ln2 \end{vmatrix} \\ &=\frac{1}{4}(X-i\pi)(2X-2\ln 2)^2 \\ &=(X-i\pi)(X-\ln 2)^2. \end{align*}

Le polynôme caractéristique de la matrice $B$ est égal à :

\boxed{P(X)=(X-i\pi)(X-\ln 2)^2.}

Déterminez la forme de Jordan de la matrice $B$ avec une matrice de passage associée

D’après le calcul effectué sur le polynôme caractéristique, le nombre $i\pi$ est une valeur propre de $B.$

Trouver un vecteur propre correspondant conduit à trouver un triplet $(x_1,x_2,x_3)\in\C^3$ non nul tel que :

\frac{1}{2}\begin{pmatrix} 1+2\ln 2 & 0 & 1\\ 1&2i\pi&1-2\ln2 +2i\pi\\ -1&0&-1+2\ln2 \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = i\pi\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix}.

Soit :

\begin{pmatrix} 1+2\ln 2 & 0 & 1\\ 1&2i\pi&1-2\ln2 +2i\pi\\ -1&0&-1+2\ln2 \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = 2i\pi\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix}.

Or :

\begin{pmatrix} 1+2\ln 2 & 0 & 1\\ 1&2i\pi&1-2\ln2 +2i\pi\\ -1&0&-1+2\ln2 \end{pmatrix}\begin{pmatrix} 0\\ 1\\ 0\\ \end{pmatrix} = \begin{pmatrix} 0\\ 2i\pi\\ 0\\ \end{pmatrix} = 2i\pi\begin{pmatrix} 0\\ 1\\ 0\\ \end{pmatrix}.

Par conséquent, le vecteur $\begin{pmatrix} 0\\1\\0\\\end{pmatrix}$ est un vecteur propre de $B.$

En posant :

P_1 = \begin{pmatrix} 0& 1&0\\ 1& 0&0\\ 0&0&1\\ \end{pmatrix}

vous obtenez une matrice inversible et :

P_1^{-1}BP_1 = \frac{1}{2}\begin{pmatrix} 2i\pi&1&1-2\ln2 +2i\pi\\ 0&1+2\ln 2 & 1\\ 0&-1&-1+2\ln2 \end{pmatrix}

Vous étudiez maintenant la matrice $S$ définie par le bloc de taille $2\times 2$ de la matrice $P_1^{-1}BP_1$ situé en bas à droite. Vous posez :

S = \frac{1}{2}\begin{pmatrix} 1+2\ln 2 & 1\\ -1&-1+2\ln2 \end{pmatrix}.

Vous cherchez la forme de Jordan de $S$ avec une matrice inversible associée.

Le polynôme caractéristique de $S$ est égal à $(X-\ln 2)^2$ étant donné que le produit par blocs du déterminant de $P_1^{-1}BP_1$ qui est identique à celui de $B.$

Subséquemment, le nombre $\ln 2$ est une valeur propre de $S.$

Vous cherchez un couple $(x_1,x_2)\in\C^2$ non nul tel que :

\begin{align*} \frac{1}{2}\begin{pmatrix} 1+2\ln 2 & 1\\ -1&-1+2\ln2 \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ \end{pmatrix} = \ln 2 \begin{pmatrix} x_1\\ x_2\\ \end{pmatrix}. \end{align*}

Soit :

\begin{align*} \begin{pmatrix} 1+2\ln 2 & 1\\ -1&-1+2\ln2 \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ \end{pmatrix} = 2\ln 2 \begin{pmatrix} x_1\\ x_2\\ \end{pmatrix}. \end{align*}

Or :

\begin{align*} \begin{pmatrix} 1+2\ln 2 & 1\\ -1&-1+2\ln2 \end{pmatrix}\begin{pmatrix} 1\\ -1\\ \end{pmatrix} = \begin{pmatrix} 2\ln 2\\ -2\ln 2\\ \end{pmatrix} = 2\ln 2\begin{pmatrix} 1\\ -1\\ \end{pmatrix}. \end{align*}

Ainsi, le vecteur $\begin{pmatrix} 1\\ -1\\ \end{pmatrix}$ est un vecteur propre de $S.$

Vous formez la matrice inversible $Q_2$ définie par :

Q_2 = \begin{pmatrix} 1 & 0\\ -1&1 \end{pmatrix}.

Vous obtenez par conjugaison :

Q_2^{-1}SQ_2= \begin{pmatrix} \ln 2 & 1/2\\ 0&\ln2 \end{pmatrix}.

A ce stade, vous n’avez pas encore obtenu la forme de Jordan de $S$, puisque le coefficient $1/2$ doit être remplacé par $1.$

Vous utilisez une dilatation pour y parvenir. Vous posez :

Q_3 = \begin{pmatrix} 1 & 0\\ 0&2 \end{pmatrix}.

Alors :

\begin{align*} Q_3^{-1}Q_2^{-1}SQ_2Q_3&= Q_3^{-1}\begin{pmatrix} \ln 2 & 1/2\\ 0&\ln2 \end{pmatrix}Q_3 \\ &=\begin{pmatrix} \ln 2 & 1\\ 0&\ln2 \end{pmatrix}. \end{align*}

La forme de Jordan de $S$ est obtenue. Pour matrice de passage globale associée, vous prenez $Q_2Q_3$ qui est égale à :

\boxed{Q_2Q_3 = \begin{pmatrix} 1 & 0\\ -1&2 \end{pmatrix}.}

Vous avez bien :

\boxed{\begin{align*} (Q_2Q_3)^{-1}S(Q_2Q_3) &=\begin{pmatrix} \ln 2 & 1\\ 0&\ln2 \end{pmatrix}. \end{align*}}

Vous formez la matrice $P_2$ définie par blocs :

\begin{align*} P_2 &=\begin{pmatrix} 1 & 0\\ 0& Q_2Q_3 \end{pmatrix}\\ &=\begin{pmatrix} 1 & 0\\ 0& Q_2 \end{pmatrix} \begin{pmatrix} 1 & 0\\ 0& Q_3 \end{pmatrix}\\ &= \begin{pmatrix} 1& 0&0\\ 0& 1&0\\ 0&-1&1\\ \end{pmatrix} \begin{pmatrix} 1& 0&0\\ 0& 1&0\\ 0&0&2\\ \end{pmatrix}. \end{align*}

Vous déduisez ce qui suit :

\begin{align*} P_2^{-1}P_1^{-1}BP_1P_2 &=P_2^{-1}(P_1^{-1}BP_1)P_2 \\ &=\frac{1}{2}P_2^{-1}\begin{pmatrix} 2i\pi&1&1-2\ln2 +2i\pi\\ 0&1+2\ln 2 & 1\\ 0&-1&-1+2\ln2 \end{pmatrix}P_2\\ &=\frac{1}{2}\begin{pmatrix} 2i\pi&2\ln 2-2i\pi & 2-4\ln2 +4i\pi\\ 0&2\ln 2 & 2\\ 0&0&2\ln2 \end{pmatrix} \\ &=\begin{pmatrix} i\pi&\ln 2-i\pi & 1-2\ln2 +2i\pi\\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}. \end{align*}

Les blocs de Jordan sont maintenant en place.

L’étape suivante consiste à éliminer le coefficient $\ln 2-i\pi$ à l’aide d’une transvection.

Pour plus de lisibilité, vous posez :

T = \begin{pmatrix} i\pi&\ln 2-i\pi & 1-2\ln2 +2i\pi\\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}.

Soit $\alpha\inC$ un nombre qui sera choisi plus tard. Vous posez :

P_3 = \begin{pmatrix} 1& \alpha &0\\ 0& 1&0\\ 0&0&1\\ \end{pmatrix}.

Alors :

P_3^{-1}TP_3 = \begin{pmatrix} i\pi&\ln 2-i\pi +\alpha i\pi - \alpha\ln 2& 1-2\ln2 +2i\pi - \alpha\\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}.

Vous choisissez $\alpha$ tel que :

\begin{align*} \ln 2-i\pi +\alpha i\pi - \alpha\ln 2 &= 0\\ \ln 2-i\pi +\alpha (i\pi - \ln 2) &= 0\\ \alpha (i\pi - \ln 2) &= i\pi-\ln 2 \\ \alpha &=1. \end{align*}

Par voie de conséquence, vous avez :

\boxed{\begin{align*} &P_3 = \begin{pmatrix} 1& 1 &0\\ 0& 1&0\\ 0&0&1\\ \end{pmatrix} \\ &P_3^{-1}TP_3 = \begin{pmatrix} i\pi&0& 2i\pi-2\ln2 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix} \\ &P_3^{-1}P_2^{-1}P_1^{-1}BP_1P_2P_3 = \begin{pmatrix} i\pi&0& 2i\pi-2\ln2 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}. \end{align*} }

Il reste à éliminer le dernier coefficient $2i\pi-2\ln2.$

Vous posez :

U = \begin{pmatrix} i\pi&0& 2i\pi-2\ln2 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}.

Soit $\beta\inC$ un nombre qui sera choisi plus tard. Vous posez :

P_4 = \begin{pmatrix} 1& 0 &\beta\\ 0& 1&0\\ 0&0&1\\ \end{pmatrix}.

Alors :

P_4^{-1}UP_4 = \begin{pmatrix} i\pi&0& 2i\pi-2\ln2 + \beta i\pi - \beta \ln 2 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}

En prenant $\beta = -2$ vous constatez que $2i\pi-2\ln2 + \beta i\pi – \beta \ln 2 = 0.$

En définitive, vous avez obtenu la forme de Jordan de $B$ avec la matrice de passage associée :

\boxed{\begin{align*} &P_4 = \begin{pmatrix} 1& 0 &-2\\ 0& 1&0\\ 0&0&1\\ \end{pmatrix} \\ &P_4^{-1}UP_4 = \begin{pmatrix} i\pi&0& 0\\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix} \\ &P_3^{-1}P_3^{-1}P_2^{-1}P_1^{-1}BP_1P_2P_3 P_4 = \begin{pmatrix} i\pi&0& 0 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}\\ &(P_1P_2P_3 P_4)^{-1}B(P_1P_2P_3 P_4) = \begin{pmatrix} i\pi&0& 0 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix}. \end{align*} }

Utilisez la structure par blocs

Notez $J$ la matrice de taille $2\times 2$ définie par :

\boxed{J = \begin{pmatrix} \ln 2& 1 \\ 0& \ln 2 \end{pmatrix}.}

Notez $I_2$ la matrice identité d’ordre $2$ et $N$ la matrice définie par :

N = \begin{pmatrix} 0& 1 \\ 0& 0 \end{pmatrix}.

Notez que $N^2 = 0.$ Cela implique :

\forall k\geq 2, N^k=0.

Soit maintenant $n$ un entier naturel supérieur ou égal à $2$. Comme $I$ et $N$ commutent, il est possible d’utiliser la formule du binôme :

\begin{align*} J^n &= ((\ln 2) I_2 + N)^n\\ &=\sum_{k=0}^n \binom{n}{k} (\ln 2)^{n-k} N^{k}\\ &=(\ln 2)^n I_2+n(\ln2)^{n-1}N + \sum_{k=2}^n \binom{n}{k} (\ln 2)^{n-k} N^{k}\\ &=(\ln 2)^n I_2+n(\ln2)^{n-1}N + 0\\ &=(\ln 2)^n I_2+n(\ln2)^{n-1}N. \end{align*}

Soit maintenant $m$ un entier supérieur ou égal à $2.$

\begin{align*} \sum_{n=0}^{m} \frac{1}{n!}J^n &= I_2+J+\sum_{n=2}^m \frac{1}{n!}J^n\\ &=I_2+J+\left(\sum_{n=2}^m \frac{1}{n!} (\ln 2)^n\right) I_2+ \left(\sum_{n=2}^m\frac{1}{n!} n(\ln2)^{n-1}\right)N. \end{align*}

\begin{align*} \sum_{n=2}^m\frac{1}{n!} n(\ln2)^{n-1} &= \sum_{n=1}^{m-1}\frac{1}{(n+1)!} (n+1)(\ln2)^{n}\\ &= \sum_{n=1}^{m-1}\frac{1}{n!} (\ln2)^{n}. \end{align*}

Vous en tirez que, quand $m\to +\infty$ :

\begin{align*} &\sum_{n=2}^m \frac{1}{n!} (\ln 2)^n \longrightarrow \sum_{n=2}^{+\infty} \frac{1}{n!} (\ln 2)^n = \e^{\ln 2}-\ln 2-1\\ &\sum_{n=2}^m\frac{1}{n!} n(\ln2)^{n-1} \longrightarrow \sum_{n=1}^{+\infty}\frac{1}{n!} (\ln2)^{n} = \e^{\ln2}-1 \end{align*}

Donc :

\begin{align*} &\lim_{m\to + \infty} \sum_{n=2}^m \frac{1}{n!} (\ln 2)^n = 1-\ln 2\\ &\lim_{m\to + \infty} \sum_{n=2}^m\frac{1}{n!} n(\ln2)^{n-1} = 1. \end{align*}

Il en résulte que :

\begin{align*} \lim_{m\to +\infty} \sum_{n=0}^{m} \frac{1}{n!}J^n &=I_2+J+(1-\ln 2)I_2+ N\\ &=I_2+(\ln 2) I_2 + N+(1-\ln 2)I_2+ N\\ &=(1+\ln 2 + 1-\ln 2)I_2+2N\\ &=2I_2+2N. \end{align*}

Le calcul de l’exponentielle de $J$ est terminé :

\boxed{\e^{J} = \begin{pmatrix} 2& 2 \\ 0& 2 \end{pmatrix}.}

La structure diagonale par blocs et la conjugaison permettent de calculer l’exponentielle de la matrice $B$ à partir de l’égalité suivante :

\begin{align*} (P_1P_2P_3 P_4)^{-1}B(P_1P_2P_3 P_4) &= \begin{pmatrix} i\pi&0& 0 \\ 0&\ln 2 & 1\\ 0&0&\ln2 \end{pmatrix} \\ &=\begin{pmatrix} i\pi&0\\ 0& J\\ \end{pmatrix}. \end{align*}

Il vient :

\begin{align*} (P_1P_2P_3 P_4)^{-1}\e^B (P_1P_2P_3 P_4) &= \begin{pmatrix} \e^{i\pi}&0\\ 0& \e^J\\ \end{pmatrix}\\ &=\begin{pmatrix} -1&0&0\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}. \end{align*}

Subséquemment :

\begin{align*} \e^B &= (P_1P_2P_3 P_4) \begin{pmatrix} -1&0&0\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}(P_1P_2P_3 P_4)^{-1} \\ &=P_1P_2P_3 P_4 \begin{pmatrix} -1&0&0\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_4^{-1}P_3^{-1}P_2^{-1}P_1^{-1} \\ &=P_1P_2P_3 \left(P_4 \begin{pmatrix} -1&0&0\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_4^{-1}\right)P_3^{-1}P_2^{-1}P_1^{-1} \\ &=P_1P_2P_3 \begin{pmatrix} -1&0&-6\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_3^{-1}P_2^{-1}P_1^{-1} \\ &=P_1P_2\left(P_3 \begin{pmatrix} -1&0&-6\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_3^{-1}\right)P_2^{-1}P_1^{-1} \\ &=P_1P_2 \begin{pmatrix} -1&3&-4\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_2^{-1}P_1^{-1} \\ &=P_1\left(P_2 \begin{pmatrix} -1&3&-4\\ 0& 2 & 2\\ 0 & 0 & 2 \end{pmatrix}P_2^{-1}\right)P_1^{-1} \\ &=P_1 \begin{pmatrix} -1&1&-2\\ 0& 3 & 1\\ 0 & -1 & 1 \end{pmatrix}P_1^{-1} \\ &= \begin{pmatrix} 3&0 & 1\\ 1&-1&-2\\ -1&0 & 1 \end{pmatrix}. \end{align*}

Concluez

Si $A$ est la matrice définie par :

A= \begin{pmatrix} 3 & 0 & 1\\ 1&-1&-2\\ -1&0&1 \end{pmatrix}

et si $B$ est celle définie par :

B=\frac{1}{2}\begin{pmatrix} 1+2\ln 2 & 0 & 1\\ 1&2i\pi&1-2\ln2 +2i\pi\\ -1&0&-1+2\ln2 \end{pmatrix}

alors l’exponentielle de la matrice $B$ est égale à la matrice $A$ :

\boxed{\exp B =A.}

334. Racine carrée complexe d’une matrice

Rédigé par Yannis TRIANTAPHYLIDESon 11/05/202416/05/2024| Niveau Prépa

Soit $A$ la matrice réelle définie par :

A= \begin{pmatrix} 3 & 0 & 1\\ 1&-1&-2\\ -1&0&1 \end{pmatrix}.

Vous allez déterminer explicitement une matrice complexe $B$ telle que $B^2 = A.$
On dit que la matrice $B$ est une racine carrée de la matrice $A$.

Pour y parvenir, vous allez d’abord chercher une expression de $A^n$ lorsque $n$ est un entier naturel non nul.

Déterminez un polynôme annulateur de $A$

Vous notez $I$ la matrice identité d’ordre $3.$

Le calcul du polynôme caractéristique $P$ de la matrice $A$ conduit à ce qui suit :

\begin{align*} P(X)&=\det(XI-A)\\ &=\begin{vmatrix} X-3 & 0 & -1\\ -1 & X+1 & 2\\ 1 & 0 & X-1 \end{vmatrix}\\ &=(X+1)\begin{vmatrix} X-3 & 0 & -1\\ -1 & 1 & 2\\ 1 & 0 & X-1 \end{vmatrix}\\ &=(X+1)\begin{vmatrix} X-3 & -1\\ 1 & X-1 \end{vmatrix}\\ &=(X+1)\begin{vmatrix} X-2 & X-2\\ 1 & X-1 \end{vmatrix}\\ &=(X+1)(X-2)\begin{vmatrix} 1 & 1\\ 1 & X-1 \end{vmatrix}\\ &=(X+1)(X-2)\begin{vmatrix} 1 & 1\\ 0 & X-2 \end{vmatrix}. \end{align*}

Ainsi :

P(X) = (X+1)(X-2)^2.

Via le théorème de Cayley-Hamilton, il en résulte que :

\boxed{P(A) = (A+I)(A-2I)^2 = 0.}

Déterminez le reste de la division euclidienne de $X^n$ par $P$

Soit $n$ un entier naturel non nul fixé.

Formez un système d’équations

En effectuant la division euclidienne de $X^n$ par $P$ qui est un polynôme de degré $3$, vous déduisez qu’il existe un polynôme quotient $Q\in\R[X]$ et un polynôme $R$ de degré $2$ au maximum, tels que :

X^n = P(X)Q(X)+R(X).

Compte tenu de la remarque précédente effectuée sur le polynôme $R$, il existe un triplet $(a,b,c)\in\R^3$ tel que :

R(X)=aX^2+bX+c.

Comme $P(2)=0$ et comme $P(-1)=0$, en évaluant en $2$ et en $-1$, vous obtenez les deux égalités :

\boxed{\begin{align*} 2^n &= 4a+2b+c\\ (-1)^n &= a-b+c. \end{align*}}

Pour déterminer une équation supplémentaire, vous allez utiliser le fait que $2$ est racine double de $P.$

En dérivant, il vient :

nX^{n-1} = P'(X)Q(X)+P(X)Q'(X)+R'(X).

Comme $P(2) = P'(2)=0$ en évaluant en $2$ il vient :

n2^{n-1} = 4a+b.

En multipliant par $2$, vous obtenez :

\boxed{n2^n = 8a+2b.}

Résolvez le système obtenu

Vous avez :

\begin{align*} 2^n &= 4a+2b+c\\ (-1)^n &= a-b+c. \end{align*}

Par soustraction vous éliminez $c$ et obtenez :

\begin{align*} 2^n - (-1)^n &= 3a+3b. \end{align*}

Après multiplication par $2$, il vient :

2\times 2^n - 2(-1)^n = 6a+6b.

En multipliant par $3$ l’équation $n2^n = 8a+2b$ vous obtenez encore $6$ fois $b$ :

3n2^n = 24a+6b.

Par soustraction vous éliminez $6b$ et obtenez :

(3n-2)2^n+2(-1)^n = 18a.

Du coup :

\boxed{a = \frac{(3n-2)2^n+2(-1)^n}{18}.}

Pour trouver $b$, vous utilisez la relation $2^n – (-1)^n &= 3a+3b.$ Il en découle ce qui suit :

\begin{align*} 3b &= 2^n - (-1)^n - 3a\\ &=2^n - (-1)^n + \frac{(-9n+6)2^n-6(-1)^n}{18}\\ &=\frac{18\times 2^n - 18 (-1)^n}{18} + \frac{(-9n+6)2^n-6(-1)^n}{18}\\ &=\frac{(-9n+24)2^n - 24 (-1)^n}{18}. \end{align*}

Après division par $3$, vous obtenez :

\boxed{b = \frac{(-3n+8)2^n - 8 (-1)^n}{18}.}

Pour trouver $c$, vous utilisez la relation $(-1)^n &= a-b+c.$ Du coup :

\begin{align*} c &= (-1)^n-a+b\\ &=\frac{18(-1)^n}{18}+ \frac{(-3n+2)2^n-2(-1)^n}{18} + \frac{(-3n+8)2^n - 8 (-1)^n}{18}. \end{align*}

Ainsi :

\boxed{c=\frac{(-6n+10)2^n+8(-1)^n}{18}.}

Concluez

Le polynôme $P$ étant défini par $P(X) = (X+1)(X-2)^2$ vous avez obtenu :

\boxed{\begin{align*} \forall n\in\NN, \exists Q\in\R[X], X^n &= P(X)Q(X) +\frac{(3n-2)2^n+2(-1)^n}{18}X^2\\ &\qquad+ \frac{(-3n+8)2^n - 8 (-1)^n}{18}X+\frac{(-6n+10)2^n+8(-1)^n}{18}. \end{align*}}

Déterminez une expression de la matrice $A^n$ quand $n\in\NN$

En évaluant la relation précédente pour $X = A$, vous obtenez :

\begin{align*} \forall n\in\NN, \exists Q\in\R[X], A^n &= P(A)Q(A) +\frac{(3n-2)2^n+2(-1)^n}{18}A^2\\ &\qquad+ \frac{(-3n+8)2^n - 8 (-1)^n}{18}A+\frac{(-6n+10)2^n+8(-1)^n}{18}I. \end{align*}

Or, il a déjà été vu que $P(A)=0.$ Du coup :

\boxed{\begin{align*} \forall n\in\NN, A^n &= \frac{(3n-2)2^n+2(-1)^n}{18}A^2+ \frac{(-3n+8)2^n - 8 (-1)^n}{18}A+\frac{(-6n+10)2^n+8(-1)^n}{18}I. \end{align*}}

Extrapolez la relation précédente et déterminez une racine carrée de $A$

Vous souhaitez choisir $n=1/2$ dans la relation précédente qui calculait $A^n.$ Afin d’éviter la problématique évaluation de $(-1)^n$ lorsque $n$ n’est pas entier, vous utilisez la relation d’Euler $-1 = \e^{i\pi}.$

L’idée est alors d’utiliser la relation suivante, valable pour tous les réels $x$ strictement positifs : $x^{1/2}=\sqrt{x}.$

Suivant cette optique, vous posez :

B = \frac{(3\times \frac{1}{2}-2)2^{1/2}+2(\e^{i\pi})^{1/2}}{18}A^2+ \frac{(-3\times \frac{1}{2}+8)2^{1/2} - 8 (\e^{i\pi})^{1/2}}{18}A+\frac{(-6\times \frac{1}{2}+10)2^{1/2}+8(\e^{i\pi})^{1/2}}{18}I.

Vous calculez explicitement la matrice $B$ et vous procédez comme suit :

\begin{align*} B&=\frac{ \frac{-\sqrt{2}}{2}+2\e^{i\pi/2}}{18}A^2+ \frac{\frac{13}{2}\sqrt{2} - 8 \e^{i\pi/2}}{18}A+\frac{7 \sqrt{2}+8\e^{i\pi/2}}{18}I\\ &=\frac{ -\sqrt{2}+4\e^{i\pi/2}}{36}A^2+ \frac{13\sqrt{2} - 16 \e^{i\pi/2}}{36}A+\frac{14 \sqrt{2}+16\e^{i\pi/2}}{36}I\\ &=\frac{ -\sqrt{2}+4i}{36}A^2+ \frac{13\sqrt{2} - 16i}{36}A+\frac{14 \sqrt{2}+16i}{36}I. \end{align*}

Or :

A^2 = \begin{pmatrix} 8 & 0 & 4\\ 4 & 1 & 1\\ -4 & 0 & 0 \end{pmatrix}.

Du coup :

\begin{align*} B &=\frac{ -\sqrt{2}+4i}{36}\begin{pmatrix} 8 & 0 & 4\\ 4 & 1 & 1\\ -4 & 0 & 0 \end{pmatrix}+ \frac{13\sqrt{2} - 16i}{36}\begin{pmatrix} 3 & 0 & 1\\ 1&-1&-2\\ -1&0&1 \end{pmatrix}+\frac{14 \sqrt{2}+16i}{36}\begin{pmatrix} 1 & 0 & 0\\ 0&1&0\\ 0&0&1 \end{pmatrix} \\ &=\frac{1}{36}\begin{pmatrix} -8\sqrt{2}+32i & 0 & -4\sqrt{2}+16i\\ -4\sqrt{2}+16i&-\sqrt{2}+4i&-\sqrt{2}+4i\\ 4\sqrt{2}-16i&0&0 \end{pmatrix} +\frac{1}{36}\begin{pmatrix} 39\sqrt{2} - 48i & 0 & 13\sqrt{2} - 16i\\ 13\sqrt{2} - 16i&-13\sqrt{2} + 16i&-26\sqrt{2} +32i\\ -13\sqrt{2} + 16i&0&13\sqrt{2} - 16i \end{pmatrix}\\ &\qquad+\frac{1}{36}\begin{pmatrix} 14 \sqrt{2}+16i & 0 & 0\\ 0&14 \sqrt{2}+16i&0\\ 0&0&14 \sqrt{2}+16i \end{pmatrix}\\ &=\frac{1}{36}\begin{pmatrix} 45\sqrt{2} & 0 & 9\sqrt{2}\\ 9\sqrt{2}&36i&-27\sqrt{2}+36i\\ -9\sqrt{2}&0&27\sqrt{2} \end{pmatrix}. \end{align*}

Après simplification par $9$, il vient :

\boxed{B = \frac{1}{4}\begin{pmatrix} 5\sqrt{2} & 0 & \sqrt{2}\\ \sqrt{2}&4i&-3\sqrt{2}+4i\\ -\sqrt{2}&0&3\sqrt{2} \end{pmatrix}.}

Vérifiez que la matrice $B$ convient

Vous calculez la matrice $B^2$ en trois temps.

Première colonne de $B^2$

\begin{align*} B^2\begin{pmatrix} 1\\ 0\\ 0 \end{pmatrix} &= \frac{1}{4}B \begin{pmatrix} 5\sqrt{2}\\ \sqrt{2}\\ -\sqrt{2} \end{pmatrix} \\ &=\frac{\sqrt{2}}{4}B \begin{pmatrix} 5\\ 1\\ -1 \end{pmatrix} \\ &=\frac{1}{4}\times \frac{\sqrt{2}}{4} \left( \begin{pmatrix} 25\sqrt{2}\\ 5\sqrt{2}\\ -5\sqrt{2} \end{pmatrix} + \begin{pmatrix} 0\\ 4i\\ 0 \end{pmatrix} + \begin{pmatrix} -\sqrt{2}\\ 3\sqrt{2}-4i\\ -3\sqrt{2} \end{pmatrix} \right) \\ &=\frac{\sqrt{2}}{16} \begin{pmatrix} 24\sqrt{2}\\ 8\sqrt{2}\\ -8\sqrt{2} \end{pmatrix} \\ &=\frac{\sqrt{2} }{4} \begin{pmatrix} 6\sqrt{2}\\ 2\sqrt{2}\\ -2\sqrt{2} \end{pmatrix} \\ &= \frac{1}{4} \begin{pmatrix} 12\\ 4\\ -4 \end{pmatrix} \\ &= \begin{pmatrix} 3\\ 1\\ -1 \end{pmatrix}. \end{align*}

Deuxième colonne de $B^2$

\begin{align*} B^2\begin{pmatrix} 0\\ 1\\ 0 \end{pmatrix} &= \frac{1}{4}B \begin{pmatrix} 0\\ 4i\\ 0 \end{pmatrix} \\ &=i B \begin{pmatrix} 0\\ 1\\ 0 \end{pmatrix} \\ &=\frac{i}{4} \begin{pmatrix} 0\\ 4i\\ 0 \end{pmatrix} \\ &= \begin{pmatrix} 0\\ -1\\ 0 \end{pmatrix}. \end{align*}

Troisième colonne de $B^2$

\begin{align*} B^2\begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix} &= \frac{1}{4}B \begin{pmatrix} \sqrt{2}\\ -3\sqrt{2}+4i\\ 3\sqrt{2} \end{pmatrix} \\ &= \frac{1}{4} B\left( \begin{pmatrix} \sqrt{2}\\ -3\sqrt{2}\\ 3\sqrt{2} \end{pmatrix} + \begin{pmatrix} 0\\ 4i\\ 0 \end{pmatrix}\right) \\ &=\frac{\sqrt{2}}{4}B\begin{pmatrix} 1\\ -3\\ 3 \end{pmatrix}+iB\begin{pmatrix} 0\\ 1\\ 0 \end{pmatrix} \\ &=\frac{\sqrt{2}}{4}\times \frac{1}{4} \left( \begin{pmatrix} 5\sqrt{2}\\ \sqrt{2}\\ -\sqrt{2} \end{pmatrix} + \begin{pmatrix} 0\\ -12i\\ 0 \end{pmatrix} + \begin{pmatrix} 3\sqrt{2}\\ -9\sqrt{2}+12i\\ 9\sqrt{2} \end{pmatrix} \right) +\frac{i}{4} \begin{pmatrix} 0\\ 4i\\ 0 \end{pmatrix} \\ &= \frac{\sqrt{2}}{16} \begin{pmatrix} 8\sqrt{2}\\ -8\sqrt{2}\\ 8\sqrt{2} \end{pmatrix} + \begin{pmatrix} 0\\ -1\\ 0 \end{pmatrix} \\ &=\frac{\sqrt{2}}{2} \begin{pmatrix} \sqrt{2}\\ -\sqrt{2}\\ \sqrt{2} \end{pmatrix} + \begin{pmatrix} 0\\ -1\\ 0 \end{pmatrix} \\ &= \begin{pmatrix} 1\\ -1\\ 1 \end{pmatrix} + \begin{pmatrix} 0\\ -1\\ 0 \end{pmatrix} \\ &= \begin{pmatrix} 1\\ -2\\ 1 \end{pmatrix}. \end{align*}

Concluez

La matrice $B$ est bien une racine carrée de la matrice $A$ :

\boxed{B^2=A.}

Prolongement

Il est possible de démontrer que toute matrice complexe inversible admet une racine carrée complexe.

Quand la matrice n’est plus inversible, le résultat ne tient plus.

En effet, considérez la matrice complexe $A$ définie par :

A=\begin{pmatrix} 0 & 1 & 0\\ 0 & 0 & 1\\ 0 & 0 & 0 \end{pmatrix}.

Justifiez qu’il n’existe aucune matrice complexe carrée d’ordre $3$ telle que $B^2=A.$

333. Racines primitives n-ièmes de l’unité

Rédigé par Yannis TRIANTAPHYLIDESon 04/05/202412/05/2024| Niveau Prépa

Soit $n$ un entier naturel non nul.

Par définition, un nombre complexe $z$ est une racine primitive $n$-ième de l’unité, si et seulement si :

\left\{\begin{align*} &z^n = 1\\ &\forall m\in\llbracket 1, n-1\rrbracket, z^m\neq 1. \end{align*}\right.

Vous allez dans cet article vérifier qu’il existe au moins une racine primitive $n$-ième de l’unité. Puis, vous allez l’utiliser pour démontrer des caractérisations générales des racines $n$-ièmes primitives de l’unité.

Un exemple important

Considérez le nombre complexe $\varepsilon$ défini par :

\boxed{\varepsilon = \e^{\frac{2i\pi}{n}}.}

Note. Ce nombre $\varepsilon$ a été rencontré dans le contenu rédigé dans l'article 332 où il a été établi que toute racine $n$-ième de l’unité s’écrit comme une puissance entière de $\varepsilon.$

Vous calculez directement $\varepsilon^n$ :

\begin{align*} \varepsilon^n &= \left(\e^{\frac{2i\pi}{n}}\right)^n\\ &=\e^{\frac{2i\pi}{n}\times n}\\ &=\e^{2i\pi}\\ &=1. \end{align*}

AInsi, le nombre $\varepsilon$ est une racine $n$-ième de l’unité.

Supposez maintenant qu’il existe un entier $m\in\llbracket 1, n-1\rrbracket$ tel que $\varepsilon^m=1.$

Vous déduisez :

\begin{align*} 1 &= \varepsilon^m\\ &=\left(\e^{\frac{2i\pi}{n}}\right)^m\\ &=\e^{\frac{2im\pi}{n}}. \end{align*}

De cette égalité, vous déduisez l’existence d’un entier $k\in\Z$ tel que :

\frac{2im\pi}{n}= 2ik\pi.

Vous simplifiez par $2i\pi$ et obtenez :

\frac{m}{n} = k.

Cela s’écrit $m = nk.$ Comme $m$ et $n$ sont strictement positifs, il en est de même pour $k.$

Donc $k\geq 1$ et par suite $nk\geq n$ et $m\geq n.$ Contradiction avec $m\leq n-1.$

Vous en désuisez : $\forall m\in\llbracket 1, n-1\rrbracket, \varepsilon^m\neq 1.$

Le nombre $\varepsilon$ est une racine $n$-ième primitive de l’unité.

Une première caractérisation d’une racine primitive

Vous allez démontrer que, pour tout nombre complexe $z$, le nombre $z$ est une racine primitive $n$-ième de l’unité, si et seulement si l’ensemble :

A_z=\{m\in\NN, z^m=1\}

est non vide et admet $n$ pour plus petit élément.

Premier sens

Soit $z$ une racine primitive $n$-ième de l’unité. Vous posez $A_z=\{m\in\NN, z^m=1\}.$

Alors $z^n=1$ et comme $n\in\NN$, $n\in A_z$ donc $A_z$ est non vide.

Comme $A_z$ est une partie de $\N$, elle admet un plus petit élément noté $\alpha.$

Comme $\alpha \in A_z$, alors $\alpha \geq 1.$

Or, $n\in A_z$ et $\alpha$ est le plus petit élément de $A_z$, donc $\alpha\leq n.$

Supposez que $\alpha \neq n.$ Alors $1\leq \alpha\leq n-1.$ Comme $\alpha\in A_z$ il vient $z^{\alpha} = 1.$

Or $z$ est une racine primitive $n$-ième de l’unité donc $\forall i\in\llbracket 1, n-1\rrbracket, z^i\neq 1.$ Alors $z^{\alpha}\neq 1.$ Contradiction.

Du coup, $\alpha = n$ est $n$ est le plus petit élément de $A_z.$

Second sens

Soit $z$ un nombre complexe tel que $A_z=\{m\in\NN, z^m=1\}$ soit non vide et $n = \min A_z.$

Comme $n\in A_z$, il vient $z^n=1.$

Soit maintenant $i$ un entier appartenant à l’intervalle $\llbracket 1, n-1 \rrbracket.$

Supposez $z^i = 1.$ Alors, comme $i\in\NN$ vous déduisez $i\in A_z.$ Comme $n$ est le plus petit élément de $A_z$ vous avez $n\leq i.$ Or $i\leq n-1.$ Du coup, $n\leq n-1$. Contradiction.

Donc $z^i\neq 1.$

Du coup, $\forall i\in\llbracket 1, n-1\rrbracket, z^i\neq 1.$

Le nombre $z$ est par conséquent une racine primitive $n$-ième de l’unité.

Une deuxième caractérisation

Vous allez démontrer que, pour tout nombre complexe $z$, le nombre $z$ est une racine primitive $n$-ième de l’unité, si et seulement si l’ensemble :

B_z=\{m\in\Z, z^m=1\}

est égal à l’ensemble noté $n\Z$ des multiples de $n.$

Premier sens

Soit $z$ une racine primitive $n$-ième de l’unité. Vous posez $B_z=\{m\in\Z, z^m=1\}.$

Soit $k\in\Z$ un multiple de $n.$ Il existe un entier $\ell\in\Z$ tel que $k = n\ell.$

Alors :

\begin{align*} z^k &= z^{n\ell}\\ &= (z^n)^{\ell}\\ &= 1^{\ell}\\ &=1. \end{align*}

Du coup $k\in B_z.$

Vous déduisez l’inclusion $n\Z \subset B_z.$

Réciproquement, soit $m\in B_z$ de sorte que $z^m=1.$

Vous effectuez la division euclidienne de $m$ par $n.$

Il existe un entier $q\in\Z$ et un entier $r\in\llbracket 0, n-1\rrbracket$ tels que $m = nq+r.$

Alors :

\begin{align*} 1 &= z^m\\ &=z^{nq+r}\\ &=z^{nq}\times z^r\\ &=(z^n)^q\times z^r\\ &=1^q \times z^r\\ &=z^r. \end{align*}

Comme $z$ est une racine $n$-ième primitive de l’unité, $\forall i\in\llbracket 1, n-1\rrbracket, z^i\neq 1.$ Comme $z^r=1$ vous déduisez $r\notin\llbracket 1, n-1\rrbracket.$ Cependant, $r\in\llbracket 0, n-1\rrbracket.$ Du coup $r=0$ et donc $m=nq$ donc $m$ est un multiple de $n.$

Vous déduisez l’autre inclusion : $B_z\subset n\Z.$

Du coup, $B_z = n\Z.$

Second sens

Soit $z$ un nombre complexe tel que l’ensemble $B_z=\{m\in\Z, z^m=1\}$ soit égal à $n\Z$, l’ensemble des multiples de $n.$

Tout d’abord, $n = n\times 1$ donc $n$ est un multiple de $n.$ Par suite, $n\in n\Z.$

Or, $B_z = n\Z$ donc $n\in B_z$ et il vient $z^n = 1.$

Soit maintenant un entier $i \in\llbracket 1, n-1\rrbracket.$

Supposez que $z^i = 1.$ Alors comme $i\in \Z$ il vient $i\in B_z.$ Comme $B_z = n\Z$ vous déduisez $i\in n\Z.$ Donc $i$ est un multiple de $n.$

Il existe un entier $k\in\Z$ tel que $i = nk.$

Si $k$ est négatif ou nul, par produit, $nk$ est négatif ou nul et $i$ aussi. Contradiction avec $i\geq 1.$

Donc $k$ est strictement positif. Or, $k$ est entier donc $k\geq 1.$ Par produit avec $n$, il vient $nk\geq n.$ Donc $i\geq n.$ Mais cela contredit l’inégalité $i\leq n-1.$

Vous déduisez que $z^i\neq 1.$

Ainsi, $\forall i\in\llbracket 1, n-1\rrbracket, z^i\neq 1.$

$z$ est ainsi une racine primitive $n$-ième de l’unité.

Une troisième caractérisation

Vous allez démontrer que, pour tout nombre complexe $z$, le nombre $z$ est une racine primitive $n$-ième de l’unité, si et seulement si les conditions suivantes sont simultanément satisfaites :

$z^n = 1$ (autrement dit, $z$ est une racine $n$-ième de l’unité) ;
Toute racine $n$-ième de l’unité s’écrit comme une puissance entière de $z.$

Note. La seconde condition s’écrit formellement ainsi :

\forall u\in\C, u^n=1 \implies \left(\exists k\in\Z, u = z^k. \right)

Remarque. Cette seconde condition signifie que $z$ est un générateur de l’ensemble des racines $n$-ièmes de l’unité.

Premier sens

Soit $z$ un nombre complexe tel que $z^n=1.$

Vous supposez ce qui suit :

\forall u\in\C, u^n=1 \implies \left(\exists k\in\Z, u = z^k. \right)

D’une part, le nombre $z$, en tant que racine $n$-ième de l’unité, s’écrit comme une puissance entière de $\varepsilon.$

Il existe un entier $\ell \in\Z$ tel que :

z = \varepsilon^{\ell}.

D’autre part, en choisissant $u=\varepsilon$, vous déduisez qu’il existe un entier $k\in\Z$ tel que :

\varepsilon = z^k.

Du coup, vous déduisez que :

\begin{align*} \varepsilon &= z^k\\ &= (\varepsilon^{\ell})^k\\ &=\varepsilon^{k\ell}. \end{align*}

Or, $\varepsilon = \e^{\frac{2i\pi}{n}}$, en tant qu’exponentielle, est un nombre non nul.

En divisant l’égalité précédente par $\varepsilon$ il vient :

1 = \varepsilon^{k\ell-1}.

Le nombre $\varepsilon$ est une racine $n$-ième primitive de l’unité. D’après la deuxième caractérisation, il vient :

k\ell -1 \in n\Z.

Autrement dit, $n$ divise $k\ell -1$ :

n\mid k\ell -1.

Il existe un entier $p\in\Z$ tel que :

k\ell-1 = np.

Cela s’écrit aussi sous la forme :

k\ell - np = 1.

D’après le théorème de Bézout, cette relation montre que les entiers $\ell$ et $n$ sont premiers entre eux.

Vous utilisez la deuxième caractérisation sur $z$ avec la série d’équivalences suivantes :

\begin{align*} \forall m\in\Z, z^m=1 &\Longleftrightarrow (\varepsilon^{\ell})^m =1\\ &\Longleftrightarrow\varepsilon^{\ell m}=1\\ &\Longleftrightarrow \ell m\in n\Z\\ &\Longleftrightarrow n\mid \ell m\\ &\Longleftrightarrow \left\{\begin{align*} &n\mid \ell m\\ &\mathrm{PGCD}(\ell, n)=1 \end{align*}\right.\\ &\Longleftrightarrow n\mid m \quad\text{(théorème de Gauss)}\\ &\Longleftrightarrow m \in n\Z. \end{align*}

Ainsi, $z$ est une racine $n$-ième primitive de l’unité.

Second sens

Soit $z\in\C$ une racine primitive $n$-ième de l’unité. Par définition, vous avez déjà $z^n=1.$

Comme $z$ est aussi une racine $n$-ième de l’unité, vous déduisez l’existence d’un entier $k\in\Z$ tel que :

z = \varepsilon^k.

Vous notez $d=\mathrm{PGCD}(n,k)$ qui est un entier non nul.

Il existe deux entiers $n’\in\N$ et $k’\in\Z$ tels que :

\left\{\begin{align*} n &=dn'\\ k&=dk'. \end{align*}\right.

Les nombres entiers $n’$ et $k’$ sont alors premiers entre eux.

Vous utilisez la deuxième caractérisation avec $\varepsilon$ et $z$ qui sont deux racines primitives $n$-ième primitive de l’unité :

\begin{align*} \forall m\in\Z, m \in n\Z &\Longleftrightarrow z^m=1\\ &\Longleftrightarrow (\varepsilon^{k})^m =1\\ &\Longleftrightarrow\varepsilon^{k m}=1\\ &\Longleftrightarrow k m\in n\Z\\ &\Longleftrightarrow n \mid k m\\ &\Longleftrightarrow dn' \mid dk' m\\ &\Longleftrightarrow n' \mid k' m\\ &\Longleftrightarrow \left\{\begin{align*} &n'\mid k' m\\ &\mathrm{PGCD}(n', k')=1 \end{align*}\right.\\ &\Longleftrightarrow n' \mid m\\ &\Longleftrightarrow m\in n'\Z. \end{align*}

Comme $n\in n\Z$ il en résulte que $n \in n’\Z$ donc $n’\mid n.$
De même, $n’\in n’\Z$ il en résulte que $n’ \in n\Z$ donc $n \mid n’.$

Par conséquent il vient $n=n’$ donc $dn = dn’$ ce qui fournit $dn = n$ et donc $d=1.$

Comme $n$ et $k$ sont premiers entre eux, par le théorème de Bézout, il existe deux entiers $u\in \Z$ et $v\in \Z$ tels que :

an+bk=1.

Comme $z = \varepsilon^k$ vous déduisez ce qui suit :

\begin{align*} z^b &= (\varepsilon^{k})^b\\ &=\varepsilon^{bk}\\ &=\varepsilon^{1-an}\\ &=\varepsilon\times \varepsilon^{-an}\\ &=\varepsilon\times (\varepsilon^{n})^{-a}\\ &=\varepsilon\times 1^{-a}\\ &=\varepsilon. \end{align*}

Soit maintenant $u$ un nombre complexe tel que $u^n=1.$

Comme $u$ est une racine $n$-ième de l’unité, il existe $\ell\in \Z$ tel que $u = \varepsilon^{\ell}.$

Du coup $u = (z^b)^{\ell}$ soit $u = z^{b\ell}.$

La propriété qui suit est bien vérifiée :

\forall u\in\C, u^n=1 \implies \left(\exists \alpha \in\Z, u = z^{\alpha}. \right)

Une quatrième caractérisation

Soit $z$ une racine $n$-ième primitive de l’unité fixée. Vous allez démontrer que, pour tout nombre complexe $u$, $u$ est une racine primitive $n$-ième de l’unité, si et seulement si, il existe un entier $k\in\Z$ premier avec $n$, tel que $u = z^k.$

Premier sens

Soit $u$ une racine primitive $n$-ième de l’unité.

Comme $u^n=1$ et que $z$ est une racine primitive $n$-ième de l’unité, via la troisième caractérisation, il existe un entier $k\in\Z$ tel que $u = z^k.$

D’autre part, $z^n=1$ et $u$ est une racine primitive $n$-ième de l’unité. Toujours via la troisième caractérisation, il existe un entier $\ell\in\Z$ tel que $z = u^{\ell}.$

Mis bout à bout, il vient :

\begin{align*} u &= z^k\\ &= (u^{\ell})^k\\ &=u^{k\ell}. \end{align*}

Or, $u$ est non nul, donc en divisant par $u$, il vient $1 = u^{k\ell -1}.$

Comme $u$ est une racine primitive $n$-ième de l’unité, via la deuxième caractérisation, il vient :

n\mid k\ell -1.

Donc il existe un entier $m\in\Z$ tel que :

k\ell -1 = nm.

Autrement dit :

k\ell-mn = 1.

D’après le théorème de Bézout, il en résulte que $\mathrm{PGCD}(k,n)=1$ et les entiers $k$ et $n$ sont premiers entre eux.

Comme $u = z^k$ avec $k$ premier avec $n$, la démonstration du premier sens est acquise.

Second sens

Soit $u\in\C$ tel qu’il existe un entier $k\in\Z$ vérifiant :

\left\{\begin{align*} &u = z^k\\ &\mathrm{PGCD}(k,n)=1. \end{align*}\right.

Tout d’abord :

\begin{align*} u^n &= (z^k)^n\\ &= z^{kn}\\ &= (z^n)^k\\ &= 1^k\\ &=1. \end{align*}

Le nombre $u$ est une racine $n$-ième de l’unité.

D’après le théorème de Bézout, il existe $(a,b)\in\Z^2$ tel que :

ak+bn=1.

Alors :

\begin{align*} u^a &= (z^k)^a\\ &= z^{ak}\\ &= z^{1-bn}\\ &=z\times z^{-bn} &=z\times (z^n)^{-b}\\ &=z\times 1^{-b}\\ &=z. \end{align*}

Soit maintenant $y$ une racine $n$-ième de l’unité. Comme $z$ est une racine $n$-ième primitive de l’unité, il existe $\alpha \in\Z$ tel que $y = z^{\alpha}.$

Alors :

\begin{align*} y &= (u^a)^{\alpha} \\ &=u^{a\alpha}. \end{align*}

Ainsi, toute racine $n$-ième de l’unité s’écrit comme une puissance entière de $u$, qui est lui-même une racine $n$-ième de l’unité. D’après la troisième caractérisation, il s’ensuit que $u$ est une racine primitive $n$-ième de l’unité.

Prolongement

Pour tout entier naturel $n$ non nul, on note $\varphi(n)$ le nombre d’éléments de l’ensemble suivant :

\{m\in \llbracket 0, n-1\rrbracket, \mathrm{PGCD}(m,n)=1\}.

La fonction $\varphi$ ainsi définie s’appelle fonction indicatrice d’Euler : à tout entier naturel $n$ non nul, $\varphi$ associe le nombre d’entiers positifs inférieurs ou égaux à $n-1$ qui sont premiers avec $n.$

En utilisant le contenu de cet article, expliquez pourquoi le nombre de racines primitives $n$-ièmes de l’unité est précisément égal à $\varphi(n).$

332. Les racines n-ièmes de l’unité

Rédigé par Yannis TRIANTAPHYLIDESon 29/04/202407/05/2024| Niveau Prépa

Soit $n$ un entier naturel non nul.

Pour tout nombre complexe $z$, on dit que $z$ est une racine $n$-ième de l’unité, si et seulement si :

z^n=1.

Le but de cet article est de démontrer que les racines $n$-ièmes de l’unité sont au nombre de $n$ et de préciser leur forme.

Analysez la situation

Déterminez la forme de ces racines

Soit $z$ un nombre complexe tel que $z$ soit une racine $n$-ième de l’unité.

Notez déjà que $z^n = 1$ donc $z\neq 0.$

Vous écrivez $z$ sous forme trigonométrique. Il existe un réel strictement positif $r$ et un réel $\theta$ tels que :

z = r\e^{i\theta}.

Alors $z^n=1$ fournit :

\begin{align*} (r\e^{i\theta})^n =1\\ r^n \e^{in\theta}=1. \end{align*}

En conjuguant la dernière égalité, il vient :

r^n \e^{-in\theta}=1.

Du coup, par produit :

r^{2n} = 1.

La fonction $f$ définie sur $]0,+\infty[$ par $f(x) = x^{2n}$ est strictement croissante.

Comme $f(r)=1$ et comme $f(1)=1$ vous déduisez $f(r)=f(1)$ et donc $r=1.$

Vous obtenez donc :

\e^{in\theta} = 1 = \e^0.

Il existe donc un entier relatif $k$ tel que :

i n\theta = 0+2ik \pi\\ \theta = \frac{2k\pi}{n}.

Pour plus de commodité, vous posez :

\boxed{\varepsilon = \e^{\frac{2i\pi}{n}}.}

D’après ce qui précède :

\begin{align*} z &= \e^{i\theta}\\ &=\e^{\frac{2ik\pi}{n}}\\ &=\left(\e^{\frac{2i\pi}{n}}\right)^k\\ &=\varepsilon^k. \end{align*}

Il est établi que pour toute racine $n$-ième de l’unité notée $z$, il existe un entier relatif $k$ tel que :

\boxed{z = \varepsilon^k.}

Justifiez que $k$ peut être choisi dans l’intervalle $\llbracket 0, n-1\rrbracket$

Soit $z$ une racine $n$-ième de l’unité. D’après le paragraphe précédent, il existe un entier relatif $\ell$ tel que :

z = \varepsilon^{\ell}.

Vous effectuez maintenant la division euclidienne de $\ell$ par l’entier naturel non nul $n.$

Il existe un entier relatif $q$ et un entier $k\in\llbracket 0, n-1\rrbracket$ tels que :

\ell = nq+k.

Alors :

\begin{align*} z &= \varepsilon^{\ell}\\ &=\varepsilon^{nq+k}\\ &=\varepsilon^{nq}\times \varepsilon^k\\ &=(\varepsilon^n)^q \times \varepsilon^k. \end{align*}

Comme $\varepsilon = \e^{\frac{2i\pi}{n}}$ il vient :

\begin{align*} \varepsilon^n &= \left(\e^{\frac{2i\pi}{n}}\right)^n\\ &=\e^{\frac{2i\pi}{n}\times n}\\ &=\e^{2i\pi}\\ &=1. \end{align*}

Du coup, $(\varepsilon^n)^q = 1$ et par suite :

z = \varepsilon^k

avec $\boxed{0\leq k \leq n-1.}$

Il est établi que pour toute racine $n$-ième de l’unité notée $z$, il existe un entier $k$ compris entre $0$ et $n-1$ tel que :

\boxed{z = \varepsilon^k.}

Synthèse

Soit $k$ un entier compris entre $0$ et $n-1.$

Vous calculez ceci :

\begin{align*} (\varepsilon^k)^n &= \varepsilon^{nk}\\ &=(\varepsilon^n)^k. \end{align*}

Or il a été établi ci-dessus que $\varepsilon^n = 1.$ Du coup :

\begin{align*} (\varepsilon^k)^n &=1^k\\ &=1. \end{align*}

Vous déduisez que, pour tout entier $k$ compris entre $0$ et $n-1$, $\varepsilon^k$ est une racine $n$-ième de l’unité.

Les termes de la suite $(\varepsilon^k)_{0\leq k\leq n-1}$ sont deux à deux distincts

Soient $p$ et $q$ deux éléments de l’intervalle $\llbracket 0, n-1\rrbracket$ tels que $\varepsilon^p = \varepsilon^q.$

D’une part, vous remarquez que :

\begin{align*} 0&\leq p &&\leq n-1\\ 1-n&\leq -q&&\leq 0 \end{align*}

Ainsi :

-(n-1)\leq p-q\leq n-1.

Par suite :

\vert p-q \vert \leq n-1.

D’autre part, vous avez :

\begin{align*} \e^{\frac{2ip\pi}{n}} &= \e^{\frac{2iq\pi}{n}}. \end{align*}

Il existe un entier $m$ tel que :

\begin{align*} \frac{2ip\pi}{n} &= \frac{2iq\pi}{n}+ 2i\pi m \\ \frac{p}{n} &= \frac{q}{n}+ m\\ p-q &=nm\\ \vert p-q\vert &=n \vert m \vert\\ n \vert m \vert &\leq n-1. \end{align*}

Si $m$ est non nul, alors $n\leq n-1$ ce qui est absurde, donc $m=0$ et donc $p=q.$

Par contraposée, vous déduisez que, quels que soient les entiers $p$ et $q$ appartenant à l’intervalle $\llbracket 0, n-1\rrbracket$ :

p\neq q \implies \varepsilon^p\neq \varepsilon^q.

Ainsi, les $n$ nombres complexes $\varepsilon^0, \dots, \varepsilon^{n-1}$ sont deux à deux distincts.

Concluez

Soit $n$ un entier naturel non nul fixé. Vous posez $\boxed{\varepsilon = \e^{\frac{2i\pi}{n}}.}$

Pour tout nombre complexe $z$, les propositions suivantes sont équivalentes :

$z$ est une racine $n$-ième de l’unité ;
$z^n =1$ ;
il existe un entier $k$ compris entre $0$ et $n-1$ tel que $z = \varepsilon^k.$

Les solutions de l’équation $z^n=1$ d’inconnue $z\in\C$ sont les $n$ nombres complexes suivants qui sont deux à deux distincts : $\varepsilon^0, \dots, \varepsilon^{n-1}.$

331. Calcul géométrique du cosinus de 36° et du cosinus de 72°

Rédigé par Yannis TRIANTAPHYLIDESon 24/04/202429/04/2024| Niveau Capes, Niveau Prépa, Niveau Terminale

Le but de cet article est de présenter un calcul de $\cos(36^{\circ})$ et de $\cos(72^{\circ})$ à partir d’outils géométriques. Le nombre d’or fera une apparition qui sera soulignée.

Tout d’abord, construisez un triangle $BCD$ isocèle en $D$, de sorte que :

\left\{\begin{align*} &BC = 1\\ &\widehat{BCD}=72^{\circ}\\ &\widehat{CBD}=72^{\circ}. \end{align*} \right.

Ces deux angles égaux à $72^{\circ}$ seront marqués en vert sur la figure.

Remarquez alors que $\boxed{CD=BD.}$

Comme la somme des angles d’un triangle est égale à $180^{\circ}$, il vient :

\begin{align*} \widehat{CDB} &= 180-72-72\\ &=180-144\\ &=36^{\circ}. \end{align*}

Cet angle sera marqué en violet.

Sur la demi-droite $[DC)$ vous placez le point $A$ tel que $AC = 1.$

Puisque $AC=BC$ le triangle $ACB$ est isocèle en $C.$ Vous avez obtenu la figure suivante, dans laquelle vous allez justifier de la présence de trois angles égaux à $36^{\circ}$, marqués en violet.

Comme l’angle $\widehat{DCA}$ est plat, il mesure $180^{\circ}.$ Du coup:

\begin{align*} \widehat{ACB} &= 180-72\\ &=108^{\circ}. \end{align*}

La somme des mesures des angles $\widehat{CAB}$ et $\widehat{ABC}$ est égale à $72^{\circ}$ pour que la somme des trois angles du triangle $ACB$ soit égale à $180^{\circ}.$

Or, les angles $\widehat{CAB}$ et $\widehat{ABC}$ ont la même mesure. Donc:

\widehat{CAB}= \widehat{ABC} = 36^{\circ}.

Remarquez alors que le triangle $ABD$ possède aussi deux angles mesurant $36^{\circ}.$ Il est donc isocèle en $B$, du coup $\boxed{AB=BD.}$

Une mesure de l’angle $\widehat{ABD}$ est obtenue comme suit:

180 - 36-36 = 180-72 = 108.

D’où : $\widehat{ABD} = 108^{\circ}.$

Remarquez que deux triangles sont semblables

Vous construisez le tableau suivant à partir des triangles $ACB$ et $ABD$ et vous déduisez les sommets homologues:

\begin{array}{|c|c|c|c|} \hline \text{valeurs des angles} & 36^{\circ} & 108^{\circ} & 36^{\circ}\\ \hline \text{sommets du triangle }ACB & A & C & B\\ \hline \text{sommets du triangle }ABD & A & B & D\\ \hline \end{array}

Notez que $A$ et $B$ ne sont pas confondus, sinon $B$ appartient à la demi-droite $[DC)$ et le triangle $BCD$ est plat, ce qui est absurde. Donc $AB$ est un réel strictement positif.

Les points $A$, $C$ et $D$ sont alignés dans cet ordre, d’où $AD = AC+CD = 1+CD.$ Ainsi, $AD$ est strictement positif.

Du coup, par proportionnalité, il vient:

\frac{AC}{AB} = \frac{AB}{AD}.

En tenant compte du fait que $AC=1$ il vient:

\frac{1}{AB} = \frac{AB}{AD}.

Puis:

\frac{1}{AB} = \frac{AB}{1+CD}.

Or, $CD = BD = AB$, d’où:

\frac{1}{AB} = \frac{AB}{1+AB}.

Le réel $AB$ est une solution strictement positive de l’équation $\frac{1}{x} = \frac{x}{1+x}.$

Note. On pourrait résoudre cette équation avec le discriminant, mais le lien avec le nombre d’or mérite d’être souligné.

Le nombre d’or est l’unique solution strictement positive de l’équation $\frac{1}{x} = \frac{x}{1+x}$

Ce résultat sera démontré en deux temps.

Le nombre d’or est défini par:

\varphi = \frac{1+\sqrt{5}}{2}.

Il est strictement positif.

Le nombre d’or est bien une solution de cette équation

En calculant $\varphi^2$ il vient:

\begin{align*} \varphi^2&=\frac{(1+\sqrt{5})^2}{4}\\ &= \frac{1+5+2\sqrt{5}}{4}\\ &=\frac{6+2\sqrt{5}}{4}\\ &=\frac{3+\sqrt{5}}{2}\\ &=\frac{1+\sqrt{5}}{2}+\frac{2}{2}\\ &=\varphi+1. \end{align*}

Ainsi:

\begin{align*} \frac{\varphi}{1+\varphi}&=\frac{\varphi}{\varphi^2}\\ &=\frac{1}{\varphi}. \end{align*}

Donc le nombre d’or $\varphi$ est bien une solution strictement positive de l’équation $\frac{1}{x} = \frac{x}{1+x}.$

Il convient maintenant d’établir l’unicité d’une telle solution.

Il n’y a pas d’autre solution que le nombre d’or à cette équation

Soit $a$ un réel strictement positif tel que $\frac{1}{a} = \frac{a}{1+a}.$

Par produit en croix, il vient:

\begin{align*} a^2=1+a\\ a^2-a-1 = 0. \end{align*}

Note. Cette équation peut être résolue avec le discriminant, mais un autre choix est effectué ici.

Donc $a$ est racine du trinôme $X^2-X-1.$

Or, il a été vu que $\varphi^2 = 1+\varphi$ donc $\varphi$ est une racine strictement positive du trinôme $X^2-X-1.$ Quand un trinôme a une racine connue, l’autre s’obtient rapidement, en utilisant la propriété suivante: le produit des racines d’un polynôme du second degré est égal au quotient du coefficient constant par le coefficient dominant. Comme $\varphi\times \frac{-1}{\varphi} = \frac{-1}{1}$ vous déduisez que l’autre racine est $-\frac{1}{\varphi}.$

Pour s’en convaincre, vous développez:

\begin{align*} (X-\varphi)\left(X+\frac{1}{\varphi}\right) &= X^2+\left(\frac{1}{\varphi}-\varphi\right)X-1\\ &=X^2+\frac{1-\varphi^2}{\varphi}X-1\\ &=X^2+\frac{1-(1+\varphi)}{\varphi}X-1\\ &=X^2+\frac{-\varphi}{\varphi}X-1\\ &=X^2-X-1. \end{align*}

Vous retrouvez les deux racines $\varphi$ et $\frac{-1}{\varphi}.$

En évaluant en $a$, il vient:

\begin{align*} 0 &= a^2-a-1\\ &=(a-\varphi)\left(a+\frac{1}{\varphi}\right). \end{align*}

Comme $a$ et $\varphi$ sont strictement positifs, la somme $a+\frac{1}{\varphi}$ l’est aussi. Donc $a+\frac{1}{\varphi}\neq 0.$

Par suite, il vient $0=a-\varphi$ et donc $a=\varphi$ ce qui établit l’unicité annoncée.

Concluez sur la valeur exacte de la distance $AB$

Il a été vu que $AB$ est solution de l’équation $\frac{1}{x} = \frac{x}{1+x}$ avec $AB >0.$ D’après l’analyse précédente:

\boxed{AB = \varphi = \frac{1+\sqrt{5}}{2}.}

Calculez la valeur exacte de $\cos(72^{\circ})$

Dans le triangle $BCD$, vous appelez $I$ le milieu du segment $[BC].$ Comme $BCD$ est isocèle en $D$, le triangle $CID$ est rectangle en $I.$

Du coup :

\begin{align*} \cos(72^{\circ}) &= \frac{CI}{CD}\\ &=\frac{1/2}{\varphi}\\ &=\frac{1}{2\varphi}\\ &=\frac{1}{2}\times\frac{1}{\varphi}. \end{align*}

Comme $\varphi^2=1+\varphi$, en divisant par $\varphi$, il vient $\varphi = \frac{1}{\varphi}+1$ soit :

\begin{align*} \frac{1}{\varphi} &= \varphi-1\\ &= \frac{1+\sqrt{5}}{2}-\frac{2}{2}\\ &=\frac{-1+\sqrt{5}}{2}. \end{align*}

Par suite :

\boxed{\cos(72^{\circ}) = \frac{-1+\sqrt{5}}{4}.}

Calculez la valeur exacte de $\cos(36^{\circ})$

Dans le triangle $ACB$, vous appelez $J$ le milieu du segment $[AB].$ Comme $ACB$ est isocèle en $C$, le triangle $AJC$ est rectangle en $J.$

Du coup :

\begin{align*} \cos(36^{\circ}) &= \frac{AJ}{AC}\\ &=\frac{\varphi/2}{1}\\ &=\frac{\varphi}{2}. \end{align*}

Compte tenu de la valeur du nombre d’or $\varphi$ vous déduisez :

\boxed{\cos(36^{\circ}) = \frac{1+\sqrt{5}}{4}.}

Prolongement

Vous souhaitez calculer les valeurs des deux cosinus susmentionnés en utilisant des résolutions algébriques ? Allez jeter un coup d’œil dans le contenu rédigé dans l'article 106.

330. Polynômes annulateurs réels d’un nombre complexe

Rédigé par Yannis TRIANTAPHYLIDESon 23/04/202423/04/2024| Niveau Terminale

Soit $z$ un nombre complexe. Vous cherchez à déterminer un polynôme réel non constant $P$ tel que $P(z)=0.$

Le cas où $z$ est un nombre réel

Si $z\in\R$, alors le polynôme $P = X-z$ appartient à $\R[X]\setminus \R$ et $P(z)=0.$

Le cas où $z$ est un nombre complexe non réel

Si $z\notin\R$ vous écrivez $z$ sous forme algébrique. Il existe deux uniques réels $x$ et $y$ tels que :

z=x+iy.

Il est illusoire de chercher un polynôme réel $P$ de degré $1$ tel que $P(z)=0.$

En effet, si un tel polynôme existe, alors il existe un couple $(a,b)\in\R^2$ avec $a\neq 0$ tel que :

\begin{align*} P(X)&=aX+b\\ P(z)&=0. \end{align*}

Il vient $az+b=0$ et comme $a$ est non nul, vous avez $z=\frac{-b}{a}$ et par suite, $z\in\R$, ce qui est exclu.

Vous calculez donc le nombre complexe $z^2$ :

\begin{align*} z^2 &= (x+iy)^2\\ &=x^2-y^2+2ixy. \end{align*}

Soient $a$ et $b$ deux nombres réels.

\begin{align*} z^2+az+b &= x^2-y^2+2ixy+ax+iay+b\\ &=(x^2-y^2+ax+b)+iy(a+2x). \end{align*}

D’après ce calcul, vous posez :

\boxed{a= -2x.}

Puis vous posez $b = y^2-x^2-ax$ ce qui fournit :

\begin{align*} b=y^2-x^2+2x^2. \end{align*}

Ainsi :

\boxed{b=x^2+y^2.}

Pour ces choix de $a$ et de $b$, vous obtenez :

\left\{\begin{align*} &a+2x = 0\\ &x^2-y^2+ax+b=0. \end{align*} \right.

Du coup :

\begin{align*} &z^2+az+b=0\\ &z^2-2xz+x^2+y^2=0. \end{align*}

En posant :

\boxed{P(X) = X^2-2xX+x^2+y^2}

vous avez bien un polynôme réel de degré $2$ tel que $P(z)=0.$

Concluez

Pour tout nombre complexe $z$ s’écrivant sous forme algébrique $z=x+iy$ avec $(x,y)\in\R^2$ :

soit $z\in\R$ et $z$ est annulé par le polynôme $P$ réel de degré $1$ défini par $P(X)=X-z$ ;

soit $z\in\C\setminus\R$ et $z$ est annulé par le polynôme réel $P$ de degré $2$ défini par $P(X)=X^2-2xX+x^2+y^2.$

Retrouvez le dernier résultat à partir de l’inverse d’un nombre complexe

Soit $z$ un nombre complexe non réel. Notez que $z$ est non nul. En écrivant $z = x+iy$ avec $(x,y)\in\R^2$, vous souhaitez retrouver que le polynôme $X^2-2xX+x^2+y^2$ possède $z$ pour racine.

Vous avez :

\begin{align*} \frac{1}{z} &=\frac{\overline{z}}{z \overline{z}}\\ &= \frac{\overline{z}}{\vert z\vert ^2}. \end{align*}

Or, la partie réelle de $z$ est la demi-somme de $z$ avec son conjugué $\overline{z}$ d’où :

2\mathrm{Re}(z) -z = \overline{z}.

Ainsi :

\begin{align*} \frac{1}{z} &=\frac{\overline{z}}{z \overline{z}}\\ &= \frac{2\mathrm{Re}(z) -z}{\vert z\vert ^2}. \end{align*}

Après multiplication de cette égalité par $\vert z \vert^2$, il vient :

\frac{\vert z \vert^2}{z} = 2\mathrm{Re}(z)-z.

Après multiplication par $z$, vous obtenez :

\begin{align*} \vert z \vert^2 &= 2\mathrm{Re}(z)z-z^2\\ z^2-2\mathrm{Re}(z)z+\vert z\vert^2&=0. \end{align*}

Vous avez $\mathrm{Re}(z)=x$ et $\vert z\vert^2=x^2+y^2$ et vous retrouvez le résultat précédemment établi, à savoir :

z^2-2xz+x^2+y^2=0.

Prolongement

Soit $z$ un nombre complexe non réel. Pourriez-vous justifier que le polynôme de degré $2$ défini par :

P(X)=X^2-2\mathrm{Re}(z)X+\vert z\vert^2

est irréductible sur $\R[X]$ ?

329. Décomposition d’un polynôme du quatrième degré en produit de deux polynômes de degré 2 à coefficients dans un corps donné

Rédigé par Yannis TRIANTAPHYLIDESon 16/04/202419/04/2024| Niveau Capes, Niveau Licence, Niveau Prépa

Dans cet article, vous vous focalisez sur le polynôme $P$ à coefficients entiers défini par $X^4+1.$ Vous étudiez sa factorisation éventuelle comme produit de deux polynômes de degré $2$ ayant leurs coefficients dans un sous-corps donné de $\C$.

Ramenez-vous à des polynômes unitaires

Soit $\K$ un sous-corps de $\C.$

Ecrire $X^4+1$ comme produit de deux polynômes de degré $2$ à coefficients dans $\K$ signifie qu’il existe $(u,v,w,r,s,t)\in\K^6$ avec $u\neq 0$ et $v\neq 0$ tels que :

X^4+1 = (uX^2+vX+w)(rX^2+sX+t).

En divisant le premier polynôme du second degré par $u$ et en multipliant celui de droite par $u$, vous obtenez :

X^4+1 = \left(X^2+\frac{v}{u}X+\frac{w}{u}\right)(urX^2+usX+ut).

Après développement et identification du coefficient de $X^4$, il vient $ur = 1$ et par suite :

X^4+1 = \left(X^2+\frac{v}{u}X+\frac{w}{u}\right)(X^2+usX+ut).

Ainsi, vous cherchez à savoir s’il existe des coefficients $a$, $b$, $c$ et $d$ à valeurs dans $\K$ tels que :

X^4+1 = (X^2+aX+b)(X^2+cX+d).

Formez un système d’équations

Supposez qu’il existe quatre coefficients $a$, $b$, $c$ et $d$ à valeurs dans $\K$ tels que :

X^4+1 = (X^2+aX+b)(X^2+cX+d).

Vous développez le produit :

\begin{align*} (X^2+aX+b)(X^2+cX+d) &=X^4+cX^3+dX\\ &\quad +aX^3+acX^2+adX\\ &\quad +bX^2+bcX+bd\\ &=X^4+(a+c)X^3+(d+ac+b)X^2+(ad+bc)X+bd. \end{align*}

Par identification des coefficients il vient :

\left\{\begin{align*} &a+c=0\\ &d+ac+b=0\\ &ad+bc=0\\ &bd=1. \end{align*} \right.

Vous utilisez la relation $c=-a$ pour effectuer des substitutions dans les équations obtenues. Du coup :

\left\{\begin{align*} &c=-a\\ &d-a^2+b=0\\ &ad-ab=0\\ &bd=1. \end{align*} \right.

Terminez l’analyse avec le système précédent

Premier cas : $a=0$

Les coefficients $b$ et $d$ vérifient le système suivant :

\left\{\begin{align*} &d+b=0\\ &bd=1. \end{align*} \right.

Vous multipliez la première équation par $b$ :

bd+b^2=0.

En remplaçant $bd$ par $1$ il vient :

\begin{align*} b^2+1 &= 0\\ (b+i)(b-i)&=0. \end{align*}

Du coup :

b\in\{i, -i\}.

Comme $\K$ est un corps, vous déduisez que :

\boxed{i\in\K.}

Second cas : $a\neq 0$

La troisième équation du système suivant

\left\{\begin{align*} &c=-a\\ &d-a^2+b=0\\ &ad-ab=0\\ &bd=1 \end{align*} \right.

après division par $a$, fournit :

\begin{align*} &d-b=0\\ &d=b. \end{align*}

Du coup, avec la quatrième équation du système :

\begin{align*} b^2&=1\\ b^2-1&=0\\ (b-1)(b+1)&=0. \end{align*}

Ainsi :

b\in\{-1,1\}.

La deuxième équation du système fournit :

\begin{align*} a^2=b+d\\ a^2 =2b. \end{align*}

Si $b=1$, alors $a^2=2$ donc :

\begin{align*} a^2-(\sqrt{2})^2 &= 0\\ (a-\sqrt{2})(a+\sqrt{2})&=0. \end{align*}

Du coup, $a\in\{\sqrt{2}, -\sqrt{2}\}.$ Comme $\K$ est un corps, il en résulte que :

\boxed{\sqrt{2}\in\K.}

Si $b=-1$, alors $a^2=-2$ donc :

\begin{align*} a^2-(i\sqrt{2})^2 &= 0\\ (a-i\sqrt{2})(a+i\sqrt{2})&=0. \end{align*}

Du coup, $a\in\{i\sqrt{2}, -i\sqrt{2}\}.$ Comme $\K$ est un corps, il en résulte que :

\boxed{i\sqrt{2}\in\K.}

Concluez sur l’analyse

S’il existe un sous-corps $\K$ de $\C$ et s’il existe quatre coefficients $a$, $b$, $c$ et $d$ à valeurs dans $\K$ tels que :

X^4+1 = (X^2+aX+b)(X^2+cX+d)

alors au moins un des complexes parmi $i$, $\sqrt{2}$ et $i\sqrt{2}$ appartient à $\K.$

Effectuez la synthèse

Premier cas

Soit $\K$ un sous-corps de $\C$ tel que $i\in\K.$

Alors :

\begin{align*} X^4+1 &= X^4 - i^2\\ &=(X^2+i)(X^2-i). \end{align*}

Le polynôme $X^4+1$ s’écrit comme produit de deux polynômes de degré $2$ à coefficients dans $\K.$

Deuxième cas

Soit $\K$ un sous-corps de $\C$ tel que $\sqrt{2}\in\K.$

Alors :

\begin{align*} X^4+1 &= X^4+2X^2+1-2X^2\\ &= (X^2+1)^2-(\sqrt{2}X)^2\\ &=(X^2+\sqrt{2}X+1)(X^2-\sqrt{2}X+1). \end{align*}

Le polynôme $X^4+1$ s’écrit à nouveau comme produit de deux polynômes de degré $2$ à coefficients dans $\K.$

Troisième cas

Soit $\K$ un sous-corps de $\C$ tel que $i\sqrt{2}\in\K.$

Alors :

\begin{align*} X^4+1 &= X^4-2X^2+1+2X^2\\ &= (X^2-1)^2-(i\sqrt{2}X)^2\\ &=(X^2+i\sqrt{2}X-1)(X^2-i\sqrt{2}X-1). \end{align*}

Le polynôme $X^4+1$ s’écrit encore comme produit de deux polynômes de degré $2$ à coefficients dans $\K.$

Concluez sur le problème initial

Pour tout sous-corps $\K$ de $\C$, le polynôme $X^4+1$ se décompose comme produit de deux polynômes de degré $2$ à coefficients dans $\K$, si et seulement si, au moins un des trois nombres parmi $i$, $\sqrt{2}$, $i\sqrt{2}$ appartient à $\K.$

Prolongement

Utilisez le contenu de cet article pour justifier que la notion de décomposition d’un polynôme en produit de polynômes irréductibles dépend du corps dans lequel les coefficients sont contenus.