Groupe Lineaire
Groupe Lineaire
Groupe Lineaire
Sommaire
1 Sur les générateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Le groupe linéaire GL(E) et le groupe spécial linéaire SL(E) . . . . . . . . . . . . . . . . . . . 1
1.2 La conjugaison des dilatations et des transvections . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Le centre et le sous-groupe dérivé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1 Les centres de GL(E) et de SL(E) et ce que l’on en fait ¹¹ËÉ PGL(E) et PSL(E) . . . . . . . 10
2.2 Les sous-groupes dérivés de GL(E) et de SL(E) . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Etude approfondie du groupe SL(2; F3 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 Simplicité de PSL(E) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Au lieu de parachuter des définitions (qui pourraient nous paraître sortir un peu de l’espace) pour attaquer
directement le problème des générateurs, ma démarche d’escargot consiste à me raccrocher au peu de chose que
je connais pour trouver des points communs avec les nouvelles choses. Si l’on revient au groupe symétrique, les
générateurs qui nous viennent à l’esprit sont bien évidemment les transpositions (i, j) qui échangent deux indices
i et j et qui laissent le reste invariant... ! Les transpositions jouent donc le rôle de briques élémentaires pour le
groupe symétrique. Notons que l’émergence d’une brique élémentaire peut se voir de la manière suivante : Un
sous-ensemble {i, j} à deux éléments est bien le plus petit sous-ensemble possible pour lequel on a une chance de
trouver une permutation dont la restriction n’y soit pas triviale, de manière (équivalente) cela consiste à se donner
un plus grand sous-ensemble d’éléments pour lequel on a une chance de trouver une permutation non-triviale dont
la restriction y soit triviale (notons alors qu’un tel sous-ensemble doit nécessairement comporter n − 2 éléments).
Notons également qu’il est naturel de voir ces derniers comme briques élémentaires car d’après moi c’est tout à
fait normal de considérer de petites transformations avant de considérer de grands bouleversements qui sont en fin
de compte le plus souvent le résultat de l’accumulation, de la conjonction de plusieurs évènements élémentaires
(tout comme le fait qu’il faille savoir marcher avant de pouvoir courir... !).
1
1. – Sur les générateurs – Chapitre 2. – Le groupe linéaire et le groupe spécial linéaire –
Essayons alors de prendre cette même démarche pour essayer de dégager nos briques élémentaire pour le
groupe linéaire ; donc pour faire notre parallèle, on peut se demander ce qui pourrait jouer de plus grand sous-
espace pour lequel on puisse trouver un élément de GL(E) \ {IdE } dont la restriction y soit triviale, la réponse est
bien évidemment un hyperplan.
Poursuivons notre exploration en passant maintenant à l’étape suivante qui consiste à décrire explicitement
les briques élémentaires. Dans le cas du groupe symétrique, une fois qu’on s’est donné n − 2 points, "la" brique
élémetaire est donc a transposition qui échange les deux autres points. Pour le groupe linéaire, si on se donne donc
un hyperplan, qu’est-ce qu’on peut trouver comme briques élémentaires issu de cet hyperplan ? Une représentation
matricielle nous aidera à voir un peu mieux ce que l’on peut éventuellement espérer trouver, en complétant une
base de l’hyperplan, matriciellement on doit trouver ceci : On voit que 1 et a sont valeurs propres de notre
1
0
B
1
a
Figure 2.1 –
transformation. En même temps, on ne souhaite pas avoir l’identité, alors deux cas se présente à nous :
• Si a 6= 1, alors on remarque que notre matrice est diagonalisable (car on a égalité entre les multiplicités
algébriques et géométriques des valeurs propres).
• Si a = 1, comme on ne veut pas de l’identité, alors on doit avoir B 6= {0}.
Comme notre transformation "élémentaire" laisse stable l’hyperplan, elle va induire une transformation inver-
sible sur l’espace quotient (ce dernier étant alors isomorphe à k), on voit très bien que dans le premier cas cela nous
donnera simplement une dilatation, tandis que dans le deuxième cas on obtiendra l’identité, ce qui nous amène à
la définition suivante :
Def. 2.1
Soit H un hyperplan de E et f ∈ GL(E) \ {idE } tel que f|H = idH , notons f ∈ GL(E/H) l’automorphisme
induit par f.
1 On dira que f est une «dilatation» d’hyperplan H si f 6= idE/H .
2 « »
On dira que f est une transvection d’hyperplan H si f = idE/H .
Présentons sans plus attendre, différentes façons de voir nos objets nouvellement définis pour mieux les appré-
hender.
2 f est diagonalisable.
4 det(f) ∈ k∗ \ {1}.
5 Im(f − idE ) * H.
6 Il existe une base de E et un scalaire a ∈ k∗ \ {1} pour lesquels la matrice de f dans cette base soit
égale à diag(1, · · · , 1, a).
Rmq
Ð
Ð Si on dénote par D := Im(f − idE ), alors par le point (5) ci-dessus, on en déduit que E = H ⊕ D.
Ð
Ð Inversement, si on a E = H ⊕ D et si on se donne un sacalaire a 6= 1 alors on trouvera une unique
Ð
Ð
Ð dilatation f vérifiant les données ci-dessus. On obtient donc une bijection entre les dilatations et les triplets
Ð
Ð « »
(H, D, a) décrits ci-dessus. Le scalaire a est appelé le rapport de la dilatation.
Passons enfin à l’objet suivant, mais avant cela nous allons avoir besoin d’introduire une notation. Pour i 6= j,
Í
soit Ei,j la matrice élémentaire dont je n’ai plus besoin de rappeler, on va dénoter par U i,j (λ) : = idE + λ.Ei,j
avec λ ∈ k, et par Ui,j la réunion de toutes ces expressions lorsque λ parcourt k. Alors on sait fort bien que Ui,j
est un sous-groupe à un paramètre et l’inverse de Ui,j (λ) n’est rien d’autre que Ui,j (−λ). Ceci étant fait nous
pouvons maintenant énoncer le résultat suivant :
5 Im(f − idE ) ⊆ H.
6 Il existe une base de E pour laquelle la matrice de f dans cette base soit égale à U n−1,n (1).
(J’ai effectivement mis en bleu le (7) pour le distinguer des autres qui ont chacun leur pendant dans la proposition
2.1 p.3).
Preuve. Compte tenu des caractérisations faites pour des dilatations (voir Prop.2.1 p.3), il est clair que les points
(1) à (5) sont bien équivalents.
Rappelons que l’aspect de la matrice que l’on trouve dans Figure 2.1 p.2 (pour le cadre d’une transvection, i.e.
« »
a = 1 et B 6= {0}) est obtenue en considérant n’importe quelle base de H complétée d’un certain vecteur v. La
remarque importante que nous pouvons faire est la suivante : Si on considère n’importe quelle autre base de H tout
en gardant le vecteur v, on obtient encore une base de E et la représentation matricielle de f dans cette nouvelle
base aura exactement la même configuration que la Figure 2.1 (on remplacera seulement B par une autre colonne
B 0 qui demeure non triviale). Si on revient sur cet aspect matriciel, on comprend que l’image du vecteur v est de
la forme v + b où b est un vecteur non-trivial de H, par la remarque que nous venons de faire, on va compléter
le vecteur b pour avoir une base de H et ensuite on adjoint à cette base notre vecteur v et il est facile de voir que
la matrice de f dans cette base sera comme celle décrite dans la figure 2.1 où dans B on aura un seul coefficient
non nul, qui vaut 1 et qui occupera la position que b occupe dans cette base de H. Il suffit alors de décider que b
occupe la dernière place dans cette base de H et on aura bien la matrice de f égale à U n−1,n (1).
(6)⇒(7) En dénotant par {e1 , · · · , en } la base précédente donnant l’aspect de la matrice de f égale à U n−1,n (1).
Si x est un vecteur quelconque, que l’on écrit dans cette base x = α 1 .e1 + · · · +αn .en , alors on voit parfaitement
que
Dans cette dernière écriture, on remarque que le coefficient αn n’est rien d’autre que l’expression obtenue en ap-
pliquant la forme linéaire e∗n à x et cette forme linéaire a pour noyau H si bien qu’elle est proportionnelle à L, on
a alors L = β.e∗n , avec β 6= 0. On peut poser vf : =
Í 1e et on obtient effectivement f(x) = x + L(x).vf et le
β n−1
tour est joué.
(7)⇒(1) Il est clair qu’une telle donnée de f nous permet de voir f = id E/H , c’est à dire qu’on a affaire à une
transvection.
h
Rmq
Ð
Ð On obtient facilement une expression plus générale que celle qu’on a obtenue au (6) : Pour i 6= j, il existe
Ð
Ð une base dans laquelle a matrice de f est égale à Ui,j (1). En particulier, de ceci on en déduit que toutes les
Ð
Ð matrices Ui,j (1) n’étant en fin de compte que l’expression matricielle de f dans des bases différentes, sont
Ð alors conjuguées entre elles.
En effet, en reprenant la dernière partie de la démonstration concernée, avec exactement la même base on va
juste changer l’ordre de ces vecteurs bases, on veut un 1 à l’intersection de la i ème ligne et de la jème colonne ; mais
en regardant d’un peu plus près les lignes de Un−1,n (1), on constate que la seule ligne présentant deux coefficients
non triviaux est la (n − 1)ème , nous on veut cette fois que cela soit à la ième ligne, donc je suggère de placer le
vecteur en−1 en ième position, le même raisonnement me dit de placer en en jème position, et le tour sera joué.
En reprenant cette même preuve, on constate que D := Im(f − id E ) = vect(vf ) ⊆ H est de dimension 1 et
contrairement à la situation d’une dilatation, la donnée de H et de D ne suffit pas à déterminer notre transvection,
en effet si on considère le résultat (7) de la proposition précédente on voit bien que x 7→ x + L(x).λ.v f avec λ 6= 0
est aussi une transvection car cela garde parfaitement l’allure de l’expression dans (7), et c’est donc une transvec-
tion d’hyperplan H est de même droite D. De cette dernière observation on en déduit que tout U i,j (λ), avec λ 6= 0
est une matrice représentative d’une certaine transvection.
D’autre part, l’expression explicite de ce résultat (7) nous dit clairement que la partie L(x).v f de l’expression
de f(x), i.e. la donnée d’une forme linéaire définissant l’hyperplan H ainsi que la donnée d’un vecteur v f ∈ H nous
permet de retrouver parfaitement notre transvection f. Si bien que l’on va noter τ(L, v f ) pour représenter notre
transvection dont l’expression explicite est contenue dans la partie (7) de la proposition 2.2 précédente.
Donnons quelques propriétés relatives aux transvections :
Cor. 2.1
En conservant les hypothèses et les notations de la proposition précédente, on a :
1 1
On a τ(L, vf ) = τ(α.L, α .vf ).
Preuve. (1) C’est trivial, d’ailleurs on a vu ça à la fin de la preuve (6)⇒(7) ci dessus, c’est juste une question de
normalisation.
(2) Rappelons la propriété déjà signalée lorsqu’on a défini les matrices U i,j (λ) : on a Ui,j (1)−1 = Ui,j (−1).
On a vu ci-dessus que Un−1,n (1) est la matrice représentative de f dans une certaine base {e1 , · · · , en } ; dans
cette même base, d’après notre rappel la matrice représentative de f −1 étant Un−1,n (−1), on en déduit que
−1
f|H = idH et f−1 (en ) = −en−1 + en . En reprenant exactement la preuve de la démonstration de la pro-
position 2.2 précédente, on verra très bien que relativement à la base {e1 , · · · , en−2 , −en−1 , en }, la matrice
de f−1 sera égale à Un−1,n (1) ; de plus en reprenant la partie de la démonstration (6)⇒(7), si on écrit x =
α1 .e1 + · · · αn−2 .en−2 + αn−1 .en−1 + αn .en = α1 .e1 + · · · αn−2 .en−2 + (−αn−1 ).(−en−1 ) + αn .en dans les
deux bases concernées, la même preuve nous donne f(x) = x + α n .en−1 et en utilisant la deuxième expression en
x (en tenant compte de sa matrice représentative de f−1 ) on trouve que f−1 (x) = x+αn .(−en−1 ). La suite de cette
même preuve nous donne L = β.e∗n et vf = β1 en−1 , alors il est facile de voir que l’on trouve vf−1 = −1 e
β n−1
ainsi que f−1 (x) = x + L(x).vf−1 est le résultat est démontré.
En fait on aurait pu donner une preuve bien plus simple, mais je voulais au dessus lier avec l’expression ma-
tricielle : f(x) = x + L(x).vf , donc f−1 (f(x)) = x = f−1 (x + L(x).vf ) = f−1 (x) + L(x).f−1 (vf ), si bien
qu’on en déduit que f−1 (x) = x − L(x).f−1 (vf ), or vf ∈ H donc f(vf ) = f−1 (vf ) = vf et on trouve que
(3)
τ(L, vf ) ◦ τ(L, vg )(x) = τ(L, vf )(x + L(x).vg ) = x 0 + L(x 0 ).vf = (x + L(x).vg ) + L(x + L(x).vg ).vf
| {z }
x0
= x + L(x).vg + L(x).vf + L(x). L(vg ) .vf
| {z }
=0
= x + L(x).(vg + vf ).
h
De l’analyse précédant le corollaire ci-dessus sur l’expression f(x) = x + L(x).v f , nous voyons les rôles non
négligeables joués à la fois par la forme linéaire L donc de l’hyperplan H, ainsi que du vecteur v f , mais si on se
réfère au résultat (1) de Cor.2.1 il s’agit plus précisément de la droite D := vect(vf ) = Im(f − idE ). C’est la raison
pour laquelle nous appellerons parfois f la transvection d’hyperplan H et de droite D. Si on pousse un peu plus
le vice, en regardant à nouveau le terme L(x).vf qui représente en quelque sorte la "partie principale" de la trans-
vection (i.e. celle qui la caractérise complètement), on peut bien spéculer sur les rôles symétriques que peuvent
jouer l’hyperplan H et la droite D : Dans la définition
de départ d’une transvection, nous sommes partis avec une
hypothèse sur la restriction de f à l’hyperplan H et avec une hypothèse sur l’automorphisme quotient f sur E/H,
alors il est légitime de se demander si on ne pourrait pas inverser les rôles entre H et D et fort heureusement la
réponse est positive :
Cor. 2.2
Soit f ∈ GL(E) \ {idE }, alors on a les (équivalences) suivantes :
Preuve. (1) ⇒ (2) : La deuxième partie n’étant rien d’autre qu’une conséquence de la définition même d’une
transvection, tandis que la première partie résulte de la description explicite de f(x) = x + L(x).v f .
(2) ⇒ (1) : l’hypothèse f̃ = idE/D nous dit que pour tout x ∈ E, on a f(x) − x ∈ D, par conséquent
on a Im(f − idE ) ⊆ D, et puisque f 6= idE on a Im(f − idE ) = D.Par le théorème du rang on en déduit que
Ker(f − idE ) := H est bien un hyperplan qui de plus contient D car fD = idD ; on utilise alors le critère (5) de
Prop.2.2 p.4 pour pouvoir affirmer que f est bien une transvection qui de plus est bien une transvection d’hyperplan
H et de droite D.
h
Enfin passons maintenant aux principaux résultats de ce §, pour cela nous allons avoir besoin d’un résultat
préliminaire qui va nous permettre de démarrer la preuve qui se fera par induction :
Lem. 2.1
Soient x, y ∈ E \ {0}. Alors il existe une transvection (ou) un produit de deux transvections qui envoie x sur
y.
• Si x et y sont colinéaires : On prend z non colinéaire et d’après le cas précédent on trouve deux transvections
g et h pour lesqulles g(x) = z et h(z) = y et leur composition fait bien l’affaire.
h
Rmq
Ð
Ð 1 De ce lemme, on en déduit que l’action du sous-groupe engendré par les transvections (i.e. SL(E) voir
Ð
Ð
Ð le théorème suivant) possède seulement deux orbites dans E : l’orbite triviale {0} et E \ {0}.
Ð
Ð
Ð 2 On aurait pu analyser l’énoncé d’une autre manière : x et y étant fixés, on recherche une inconnue ∗
Ð
Ð qui doit vérifier l’équation x + ∗ = y et où ∗ doit obligatoirement se balader dans un hyperplan (en
Ð
Ð effet l’expression d’une transvection est de la forme f(x) = x + L(x).v f , où vf est un certain vecteur
Ð
Ð de H = Ker(L)) ; une autre façon de décripter cela est de voir x totalement figé, y balayant E, et ∗
Ð
Ð venant à compléter le podium. C’est en quelque sorte voir x comme la première coordonnée de y et
Ð
Ð on chercherait alors à trouver un supplémentaire adapté à cette situation :
Ð
Ð
Ð
Ð
Ð
Ð
Ð y
Ð
Ð
Ð
Ð x
Ð
Ð y−x
Ð
Ð
Ð Sur la figure on voit très bien qu’il faudrait prendre ∗ = y−x. Par conséquent, notre analyse a toutes les
Ð
Ð chances d’aboutir, i.e. tout vecteur y a pour première coordonnée le vecteur fixé x initialement pouvu
Ð
que la deuxième coordonnée ∗ = y − x puisse être dessinée, i.e. si x et y ne sont pas colinéaires.... !
Preuve. (1)- • Soit g ∈ SL(E), et Soit x 6= 0. D’après le lemme 2.1 ci-dessus, quitte à remplacer g par fg où f
serait un produit de transvections, on peut supposer que g(x) = x. Dénotons D := vect(x) la droite engendrée
par x, alors D est stable par g qui induit alors un automorphisme sur l’espace quotient g̃ : E/D → E/D. On peut
considérer la base suivante de E : e1 = x complété des vecteurs e2 , · · · , en pour lesquels {e2 , · · · , en } soit une base
de E/D. Il est alors
facile de
voir que l’on obtient l’aspect de la matrice M de g et celui M̃ de g̃ dans ces bases sont
1 ∗
reliés par : M = . Le développement du déterminant suivant la première colonne de M nous donne
0 M̃
exactement det(g) = det(g̃). Si bien que l’on a g̃ ∈ SL(E/D). La récurrence nous permet d’avoir g̃ comme produit
de transvections sur E/D, g̃ = τ̃1 · · · τ̃r avec τ̃i = τ(L̃i , ãi ). Considérons ai un relevé de ãi dans E, et Li ∈ E∗ tel
que Li = L̃i ◦ π où π : E → E/D est la projection canonique.
Í
• Posons alors τi : = τ(Li , ai ) . Il faut remarquer que par construction, on a Li (x) = L̃i ◦ π(x) = 0, si bien
|{z}
=0
que τi (x) = x et les τi stabilisent D et induisent des automorphimes sur E/D qui se confondent avec les τ̃i .
Í
• Posons le produit de transvections suivant f : = τ1 · · · τr , alors f(x) = x = g(x) et par l’observation
å
précédente on a f̃ = τ̃1 · · · τ̃r = g̃, si bien que (f−1 ◦ g)|D = idD et (f E/D , alors par le
−1 ◦ g) = f̃−1 ◦ g̃ = id
Cor.2.2 p.6, on peut affirmer que f−1 ◦ g est une transvection v et on a g = fv est bien un produit de transvections,
(2)- Soit g ∈ GL(E), considérons f la dilatation de rapport det(g)−1 , alors fg ∈ SL(E) et on peut appliquer
(1) pour conclure.
h
Rmq
Ð
Ð Dans la démonstation, on aurait pu facilement inclure le fait que nombre de transpositions qui rentrent
Ð
Ð dans la décomposition d’un élément de SL(E) est majoré par la dimension de E. Néanmoins on pourra
Ð
Ð voir les exercices 7. (resp. 8.) dans [Per] p.110-111 pour avoir exactement le nombre minimun nécessaire
Ð de transvections (resp. de transvections et de dilatations) pour représenter un élément de SL(E) (resp. de
Ð
Ð GL(E)) ; ce nombre est "forcément" lié à la dimension de l’espace des vecteurs fixes par notre transformation.
Ð
Ð Il était important pour moi de faire l’observation suivante concernant la conjugaison,
Ð
Ð "Pourquoi a-t-on privilégié l’action de conjugaison pour un groupe donné ?". La raison selon moi est
Ð la suivante : Nous avons axé notre étude sur la notion de produit semi-direct (cf. l’idée déjà évoquée dans le
Ð
Ð chapitre sur le groupe symétrique) qui finalement nous a conduit à comprendre les sous-groupes distingués
Ð
Ð d’un groupe donné. Mais voilà, nous avons (ou ne devrions avoir) de manière canonique à l’esprit que pour
Ð
Ð un groupe donné, il lui est rattaché certains sous-groupes bien particuliers qui lui sont intrinsèquement
Ð
Ð associés qui sont le "centre", le "sous-groupe dérivé", les séries de sous-groupes "centraux".... Et les
Ð
Ð premiers qui se présentent spontanément dans cette petite liste sont bien évidemment le "centre" ainsi
Ð
Ð que le sous-groupe dérivé, et vouloir en fin de compte comprendre si un groupe est distingué ou non
Ð
Ð nous amène naturellement à comprendre en premier lieu comment sont ces deux lascars, nous sommes
Ð
Ð donc ammenés à comprendre ces derniers qui requièrent naturellement à comprendre les commutateurs
Ð
Ð ou encore à comprendre l’action de conjugaison... ! Et comme on est dans l’étude des générateurs, on va
Ð
Ð chercher à comprendre l’effet que produit l’action de conjugaison sur ces derniers, avant d’étudier nos deux
Ð
sous-groupes.
Rappel
Ð
Ð Dans le chapitre du groupe symétrique, nous avons vu combien il était important de connaître le compor-
Ð
Ð tement par conjugaison des cycles, et notamment la conjugaison des 3-cycles qui sont des générateurs du
Ð groupe alterné An . On a même pu voir que les 3-cycles étaient conjugués à l’intérieur même de A n , lorsque
Ð
Ð
Ð n ¾ 5, mais que cela était faux pour n = 3, 4.
Nous pouvons donc essayer de voir ce qu’il en est de nos générateurs :
Preuve. C’est une conséquence même de la caractérisation (6) de Prop.2.1 p.3, car nos dilatations présentent la
même matrice dans des bases convenables.
h
Pour ce qu’il en est des transvections :
1 Soit f une transvection d’hyperplan H et de droite D, et soit g ∈ GL(E). Alors gfg−1 est une trans-
vection d’hyperplan g(H) et de droite g(D).
Plus précisément, si f = τ(L, vf ), alors gfg−1 = τ(L ◦ g−1 , g(vf )).
Preuve. (1)- Soit x ∈ E, alors f(g−1 (x)) = g−1 (x) + L(g−1 (x)).vf , donc gfg−1 (x) = x + L(g−1 (x)).g(vf ) et si
H = Ker(L) alors g(H) = Ker(f ◦ g−1 ).
(2)- Cela provient du résulat (6) de Prop.2.2 p.4 donnant une représentation ("canonique") matricielle de toute
transvection qui n’est rien d’autre que la forme réduite de Jordan.
Supposons n ¾ 3. Si f et g sont deux tranvections, d’après ce qui précède on peut déjà affirmer qu’elles sont
conjuguées par un certain
élément u ∈ GL(E), g = ufu−1 . Si λ = det(u), il suffit alors de trouver un élément
de déterminant λ et qui fixe g (i.e. qui va commuter avec g). Pour cela, on se facilite la vie en se plaçant
−1
dans une base où l’aspect de g est donné sous forme de Jordan (voir (6) de Prop.2.2 p.4), alors on construit un
commutateur de g sous la forme de blocs à l’identique de ceux isssus de g, c’est à dire une somme de (n−2) blocs
de longueur 1 et un bloc de longueur 2 : Il est facile de voir que quelles que soient les valeurs des blocs de longueur
1, ces valeurs n’affectent pas l’aspect (dans la conjugaison) de g (c’est aussi à cause de l’aspect du vecteur colonne
B où il n’y a qu’un coefficient non nul en dernière position), donc tout se passe dans le bloc de longueur 2, mais on
sait aussi que les homothéties commutent avec tout, on va donc prendre ce bloc de longueur 2 sous la forme d’une
homothétie :
Pour avoir des chances d’avoir un tel élément de déterminant λ−1 , au niveau des coefficients : La chose la plus
facile qui nous apparaît de faire est de considérer le bloc de longueur 2 égal à une homothétie et ensuite de rectifier
avec les autres coefficients pour qu’on ait un élément de déterminant
λ , mais pour que cette restification puisse
−1
avoir lieu il faut effectivement que l’on soit dans la situation où n ¾ 3 . On va alors prendre la matrice suivante
qui est (d’aspect) la plus triviale possible.
1 0 ··· ··· ··· 0
.. .. .. .. ..
0 . . . . .
.. .. .. .. ..
. . 1 . . .
,
.. .. .. .. ..
. . . λ . .
.. .. .. ..
. . . . λ−1 0
0 ··· ··· ··· 0 λ−1
Rmq
Ð
Ð On ne se pose pas la question de la conjugaison des dilatations dans SL(E), car aucun d’entre eux n’appartient
Ð
à SL(E).
Preuve. (1)- Fixons une base B := {e1 , e2 } de E et soit f une transvection sur E. Considérons k.ε1 l’hyperplan
1 ∗
fixe de f et soit ε2 ∈
/ k.ε1 . Dans la base B 0 := {ε1 , ε2 } de E la matrice de f est de la forme tant voulue ,
0 1
mais pour aller dans une telle configuration on conjugue en fait la matrice de f dans B par P la matrice de passage
de B vers B 0 qui est un élément de GL(E).
:::::::
Remarquons alors que dans la base B" := {α.ε1 , ε2 } la matrice de f a aussi l’aspect bien joli qu’on souhaite, si
bien que pour obtenir cette nouvelle matrice dans la base B" on va reconjuguer le tout par P 0 (la matrice de passage
de B 0 vers B"). Ces deux conjugaisons se résument en fin de compte par une seule qui est la conjuguaison par
PP 0 ; mais on remarque que det(PP 0 ) = det(P) × α, si bien qu’en considérant α = det(P)−1 , la conjugaison finale
se fait au moyen d’un élément de SL(E).
a b
(2)- (⇒) Si on a un élément g = ∈ SL(E) (i.e. det(g) = ad − bc = 1) qui vérifie gλg−1 = µ, avec
c d
1 λ 1 µ
λ= = id + λ.E1,2 et µ = = id + µ.E1,2 , cette relation se traduit encore par gλ = µg, i.e.
0 1 0 1
a b + aλ a + µc b + µd
gλ = = µg = .
c d + cλ c d
2 Le centre de SL(E) est égal à Z ∩ SL(E). Il est isomorphe au sous-groupe des racines n ème de l’unité
dans k.
« »
Rappelons qu’une homothétie est une application linéaire de la forme x 7→ λx, où λ ∈ k∗ .
Lem. 2.2
Soit f ∈ GL(E) une application linéaire inversible de E laissant stable toute droite vectorielle, alors f est
une homothétie.
Preuve. L’hypothèse nous permet de dire que pour tout x ∈ E, il existe un scalaire λ x ∈ k∗ tel que f(x) = λx x.
• Soient x, y ∈ E deux vecteurs non-colinéaires, il nous suffit de montrer que l’on a λ x = λy : Nous avons
Preuve du théorème 2.2. Si on se rappelle comment on a montré que le centre du groupe symétrique est trivial
lorsque n ¾ 3, on a bien évidemment travaillé avec des générateurs du groupe symétrique, on l’avait fait en parti-
culier avec les transpositions. Ici on va également adopter la même stratégie.
Soit g ∈ GL(E) un élément de son centre ; cet élément va en particulier commuter avec n’importe quel élé-
ment de SL(E) ( Attention ! Cela n’implique nullement que g soit dans le centre de SL(E)). Soit τ ∈ SL(E) un
transvection de droite D, on aura en particulier gτg−1 = τ ; or d’après Prop.2.4 p.9 notre élément gτg−1 est une
transvection de droite g(D), de sorte que l’on a g(D) = D, alors cette observation nous permet d’utiliser le
lemme 2.2 ci-dessus pour affirmer que g est une homothétie.
Si maintenant g est dans le centre de SL(E), alors le raisonnement ci-dessus continue à fonctionner on a alors
g = λ.idE , l’information supplémentaire que l’on a est que det(g) = λn = 1, ce qui signifie bien que λ doit être
une racine nème de l’unité dans k.
h
Pendant que c’est encore chaud, puisque nous venons de parler du centre du groupe linéaire et celui du groupe
spécial linéaire, nous avons donc constaté qu’ils n’étaient pas triviaux, on peut donc déjà affirmer que le groupe
linéaire et le groupe spécial linéaire ne sont bien évidemment pas simples. On a appris par expérience à quotienter
un groupe par un sous-groupe distingué afin de tuer les relations occasionnées par ce dernier, dans le groupe quo-
tient que l’on obtient on ne retrouvera plus un tel sous-groupe. Si on le fait avec le centre, on aura en quelque sorte
éliminé un candidat qui nuit au caractère simple de notre groupe de départ, on pourra alors à nouveau se demander
Def. 2.2
« »
Le quotient de GL(E) par son centre Z est appelé le groupe projectif linéaire , on le notre PGL(E) . De
même, le quotient de SL(E) par son centre Z ∩ SL(E) sera noté PSL(E) .
Je ne l’ai pas encore fait, parce que je compte faire un chapitre spécial sur les suites exactes courtes (car il y
a selon moi quelques unes de ces suites exactes courtes qu’il est bon de connaître lorsqu’on évolue dans tout ça,
cela permettrait d’avoir en tête quelques unes des structures fondamentales liant nos sujets d’études), rappelons au
passage que dans une suite exacte courte on fait toujours appel à trois groupes entre les extrêmités de la chaîne, ces
derniers étant 0 ou 1 (0 pour le cadre commutatif et 1 sinon). Néanmoins, le contexte actuel se présente pour que
deux d’entre elles soient présentées. Mais avant cela rappelons celle qui lie les groupes SL(E) et GL(E).
det
1 ,→ SL(E) → GL(E) → k∗ 1
Des définitions ci-dessus des groupes projectifs, on obtient immédiatement les suites exactes courtes suivantes :
1 ,→ Z → GL(E) → PGL(E) 1
det
1 ,→ PSL(E) → PGL(E) → k∗ /k∗n 1
PGL(E) et PSL(E) sont en général bien distincts (on le reverra explicitement un peu plus loin lorsqu’on
traitera le cas des corps finis, tout comme le groupe symétrique est bien distinct du groupe alterné), on aurait
pu croire le contraire à cause du 2-ième Thm. d’isomorphisme "Soit H un sous-groupe d’un groupe G, et
soit K G un sous-groupe distingué de G, alors on a l’isomorphisme suivant H/(H ∩ K) ' HK/K".
On a bien le centre Z GL(E) qui est distingué, alors on va pouvoir appliquer ce Thm. d’isomorphisme
SL(E)/(Z ∩ SL(E)) ' Z.SL(E)/Z, en particulier on obtient PSL(E) ' Z.SL(E)/Z, mais on a Z.SL(E) 6=
GL(E) car Z n’est hélas constitué que d’homothéties et non pas de dilatations (cf. Théorème à la page 7)
sinon on aurait effectivement une identification possible entre PGL(E) et PSL(E).
• D’autre part, nous avons trivialement det(xyx−1 y−1 ) = 1 et cela quelque soit x, y ∈ GL(E), si bien que le
groupe dérivé D(GL(E)) est déjà contenu dans SL(E).
• Enfin, une dernière remarque, ici nous sommes ammenés à étudier les commutateurs pour comprendre le
groupe dérivé, alors que dans le chapitre sur le groupe symétrique, lorsque nous cherchions directement à com-
prendre les sous-groupes distingués de Sn , il nous était apparu de manière naturelle l’analyse des commutateurs
(cf. Thm.1.2 à la page 11) car nous savions que pour n ¾ 3 le centre de S n était trivial, donc si s est un élément
non-nul appartenant à un sous-groupe distingué, alors il va exister une transposition t (i.e. un élément d’un sys-
tème générateur particulier) pour lequel on ait sts−1 t−1 6= 1. Nous étions donc naturellement amenés à étudier les
commutateurs. L’élément sts−1 t−1 était certe le produit de deux transpositions sts−1 et t−1 , mais deux situations
se présentaient alors à nous, soit que c’est un 3-cycle, soit que c’est tout simplement le produit de 2 transpositions
à support disjoint.
Nous allons suivre cette dernière démarche, qui va nous ammener à faire des discussions pour obtenir les ré-
sultats suivants :
D(GL(2; F2 )) ' A3 .
Preuve. Puisque qu’il s’agit ici de traiter le sous-groupe dérivé, nous allons nous intéresser en particulier aux
commutateurs !
Nous avons vu que xyx−1 y−1 est un élément de SL(E). Si xyx−1 y−1 est une transvection, or nous
savons d’après Prop.2.4 (2) que deux transvections sont toujours conjuguées par GL(E) ( et on peut même
dire par SL(E) lorsque n ¾ 3). Alors si cela s’avère vrai, on peut affirmer que toute transvection sera un
commutateur et par conséquent on pourra affirmer que D(GL(E)) = SL(E). Il nous suffirait donc de trouver
une transvection qui soit un commutateur.
• Soit f une transvection, alors d’après Prop.2.2 (6), nous pouvons trouver une base dans laquelle on aura
l’aspect ("normalisé") suivant f = Un−1,n (1) = idE + 1En−1,n , alors on a
f2 = idE + 2En−1,n + En−1,n × En−1,n
| {z }
0
2
f = idE + 2En−1,n .
On a f2 6= idE lorsque car(k) 6= 2 et cette écriture nous permet alors d’affirmer que f2 est bien une transvection
("non normalisée"), alors d’après notre rappel on va trouver un élément g ∈ GL(E) tel que f2 = gfg−1 et donc
en multipliant à droite de part et d’autre de cette égalité par f−1 on va trouver u = gfg−1 f−1 et notre résultat sera
établi.
Pour réduire au maximun l’utilisation de variables et avoir ainsi une borne inférieure de la cardinalité du
corps k, on va bien évidemment prendre µ = λ−1 , et alors Si card(k) > 3, alors on va bien pouvoir
trouver λ déjà différent de 0 d’être également différent de ±1, pour voir que ce commutateur reste bien une
transvection. Signalons au passage que ce raisonnement fonctionne parfaitement pour SL(E) car les éléments
f et g ci-dessus sont dans SL(E).
Rmq
Ð
Ð Il serait légitime de se demander pour quelle raison on a fabriqué un commutateur en choisissant f et
Ð
Ð g bien particuliers, cela s’explique par un résultat qui sera dévoilé un peu plus tard dans le Lemme 2.5
Ð
Ð p.19 ; la même observation pourra être faite dans la conjugaison qui sera faite dans 3 p.32
La démonstration au point • • est plus efficace dans le sens où l’on a établi D(GL(E)) = SL(E) lorsque
card(k) ¾ 3 et cela même losque n = 2 ; mais le point • nous as permis en contre-partie d’établir D(GL(E)) =
SL(E) et cela pour pour card(k) = 3.
• • • Enfin, si card(k) = 2, on a k = F2 , il nous faut nous passer des raisonnements précédents qui ne
conviennent plus. Pour cela remarquons que si E est de dimension n, alors E ' (F2 )n et ce dernier espace est
de cardinal fini, il en va de même des groupes GL(E), SL(E), PGL(E) et PSL(E), qui sont GL(2; F 2 ), SL(2; F2 ),
PGL(2; F2 ) et PSL(2; F2 ). Ce sont en particulier, des sous-groupes du groupe symétique, il serait donc intéresant
de pouvoir les analyser :
Lem. 2.3
Fixons des entiers n et q. Alors on a :
card(SL(n; Fq ))
iii card(PSL(n; Fq )) = .
PGCD(n, q − 1)
l’information
intéressante lorsqu’on a un élément de GL(n, Fq ), c’est que l’image de la base canonique redevient
une base et réciproquement, on a donc une bijection entre les éléments de GL(n, F q ) et les bases de Fn q.
Essayons de voir comment on arrive à se procurer une base de F n q :
Donnons nous pour commencer un vecteur v1 non-nul de Fn q , ce dernier est un ensemble fini qui comporte q
n
Pour le deuxième vecteur, il ne faut pas qu’il soit colinéaire au premier, il nous faut donc le prendre en dehors de
la droite vect(v1 ), or cette droite est isomorphe au corps de base Fq qui comporte q éléments qu’il faut exclure
dans notre choix de v2 , on a donc qn − q choix possibles pour v2 .
Le même raisonnement se poursuit, lorsqu’on doit choisir vi+1 , on doit considérer un élément en dehors de
vect(v1 , · · · , vi ) ' Fiq qui comporte exactement qi éléments, on a donc qn − qi choix possibles.
(ii) Pour le calcul de SL(n; Fq ) et de PGL(n; Fq ), on va s servir des suites exactes courtes
det
1 ,→ SL(E) → GL(E) → k∗ 1
et
1 ,→ Z → GL(E) → PGL(E) 1.
qui nous donnent les relations triviales card(GL(n; Fq )) = card(SL(n; Fq )) × card(F∗q ) et card(GL(n; Fq )) =
card(PGL(n; Fq )) × card(Z), où Z = ∼ F∗ est le centre et on a card(F∗ ) = q − 1 ; or qn − qn−1 = qn−1 (q − 1), si
q q
bien qu’en divisant le dernier terme dans le produit précédent donnant le cardinal de GL(n; F q ), on obtient bien (ii).
(iii) Pour le dernier résultat, nous savons que PSL(n; Fq ) est obtenu comme le quotient de SL(n; Fq ) par le
sous-groupe des racines nème de l’unité dans Fq que l’on note par µn (Fq ) (cf. Thm.2.2 à la page 11), il nous est
donc indispensable de connaître ce dernier : On a la relation card(PSL(n; F q )) = card(SL(n; Fq ))/card(µn (Fq )),
la conclusion s’obtient alors à partir du lemme précédent.
h
Lem. 2.4
card(µn (Fq ) = PGCD(n, q − 1).
Preuve. Tout d’abord, nous savons qu’il existe deux entiers (r, s) tels que
Nous savons que le groupe multiplicatif F∗q est d’ordre q − 1, si bien que pour tout x ∈ F∗q on a xq−1 = 1 ; si
x ∈ µn (Fq ) on a en plus xn = 1, si bien que la relation (2.1) nous permet d’avoir xPGCD(n,q−1) = xrn+s(q−1) =
xrn xs(q−1) = 1.
Inversement, si xPGCD(n,q−1) = 1, alors à fortiori xn = 1, car n est un multiple de PGCD(n, q − 1), si bien que
l’on a
D’autre part, nous savons que le polynôme Xq −X admet Fq comme corps de décomposition : Ceci nous renvoie
à la théorie des corps finis (qui, signalons le au passage, sont commutatifs par Wedderburn), et le groupe multi-
plicatif F∗q est cyclique, isomorphe à Z/(q−1)Z (cf. [Per]. Thm.2.7 p.74) ; de plus, nous avons une correspondance
entre les sous-groupes de Z/mZ et les entiers divisant m (de plus ces sous-groupes sont cycliques), c’est ce qui
P
nous permet entre autre d’établir la relation m = ϕ(m) où ϕ est la fonction d’Euler (cf. [Per] p.74). De la
d|m
même façon, si d est un diviseur de q − 1, alors Xd − 1 est diviseur de Xq−1 − 1 (cf. formule classique dans l’étude
Sachant que Xq−1 − 1 a exactement q − 1 racines dans F∗q (il est bien scindé), d’après notre observation on
en déduit que le polynôme Xd − 1 aura lui aussi exactement d racines dans F∗q , cela signifie en particulier que le
sous-groupe des racines dème de l’unité dans F∗q contient d éléments ; puisque ceci s’applique pour tout diviseur
de q − 1, cela s’applique donc en particulier pour le diviseur PGCD(n, q − 1) et on obtient alors
h
Revenons à notre petit problème à évaluer le sous-groupe dérivé D(GL(2; F 2 )) : Le groupe GL(n; Fq ) pré-
sente une action sur l’espace vectoriel E = Fn q , qui descent en une action sur P(E). Le noyau de cette action est
constituée des applications linéaires qui laissent invariants toute droite, alors d’après le Lemme 2.2 on en dé-
duit que ce noyau n’est rien d’autre que l’ensemble des homothéties, si bien que l’on obtient une action fidèle de
GL(n; Fq )/Z = PGL(n; Fq ) sur l’espace P(E).
L’espace P(E) n’est rien d’autre que l’ensemble des classes pour la relation d’équivalence :
x ∼ y ∈ Fn
q \ {0} ⇔ ∃λ ∈ F∗q t.q y = λ.x
card(Fn
q \ {0})
card(P(E)) =
card(F∗q )
(qn − 1)
=
(q − 1)
= 1 + q + · · · + qn−1 .
En particulier, puisque notre action est fidèle, on en déduit que l’action de PGL(n; F q ) n’est rien d’autre qu’un
ensemble de permutations, cela signifie en particulier que PGL(n; F q ) est un sous-groupe de S1+q+···+qn−1 .
• Pour q = 2, on en déduit que F2 se réduit à deux éléments {0, 1}, si bien que l’on a Z = k∗ = {1} : Des deux
suites exactes courtes déjà évoquées au dessus,
det
1 ,→ SL(E) → GL(E) → k∗ 1
et
1 ,→ Z → GL(E) → PGL(E) 1
on en éduit que SL(E) = GL(E) = PGL(E) = PSL(E).
• Pour n = 2 et q = 2, alors en résumant les deux phénomènes ci-dessus, on obtient :
Mais on a card(S3 ) = 6 et d’après les formules du Lemme 2.3 nous avons card(GL(2; F2 )) = (22 − 1)(22 −
2) = 3 × 2 = 6 si bien que l’on obtient
Alors en regardant le chapitre sur le groupe symétrique, on sait que pour m 6= 4, les seuls sous-groupes
distingués de Sm sont {1}, Am et Sm (voir Thm.1.2 p.11 du chapitre correspondant). Si bien que notre sous-
groupe dérivé D(GL(2; F2 )) qui est distingué, est l’un de ses trois sous-groupes ; or S3 n’est pas abélien (cf.
Cor.1.2 p.3 du chapitre correspondant), donc on peut déjà exclure {1}. Il nous suffit dans ce cas de voir ce que
donne le commutateur entre deux transpositions distinctes (puisqu’on est dans S 3 , les deux transpositions
ont un point en commun dans leurs supports) :
(a, b)(b, c)(a, b)−1 (b, c)−1 = (a, c)(b, c) = (a, c)(c, b) = (a, c, b) = σ
| {z }
(a,c)
(on pourra retrouver une telle formule à la p.8 dans le chapitre correspondant). On pourra alors regarder
Attention p.13 du chapitre correspondant pour voir que l’on a A 3 = {1, σ, σ2 } et à partir de là on a D(S3 ) =
A3 et notre dernier résultat est démontré.
h
Thm. 2.4 [ Sous-groupe dérivé de SL(E) ]
Soit E un k-espace vectoriel de dimension n.
1 Pour n 6= 2 (ou) k 6= F2 , F3 , on a D(SL(E)) = SL(E).
2 Pour n = 2
• Si k = F2 , on a D(SL(2; F2 )) ' A3 , et on a aussi SL(2; F2 ) ' S3 .
• Si k = F3 , on a D(SL(2; F3 )) ' H8 , et on a aussi SL(2; F3 ) ' H8 o Z/3Z.
• Si car(k) 6= 2, nous pouvons reprendre exactement le début de la preuve du Thm.2.3 p.13, i.e. les points •
et • •, pour pouvoir affirmer qu’avec l’hypothèse supplémentaire n ¾ 3, on aura effectivement D(SL(E)) = SL(E)
(cette dernière hypothèse est indispensable, car on utilise la propriété du fait que les transvections forment une
seule orbite sous l’action de SL(E) lorsque n ¾ 3, cf. Prop.2.4 (2) à la page 9).
• • En reprenant le même point dans la démonstation de la preuve du Thm.2.3 p.13, mais comme nous l’avions
déjà signalé, la conclusion se termine lorsqu’on peut se permettre d’avoir en amont la propriété que les transvec-
tions forment effectivement une seule orbite sous l’action de conjugaison du groupe et qu’ils engendrent ausi
notre groupe. Ici ce qu’il faut faire attention, c’est d’avoir "une seule orbite", cette dernière propriété est valable
pour n ¾ 3 (cf. Prop.2.4 (2) p.9). Et si on se réfère à la Prop.2.5 (2) à la page 10 on voit que c’est encore vrai pour
n = 2 que lorsque k∗ = k∗ 2 , où k∗ 2 représente l’ensemble des éléments non-nuls qui sont des carrés dans k, c’est
valable par exemple lorsque k est algébriquement clos.
Contrairement à la preuve du Thm.2.3 p.13, cette partie est à peine plus efficace
que le premier point, elle nous
a permis de montrer en fin de compte que D(SL(E)) = SL(E), pour n ¾ 3 et card(k) > 3. En synthétisant les
deux preuves, on arrive à la conclusion que l’on a D(SL(E)) = SL(E) pour n ¾ 3 et k 6= F 2 , F3 , ainsi que pour
n = 2 et pour car(k) 6= 2. [Dans [Per] p.103, où il établit que pour n ¾ 3, le groupe PSL(E) est simple, on pourrait
également reprendre sa preuve pour établir ce que l’on vient de montrer ici avec en plus l’avantage de nous passer
de l’hypothèse car(k) 6= 2].
En utilisant la caractérisation Prop.2.2 (4) à la page 4 (f 6= id, f|H = idH et det(f) = 1), on constate que f est bien
une transvection. D’autre part, il est facile de vérifier que l’on a f = ghg −1 h−1 , avec g, h ∈ SL(E), et grâce au fait
qu’on est dans la situation n ¾ 3 où les transvections forment qu’une seule orbite dans SL(E), on en déduit que
D(SL(E)) = SL(E).
? ? Pour le cas n = 2, on ne peut plus essayer de voir si un commutateur peut être une transvection, en
effet on est dans la situation où les transvections ne forment plus en général une seule orbite dans SL(E), on a
vu que cela dépendait du corps k. Néanmoins nous avons toujours la propriété que SL(2; k) est engendré par les
transvections. On peut alors analyser la situation d’avoir toute transvection comme étant un commutateur ; d’après
la Prop. 2.5(1)
p.10,
nous savons que dans SL(2; k) toute transvection est conjuguée (via SL(2; k)) à une matrice de
1 µ
la forme .
0 1
Dans la preuve du point • • plus haut (voir exactement la preuve du Thm.2.3 à la page 13), nous avions
regardé
λ 0
(sans trop nous poser de question) le résultat obtenu du commutateur d’une matrice diagonale g =
0 λ−1
1 1 1 λ2 − 1
avec une transvection écrite sous la forme canonique f = pour obtenir gfg−1 f−1 =
0 1 0 1
(on auraittrès bien pu s’attendre à une telle configuration, car on sait que gfg sera une matrice de la forme
−1
1 ∗
, de même pour f−1 donc pareillement pour leur produit) ; on aurait pu aussi regarder fgf −1 g−1 on au-
0 1
1 −λ2 + 1
rait obtenu et abouti à la même conclusion sur la discussion de g afin d’avoir une transvection.
0 1
Tout comme dans la preuve
de la Prop. 2.5(2) p.10, lorsque nous nous demandions quand est-ce que deux
1 ∗
matrices de la forme sont conjuguées, nous cherchions à résoudre l’équation en g donnée par gλg −1 =
0 1
a b
µ. Ici nous pourrions de la même manière chercher à résoudre l’équation dans SL(E) en g = et
c d
λ 0 1 µ
f= donnée par gfg−1 f−1 = = µ. Ce qui revient à gf = µfg ce qui nous donne
0 λ−1 0 1
aλ bλ−1 aλ + (µc)λ−1 bλ + (µd)λ−1
gf = = µfg = .
cλ dλ−1 cλ−1 dλ−1
De la 1-ère équation, on en déduit que c = 0 car µ, λ 6= 0 ; si bien qu’avec la dernière équation, on obtient
ad = 1. Il ne nous reste plus qu’à discuter des valeurs des deux autres variables b et a (ou d).
Synthèse : Même si nous ne l’avions pas remarqué, mais notre raisonnement peut très bien s’inverser pour
remonter à l’envers, on en déduit :
Lem. 2.5
λ 0
Supposons k 6= F2 , F3 . Et soit D = une matrice diagonale fixée de SL(2; k). Alors toute
0 λ−1
matrice de transvection µ est le commutateur entre deux matrices de SL(2; k) dont l’une est D (si et seulement
si) D 6= ±id2 .
Rmq
Ð
Ð
Ð Tout comme dans la preuve de Prop. 2.5 (2) p.10, ainsi que la preuve de 2 juste avant Rmq. 3 p.31, on
Ð
s’arrange toujours dans nos calculs pour ne pas faire apparaître les inverses.
Nous savons d’un résultat classique en algèbre linéaire que deux matrices dagonalisables
sont conjuguées par
GL(E) (si et seulement si) elles présentent un même nombre de valeurs propres et une même liste de multiplicités
(cf. décomposition des entiers en nombres premiers). Ici on a quelque chose de semblable dans SL(2, k) :
Lem. 2.6
Soit D un élément de SL(2; k) ayant une valeur propre λ 6= ±1 (en particulier, k 6= F 2 , F3 ), alors D est
λ 0
conjugué par SL (2; k) à la matrice diagonale .
:::::: 0 λ−1
Preuve. Puisque D ∈ SL(2; k),on a det(D)=, si bien D présente une seconde valeur propre qui ne peut être que
λ 0
λ−1 . Par le rappel, D et Dλ = sont conjugués par un élément g de GL(2; k), i.e. Dλ = gDg−1 . Soit
0 λ−1
−1
d 0
d = det(g), alors la matrice inversible g^ = commute avec Dλ , si bien que l’on obtient
0 1
Dλ = g
^ Dλ g ^−1 = g
^gDg−1 g
^−1 = (^ gg)−1
gg)D(^
|{z}
gDg−1
D(S3 ) = A3 .
De plus nous avons vu que PGL(n; Fq ) est un sous-groupe de S1+q+···+qn−1 , en particulier PGL(2; Fq ) est un
sous-groupe de S1+q , si bien que pour ici PGL(2; F3 ) est un sous-groupe de S4 (Encore ce fameux groupe déjà
rencontré dans le chapitre sur le groupe symétique !). Mais le groupe PGL(2; F 3 ) est de cardinal 24 (égal au cardinal
de SL(2; F3 )), il en va de même du groupe S4 , donc nous avons
PGL(2; F3 ) = S4 . (2.3)
card(SL(2; F3 ))
D’autre part PGCD(2, 3 − 1) = 2, donc card(PSL(2; F3 )) = = 12, ce qui signifie que le
2
sous-groupe PSL(2; F3 ) est d’indice 2 dans PGL(2; F3 ) = S4 ; or dans le groupe symétrique, il n’y a qu’un seul
sous-groupe d’indice 2 qui est A4 , et donc
PSL(2; F3 ) = A4 . (2.4)
[On aurait pu voir aussi que PSL(2; F3 ) est d’indice deux, car par définition, c’est le quotient de SL(2; F 3 ) par les
racines 2-ième de l’unité qui sont dans le centre Z de GL(2; F3 ), mais il est trivial de voir que tout élément de Z
s’identifiant à un élément de F∗3 = {±1} est déjà une racine 2-ième de l’unité.]
ATTENTION ! Bien qu’ayant cardinalité que S4 , cela ne nous dit pas pour autant que SL(2; F3 ) est iso-
morphe à S4 . En effet on sait que S4 n’a pas de centre contrairement à SL(2; F3 ) qui a un centre à deux
éléments. En revanche, grâce à l’injection rappelée au dessus on a effectivement PGL(2; F 3 ) = S4 .
Nous renvoyons au Lemme1.5 à la page 10 du chapitre sur le groupe symétrique qui dit que dans le groupe
« »
A4 , on y trouve le sous-groupe H4 (qui est un groupe de Klein isomorphe à Z/2Z × Z/2Z) qui est distingué et
même caractéristique de cardinal 4 dans A4 . Si bien que le groupe quotient A4 /H4 est de cardinal 3, c’est facile à
vérifier que ce quotient est abélien. En se rappelant que le groupe dérivé est exactement le plus petit sous-groupe
d’un groupe donné tel que le quotient soit abélien (cf. [Cal] Thm.4.39 p.156), on en déduit que H4 contient le
sous-groupe dérivé de A4 , et comme on sait que A4 n’est pas abélien et que H4 n’a pas d’autre sous-groupe
distingué, on en déduit que H4 = D(A4 )(cf. Lemme 1.5. p.10 du chapitre sur le groupe symétrique).
Pour la même raison invoquée juste au dessus, on en déduit que le noyau du morphisme composé q 2 ◦ q contient
le sous-groupe dérivé de SL(2; F3 ), ce noyau est de cardinal égal à 24/3 = 8. D’autre part, il est ô combien facile
mais fondamental de voir que
si bien que le nombre card(D(SL(2; F3 ))) est un multiple de 4, i.e. que l’on doit avoir card(D(SL(2; F3 ))) = 4 ou
8.
Si card(D(SL(2; F3 ))) = 4, alors de la relation (2.6) ci-dessus on en déduit que D(SL(2; F3 ))'H4 et
comme H4 étant un groupe de Klein, tous ses éléments non-triviaux sont d’ordre 2, i.e. que D(SL(2; F 3 )) contien-
drait 3 éléments d’ordre 2 :
a b
• • D’autre part, considérons un élément f = ∈ SL(2; F3 ) d’ordre 2, alors on a :
c d
2
a + bc ab + bd
f2 =
ca + dc bc + d2
card(D(SL(2; F3 ))) = 8.
Il nous est donc indispensable de connaître les groupes de cardinal 8, et c’est ce que nous allons faire dans la
proposition suivante :
Preuve. Soit G un groupe d’ordre 8. D’après le théorème de structure des modules de type fini, si G est abélien,
alors G sera nécessairement de la forme Z/8Z, Z/4Z × Z/2Z ou encore (Z/8Z) 3 .
Considérons r l’ordre maximal des éléments de G, alors on sait que r doit diviser l’ordre de G si bien que
l’on a r = 2, 4 ou 8.
• Si r = 8, alors cela signifie que G est cyclique, il est en particulier abélien et donc G ' Z/8Z.
• Si r = 2, cela signifie en particulier que tout élément de G est involutif, et par conséquent on a fgf −1 g−1 =
fgfg = (fg)2 = 1, i.e. que l’on a affaire encore à un groupe abélien et on trouve G ' (Z/2Z) 3 .
• Si r = 4, considérons i un élément de G d’ordre 4, alors H =< i >' Z/4Z est d’indice 2 dans G, il est
donc en particulier distingué dans G, on peut donc considérer le quotient de G par H pour obtenir la suite
exacte courte :
comme tout élément divise l’ordre de G et puisque G n’est pas cyclique on en déduit que tout élément de
G \ H est d’ordre 4. Aussi, on pourra observer que si g ∈ G \ H, alors g−1 ∈ G \ H. Remarquons aussi que
notre élément i qui génère H est d’ordre 4 et vérifie en particulier (i2 )2 = 1, de plus i2 est le seul élément
dans H =< i > à vérifier cette propriété (cf. [Per] p.74, c’est la correspondence dans un groupe cyclique
entre les sous-groupes et les diviseurs de l’ordre du groupe) et on peut même rajouter que c’est l’unique
élément d’ordre 2 de G. Nous pouvons même remarquer que H est donc constiué du neutre, d’un élément
d’ordre 2 et de deux élément d’ordre 4 qui sont i et i −1 . De toutes ces observations, nous allons essayer de
« »
comprendre ce groupe G : Il y a plusieurs caractérisations concernant le groupe des quaternions .
1ère Caractérisation
Í
La plus classique se fait à travers 3 générateurs : Définissons −1 : = i2 , et considérons un élément
Í
quelconque j ∈ G \ H d’ordre 4 et considérons l’élément k : = ij ce dernier est d’ordre 4 et est
F
également dans G \ H (cf. G = H iH). Nous avons en particulier j2 = k2 = −1, en effet j et k
sont dans G \ H, ils sont donc d’ordre 4, leurs carrés seront d’ordre 2 et comme il n’y a qu’un seul
élément d’ordre 2 dans G qui est −1, ces derniers coïncident bien avec −1. Le centre Z(G) de G est
un sous-groupe d’ordre 1, 2, 4 ou 8, mais nous avons affaire à un 2-groupe, son centre n’est donc pas
trivial (Thm. de Burnside, cf. [Per] Prop.4.15 p.16) donc on peut déjà exclure 1. On peut également
exclure 8 car G n’est pas abélien, enfin si c’est 4 alors le centre serait d’indice 2 et en utilisant la
F
décomposition G = Z(G) gZ(G) où g ∈ G \ Z(G), soient a, b ∈ G, si a ou b est dans Z(G) alors a
et b commutent considérons alors a et b dans gZ(G) que l’on peut écrire comme a = ga 1 et b = gb1 ,
alors
aba−1 b−1 = ga1 gb1 (ga1 )−1 (gb1 )−1 = ga1 gb1 a−1 1 g
−1 −1 −1
b1 g
mais comme a1 et b1 sont dans Z(G), ces derniers commutent avec tout élément et on peut les placer
où l’on veut dans l’expression précédente, si bien que l’on trouve
Cela nous montre qu’en fin de compte G est commutatif, mais cela est exclu dans notre contexte si
bien que la seule possibilité est que Z(G) est de cardinal 2. Le centre Z(G) a donc un élément d’ordre
Í Í Í
2, si bien que l’on a −1 ∈ Z(G). On pose −i : = (−1) × i , −j : = (−1) × j et −k : = (−1) × k . On
a alors à notre disposition 8 éléments distincts : 1, −1, i, j, k, −i, −j et −k et ils vérifient les relations
∗ i2 = j2 = k2 = −1,
∗ ij = −ji = k, jk = −kj = i et ki = −ik = j.
| {z }
permutation des lettres i,j et k
Vérifions par exemple que ij = −ji :
⇔ i j i j2 j3 = −1 ?
⇔ i j i j j4 = −1 ?
⇔ i j i j = −1 ok
|{z}
Ø.
k2
Ces relations, entre les éléments de G nous dit qu’on a effectivement affaire au groupe des quaternions
(cf. [Per] p.161 même s’il parle de l’algèbre des quaternions, sinon on pourra se rendre sur internet à
l’adresse http ://www.les-mathematiques.net/d/c/a/node23.php)
2ème Caractérisation
Cette fois-ci nous allons nous baser sur une autre caractérisation qui se limite à deux générateurs a et
b et à leurs relations
(cf. http ://fr.wikipedia.org/wiki/Représentations_du_groupe_des_quaternions) :
a4 = b4 = 1, bab−1 = a−1 , a2 = b 2
Í
Pour cela considérons a : = i et b ∈ G \ H, alors la première et la dernière relation sont trivialement
vérifiées. Reste à voir la deuxième
relation : Remarquons que b peut toujours s’écrire ga où g est
k
(gak ).(gal ).(gak )−1 .(gal )−1 = gak .gal (ak )−1 g−1 (al )−1 g−1
= gak . gal−k g−1 (al )−1 g−1
| {z }
∈ H par hyp
Et par hypothèse g doit commuter avec tout éément de H, on a ga l−k g−1 = al−k . Si bien que l’on
obtient :
(gak ).(gal ).(gak )−1 .(gal )−1 = gak .al−k (al )−1 g−1
= g.1.g−1 = 1.
Ce que l’on vient de montrer est qu’en fin de compte avec l’hypothèse faite, on a que G est abélien,
et dans ce cas à cause d’éléments d’ordre maximal 4, nous savons déjà que G doit être nécessairement
Z/2Z × Z/4Z, [notons que nous aurions pu en déduire cette décomposition lorsque nous savions que
H ⊂ Z(G) (cf. [Per] Prop.6.5. p.23)]. Mais cela est exclu car on est dans la situation non-scindée. Donc
il existe bien un élément b ∈ G \ H tel que bab−1 = a−1 .
h
En revenant à notre étude de D(SL(2; F3 )) : Nous avions remarqué que D(SL(2; F3 )) est de cardinal 8 et
contenait qu’un seul élément d’ordre 2 (cf. juste avant la Prop. 2.6 p.21). D’après la Prop.2.6 p.21 décrivant
les groupes d’ordre 8, et le fait que D(SL(2; F3 )) ne contient qu’un seul élément d’ordre 2, on en déduit que
D(SL(2; F3 )) ne peut être égal qu’à Z/8Z (ou) à H8 . Si D(SL(2; F3 )) = Z/8Z, via le morphisme surjectif q1
(cf. (2.5)), on a déjà q1 (D(SL(2; F3 ))) = D(PSL(2; F3 )) = D(A4 ) = H4 'Z/2Z×Z/2Z, or le groupe Z/2Z×Z/2Z
n’est pas cyclique ce qui serait en contradiction avec le fait d’être l’image d’un groupe cyclique. Il ne nous reste
donc plus que la possibilité
D(SL(2; F3 )) = H8 , (2.8)
• Jusqu’à présent, nous avons montré que le groupe projectif de SL(2; F 3 ) coïncidait avec A4 (cf. (2.4) p.20),
et que le sous-groupe dérivé de SL(2; F3 ) coïncidait avec H8 (cf. (2.8) au dessus). Nous allons voir ci-
dessous que structurellement parlant, on aura une description semblable des éléments de H 8 (on verra que
ce dernier est exactement l’ensemble des éléments de SL(2; F3 ) d’ordre divisant 4) et qu’on a aussi un
produit semi-direct de H8 par Z/3Z pour donner SL(2; F3 ) :
Le sous-groupe dérivé H8 étant distingué dans SL(2; F3 ) et d’indice 3, on obtient alors la suite exacte courte
suivante :
1 → H8 → SL(2; F3 ) → Z/3Z → 0 (2.9)
Tout comme cela avait été fait concernant A4 (cf. discussion faite dans la démo du Lemme 1.5. p.10 au chapitre
sur le groupe symétrique), on peut légitimement se demander si SL(2; F 3 ) ne pourrait pas se présenter comme un
produit semi-direct entre H8 et Z/3Z. Mais en revenant, comme cela a été fait avec la suite exacte courte (2.7) à
la p.21, on peut très bien se demander si la suite exacte courte (2.9) ci-dessus est scindée, (ce qui revient, comme
cela avait été fait lorsqu’on avait une suite axacte courte qui se terminait par Z/2Z) à se demander s’il existe dans
SL(2; F3 ) \ H8 un élément d’ordre 3. Pour cela nous pouvons commencer par remarquer que d’après la relation
(2.2), on a card(SL(2; F3 )) = 24 = 23 × 3. Si bien qu’à l’intérieur de SL(2; F3 ), l’existence de 3-sous-groupes
de Sylow est assuré (cf. [Per] Thm.5.4. p.19), il en va de même de 2-sous-groupe de Sylow. Nos 3-Sylow sont
de cardinal 3, tandis que les 2-Sylow sont de cardinal 23 . Remarquons alors qu’un 3-Sylow est nécessairement
cyclique et qu’à l’intérieur le générateur et son inverse sont bien d’ordre 3 et ils ne peuvent pas être contenus
dans H8 (sinon on aurait 3|8, ce qui n’est pas possible). Si bien que la suite exacte courte (2.9) ci-dessus est bien
scindée et on a
SL(2; F3 ) ' H8 o Z/3Z. (2.10)
L’isomorphisme ci-dessus nous assure que l’ensemble SL(2; F 3 ) muni de sa loi interne provient effectivement
de la structure d’un certain produit semi-direct.
————————————————-
Notre objectif :
En consultant [Per] Remarque 6.3. p.22, on constate que le produit semi-direct N o H, ensemblistement
ce n’est rien d’autre que le produit direct N × H, mais l’opération du groupe n’est pas le produit que l’on
Í
rencontre pour l’espace produit, c’est un certain produit obtenu de la manière suivante : (n, h)(n 0 , h 0 ): =
(n.ϕ(h)(n 0 ), h.h 0 ) où ϕ : H → Aut(N) est le morphisme qui nous permet de "tordre" la loi du produit
direct (c’est ce que l’on qualifie également d’action de H sur N). Si on identifie N (resp. H) avec les sous-
ensembles N = {(n, 1); n ∈ N} (resp. H = {(1, h); h ∈ H}, alors l’action de ϕ se décrit de la manière
suivante : ϕ(h)(n 0 ) = hnh−1 où les termes et le produit utilisés dans le membre de droite sont perçus
| {z }
∈N
comme des éléments de N × H et leur produit utilisé provient de la loi qu’on a donné juste au dessus. C’est
donc l’action de conjugaison via cette identification de N et de H. Si bien que pour connaître ϕ dans notre
étude, il nous faut connaître l’action de conjugaison d’un 3-Sylow sur H 8 .
C’est ce que nous allons tenter de faire dans les prochaines lignes.
Notons par k2 (resp. k3 ) le nombre des 2-Sylow (resp. 3-Sylow). Alors on sait qu’ils divisent tous les deux le
cardinal du groupe entier, i.e. 24 et vérifient les relations suivantes (cf. [Per] Thm.5.7. p.19) :
k2 ≡ 1 [2] et k3 ≡ 1 [3].
Si bien que k2 divise 3 et k3 divise 8. En particulier, on en déduit que les 2-Sylow sont au nombre de 1 ou 3, et les
3-Sylow sont au nombre de 1, 2, 4 ou 8.
Nous pouvons nous baser sur le résultat (2.8) pour se rendre compte que le sous-groupe dérivé de SL(2; F 3 ) est
un 2-Sylow, c’est en particulier un sous-groupe distingué dans SL(2; F 3 ), et en se référant par exemple à [Per]
Cor.8.8. p.19 on en déduirait que c’est le seul 2-Sylow dans SL(2; F 3 ). Mais nous allons ici procéder différemment
en analysant en profondeur les éléments d’un 2-Sylow.
Soit g est un élément non-trivial d’un 2-Sylow, alors son ordre ne peut être que 2, 4 ou 8. Il est facile de vérifier
que dans SL(2; F3 ), il n’y a pas d’élément d’ordre 8, donc il ne nous reste plus que 2 et 4 comme possibilités :
• Ordre 2 : L’élément g vérifie l’équation X2 = 1, mais notre groupe est particulier, il est contenu dans
l’espace des matrices, si bien que l’équation précédente se retranscrit par l’équation "polynomiale" X 2 − 1 =
0, or X2 = (X−1)(X+1), si bien que l’on en déduit que le polynôme minimal correspondant à g s’obtiendra
à partir d’une sous-expression de la décomposition que l’on vient d’obtenir, les sous-expressions possibles
sont donc X − 1, X + 1 ou X2 − 1. Puisque g est différent de l’identité, il ne nous reste plus que X + 1 et
X2 − 1 comme possibilités. Si c’est X2 − 1, alors puisqu’on est en dimension n = 2, si bien que polynôme
caractéristique serait confondu avec le polynôme minimal ; or le polynôme caractéristique est de la forme
X2 − Tr(g) + det(g), on aurait alors Tr(g) = 0 et det(g) = −1 ce qui ne serait pas envisageable. La seule
possibilité qui nous reste est donc g = −id 2 et c’est donc le seul élément d’ordre 2 dans SL(2; F3 ).
• Ordre 4 : La même analyse que celle qui vient dêtre fait nous conduit à l’équation "polynômiale" X 4 −1 =
0, or X4 = (X2 − 1)(X2 + 1) = (X − 1)(X + 1)(X2 + 1) et notons que X2 + 1 n’a pas de racines dans F3
si bien que ce dernier est irréductible et puisque g 6= ±id2 , on en déduit par le même
type d’analyse que le
polynôme minimal de g coïncide cette fois-ci avec son polynôme caractéristique et est donc égal à X2 + 1
et vérifie donc les contraintes suivantes (que l’on tire de ses coefficients) :
− Tr(g) = 0 et
− det(g) = 1.
Nous sommes donc en mesure de décrire tous les éléments vérifiant ces contraintes et de voir ceux qui sont
d’ordre 4. On pourra vérifier que les matrices qui vérifient ces contraintes (essentiellement la 1-ère, puisque
la 2-ième est automatiquement vérifiée car on est quand même dans SL 2 ) dans SL(2; F3 ), sont les suivantes :
0 1 0 −1 1 1 1 −1 −1 1 −1 −1
, , , , , .
−1 0 1 0 1 −1 −1 −1 1 1 −1 1
On pourra aussi vérifier que ces matrices sont d’ordre exactement égale à 4.
Posons alors
Í
i :=
0 1
, j :=
Í −1 −1 et k : =
Í 1 −1
,
−1 0 −1 1 −1 −1
on remarque alors que H = ±id2 , ±i, ±j, ±k est bien isomorphe au groupe des quaternions H8 , et de cette
analyse on en déduit qu’il n’existe qu’un seul 2-Sylow dans SL(2; F3 ), de plus il coïncide exactement
avec l’ensemble des éléments g ∈ SL(2; F3 ) d’ordre divisant 4 (cf. la description faite pour les éléments H4
qui sont les involutions de A4 ). Grâce à cette dernière description des éléments de H, on en déduit facilement
que H est distingué dans SL(2; F3 ), sans cela on aurait également pu déduire le même constat en se basant
sur un résultat concernant les sous-groupes de Sylow qui dit que le nombre de p-Sylow est égal à 1 (si et
seulement si) il existe un p-Sylow distingué dans SL(2; F3 ) (cf. [Per] Cor.5.8. p.19).
Remarquons qu’un 3-Sylow est nécessairement cyclique, un générateur g est donc un élément d’ordre 3 dans
SL(2; F3 ). La même analyse que celle qui a été faite au dessus nous permettra de dire qu’un tel générateur doit
vérifier l’équation "polynomiale" X3 − 1 = 0. Or nous le corps de base est F3 , qui est de caractéristique 3, si bien
que par le morphisme de Frobenius nous avons l’identification X 3 − 1 = (X − 1)3 . De cette "décomposition", le
polynôme minimal est donc une sous-expression, cela ne pourra être que X − 1, (X − 1) 2 ou (X − 1)3 , mais g 6= id2
si bien que l’on peut exclure X − 1, et comme le degré du polynôme minimal n’excède pas celui du polynôme
caractéristique, qui ici vaut 2, on en déduit que (X − 1)2 est à la fois son polynôme minimal et caractéristique
[Notons au passage qu’un polynôme minimal n’est pas nécessairement irréductible].
Si bien que l’on obtient (X − 1)2 = X2 − |{z}2 X + 1 = X2 + X + 1 = X2 − Tr(g)X + det(g), on obtient ainsi les
=−1
contraintes :
− Tr(g) = 2 ou − 1 et
− det(g) = 1.
De ces contraintes on obtient les 8 possibilités suivantes pour g :
1 ±1 1 0 −1 −1 −1 1 0 −1 0 1
, , , , , et
0 1 ±1 1 1 0 −1 0 1 −1 −1 −1
D’autre part un 3-Sylow est (ici) de cardinal 3, chacun d’entre eux contient exactement 2 éléments d’ordre 3, si
bien qu’avec nos 8 éléments d’ordre 3, on en déduit que les 3-Sylow sont au nombre de 4. Prenons par exemple
l’élément :
Í
ζ :=
1 1
.
0 1
Alors on pourra calculer la conjugaison des éléments de H8 par notre élément ζ pour obtenir la description du
3-Sylow sur H et ainsi avoir la structure de notre produit semi-direct . . . !
Rmq
Ð
Ð D’après le Lemme2.5 p.19, on arrive à voir que toute transvection est parfaitement un commutateur dont
Ð
Ð l’un est une matrice diagonale dans SL(2; k) lorsque k 6= F2 , F3 . Malheureusement, on ne pourrait pas
Ð
Ð argumenter ensuite par un raisonnement de "densité" pour conclure que D(SL(2; k)) = SL(2; k), car lorsque
Ð k est un corps fini, le groupe SL(2; k) est lui même fini, donc cela ne marcherait pas... !
3 Simplicité de PSL(E)
Nous arrivons maintenant un des résultats principaux de ce chapitre qui consistait à comprendre pour l’essentiel
les sous-groupes distingués du groupe linéaire (on essaie dans notre philosophie à dévisser en briques élémentaires
nos objets d’étude). Du groupe linéaire GL(E) nous sommes passés au groupe spécial linéaire SL(E) qui n’est rien
d’autre (à l’exception d’un cas près) que son sous-groupe dérivé (cf. Thm.2.3 p.13) et on vient de voir que ce
dernier est (à l’exception de deux cas près, cf. Thm.2.4 p.17) confondu avec son sous-groupe dérivé.
Ð Nous avions focalisé notre étude dans la section précédente sur la détermination des centres et des
Ð
Ð sous-groupes dérivés (cf.1.2), on pourra noter quelque part que ces deux sous-groupes sont un peu à l’opposé
Ð
Ð l’un de l’autre dans le dévissage d’un groupe donné :
Ð
Ð • Pour le centre : On remarque que le quotient G/Z(G) n’a plus aucun couple d’éléments qui commutent
Ð
Ð entre eux, en plus si le groupe est un semi-direct de la forme Z(G) o G/Z(G), alors ça sera nécessairement
Ð
Ð un produit direct car l’action de "conjugaison" d’un sous-groupe de G isomorphe à G/Z(G) sur Z(G) sera
Ð
Ð triviale. [Je parle de "conjugaison" à cause de ce que j’ai pu rappeler en trait bleu dans la sous-section 2.3
Ð
Ð précédente].
Ð
Ð • Pour le sous-groupe dérivé : On remaque que cette fois-ci le quotient G/D(G) sera bien au contraire
Ð
commutatif.
• De cette observation, si bien que lorsqu’un sens de dévissage se coince (i.e. par exemple lorque l’un de nos
deux sous-groupes en question coïncide avec le groupe), on va s’intéresser à l’autre. Par exemple, pour ce qui est
dans notre étude, puisqu’on coince avec le sous-groupe dérivé qui est égal au groupe de départ (cf. Thm.2.4 (1)
p.17, on a dans la majorité des cas D(SL(E)) = SL(E)), on va alors s’intéresser au centre de SL(E), ce dernier étant
commutatif, on ne répercute donc pas notre recherche sur le centre de ce dernier ni sur son sous-groupe dérivé...
on va alors s’intéresser au quotient de SL(E) par son centre, c’est à dire à PSL(E).
Notons que lorsqu’on a soit le centre, soit le sous-groupe dérivé, avec notre philosophie de décomposition en
produit semi-direct, on devrait automatiquement quotienter notre groupe d’étude par ce sous-groupe. On ne l’a
pas mentionné lorsqu’on était parti avec GL(E), on a vu que son quotient par son centre nous donnait PGL(E),
on n’a pas plus mis l’accent sur son étude car nous avions déjà remarqué que PGL(E) était le produit semi-direct
de PSL(E) par k∗ /k∗ n (cf. page 12), si bien qu’en poursuivant notre philosophie, nous aurions dû ensuite étudier
PSL(E). Nous avions alors mis l’accent dans notre recherche dans l’autre sens, dans l’étude des sous-groupes dé-
rivés, qui finalement nous ramène à cette étude mise de côté jusqu’alors.
• Enfin une dernière observation, puisque nous voulons comprendre les sous-groupes distingués, ainsi que
l’action de conjugaison d’un tout autre sous-groupe sur ce groupe distingué (je fais ici encore allusion au produit
semi-direct), nous pourrions pousser plus largement notre étude en ne nous limitant pas au seul intérêt du centre
et du sous-groupe dérivé, mais cela nous entrainerait bien loin du niveau exigé pour ce cours ; le fil conducteur le
plus naturel qui doit nous guider est bien celui que l’on a adopté jusqu’à maintenant en cherchant à comprendre le
centre et le sous-groupe dérivé et en formant un nouveau groupe en quotientant notre groupe de départ par son
centre ou son sous-groupe dérivé... !
Comme nous l’avions signalé plus haut mis à part quelques cas particuliers près où nous n’avions pas le groupe
spécial linéaire égal à son sous-groupe dérivé, nous obtenons un résultat dans cette lignée qui est de nature globale
(mis à part encore une fois, à ces quelques cas particuliers) :
Preuve. Soit donc E un k-espace vectoriel de dimension n. Nous renvoyons à Def.2.2 à la p.12, pour voir que
PSL(E) est obtenu comme l’image du quotient q : SL(E) → SL(E)/Z = PSL(E), où Z est le centre
de SL(E).Soit
N un sous-groupe non trivial, distingué dans PSL(E), alors N = q−1 (N) est un sous-groupe distingué dans
SL(E) qui contient strictement le centre Z . Le résultat sera démontré dans la majorité des cas si on parvient à
montrer que N = SL(E).
Nous savons que SL(E) est engendré par les transvections (cf. Thm.2.1 p.7), si bien que l’on peut essayer de
voir par exemple que toute transvection est contenue dans N, mais c’est une idée un peu trop directe et a peu de
chance d’aboutir en sachant que la seule hypothèse à notre disposition est que N est distinguée. Néanmoins si
on est en plus dans l’hypothèse n ¾ 3, on sait alors que les transvections forment une seule orbite pour l’action
de conjugaison dans SL(E) (cf. Prop.2.4 p.9) et comme N est distingué dans SL(E), il nous suffirait d’exiber une
transvection qui serait contenue dans N.
• Supposons n ¾ 3 : Nous pensons évidemment aux débuts des preuves des Thm.2.3 p.13 et Thm.2.4 p.13,
qui sous l’hypothèse supplémentaire car(k) 6= 2 a permis de mettre en évidence un "commutateur" comme étant
une transvection, nous nous sommes intéressés aux commutateurs car il s’agissait d’étudier les sous-groupes dé-
rivés. Ici on a un sous-goupe plus général, donc on n’a pas à notre disposition des générateurs explicites (comme
cela avait été le cas pour les "commutateurs") de N sur lesquels nous pourrions pousser notre analyse.
Néanmoins, nous pouvons toujours analyser les conjugués des éléments
g de N pardes transvections f et voir
ce que cela donne. Considérons g ∈ N et f une transvection, puisque N est distingué , on a fgf−1 ∈ N mais on
a aussi (fgf−1 )g−1 ∈ N ! Par nos observations ci-dessus, il nous suffit d’exiber un tel commutateur qui soit une
transvection.
[On est encore une fois ramené à l’étude des commutateurs ! Quel miracle ... ! ! !]
Remarquons enfin que l’expression du commutateur fgf−1 g−1 se présente aussi comme le produit des trans-
vections f et gf−1 g−1 . Si bien que nous avons à étudier le produit de deux transvections f(gf −1 g−1 ). On pourra
consulter Cor.2.1 p.5 où nous avions vu un résultat concernant le produit entre deux transvections, mais il s’agis-
sait de deux transvections de même hyperplan fixe, ici il n’est pas garanti que les transvections f et gf −1 g−1 aient
même le même hyperplan
fixe ! Supposons que f soit une transvection d’hyperplan H, il en sera de même pour f −1
(cf. Cor.2.1 p.5), et gf g sera alors une transvection d’hyperplan g(H) (cf. Prop.2.4 p.9).
−1 −1
Considérons g ∈ N \ Z, en particulier g n’est pas une homothétie , il existe alors un vecteur a tel que b =
g(a) n’est pas colinéaire à a. Puisque n ¾ 3 , il existe un hyperplan H qui va contenir le plan Vect(a, b). D’autre
part, toute transvection se définit également par une droite (cf. Cor.2.2 p.6), considérons f "une" transvection
de
droite Vect(a), alors f−1 sera aussi une transvection de même droite Vect(a) (cf. Prop.2.1(2) p.5) et gf−1 g−1
est une transvection de droite Vect(g(a)) = Vect(b), ce qui signifie que l’on a
Im(f − idn ) = Vect(a)
et
Im(gf−1 g−1 − idn ) = Vect(b).
Alors on obtient :
fgf−1 g−1 − idn = [fgf−1 g−1 − f] + [f − idn ] = f[gf−1 g−1 − idn ] + f[idn − f−1 ].
Par conséquent :
Or si V est un sous-espace vectoriel, on a f(V) = [f− idn + idn ](V) ⊂ (f− idn )(V)+ idn (V) = (f− idn )(V)+V, si
bien que l’on obtient f(Vect(a, b)) ⊂ (f − idn )(Vect(a, b)) + Vect(a, b) ⊂ Im(f − idn ) +Vect(a, b) = Vect(a, b).
| {z }
Vect(a)
De cette analyse, on en déduit en particulier que
Le premier point provient facilement de la relation (3.2), en effet si x ∈ H alors fgf−1 g−1 (x) + x ∈ H et donc
fgf g (x) ∈ H et comme fgf−1 g−1 est inversible, on a alors fgf−1 g−1 (H) = H. Pour le deuxième point, si
−1 −1
jamais fgf−1 g−1 (b) = idn , alors f = gfg−1 , mais on a vu que f est une transvection de droite Vect(a) tandis
que gfg−1 est une transvection de droite Vect(b) avec a et b non-colinéaires, ce qui n’est donc pas possible.
Petite analyse :
La première observation que nous pouvons faire est que Cond. ressemble beaucoup à Cond. , sans
pour autant remplir simultanément les demandes souhaitées. En effet :
• Si on commence par considérer (par exemple) la 2-ième condition de Cond. réalisée comme le réclame
Cond. , ce n’est pas pour autant que l’on ait g(H) = H ; en effet, dans nos argumentations de la page
précédente, on a seulement pris H comme un certain hyperplan qui va contenir Vect(a, b), et en plus on
sait seulement que par construction f est une transvection de droite Vect(a), donc on n’a pas de lien plus
conséquent comme cela pourrait être avec l’hyperplan d’une transvection (pas de lien avec l’hyperplan H).
Donc nous avons ici, un choix de H qui semble trop aléatoire, trop vague, pour pouvoir remplir ces deux
dernières contraintes réclamées (i.e. être à la fois l’hyperplan de la transvection f et vérifier aussi g(H) =
H).
Néanmoins remarquons que par la Prop.2.2 (5) p.4, si f est aussi une transvection d’hyperplan H, alors on
doit avoir Im(f − idn ) = Vect(a) ⊂ H, c’était donc assez intelligent d’avoir choisi H contenant a, de même
pour on pourra faire la même analyse pour avoir aussi choisi H contenant b.
Par cette observation, on peut légitimement demander que f soit bien une transvection de droite Vect(a),
mais aussi d’hyperplan H (c’est facile de construire f à partir de Prop.2.2 p.4), et il ne nous restera plus
que la condition g(H) = H à remplir... ! En résumé, la question que l’on se pose est s’il existe bien un
hyperplan contenant a et b = g(a) tel que g(H) = H... !
Mais malheureusement, la seule information dont on dispose est que h n’est pas une homothétie et on ne
sait pas si cela suffit pour lui trouver un hyperplan invariant ; en imaginant par exemple la situation où E est
le plan et g une rotation, alors on a aucune chance de lui trouver une droite fixe... !
• Si maintenant on considère que c’est la 1-ère condition qui est réalisée dans Cond. , c’est à dire que r =
fgf−1 g−1 vérifiant r(H) = H, il nous faudrait pour pouvoir satisfaire Cond. , trouver une transvection
h d’hyperplan H telle que rhr h 6= idn . De l’analyse faite au point précédent, on peut repartir cette
−1 −1
fois-ci avec cet élément r ∈ N admettant au moins un hyperplan fixe, il ne nous restera plus qu’à trouver une
transvection h d’hyperplan H, et qui ne commute pas avec r.... !
Mine de rien, c’est déjà un progrès en soit... en effet, au point précédent, on avait imaginé que si jamais
on partait avec la 2-ième condition, on se plaçait dans une certaine éventualité, alors en poussant notre
analyse, on pouvait éventuellement déboucher à une certaine impasse (c’était dans le cas où g serait une
rotation du plan), cette fois-ci en partant avec la 1-ère condition, on pourrait essayer de la même façon,
imaginer des scénarios qui pourrait éventuellement freiner notre réflexion (pour le moment je n’en vois
pas... !). C’est la raison pour laquelle, je dis que c’est un progrès en soi... !
• S’il existe une transvection d’hyperplan H qui ne commute pas avec r, alors la partie est gagnée d’après
l’analyse qui vient d’être faite.
• Sinon, r doit commuter avec toute transvection h d’hyperplan H, i.e. rh = hr. Puisque h fixe H, on en déduit
en particulier que r stabilise tout sous-espace de H stable par h, et puisque h |H = idH , on en déduit en particulier
que r stabilise toute droite de H ; d’après Lemme 2.2 p.11 on en déduit que la restriction de r à H est un homothé-
tie [jusque là tout va bien, rien d’incohérent, car une homothétie commute bien avec tout le monde, ce qui semble
être le cas de r]. On constate que l’on n’a pas pris les choses par le bon bout, car on n’exploite pas pleinement
l’hypothèse, en effet on utilise juste le fait que toute transvection d’hyperplan H se restreint en l’identité, mais on
aurait pu arriver au même résultat en se limitant à une seule transvection d’hyperplan H.... !
Soit L une forme linéaire définissant H, d’après Prop.2.2 (7) p.4, il existe un vecteur vh ∈ H tel que pour tout
x∈E:
h(x) = x + L(x).vh
Et inversement, pour tout vecteur vh ∈ H, on aura ainsi une stransvection définie de cette manière.
On en déduit que
L(x).r(vh ) = L(r(x)).vh
De la relation (3.2) qui dit que Im(r − idn ) ⊂ H = ker(L), on en déduit que pour tout x ∈ E on a L(x) = L(r(x)),
et si on prend par exemple x ∈ / H, on aura L(x) = L(r(x)) 6= 0, et par conséquent r(v h ) = vh et cela quelque soit
vh ∈ H, ce qui démontre que la restriction de r à H est l’identité, et on a aussi r 6= id n et Im(r − idn ) ⊂ H, c’est
en fait dire que r est déjà une transvection d’hyperplan H (cf. Prop.2.2 (5) p.4). Alors N contient la transvection r
et c’est gagné.
2 Si g admet une valeur propre λ = ±1, [ce n’est même pas la peine de supposer que g pourrait être une
transvection, car cela ne suffirait pas pour s’assurer que toute classe (pour la conjugaison) des transvections
ait un représentant dans N, c’est la même observation qu’au dessus]. Néanmoins cela ne veut pas dire pour
autant que N ne puisse pas avoir un autre élément ayant une valeur propre λ 6= ±1, de toute façon à ce stade
de notre raisonnement ça sera notre seul salut que de pouvoir exiber un tel élément de N. . . , mais on ne va
évidemment pas rechercher parmi les conjugués de g, car cela ne nous donnera pas un élément qui aurait
une valeur comme on le souhaite, on pense alors au fait qu’en considérant les commutateurs formés à partir
d’au moins un élément de N, on va rester dans N.
a b
Matriciellement g aura la forme avec c 6= 0 (et cela dans n’importe quelle base, de même on
c d
α β
peut aussi s’infliger de la même hypothèse concernant b). Soit f = un élément quelconque
γ δ
dans SL(2; k) ; essayons alors de voir dans quelle condition le commutateur admet une valeur propre
λ 6=
1
±1. Cela signifiera que pour un certain vecteur e1 que l’on pourra supposer égal à e1 = , on aura
0
fgf g (e1 ) = λ.e1 .[On aimerait en fait, faire disparaître les inverses f et g en les faisant passer
−1 −1 −1 −1
à droite comme cela avait été fait dans la preuve de Prop.2.5 (2) p.10 ou dans la discussion faite avant le
Lemme 2.5 p.19, en effet cela nous soulagerait au niveau des calculs en nous évitant le calcul de f −1 et de
g−1 . Mais en ayant écrit notre commutateur de cette manière ce n’est pas très pratique, car il faudra en fait
faire passer f et g à droite et garder f−1 etg−1 à gauche, donc cela va nous amener à compiler f−1 et g−1 ,
donc des calculs "inutiles" il vaut donc mieux considérer le commutateur f −1 g−1 fg]. Donc on recherche
f tel que f−1 g−1 fg(e1 ) = λ.e1 , ce qui revient à fg(e1 ) = λ.gf(e1 ), i.e.
aα + cβ bα + dβ 1 aα + bγ aβ + bδ 1
= λ. (3.3)
aγ + cδ bγ + dδ 0 cα + dγ cβ + dδ 0
On constate que α et γ y apparaissent trois fois tandis que β et δ une seule fois.
Rmq
Ð
Ð On pourra évidemment suivre le raisonnement présenté dans [Per] p.104, qui suggère de prendre
Ð
Ð γ =0 et ainside suite... Mais en y réfléchissant un peu plus, on veut calculer fg d’un côté, avec
Ð α β
Ð f= on voit alors qu’en demandant que γ = 0, on obtient f triangulaire supérieure, alors
Ð γ δ
Ð
Ð le produit fg ne le sera pas tout à fait (voir (3.3)), d’un point de vue matricielle, e1 ne se présentera
Ð
Ð pas encore comme vecteur propre de fg, c’est en même temps rassurant car quel rôle jouerait alors
Ð
Ð gf ? Que l’on demande ensuite que cela soit égal à gf (modulo λ) en e 1 n’est qu’une contrainte
Ð
Ð supplémentaire que l’on s’était imposée pour pouvoir rester dans N, car à la base il s’agissait d’étudier
Ð
les commutateurs.
Aussi, on pourra remarquer par exemple dans la 1-ère équation de (3.4), qu’à cause de c 6= 0, on pourrait prendre
α, γ comme on veut et on pourra toujours compenser les choses pour conserver l’égalité et cela au moyen de β ; on
pourra également faire la même observation avec la 2-ième équation avec δ. Le seul point est que nos inconnues
α, β, γ et δ doivent aussi vérifier la contrainte αδ − βγ = 1, donc on ne peut pas non plus se permettre de faire ce
que l’on veut.
On devine par exemple que si α, γ font ce qu’ils veulent, β doit compenser alors pour la 1-ère équation de
(3.4), mais à cause de la contrainte imposée αδ − βγ = 1, on voit que δ sera figé par cette dernière contrainte et
ne pourra donc pas jouer la compensation nécessaire pour la 2-ième équation de (3.4).
Mais en fait on pourrait revenir à nos réflexes primaires : On a ici 4 variables pour trois contraintes, quelque part
il doit y avoir une variable "libre", [ma grande tergiversation est due à la remarque que je ferai plus bas à la page 33].
Comme cela a été fait dans l’établissement du Lemme 2.5 p.19, on va essayer de jouer à l’économie au niveau
des variables, i.e. au niveau du cardinal du corps k. Pour la variable "libre" que l’on aura choisie, on va bien entendu
lui attribué une des valeurs déjà présentes dans notre contexte à savoir 0, 1 ou −1, et ce qui serait intelligent c’est
bien entendu, après lui avoir attribuer une de ces valeurs, d’avoir des équations simplifiées, on pense évidemment
qu’avec la valeur 0 cela va bien raccourcir nos équations (c’est naturel, mais il ne faudra pas toujours penser que
c’est la meilleure des options). Enfin, si on adopte cette stratégie, il faudra bien entendu choisir la variable qui
apparaît le plus possible dans toutes nos équations... ! De cette petite escapade, on pense évidemment aux variables
α ou γ qui apparaissent le plus de fois :
† Si α = 0, alors on obtient −βγ = 1 6= 0, soit γ = −β−1 et le système (3.4) devient :
cβ = λbγ
(3.5)
aγ + cδ = λdγ
La 1-ère équation devient cβ2 = λb, on constate que cette équation peut éventuellement être impossible,
c’est par exemple si on a b = 0.. . . ! Essayons alors autre chose.
La 2-ième équation devient alors cδ2 = λc, puisque c 6= 0, cela devient δ2 = λ, ici cela semble un peu plus
réalisable (sous l’hypothèse que λ admette un racine carrée), i.e. il faudrait que λ ∈ k ∗ 2 \ {0, ±1} (notation
déjà utilisée juste après Thm.2.4 p.17).
C’est là que Perrin est allé un peu vite en besogne, il n’a pas précisé pourquoi lorsque card(k) ¾ 7, le
choix d’un tel λ était réalisable. Notons que tout corps a une certaine caractéristique qui en fonction de cette
caractéristique va contenir leur corps premier qui est soit Q soit un des corps F q . Remarquons alors que si λ
pouvait exister dans ce corps premier, il existera également dans le corps initial.. . . !
- Si car(k) 6= 0, alors un corps premier est de la forme Fq et sur un tel corps on poura consulter [Per] Prop.2.10
q−1
p.74 pour voir que l’on a card(F∗q 2 ) = , dans notre analyse il faudrait que F∗q 2 ait au moins 4 éléments,
2
i.e.
q−1
¾ 4 ⇔ q−1¾8 ⇔ q ¾ 7.
2
(λ − 1)a
aα + cβ = λaα ⇔ cβ = (λ − 1)aα ⇔ β= .
cδ
† On pourra voir que les autres discussions β = 0 ou δ = 0 nous mènent à des impasses, je laisse au lecteur le
soin de le vérifier.
On vient d’établir le résultat suivant :
Lem. 2.7
Si a b
card(k) ¾ 7, alors pour toute matrice g = ∈ SL(2; k) avec c 6= 0, il existe un élément
c d
f ∈ SL(2; k) tel que le commutateur f g fg ait une valeur propre λ 6= 0, ±1.
−1 −1
Revenons à nos moutons : Si donc g ∈ N n’admet pas de valeur propre qui soit différent de 0, ±1, alors par le
Lemme 2.7 précédent on va considérer un commutateur pour obtenir un autre élément de N qui lui aura bien une
valeur propre différente de 0, ±1 (cela sera effectivement possible si on est dans le contexte où card(k) ¾ 7), alors
on pourra apliquer le raisonnement précédent.
3 Traitons à présent le cas où g admet ±1 comme valeur propre, alors matriciellement dans une certaine base
±1 b 0 1
on aura g = avec b 6= 0 car on a pris g 6= ±id2 . Remarquons qu’avec f = qui
0 ±1 −1 0
±1 0
est en quelque sorte la permutation (1, 2), si on conjugue g par f on obtient fgf −1 = , on
−b ±1
reste toujours dans N et on est ramené dans la situation précédente 2 . Remarquons au passage qu’avec
la configuration de g au départ, on est déjà dans la configuration de la situation précédente, on avait déjà
signalé ça au moment où l’on avait supposé c 6= 0. Ici aussi, il faudra bien se placer dans la situation où
card(k) ¾ 7.
card(PGL(2, F3 )) 24
Et par ce même Lemme 2.3(3) on a card(PSL(2; F3 )) = = = 12, et grâce à
PGCD(n; q − 1) 2
det
suite exacte courte p.12 : 1 ,→→ PSL(E)PGL(E) → k /k ∗ ∗n
1 on en déduit que PSL(2; F3 ) est un
sous-groupe d’indice 2 dans S4 , on a donc
PSL(2; F3 ) = A4 ,
PSL(2; F4 ) = A5
PSL(2; F5 ) = A5
Rmq
Ð
Ð Pour finir je voudrai revenir sur un point que j’ai signalé après la remarque plus haute concernant ma "ter-
Ð
Ð giversation" : En effet, j’ai un peu hésité avant de revenir sur le réflexe naturel "Quatre variables pour trois
Ð
Ð contraintes, cela nous dit quelque part qu’il doit y avoir une variable libre" : Par définition SL(E) = det −1 (1)
Ð det
Ð c’est donc la fibre au dessus de l’application PGL(E) → k. Si on se place dans le contexte où k = F3 , l’ap-
Ð
Ð plication det a trois fibres au dessus de 0, 1 et −1, on penserait que les fibres seraient de même grosseur. Or
Ð
Ð card(GL(2; F3 )) = (32 − 1) × (32 − 3) = 8 × 6 = 48 et card(SL(2; F3 )) = (32 − 1) × 3 = 8 × 3 = 24, et c’est
Ð
Ð bien plus grand que 48/3 = 16. Autre façon : Si on pense d’un point de vue dimensionnel GL(2; F 3 ) serait
Ð
Ð de dimension 43 = 64, mais là également on trouve que 64 = 3 × 21 + 1, donc cela ne tombe pas "juste",
Ð
Ð donc les fibres dans ce cas là ne doivent pas être de même grosseur... ! C’était un souci qui m’était apparu
Ð dans l’étude approfondie de SL(2; F3 ) ' H8 o Z/3Z (cf. p.23).
34
Vocabulaire
dilatation, 3
GL(E), 2
GL(n; k), 2
groupe des quaternions H8 , 22
groupe diédral D4 , 22
groupe projectif linéaire, 13
homothétie, 12
k∗ 2 , 18, 31
PGL(E), 13
PSL(E), 13
τ(L, vf ), 6
transvection, 3
Ui,j , 4
Ui,j (λ), 4
35