Le paradoxe de Banach-Tarski

Le théorème de Banach-Tarski est un paradoxe au sens où il défie l’intuition. Il affirme qu’en partant d’une boule (dans un espace à 3 dimensions) il existe une décomposition de cette boule en un nombre fini de morceaux qu’on peut rassembler pour former deux boules identiques à l’originale, à un déplacement près. La clé de ce paradoxe repose sur le fait que ces ensembles ne soient pas mesurables, ces boules n’ayant en effet pas de volume à proprement parler.banachtarski

Ce site en fait une démonstration si limpide, qui bien que simplifiée couvre l’essentiel de l’idée, que je ne peux résister à vous en faire la traduction.

Vous prenez une balle, vous la découpez, et vous rassemblez les morceaux en deux balles de la même taille que la première. Cela semble fou, et à raison ! Si ce théorème marche pourtant, c’est parce qu’il s’applique à des objets mathématiques et non à des objets physiques. En particulier, il repose sur certaines propriétés des nombres réels : le fait qu’il en existe une infinité, et qu’on ne peut les associer un à un aux nombres entiers. Voyons ça de plus près.

Dans une sphère physique, une balle de tennis par exemple, il n’y a pas une infinité d’atomes, seulement un nombre fini qu’on peut séparer et réarranger. Manipuler les nombres réels donne des résultats différents. Combien y a-t-il de nombres réels entre 0 et 1 ? Une infinité. Tellement même qu’on ne pourrait les associer un à un aux nombres entiers. Combien y en a-t-il entre 0 et 2 ? Une infinité encore, mais…

Considérons une fonction qui multiplie les nombres par 2. Si l’on applique cette fonction à un nombre x entre 0 et 1, on multiplie ce nombre par 2 et le résultat y se trouve entre 0 et 2. De plus, pour chaque nombre y entre 0 et 2, il y a exactement un nombre x entre 0 et 1 qui quand on le multiplie par 2 donne y (ce nombre étant y/2).
Ainsi, les nombres réels entre 0 et 1 peuvent être associés un à un aux nombres réels entre 0 et 2 (les deux ensembles [0;1] et [0;2] sont en bijection, on dira qu’ils sont équipotents). Si dans un sens, intuitivement, il y a deux fois plus de nombres entre 0 et 2 qu’il y en a entre 0 et 1, dans un autre il y a exactement le même nombre de nombres entre 0 et 2 qu’entre 0 et 1.
Cette notion d’équipotence mériterait un article entier pour être traité plus en détail (et peut-être que j’y reviendrai), mais ça nous servira de base pour aborder, à travers les ensembles infinis de nombres, le théorème de Banach-Tarski.

On a vu qu’en appliquant une fonction comme la multiplication on pouvait associer des nombres d’un certain ensemble d’une certaine taille (ou similairement des points d’une ligne entre deux extrémités) un à un à des nombres d’un ensemble d’une autre taille. Mais la multiplication est par nature quelque chose qui étire la taille des choses. Pour démontrer le théorème de Banach-Tarski, il nous faut une association analogue qui utilise une opération qui n’étire pas les choses.
L’opération que nous allons utiliser est la rotation en trois dimensions. Si vous prenez un objet en trois dimensions et que vous le tournez, il ne s’étire pas ni ne se réduit, n’est-ce pas ?
Le reste de la démonstration va se dérouler en ignorant quelques détails. Ils devraient être traités dans une démonstration formelle, mais le but de cet article n’est pas de fournir une démonstration formelle, juste de montrer l’idée globale derrière. Allons-y !

Considérons une sphère. Pour prendre un exemple familier, disons la Terre (ne chipotons pas et oublions les anomalies et aplatissements de notre globe). Une sphère parfaite donc.
On va imaginer notre Terre en rotation autour de différents axes. Le premier qui nous vient à l’esprit est l’axe actuel de rotation qui passe par les pôles nord et sud. Il nous en faut un deuxième, à angle droit de celui-là. Prenons l’axe qui passe à travers l’équateur, passant par le méridien de Greenwich d’un côté et le 180e méridien de l’autre, tel qu’en faisant pivoter la Terre autour de cet axe les pôles nord et sud viennent tourner autour du centre.

Ok, imaginons que l’on fait tourner la Terre autour de ces axes d’un angle très précis. On peut le faire plusieurs fois, mais à chaque fois que l’on tourne la Terre, on le fait de cet angle uniquement. Cet angle que l’on choisit arbitrairement doit par contre être un nombre irrationnel de degrés, donc ça ne peut être un nombre rationnel.

On rappellera qu’un nombre rationnel est un entier divisé par un autre. Par exemple, 5/8, 2 (soit 2/1) ou -3-4/9 (soit -31/9). Un nombre rationnel peut être représenté par un nombre dont les décimales se terminent après un nombre fini de décimales, ou bien dont les décimales forment une séquence de nombres qui se répètent à l’infini (reprenant les exemples du dessus, 0.625, 2.0 et -3.444…). Un nombre irrationnel est un nombre qui ne peut pas être écrit comme un entier divisé par un autre. Représenté comme un nombre décimal, un nombre irrationnel a ses décimales qui ne s’arrêtent jamais ni ne forment une séquence répétée. Par exemple, la racine carrée de 2, le nombre π (=3.1415926…) ou le logarithme de 7 sont irrationnels.

Si l’on choisissait un nombre rationnel de degrés, soit p/q degrés, en appliquant la rotation q fois autour du même axe, on arriverait à une rotation équivalente de p degrés. Comme il y a 360° dans une rotation complète, si l’on appliquait notre rotation 360q fois, la Terre se retrouverait à l’exacte même orientation qu’au départ, et c’est quelque chose qu’on ne veut pas pour notre démonstration.
En prenant un nombre irrationnel pour l’angle de notre rotation, on se garantit que quelque soit le nombre de rotations appliquées, la Terre ne reviendra jamais à son angle initial (c’est juste une autre façon de voir la propriété comme quoi en multipliant un nombre irrationnel par un nombre entier, on n’obtient jamais un nombre entier. Étant la définition même d’un nombre irrationnel, on sait que c’est vrai). On peut se rapprocher extrêmement près de l’orientation de départ, mais jamais on y sera précisément.

La seule exception est si l’on applique des rotations inverses pour annuler les rotations initiales. Si l’on tourne 6 fois en avant, puis 6 fois en arrière, on revient au point de départ.
L’autre point intéressant est que lorsqu’on combine des rotations autour des deux axes, on ne revient jamais au point de départ non plus, quelque soit l’ordre ou le nombre de rotations effectuées. La seule exception étant encore d’appliquer la séquence inverse pour annuler la séquence initiale.

Ok, on va avoir besoin de quelques notations mathématiques maintenant. Juste un peu, rien d’effrayant.
Appelons A l’opération « tourner de l’angle choisi autour de l’axe nord-sud de la Terre dans la direction normale ». L’opération inverse « tourner de l’angle choisi autour de l’axe nord-sud de la Terre dans la direction inverse » sera A’.
La notation usuelle pour l’inverse est l’exposant -1, mais wordpress ne va pas me laisser l’utiliser facilement, alors je vais prendre le signe prime (ce qui ne devrait pas dépayser les amateurs de Rubik’s cube :p) à la place. L’opération inverse est celle qui combinée à l’opération initiale (on tourne dans une direction, puis dans l’autre du même angle) nous ramène au point de départ.
Il nous reste à nommer deux autres opérations, s’appliquant autour de l’équateur. « Tourner de l’angle choisi autour du nouvel axe dans le sens horaire en regardant l’Afrique » sera B. Et son inverse dans le sens antihoraire sera B’.

On peut ainsi écrire une suite de rotations avec ces quatre variables. On les lira de gauche à droite. Par exemple, la suite AB’A’BB veut dire :
– tourner de l’angle choisi autour de l’axe nord-sud dans le sens normal, puis
– tourner de l’angle choisi autour de l’équateur dans le sens antihoraire, puis
– tourner de l’angle choisi autour de l’axe nord-sud dans le sens inverse, puis
– tourner de l’angle choisi autour de l’équateur dans le sens horaire, puis
– tourner de l’angle choisi autour de l’équateur dans le sens horaire.

Toute suite de rotations peut ainsi s’écrire comme une suite d’une de ses quatre opérations. Un petit détail cependant, si l’on voit une opération et son inverse l’une à côté de l’autre, ses deux opérations s’annulent l’une et l’autre et on les retire de la suite. Par exemple, la suite AB’BAA’BA’ peut se simplifier en ABA’.
Avec ces notations, on peut revenir de façon plus précise sur le fait qu’on ne pourra jamais revenir à son point de départ, quelle que soit la chaîne de rotations effectuées. Les suites AAB, ABA et BAA donnent des rotations différentes de la Terre. De même, quelque chose comme ABA’ ne donne pas le même résultat que B, on ne peut pas annuler des rotations inverses s’il y a quelque chose entre (Prenez par exemple un dé à 6 faces et des rotations à 90° pour tester ce résultat).
C’est bon jusque là ?

Considérons maintenant l’ensemble de toutes les rotations possibles autour de la Terre (suivant nos contraintes). Appelons cet ensemble S. Puisqu’on ne peut tourner la Terre que de notre angle, autour de deux axes, en avant ou arrière, ça veut dire que toutes les rotations peuvent s’écrire comme une suite de A, B, A’ et B’. Comme on ne peut revenir au point de départ (l’angle étant irrationnel), une chaîne de symboles peut être aussi longue que l’on veut, et en supposant que l’on a retiré toutes les paires d’inverses qui s’annulent (simplifiant chaque chaîne à son écriture la plus courte), cette chaîne donnera toujours une nouvelle orientation unique. Il y a ainsi un nombre infini de chaînes, et un nombre infini d’orientations.
Divisons cet ensemble S entre quatre sous-ensembles :
1. L’ensemble des rotations qui commencent par A – appelons-le (ens. 1).
2. L’ensemble des rotations qui commencent par B – appelons-le (ens. 2).
3. L’ensemble des rotations qui commencent par A’ – appelons-le (ens. 3).
4. L’ensemble des rotations qui commencent par B’ – appelons-le (ens. 4).

Ça a l’air assez simple. Quelle taille ont ces ensembles ? Chacun contient un nombre infini de possibilités, ils sont donc de taille infinie. Mais il semble raisonnable de penser qu’ils ont tous la même taille. On a divisé notre ensemble S de toutes les rotations possible en quatre morceaux « égaux ».

Prenons (ens. 3), l’ensemble des rotations qui commence par A’. La première opération dans chacune de ses rotations est A’, mais ça ne nous dit rien sur ce qu’est la deuxième opération. Excepté que ça ne peut être A, parce que la rotation commencerait alors par A’A et que ça s’annulerait et serait retiré de la chaîne. Donc la deuxième opération dans chacune des rotations de (ens. 3) est B, A’ ou B’.

Tournons la Terre par l’opération A. C’est bon ? Regardons nos ensembles de rotations. Toutes les rotations sont les mêmes, avec un A placé devant.
Examinons (ens. 3) encore. Toutes les rotations de (ens. 3) sont les mêmes qu’avant, mais avec un A placé devant. Mais les rotations de (ens. 3) commençaient toutes par A’. Ainsi elles commencent toutes désormais par AA’. Ces deux opération s’annulent et on peut les retirer. Ce faisant, la première opération d’une rotation de (ens. 3) est maintenant l’ancienne deuxième opération. Mais cette deuxième opération des rotations de (ens. 3) est soit B, A’ ou B’. Donc (ens. 3), après avoir tourné la Terre par A, comprend toutes les rotations des ensembles 2, 3 et 4 !

En d’autres mots, par une simple rotation de la Terre par A, on a transformé l’ensemble des rotations (ens. 3) en l’ensemble des rotations (ens. 2) plus (ens. 3) plus (ens. 4).
Arrêtons nous pour réfléchir à ce que ça veut dire pour chacune des rotations possibles, l’ensemble S.
On a commencé en divisant S en quatre morceaux, (ens. 1), (ens. 2), (ens. 3) et (ens. 4). Ainsi on peut dire :
S =  (ens. 1) + (ens. 2) + (ens. 3) + (ens. 4)

Jusque là ça va. Mais on vient juste de voir qu’en tournant la Terre par A, on transformait (ens. 3) en (ens. 2) plus (ens. 3) plus (ens. 4). Ainsi on peut écrire :
S = (ens. 1) + (ens. 3 après avoir tourné la Terre par A)
On n’a plus besoin de (ens. 2) ou de (ens. 4) ! Aussi, de façon similaire, en tournant la Terre par B à la place de A, on transformerait (ens. 4) en (ens. 1) plus (ens. 3) plus (ens. 4), et ainsi écrire :
S = (ens.2) + (ens. 4 après avoir tourné la Terre par B)

Au final, qu’est-ce qu’on a montré ? Que si on prenait l’ensemble S de toutes les rotations possibles autour de la Terre (suivant nos contraintes), on pouvait les diviser en quatre sous-ensembles. Par une rotation de l’un de ses ensembles par A, et d’un autre par B, on peut combiner deux de ces ensembles pour générer S, et on peut combiner les deux autres pour générer une autre copie complète de S.

Très bien, mais on parle juste d’ensemble de rotations, pas de parties réelles de la Terre. Mais on a fait le plus gros du travail. Considérons maintenant des points à la surface de la Terre. Par « point » ce n’est pas des endroits comme « Paris » ou « la Tour Eiffel », mais des points mathématiques comme 34.432913…° N, 127.348762…° W. Chaque latitude et longitude distinctes forment donc un point, et la latitude et la longitude peuvent être tout nombre réel dans leur écart respectif de valeurs (et avoir un nombre infini de décimales).

Prenons un point à la surface de la Terre, peu importe où. Quand on applique à ce point la rotation A (tournant juste ce point autour du centre de la Terre cette fois, et pas la Terre toute entière), on se retrouve avec un nouveau point à la surface de la Terre. De même si l’on tourne par B, A’, ou AB’A’BB, ou n’importe quelle autre rotation de notre ensemble S. Imaginons tous les points possibles à la surface de la Terre que l’on peut atteindre en appliquant toutes les rotations possibles de S à notre point de départ. C’est un ensemble infini de points, répartis très densément sur toute la surface de la Terre (dans chaque millimètre carré de la Terre, il y aura une infinité de ces points).

Mais ce n’est pas nécessairement tous les points de la Terre. Il y a également une infinité de points que l’on ne peut pas atteindre partant de notre point de départ et en appliquant n’importe quelle rotation de S. Prenons donc un autre point parmi ceux-là. Et imaginons l’ensemble de tous les points que l’on peut atteindre partant de ce point-ci en lui appliquant les rotations de S. C’est un autre ensemble de points à la surface de la Terre. Vous l’aurez deviné, il y a encore des points non atteints. Prenons-en un autre et appliquons-lui S…

Il faudrait ainsi prendre une infinité de points de départ pour être sûr d’atteindre tous les points à la surface de la Terre en utilisant les rotations de S. Mais ce n’est pas un problème. En fait, on a coupé la surface de la Terre en une infinité d’ensemble de points, chaque « tranche » étant composée de points dont on peut se déplacer de l’un à l’autre par une rotation de S ; et il est impossible de se déplacer d’un point d’une tranche vers un point d’une autre tranche par une rotation de S.

Allons plus loin. Créons un nouvel ensemble de points, appelons le M. Cet ensemble M sera composé d’exactement un point de chaque tranche précédemment définie. Peu importe quel point on choisit, tant que l’on en prend un et un seul dans chaque tranche. Si l’on peut faire cela, c’est grâce à l’axiome du choix.

Petit aparté sur l’axiome du choix. Un axiome est en mathématiques une vérité première, une propriété indémontrable qui sert de base à un système de logique. xkcdsetL’axiome du choix s’énonce ainsi : « Étant donnée une famille non vide d’ensembles non vides, il existe une fonction, appelée fonction de choix qui à chacun d’entre eux associe un de ses éléments. ». Cet axiome est assez controversé, et optionnel, notamment parce que s’il affirme l’existence d’un objet, il ne donne aucune façon de le trouver. C’est pourquoi, même si la plupart des mathématiciens l’utilisent sans réticence, d’autres éviteront d’y avoir recours quand ils le peuvent. Cet axiome sert particulièrement lorsqu’il faut faire un choix dans un ensemble infini (il n’est pas nécessaire dans un ensemble fini), ce qui est le cas pour le théorème de Banach-Tarski.

Bref l’axiome du choix nous permet de créer cet ensemble M qui va se révéler très intéressant.
Pensez à n’importe quel point à la surface de la Terre. Il y a exactement un point dans l’ensemble M à partir duquel on peut appliquer une rotation de S pour obtenir votre point. C’est vrai parce que c’est ainsi que l’on a défini M. Ainsi, on peut atteindre n’importe quel point à la surface de la Terre en commençant d’un point précis de M et en lui appliquant une rotation particulière de S, et on ne peut l’atteindre en commençant d’un autre point ou en utilisant une autre rotation.

Maintenant, divisons la surface de la Terre en quatre parties :
1. La partie des points que l’on peut atteindre commençant d’un point de M et utilisant uniquement une rotation de (ens. 1). Appelons-la (partie 1).
2. La partie des points que l’on peut atteindre commençant d’un point de M et utilisant uniquement une rotation de (ens. 2). Appelons-la (partie 2).
3. La partie des points que l’on peut atteindre commençant d’un point de M et utilisant uniquement une rotation de (ens. 3). Appelons-la (partie 3).
4. La partie des points que l’on peut atteindre commençant d’un point de M et utilisant uniquement une rotation de (ens. 4). Appelons-la (partie 4).

La surface de la Terre est la somme de ces quatre parties :
Surface de la Terre = (partie 1) + (partie 2) + (partie 3) + (partie 4)

Mais que se passerait-il si l’on tournait la Terre par A ? L’ensemble des rotations (ens. 3) devient égal à (ens. 2) + (ens. 3) + (ens. 4), comme on l’a montré plus haut. Donc (partie 3) devient égal à (partie 2) + (partie 3) + (partie 4). Et on a :
Surface de la Terre = (partie 1) + (partie 3 après avoir tourné la Terre par A)

De même, en tournant par B on obtient :
Surface de la Terre = (partie 2) + (partie 4 après avoir tourné la Terre par B)

Donc on a coupé la surface de la Terre en quatre parties. Si l’on tourne l’une de ces parties d’une certaine façon, on peut la combiner avec une autre de ces parties pour obtenir la surface totale de la Terre. Et avec les deux parties restantes, en tournant l’une d’elles d’une certaine façon, on peut les combiner pour obtenir une autre copie complète de la surface de la Terre.
On se rapproche de la fin là ! Il nous reste à étendre cela au volume de la Terre, ce qui est relativement simple. Pour chaque partie de la surface de la Terre, prenons le volume de la xkcdaxiomTerre égal à cette partie plus tout l’espace sous les points de cette partie jusqu’au centre de la Terre. On a ainsi quatre volumes :
1. Le volume de la Terre de et sous (partie 1). Appelons-le (volume 1).
2. Le volume de la Terre de et sous (partie 2). Appelons-le (volume 2).
3. Le volume de la Terre de et sous (partie 3). Appelons-le (volume 3).
4. Le volume de la Terre de et sous (partie 4). Appelons-le (volume 4).

On peut diviser la Terre en ces quatre volumes :
Terre = (volume 1) + (volume 2) + (volume 3) + (volume 4)

Et vous l’aurez deviné :
Terre = (volume 1) + (volume 3 après avoir tourné la Terre par A)
et :
Terre = (volume 2) + (volume 4 après avoir tourné la Terre par B)
Ta da !

Il resterait quelques détails à traiter. Avec ces notations on a vu que l’on pouvait diviser une sphère en quatre parties et les rassembler en deux sphères de même taille. Le théorème de Banach-Tarski montre qu’il en faut en fait cinq. En effet la partie supplémentaire contient tous les points « mis de côtés ». Ces points comportent le centre de la sphère (qui ne peut être inclus dans aucun des volumes définis plus haut), les points des axes de rotations (qui ne bougent pas quand on leur applique la rotation de leur axe). Y sont également les points de l’ensemble M lui-même, qu’on ne peut atteindre en partant d’un point de M et en appliquant une rotation (la rotation qu’on aurait besoin d’appliquer est la rotation « nulle » consistant en une chaîne de zéro A, B, A’, B’. Bien que ça soit une opération valide, elle n’est pas incluse dans l’ensemble des rotations commençant par chacun de ces symboles, puisqu’elle n’a aucun symbole). Ces détails ne ruinent pas la démonstration du théorème, juste qu’il faudrait les traiter pour une explication plus complète.

Bon, vous êtes soit émerveillés d’avoir tout compris, ou vous êtes perdus quelque part entre ces lignes (je m’en excuse alors), ou bien vous vous dites qu’il doit y avoir quelque chose de faux quelque part, parce que c’est impossible que ça soit vrai.

Il est important de redire que c’est un résultat mathématique, qui ne s’applique qu’à des sphères en trois dimensions, infiniment divisibles. On ne peut pas l’appliquer à la Terre (en excluant le côté pratique), parce que la Terre est composée d’un nombre discret (fini) d’atomes. Les parties et volumes décrites plus haut ne sont pas de simples objets facilement visualisables, ils sont constitués d’ensembles dispersés d’un nombre infini de points. Ce serait plus un motif fractal qu’une orange.

Une des choses que nous dit le théorème de Banach-Tarski est que le concept de volume d’un objet mathématique à trois dimensions n’est pas aussi facilement défini que l’intuition laisserait paraître. C’est même un problème bien connu en mathématiques, il est extrêmement difficile de définir le volume d’un objet mathématique de façon à ce qu’il correspond au volume tel qu’on le connait. Les amateurs de théorie de la mesure savent ce qu’il en est.

Je le redis aussi, ici n’est montrée qu’une démonstration simplifiée et les détails les plus délicats ont été laissés de côté, mais ça ne change pas le résultat du théorème de Banach-Tarski.

Merci encore à David Morgan-Mar pour son explication si claire.

banachtarski2

Publicités
Cet article, publié dans Maths, Paradoxe, est tagué , . Ajoutez ce permalien à vos favoris.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s