Mathématiques et langages : le feuilleton de la rentrée
Écriture automatique 2.0
Le 11 septembre 2017 Voir les commentaires (4)
Grâce à l’informatique, l’angoisse de la page blanche ne sera-t-elle bientôt qu’un lointain souvenir ? Autrement dit, peut-on demander à un ordinateur d’écrire un texte original et cohérent par un procédé automatique ?
Dans son article A Mathematical Theory of Communication publié en 1948, Claude Shannon, dont on célèbre le centenaire de la naissance cette année (voir aussi ici) a proposé une méthode simple pour produire un texte aléatoire. On commence par choisir un livre de référence, par exemple À la recherche du temps perdu de Marcel Proust. On ouvre une page au hasard et on pose son doigt au hasard sur la page ; on écrit sur une feuille le premier mot de la phrase indiquée – par exemple : « Le ». On ouvre ensuite une autre page du livre au hasard et on cherche la première apparition de ce mot à partir de cette page – par exemple « soutenaient légèrement le plafond s’écartaient ». On écrit alors sur notre feuille le mot suivant du livre – ici, « plafond ». On choisit à nouveau une page du livre au hasard et on cherche la première apparition de « plafond » à partir de cette page – par exemple : « suspendu au plafond par des » et on écrit le mot « par » sur notre feuille... Et ainsi de suite jusqu’à tomber sur un point. La suite donne, par exemple : « Le plafond par des yeux de clouer ses instruments interchangeables d’un coup qui n’eût paru quelque message d’elle [...] ». L’ordinateur permet d’automatiser la procédure. Mais on aura du mal à faire passer la phrase obtenue pour du véritable Proust !
Depuis Shannon, d’autres méthodes plus élaborées ont été créées, dont certaines fondées sur le concept de « grammaire non contextuelle » introduit par le linguiste Noam Chomsky en 1956. Ces méthodes ont été récemment utilisées par le mathématicien Nate Eldredge pour créer le programme Mathgen, capable de produire automatiquement et en une fraction de seconde des articles formatés comme des articles de recherche en mathématiques, et qui ne contiennent que des phrases grammaticalement correctes, comme celle-ci : « la construction par Hito de domaines résolubles cocomplets d’Erdös a été une étape décisive dans le calcul elliptique. » Pour un profane, la différence avec un véritable article de recherche n’est sans doute pas flagrante, mais un mathématicien professionnel comprend très vite que le texte qu’il a sous les yeux n’a absolument aucun sens.
Ces galimatias ne devraient donc pas pouvoir aider à vaincre une crise d’inspiration. Pourtant, deux articles produits par Mathgen ont été acceptés pour publication dans des revues « scientifiques ». La publication dans ces revues se faisant aux frais de l’auteur, on peut imaginer que les éditeurs acceptent d’y publier tout ce qui ressemble de près ou de loin à des mathématiques, peu importe le contenu, et que le rapport d’expert, qui note que « les résultats obtenus sont originaux, nouveaux et intéressants » a lui aussi été produit par un procédé automatique... On est bien loin du fonctionnement standard des journaux scientifiques, dont les éditeurs, qui sont eux-mêmes des chercheurs, demandent à plusieurs spécialistes du domaine un rapport détaillé sur l’article avant de prendre leur décision. Face à la page blanche, en mathématiques comme ailleurs, inspiration et transpiration restent d’actualité !
N.B. L’article de Shannon de 1948 est considéré comme la fondation de la théorie de l’information. Outre la façon de décrire les textes présentée ici, il contient un contexte général pour penser un système de communication et les notions d’entropie de l’information et de redondance qui sont intensivement utilisées jusqu’à aujourd’hui. On peut le lire en ligne et il est analysé (en anglais) sur Wikipedia.
Ce texte appartient au dossier thématique « Mathématiques et langages ».
Partager cet article
Pour citer cet article :
Jérôme Germoni, Pierre-Antoine Guihéneuf, Frédéric Le Roux — «Écriture automatique 2.0» — Images des Mathématiques, CNRS, 2017
Laisser un commentaire
Dossiers
Actualités des maths
-
14 février 2020Bob Hummer, le mathémagicien fou (Paris, 20/02)
-
24 janvier 2020Maths & mesure – mesurer le monde (Poitiers, 2020)
-
23 janvier 2020Les nouvelles formes d’argent décentralisé : le Bitcoin et les cryptomonnaies (Montpellier, 29/1)
-
22 janvier 2020Topologie en sous-sol (Paris, 28/1)
-
13 janvier 2020Des tas de sable aux pixels, deux siècles et demi de transport optimal depuis Monge (Paris, 15/1, reportée !)
-
10 janvier 2020Rencontre avec Alecos Papadacos, auteur de Logicomix (Lyon, 16/1)
Commentaire sur l'article
Voir tous les messages - Retourner à l'article
Quand aura-t-on des textes cohérents ?
le 21 septembre 2017 à 17:55, par Carlo