28 mars 2011

4 messages - Retourner à l'article
  • La classification des textes

    le 28 mars 2011 à 11:07, par François Brunault

    Bonjour,

    Merci pour cet article très intéressant. Une petite remarque technique : vous mentionnez la terminologie « distance euclidienne » pour la distance intertextuelle. En fait, les trois propriétés (identité, symétrie, inégalité triangulaire) sont également vraies pour les distances non euclidiennes (telles que la distance sur la sphère). Il n’est donc pas clair pour moi à quel point la distance intertextuelle est « euclidienne ». De manière un peu plus précise, il me semble difficile de représenter l’ensemble des textes dans un espace euclidien (même de grande dimension) de manière à ce que les distances soient conservées...

    Répondre à ce message
  • La classification des textes

    le 28 mars 2011 à 12:47, par Caocoa

    Bonjour,
    Merci de ce bel article : on ne m’avait pas encore expliqué comment se servir des Maths pour l’étude de la littérature. C’est très intéressant.

    Répondre à ce message
    • Littérature ? Mathématiques ?

      le 28 mars 2011 à 13:06, par Michèle Audin

      on ne m’avait pas encore expliqué comment se servir des Maths pour l’étude de la littérature

      C’est plutôt des mots dans les textes que vraiment de littérature qu’il est question. Par exemple, le mot « lire » n’apparaît pas dans l’article et le mot « lecture » non plus.

      Littérature, disiez-vous ?

      Quant aux mathématiques, il me semble par exemple que la phrase

      Toutes ces distances – entre deux auteurs supposés différents - sont les plus faibles que l’on peut rencontrer dans l’œuvre d’un seul auteur, dans un même genre, quand cette œuvre s’étend sur trente ans.

      aurait peut-être été remplacée, par un auteur mathématicien, par quelque chose du genre :

      Toutes ces distances – entre deux auteurs - sont les plus faibles que nous ayons rencontrées dans les corpus que nous avons étudiés.

      Répondre à ce message
  • La classification des textes

    le 4 avril 2011 à 22:17, par Rémi Peyre

    Bonjour,

    Merci aux auteurs pour cette description minutieuse de leur méthode. J’avais déjà entendu parler de ces travaux, mais ne connaissais pas les détails, qui sont présentés ici de manière rigoureuse et claire.

    Un point m’intrigue : la distance intertextuelle utilisée dans cette méthode (compter les mots différents) est, si j’ose dire, extrêmement « primitive », et il est même stupéfiant à mes yeux qu’elle donne des résultats de cette qualité.

    Ce choix de distance est-il juste le « premier venu », ou s’est-il en fait imposé par comparaison avec d’autres méthodes ? Quelles distances concurrentes ont-elles déjà été testées ? (Vous mentionnez notamment la longueur des phrases). Peut-on envisager des techniques pour mieux faire ressortir l’impact de l’auteur par rapport au genre et au thème ?

    Répondre à ce message
Pour participer à la discussion merci de vous identifier : Si vous n'avez pas d'identifiant, vous pouvez vous inscrire.