Logo de l'OEP

Technologies linguistiques

Sur la traduction automatique (courrier des lecteurs) - Jean-Charles Vegliante (suite)

Last Updated: 10 Apr 2019

Suite au n° 72 de cette Lettre, j'avais envoyé une réaction à l'article du "Monde" sur la traduction et l'intelligence artificielle ; elle avait paru le 19 déc. 2017 sous le titre Sur la traduction automatique (courrier des lecteurs) - Dossier Le Monde - Sciences & médecine 29 novembre 2017. Depuis, à la suite d'un stimulant colloque sur "La traduction et les NdT" à Paris 10 - Nanterre, où la question a été entre autres choses soulevée, je me suis intéressé au logiciel bien plus performant du Deep Learning, dont une version simple est accessible en ligne sur DeepL Translator (https://www.deepl.com/translator). Il y a deux ans, j'avais testé les très rudimentaires traducteurs automatiques en ligne sur quelques vers de Pascoli. Ici, l'instrument s'étant bien perfectionné, j'essaie de voir le résultat avec un court poème très célèbre de Leopardi, L'infini in extenso ; en voici quelques résultats, et un minimum de réflexions.

L'infinito

Traduction Deepl (instantanée) :

Cette colline m'a toujours été chère,

Et cette haie, qui à bien des égards

Du dernier horizon que le guardo exclut.

Mais s'asseoir et regarder, entremêlé

Des espaces au-delà de ça, et des espaces surhumains

Silence et immobilité profonde

Dans la pensée que je me prétends, où, pendant un moment.

Ton cœur ne saigne pas. Et comme le vent

Je déteste prendre d'assaut parmi ces plantes, c'est moi qui suis celui qui

Silence infini à cette voix

Je vote en comparant : et je le serai pour toujours,

Et les saisons de la mort, et le présent

Et vivant, et le son d'elle. Donc, entre tout ça

L'immensité noie mes pensées :

Et l'épave est douce pour moi dans cette mer.

Traduit avec www.DeepL.com/Translator

… Le résultat - instantané - est tout simplement bluffant ! Certes, il y a encore beaucoup d'incohérences, sur lesquelles je n'insiste pas (le vers 9, qui convertit "Odo stormir tra quelle piante, io quello" est presque surréaliste), mais le vers 1 (où "ermo" est toutefois omis) n'est pas si mal (l'option passé composé fait preuve d'un prévisible bon aggiornamento stylistique) ; de même, l'avant-dernier vers, que l'on pourrait qualifier de correcte "modulation". La chute enfin, pour le célèbre "E il naufragar m'è dolce in questo mare", n'est pas sans intérêt aujourd'hui, avec cette métonymie entre le naufrage et l'épave (le sens de m' - dans m'è -, est aussi assez bien rendu ; et, avec quelques ajustements pourrait aider à mieux comprendre le mi fingo du v. 7, lequel pose aussi des problèmes aux traducteurs humains)…

Dans cette conversion instantanée, seul manque "guardo" ; mais on peut cliquer sur le mot, et une autre suggestion apparaît alors : guéridon… [sic]. J'ignore selon quels critères certains mots sont laissés tels quels (il en va de même avec les petits sites de traduction Google, Systran ou autres, utilisés dans le courrier cité de déc. 2017)…

On peut aussi essayer de piéger la machine, avec un faux, où "colle" devrait changer de sens (de "colline" à "col") et où un mot rare est introduit :

Sempre caro mi fu quest'erto colle

E questa rua che tra due sì strette

Pareti sale verso il cielo innube.

résultat :

Cette colline escarpée m'a toujours été chère.

Et cette rue qui entre deux si étroites

Les murs s'élèvent vers le ciel nuageux.

Ici, la conversion s'est faite en deux temps (très rapprochés) : en un premier temps, la machine avait laissé "rua" tel quel ; puis l'a converti en "rue" ; pour en avoir le coeur net, j'ai donc cliqué sur le mot "rue", et elle m'a suggéré route ou ruelle. Je suppose que la proximité de "colle" (tjs. compris par le système comme colline) a orienté le traducteur vers "route" ; puis que la détermination de "strette" l'a orienté vers "ruelle"… On voit que tel ou tel composant se combine et réoriente (très vite) "intelligemment" la conversion dans l'autre langue. C'est le principe même du Deep Learning, je crois, ici bien illustré…

Restent, cela dit les incohérences. Elles sont syntaxiques et de grammaire du texte pour l'essentiel : dans la première conversion, la relative du vers 3 ; dans la brève (expérimentale) seconde, la fausse autonomie du vers 2, entraînant le décrochage du 3° vers (un peu comme si la machine analysait séparément chaque fragment de 7 ou 8 mots, sans faire toujours le lien entre eux). On avait dit, au colloque cité, que les résultats optimaux concernent des phrases de moins de 10 mots en effet.

Conclusion : Vu la rapidité sidérante du processus, nous (traducteurs humains) avons bien du souci à nous faire ; au vu des résultats, y compris lexicaux (ils sont là tellement évidents que je n'en ai pas parlé) mais surtout de grammaire textuelle, de cohérence, nous avons encore quelques beaux jours devant nous. Il faudra sans doute résister à la tentation de la vitesse, exigée de plus en plus par nos employeurs. Mais ça, c'est une autre histoire.

(Je signale l'existence - un peu confidentielle - d'une anthologie de traductions de L'infinito en français récemment publiée : L’infini (éd.Pascale Roux), Droue-sur-Drouette, La Pionnière, 2018, pour qui voudrait poursuivre le travail de comparaison).

J.-Charles Vegliante