En août 2017, Deepl Translator, le nouveau traducteur automatique qui se nourrit de la formidable base de donnée de Linguee, fait une entrée remarquée dans la webosphère. De nombreux médias européens et américains l’ont testé et ne tarissent pas d’éloge.
Sommaire
Qui se cache derrière Deepl ?
DeepL est une start-up basée à Cologne qui vient bousculer le marché de la traduction. Le lancement de son outil de traduction automatique n’a laissé personne indifférent.
Depuis des années, géants du Web et start-up spécialisées s’affrontent, à grand renfort de communiqués triomphants, pour affirmer que leur outil de traduction automatique est supérieur aux autres. Dernier épisode en date : le lancement de DeepL, mardi 29 août, une société européenne qui revendique un service « trois fois plus performant que celui de Google ». Malgré la nouveauté du nom, elle n’est pas inconnue puisqu’elle propose déjà le dictionnaire en ligne linguee.com. (Le Monde)
Le marché de la traduction est un marché qui brasse des milliards. David vient narguer Googliat.
Le marché des services de traduction et des dictionnaires de toutes sortes représente un milliard d’euros rien qu’en Allemagne. Selon le cabinet de conseil Common Sense Advisory, ce projet générera un chiffre d’affaires d’environ 35 milliards d’euros dans le monde. On estime que 80% des entreprises industrielles allemandes ont besoin de services d’interprétation et de traduction. Selon l’Association fédérale des interprètes et traducteurs, il y a environ 40 000 interprètes et traducteurs en Allemagne. Les possibilités techniques autour des ordinateurs et des logiciels ont provoqué un grand retentissement dans l’industrie. (FAZ – traduction DeepL)
DeepL ne sort pas du néant. En fait, son fondateur, Gereon Frahling, un ancien chercheur chez Google (tiens, tiens !), est également le père de Linguee, un dictionnaire en ligne bilingue gratuit, présent sur le marché depuis huit ans et qui prend en charge une vingtaine de langues.
En entrant un mot ou une expression, Linguee propose une traduction, des synonymes et des dizaines de textes contenant l’expression recherchée. Linguee reçoit environ deux milliards de demandes de traduction par an et a, grâce à cela, accumulé un énorme trésor de données. Un trésor qui alimente le système DeepL avec des milliards de traductions.
Quels sont les atouts de Deepl ?
Un projet ambitieux
Au départ disponible gratuitement en sept langues, à savoir l’anglais, le français, l’espagnol, l’italien, le néerlandais, le polonais et l’allemand. Le russe et le portugais sont venus compléter l’offre en 2018, puis le mandarin et le japonais en 2020. Et chaque année de nouvelles langues sont ajoutées. Depuis mars 2021, l’outil prend en charge treize nouvelles langues européennes : bulgare, tchèque, danois, estonien, finnois, grec, hongrois, letton, lituanien, roumain, slovaque, slovène et suédois.
Par comparaison, Google Translation supporte actuellement 103 langues et Bing Translator 60.
DeepL est capable de traduire n’importe quel type de texte : une pièce de Shakespeare, un poème de Goethe, des rapports boursiers, des essais scientifiques aussi bien que des articles de journaux. Ok me direz-vous. Mais en quoi cela vaut-il mieux que Google Translate, Bing Translator ou d’autres ?
Testez l’outil, vous verrez, il n’y a pas photo ! D’ailleurs Deepl n’a pas hésité à réaliser un blind test en août 2017.
DeepL Traducteur, Google Traduction, Microsoft Traducteur et Facebook reçoivent chacun 100 phrases à traduire. Des traducteurs professionnels évaluent ensuite les différentes traductions, sans savoir de quel système de traduction en ligne ces dernières proviennent. Les testeurs choisissent DeepL trois fois plus souvent que les autres services de traduction. Voici les résultats d’un test effectué en août 2017 :
DeepL propose aussi de traduire en un clic des fichiers Microsoft Word (.docx) et PowerPoint (.pptx). Tous les éléments du document, y compris le corps du texte, les titres, les légendes et même les notes de bas de page, sont traduits dans la langue de votre choix. Le formatage original est également conservé. Et depuis le printemps 2021, DeepL peut également traduire des documents au format PDF.
DeepL pour Deep Learning.
En 2017, l’entreprise Linguee est rebaptisée DeepL, reflétant ainsi la volonté de son fondateur de concentrer ses efforts sur la recherche dans le domaine du Deep Learning et de développer des produits sur base de réseaux neuronaux sophistiqués.
Le système s’appuie sur des années d’expérience en matière d’apprentissage machine pour le traitement du langage naturel et est capable d’entraîner ses propres réseaux neuronaux sur base de milliards de traductions de haute qualité collectées par les « Linguee Crawlers » (les algorithmes utilisés par Linguee pour collecter les traductions sur le web). (Deepl)
DeepL, champion de la NMT
Depuis deux ans, la traduction automatique neuronale (NMT) est le nouveau graal de la communauté MT (Machine Translation).
Afin d’entraîner nos réseaux neuronaux de traduction, nous avons construit un superordinateur en Islande, capable d’effectuer plus de 5 100 000 000 000 000 d’opérations à virgule flottante par seconde. Cette performance nous classerait à la 23e place dans la liste des 500 superordinateurs les plus puissants au monde.
Les performances d’un réseau neuronal dépendent de la qualité de son matériel d’entrainement. Les réseaux neuronaux de DeepL s’entrainent sur des milliards de segments de traduction de haute qualité issus du moteur de recherche de Linguee. DeepL possède ainsi un avantage décisif sur ses concurrents. (Deepl)
Les géants technologiques ont également entamé leur transition vers NMT. Google a bien compris l’intérêt d’utiliser les réseaux neuronaux, sur lesquels il s’appuie depuis fin 2016 pour certaines langues, traduisant des phrases entières plutôt que des suites de mots.
Les géants de la technologie Google, Microsoft et Facebook appliquent les leçons de l’apprentissage automatique à la traduction, mais une petite entreprise appelée DeepL les a tous dépassés et mis la barre plus haut encore. Son outil de traduction est aussi rapide que celui des poids lourds du secteur, mais plus précis et nuancé que tous ceux que nous avons essayés. (TechCrunch)
Le système DeepL reconnaît automatiquement la langue source. Il fonctionne comme un cerveau : non seulement il peut calculer et traiter d’énormes quantités de données, mais il peut aussi corriger ses erreurs et s’optimiser. Deepl est équipé d’un « crawler » qui recherche sur Internet des textes bilingues, les analyse et les décompose en parties constitutives, paragraphes, paires de phrases et mots. Il les évalue en fonction de la qualité de la traduction. Il apprend avec eux.
Le secret d’une traduction machine de qualité repose entre autres sur la richesse de sa base de données. Deepl a la chance de pouvoir puiser dans la formidable base de données de Linguee.
Deepl Pro, toujours plus loin
- Depuis mars 2018, DeepL Pro offre une API pour les développeurs, un plug-in à intégrer à des CMS comme WordPress ainsi qu’un service de traduction en ligne optimisé.
- DeepL Pro s’adresse également aux traducteurs professionnels utilisant déjà des logiciels de TAO. Il s’intègre par exemple directement à SDL Trados Studio 2017®.
- Les abonnés à DeepL Pro bénéficient en outre d’une excellente protection des données : leurs textes et traductions ne sont pas conservés. La confidentialité des informations transmises par les abonnés est par conséquent assurée.
Traduction automatique vs traduction humaine
Le match n’est pas nouveau, d’autant que l’enjeu économique est énorme, comme on l’a vu. La question clé que tout le monde se pose : un traducteur automatique parviendra-t-il à atteindre la qualité d’une traduction humaine ? Difficile à dire car même si la machine apprend et se perfectionne, un bon traducteur prend en compte tellement de paramètres qui n’ont rien de linguistiques.
Le contexte est souvent essentiel. Un bon traducteur professionnel traduit en fonction du client, du public cible, de la finalité de la traduction, du canal de diffusion, de l’âge du destinataire, etc. Selon les mots même du créateur de DeepL, les traducteurs ont encore 20 ans devant eux avant que la NMT ne leur fasse vraiment concurrence. En fait, ils doivent voir DeepL comme un allié plutôt que comme un concurrent. Une utilisation maline de la NMT pourrait en effet doubler leur vitesse de production.
Ce qu’en pensent les médias
- DeepL schools other online translators with clever machine learning (TechCrunch)
- Besser als Google (FAZ)
- Deepl traduttore: dalla Germania un’alternativa a Google Translate (La Stampa)
- ¿Cuál es el mejor servicio de traducción online? DeepL quiere desterrar a Google (ABC)
En conclusion
J’ai testé l’application dans plusieurs configurations linguistiques … et j’avoue, elle est bluffante !
Certes DeepL n’est pas parfait mais il traduit de nombreux textes bien plus intelligemment que la concurrence. Principalement parce que ce logiciel tente d’appréhender les mots dans leur contexte, tandis que les services de Google ou Bing traduisent le plus souvent mot à mot, littéralement.
J’expérimente présentement deepL pour traduire un brevet français vers l’anglais. Je suis un Professeur d’université en Physique qui parle anglais, mais pas du tout un interprète professionnel. Je dois toutefois écrire en anglais fort souvent.
deepL est tout simplement prodigieux pour obtenir un brouillon,évidemment en un anglais plein de charabia et de sabir, mais sur lequel on peut faire simplement du »rewriting », de la réécriture. Quel temps gagné !
Merci pour votre retour d’expérience.
Vous avez tout à fait raison. Deepl est excellent pour « pré-traduire » un texte.
Il ne remplace en aucun cas un traducteur professionnel mais il fait gagner un temps précieux à tous ceux qui, comme vous, sont amenés à rédiger en anglais pour leur profession.
C’est bien dans ce contexte que je le recommande !
J’avoue ne pas très bien comprendre les deux messages précédents car il y a un grave problème dont on ne semble pas tenir compte : la confidentialité. Je rappelle cet avertissement que je prends sur un blog de traducteurs : « le fait de faire traduire par Google un document le fait automatiquement entrer dans sa base de données, et il devient ainsi sa propriété ». Il m’arrive d’avoir recours à Google Traduction ou deepL pour traduire un texte appartenant ou presque au domaine public, mais je ne m’y risquerais pas pour une traduction professionnelle.
Bonjour,
Vous faites référence à un débat vieux comme le monde … alimenté en priorité par des traducteurs qui défendent leur métier. C’est bien compréhensible.
En cherchant à vous donner une réponse éclairée, j’ai d’ailleurs retrouvé la trace d’un autre article que vous aviez commenté, selon les mêmes termes.
http://www.tradonline.fr/allez-vous-donner-vos-traductions-a-google-translate/
Je vous invite à lire ou relire l’excellent commentaire déposé à la suite du vôtre par Cyril en janvier 2016.
Il me semble apporter un éclairage tout à fait pertinent sur l’utilisation des outils de traduction en ligne.
En résumé :
« le contenu de vos documents reste votre propriété (ou celle de vos clients) par contre la mémoire de traduction globale [de Google ou deepl] s’enrichit de vos traductions.
Le produit s’améliore en traduisant mieux et plus précisément tout en conservant votre propriété intellectuelle …
La façon dont je comprends cela est que la traduction devient collaborative, me permettant de travailler plus vite et plus facilement, et la propriété intellectuelle de mon client est respectée. »
Je crois qu’il faut se faire une raison : le digital a sonné le glas des vieilles pratiques et prérogatives corporatistes.
D’ailleurs tous les traducteurs travaillent à partir de bases de traduction qui s’enrichissent progressivement et profitent à tout le monde. Et tous ces outils fonctionnent sur le même principe (Trados ou autres).
Et la question de la propriété des mémoires de traduction se pose au sein même de la profession et est plus complexe qu’il n’y paraît.
Je vous renvoie à cet article intéressant : https://mastertsmlille.wordpress.com/2016/11/28/le-saviez-vous-les-ressources-numeriques-a-qui-appartiennent-elles/ qui pose bien le problème :
Ainsi, trois acteurs peuvent parfois en arriver à se disputer la propriété des mémoires de traduction : le client final, le traducteur et, le cas échéant, l’agence de traduction. Leurs arguments respectifs sont les suivants : le client final, propriétaire des documents sources, considère que le fait de payer pour la traduction de ces derniers fait automatiquement de lui le propriétaire des mémoires de traduction ; le traducteur considère que le fait d’alimenter mais également de créer une mémoire, le rend automatiquement propriétaire de celle-ci ; quant à l’agence, elle se considère parfois également propriétaire des mémoires lorsqu’elle les génère.
Pour ma part, je soutiens à 100% ces nouveaux outils en ligne qui permettent à tout un chacun de travailler mieux, de se former en permanence et d’apporter sa petite pierre collaborative à des outils qui profitent à tout le monde.
Cordialement, Christiane
Le problème, à mon humble avis, est qu’il ne s’agit pas de droits d’auteur mais de de secret commercial. Je me rappelle un professeur qui, dans les versions latines de ma jeunesse, soulignait de vert les trouvailles heureuses auxquelles il n’avait pas pensé ; s’il les avait employées par la suite dans des traductions publiées sous son nom, je ne me serais pas senti volé mais flatté. Mais ici il s’agit de tout autre chose : c’est le secret commercial qui est en jeu. Si une société donne des consignes à ses filiales à l’étranger ou prépare une campagne publicitaire, il ne faut surtout pas que la concurrence soit au courant, et c’est là, me semble-t-il, que le recours à Google traduction ou à DeepL peut représenter un danger.
LE SEXUELLEMENT CORRECT
On sait qu’aujourd’hui il ne faut plus dire, selon certain.e.s excité.e.s : « Les collaborateurs de notre entreprise sont cordialement invités au pot d’adieu de monsieur Martin », mais « Les collaboratrices et collaborateurs de notre entreprise sont cordialement invité.e.s au pot d’adieu de monsieur Martin ». J’ai voulu voir comment DeepL s’en tirerait avec la seconde phrase ; eh bien il comprend, c’est ce qui est remarquable, mais il traduit en allemand normal : « Zur Abschiedsfeier von Herrn Martin sind die Mitarbeiter unseres Unternehmens herzlich eingeladen ». Maintenant, si je prends la phrase allemande et que je veuille la retraduire en français, j’obtiens simplement : « Les employés de notre entreprise sont cordialement invités à la fête d’adieu de Monsieur Martin. ». Je ne puis que donner raison à DeepL sur ce point : je n’ai jamais essayé de remettre à un client une traduction « militante ».
Il est clair que dans certains cas, la confidence doit être préservée. C’est bien sûr le cas pour les lancements de produit et les campagnes marketing (même si les fuites ne sont pas rares, voire même parfois orchestrées). Plus sérieusement, il est évident que les innovations industrielles, les brevets et tout ce qui touche au droit des entreprises ou des personnes ne sera pas dévoilé impunément. On est bien d’accord là-dessus. Celui qui utiliserait des outils de traduction en ligne dans de tels contextes serait assurément peu prudent.
Mais ce type de traduction ne représente qu’une infime partie des énormes besoins auxquels nous devons faire face, soit pour avoir accès aux infinies richesses du web, soit tout simplement pour mieux communiquer dans un environnement professionnel international.
Merci pour ce joli exercice de style ^^
L’écriture inclusive a certes fait grand bruit dans la presse et sur les réseaux sociaux ces derniers temps. Pour autant, elle est loin de faire partie des pratiques courantes de la langue français. Or, comme Deepl (comme toute mémoire de traduction d’ailleurs) travaille et apprend à partir du gigantesque réservoir de paires linguistiques qu’il engrange et analyse, je ne suis pas étonnée du résultat !
J’ai testé DeepL sur un article philosophique difficile et sur le texte d’un livre pour enfants. (E->F dans les deux cas). Je trouve DeepL absolument stupéfiant . Il ne pense pas, bien sûr, mais ce n’est pas vraiment la question. La traduction qu’il produit est bien supérieure à celle de Google ou de Bing et même à la traduction du livre pour enfants publié.
Je suis un traducteur professionnel(retraité de l’ONU après un peu plus d’un quart de siècle dans les mines de sel :).
Merci pour votre commentaire et votre appréciation de l’outil.
Nous sommes bien d’accord; Deepl est bien supérieur à Google ou Bing translation.
Quand je veux tester les traducteurs automatiques, je ne leur propose pas des phrases du genre « My tailor is rich » pour me pâmer ensuite d’admiration devant le résultat : je pars toujours d’une langue autre que l’anglais pour voir ce qui adviendra après la double traduction et je choisis une phrase simple pour le locuteur natif mais qui ne le sera pas pour une machine. Prenons ainsi « Das Urteil akzeptierte die Staatsanwältin », c’est-à-dire en français « L’avocate générale a accepté le verdict » et je convoque à cet examen Bing, DeepL, Google traduction, Promt et Systran.
DeepL s’en sort le mieux : je ne sais comment il a fait mais seul il a compris que « Staatanwältin » était le sujet et il nous donne « Le verdict a été accepté par le procureur. », en ajoutant d’ailleurs un point qui n’était pas prévu dans l’original. Malheureusement en passant par l’anglais « Staatanwältin » a perdu son genre et nous avons « procureur » au lieu de « procureure ».
Systran ne se trompe pas quant au sexe mais, avec « Le jugement admis », échoue lamentablement pour savoir qui a fait quoi et son « admis » est du charabia.
Promt donne au moins une forme verbale correcte mais, avec « Le jugement acceptait l’avocate d’État », nous avons une expression que l’on ne trouve que cinq fois chez Google, et avec un sens différent. Notez que j’ai un vieux logiciel Promt de 2001, j’ai fait entrer l’expression « avocate générale » dans sa mémoire et il s’en souviendra… un peu trop tard.
Bing est, parait-il, le rival de Google et tous les deux, comme des mauvais élèves qui ont copié l’un sur l’autre, tombent dans les deux pièges avec « Le verdict a accepté le procureur ».
Conclusion : DeepL que vous chouchoutez mérite en effet un petit câlin mais, s’il a pu se tirer d’affaire en ne confondant pas le sujet et le complément d’objet direct, je ne vois pas comment il pourrait ne pas continuer à progresser.
Pour des traductions pointues comportants des termes techniques, scientifiques, du jargon métier, les résultats avec DeepL et les autres traducteurs en ligne type Google Translate, Bing translator ne sont pas toujours très pertinents. Dans ce cas vous pouvez essayer TechDico, https://www.techdico.com, en 28 langues, qui propose des traductions classées par domaine d’activité, afin d’identifier plus rapidement la traduction la plus adaptée.
Bonsoir
Avez vous une expérience par rapport au logiciel de traduction Systran qui présente l’avantage d’être déployable en interne sur le réseau d’entreprise et donc pas besoin de traduire sur Internet
Bonsoir, n’étant pas traductrice, je n’ai pas d’expérience ni d’avis par rapport au logiciel Systran.
Cordialement, Christiane
Bien difficile de vous répondre dans la mesure où je ne sais pas comment travaille votre société, dans quelles langues, et même à quel niveau de langage. Je prends la simple phrase : « On va vous envoyer le matériel que vous avez demandé » et j’essaie de la traduire en allemand ; seulement je ne sais pas s’il s’agit de l’emploi populaire de « on » pour « nous » ou si ce sont d’autres personnes qui vont faire cet envoi. Suivant les logiciels nous aurons :
Systran : Man wird Ihnen das Material senden, das Sie verlangt haben
Promt : Man wird Ihnen das Material schicken, nach dem Sie gefragt haben
(ces deux logiciels prennent le sens traditionnel)
Deepl : Wir senden Ihnen das gewünschte Material zu.
Google : Wir senden Ihnen das von Ihnen angeforderte Material zu
(ces deux logiciels prennent le sens populaire)
Ce qui serait nécessaire, selon moi, c’est que vous vous adressiez à un traducteur, très compétent en informatique et en management, qui étudierait la structure de votre société, le niveau d’utilisation des diverses langues et qui entrerait le vocabulaire indispensable dans la mémoire de votre nouveau logiciel. L’ennui, c’est qu’un pareil spécialiste devrait être bien payé tandis que votre souci principal est de faire des économies. Alors je ne vois pas ce qu’il faudrait faire.
Bonjour ! L’avantage d’un « blog » c’est que l’on peut y participer 2 ans après son premier commentaire 🙂
La protection des données est au paroxysme de son oxymore si j’ose dire…
La nouvelle loi UE fait tout à fait sens, rien à redire. Ce qui me dérange plus c’est la loi de pareto.
D’un sens on offre toute notre vie privé gratuitement sur divers support de réseau sociaux, etc. de l’autre on s’offusque que les sociétés utilisent nos données. Loi de Pareto car pour un service comme DeepL, je vais l’utiliser dans mes différentes rédactions et relations fournisseurs (BtoB). Et même s’il devait y avoir parfois de la confidentialité, l’enjeu d’avoir une traduction correcte est telle, que je veux bien offrir mes textes pour que nos futurs textes soient mieux traduits.
En tant qu’Helvète, la traduction est pour nous très importante et l’effort de l’autre est important dans notre relation client fournisseur ou simplement sociale.
Ce que je veux dire, c’est qu’on ne va parler pendant 90% de la problématique de confidentialité et de propriété intellectuelle, alors qu’en réalité, elle ne va concerner peut-être que 1% des traductions.
Nous avons le même problèmes avec les entreprises étatiques avec lesquels on travaille : la sécurité. Les clients IT responsables de nos clients, veulent une sécurité proche de celle de la NASA alors qu’ils veulent payer le moins cher notre coût de mise en place d’un logiciel chez eux. Il y a un problème de fond en 2020 : on paye pour ce que l’on a.
DeepL est gratuit et cela ma convient, il ne serait ni si fort ni intéressant pour moi, s’il était payant (à mon niveau) et qu’il respectait toutes les « normes nécessaires ».
Un autre exemple : grand débat autour des cookie : https://fr.wikipedia.org/wiki/Cookie_(informatique)
Le Web « libre » vit de la publicité, je préfère si je visite un site, qu’une annonce ait utilisé mes données de navigation, plutôt qu’une publicité pas du tout ciblé du moment que la publicité existe.
On doit apprendre ce qu’un vieux barbu nous a dit il y a 2’000 ans 🙂 il faut partager. A mon sens et en 2020, il n’y pas que le pain, il y a aussi ses données pour expérience utilisateur plus adaptée.
Je me concentrerais beaucoup plus sur les loi Anti-trust véritable fléau de demain, où les GAFAM dominent le monde, que sur la protection des données. A ce sujet il y a un excellent reportage sur Netflix concernant Amazon de fin 2018. Disponible sur… youtube donc Google bien sûr 😉 https://www.youtube.com/watch?v=5maXvZ5fyQY
C’est philosophique mais dans le fond c’est la même chose : on a rien sans rien.