L’intelligence artificielle (IA) sera bientôt capable d’analyser le sens d’un grand nombre de données qualitatives afin de comprendre et d’anticiper les comportements des consommateurs. L’analyse sémantique est donc un enjeu fondamental pour les grandes majors du net. Facebook, Google, Microsoft, Apple y investissent des milliards d’euros. IBM a une longueur d’avance avec son projet Watson. Google s’enorgueillit de la puissance de son algorithme d’IA Interlingua pour son système de traduction automatique. Mais dans les faits, qu’en est-il exactement ?
Analyse sémantique et IA : la traduction automatique Google comme source de test
Les articles sur l’IA et l’analyse sémantique ne manquent actuellement pas. La requête sur Google envoie, en français, 930 000 résultats. Certains clients avec lesquels nous avons collaboré (dont Loyalty Expert) soulignent l’importance de l’analyse sémantique du big data dans les études de l’insight et du customer journey des prospects, surtout dans une approche omnicanal. Mais nous savons tous que malgré tout, en 2017, les systèmes ne sont pas encore assez pointus pour offrir une analyse suffisamment fiable.
Google traduction : une approche pour faire le point sur l’analyse sémantique en IA
Il est difficile d’utiliser de front des algorithmes d’IA qui ne soient pas expérimentaux mais à usage quotidien, pour les tester. L’un nous est apparu clairement : Google Traduction. Il utilise un système développé entre autre par une filiale de Google, DeepMind. Le 14 novembre 2016, Google annonçait que son algorithme Multilingua était capable de traduire une langue non apprise en un seul coup : sans que les corrélations sémantiques ni grammaticales n’aient été manuellement programmées préalablement.
Voici qui est impressionnant… si on n’est pas trop regardant sur la qualité de la traduction. Google Neural Machine Translation, le moteur de deep learning de Google Traduction, crée des ensembles sémantiques dans toutes les langues et les calque dans un pseudo-langage intermédiaire, Multilingua, qui lui permet dès lors, sans doute par analogies, de traduire toute langue source vers une langue cible.
Pour autant, la perte sémantique est analysable notamment à travers une étude quantitative des différences entre le texte source et le texte traduit. Cette métrique est objective.
Méthodologie de quantification de performance de l’analyse sémantique en IA de Google
Ainsi, il est facile de voir si Google Traduction est fiable ou non. La méthode est simple. Il suffit de traduire un texte source dans une langue lambda. Puis de retraduire ce texte dans la langue source. On parle ici d’un texte source “simple”, avec un indice de lisibilité moyen. Pas d’un poème d’Apollinaire… Un humain bilingue obtiendrait un taux de différence fort bas entre le texte original et le texte retraduit, et le sens ne serait pas tronqué.
D’ailleurs, si ce texte était traduit en quatre langues romanes source⇒L1⇒L2⇒L3⇒L4⇒source, il est fort à parier que le taux de déperdition sémantique serait proche de zéro.
Comment Google se sort-il de cet exercice ?
Analyse sémantique et IA : analyse objective par MEDITE, indice de Gulpease et Tropes
Pour s’assurer de cela, il faut un système de mesure statistique objectif et reconnu. Nous avons utilisé le logiciel MEDITE développé par des spécialistes de génétique textuelle de l’ITEM (Institut des Textes et Manuscrits Modernes) et des spécialistes d’intelligence artificielle de l’équipe ACASA du LIP6 (Laboratoire d’informatique de Paris 6 – Université Pierre et Marie Curie). Il met en évidence les différences et les invariances structurelles quantitatives entre deux textes en utilisant lui-même un algorithme d’IA. Concernant l’analyse sémantique différentielle (qualitative, non quantitative), nous avons utilisé Tropes, logiciel développé par Pierre Molette et Agnès Landré sur la base des travaux de Rodolphe Ghiglione.
Pour rendre l’expérience significative, nous avons choisi un texte source en français suffisamment long pour qu’il soit pertinent. Et à l’indice de lisibilité moyen. Nous avons alors découvert que plus le texte était célèbre – par exemple la Déclaration des Droits de l’Homme – et plus les traductions étaient exactes. Et à l’inverse, que plus le texte était anonyme (coupure de presse…) et plus la traduction était approximative. Ainsi, il y a bien une intervention humaine dans Google Traduction sur certains textes.
Nous avons donc pensé à utiliser un texte source célèbre, mais encore sans correction humaine. Un fragment de J’accuse…! d’Émile Zola.
Expérimentation de l’analyse sémantique en IA de Google Traduction
Texte source de l’analyse sémantique
Telle est donc la simple vérité, monsieur le Président, et elle est effroyable, elle restera pour votre présidence une souillure. Je me doute bien que vous n’avez aucun pouvoir en cette affaire, que vous êtes le prisonnier de la Constitution et de votre entourage. Vous n’en avez pas moins un devoir d’homme, auquel vous songerez, et que vous remplirez. Ce n’est pas, d’ailleurs, que je désespère le moins du monde du triomphe. Je le répète avec une certitude plus véhémente : la vérité est en marche et rien ne l’arrêtera. C’est aujourd’hui seulement que l’affaire commence, puisque aujourd’hui seulement les positions sont nettes : d’une part, les coupables qui ne veulent pas que la lumière se fasse ; de l’autre, les justiciers qui donneront leur vie pour qu’elle soit faite. Je l’ai dit ailleurs, et je le répète ici : quand on enferme la vérité sous terre, elle s’y amasse, elle y prend une force telle d’explosion, que, le jour où elle éclate, elle fait tout sauter avec elle. On verra bien si l’on ne vient pas de préparer, pour plus tard, le plus retentissant des désastres.
Indice de Gulpease
L’indice de lisibilité de Gulpease est, malgré les idées reçues, parmi les plus fiables pour le français (et non seulement pour l’italien). Les bornes de l’indice de Gulpease vont de 50 (très compréhensible) à 250 (très complexe). La lisibilité moyenne est de 148/250.
Calcul :
Lisibilité=89-LP/10+FR*3 où LP=nombre de lettres*100/nombre total de mots et FR=phrases*100/nombre de mots.
Le texte de Zola comporte 1085 caractères avec un indice de Gulpease de 143/250, ce qui montre une difficulté de compréhension en-dessous de la moyenne (148). Nous sommes donc face à un texte facile d’accès, sans plan connotatif complexe : une seule figure de style de connotation, une métaphore filée liant vérité et bombe, la vérité sous terre qui s’amasse pour exploser au grand jour. Objectif : un effet rhétorique d’amplification (hyperbole). Le reste du texte est argumentatif sur un ton vocatif (adresse directe au président du tribunal). Le fond est donc, pour un humain, très expliciteet facile à comprendre.
Démonstration statistique de la compréhension facile du texte
- 9 phrases, 22,2 mot/phrase, 4,4 caractère/mot
- 11 verbes ternes, 100 % (pas de mot rare, pas de mot inconnu, niveau de langue 0/5, pas de régionalisme, pas d’abréviation)
- 8 répétitions
- 0 phrase longue
- 1 voix passive
- 7 négations
- 0 forme impersonnelle
- 0 forme participale
- Empan lexico-sémantique : vérité, présidence, affaire, répète, aujourd’hui
- Information extratextuelle (pragmatique) : 20 sur 200 mots (10 %)
- Mots faibles : 10,4 %
- Mots forts : 16,7 %
- Mots négatifs : 10,4 %
- Mots positifs : 9,4 %
- 6 mots charnières (logique), 0 incise
- Fréquence : être (7), plus (3), vérité (3), faire (3), bien (2), répéter (2), affaire (2), ajourd’hui (2), avoir (2), seulement (2)
- Temps verbaux : présent (71,4 %), futur (21,4 %), passé (7,1 %)
- Classes grammaticales : substantifs (29,2 %), verbes (35,4 %), adverbes (29,2 %), adjectifs (6,3 %)
- Groupes : 15 nominaux, 13 prépositionnels, 19 verbaux, 0 incise
- Fonctions grammaticales : 30 sujets dont 0 réel, 22 compléments d’objet, 24 compléments adverbiaux, 1 pronom sans fonction, 6 attributs, 3 épithètes, 5 compléments du nom, 0 complément d’adjectif
- Formes verbales : 2 participes passés, 1 verbe périphrastique en passé proche, 2 infinitifs, 2 subjonctifs, 27 indicatifs
- Genres : 18 masculins, 31 féminins
Synthèse : des structures de base en français, aucun gallicisme, des formes verbales simples : un texte argumentatif, conçu pour une forme orale et donc ayant pour but la compréhension immédiate et la clarté.
Analyse Tropes référence : |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
NB : les chiffres apparaissant dans Tropes en regard des classes sémantiques correspondent à une nomenclature de groupes sémantique dite “scénarios”. La nomenclature est propre à la langue du texte source. En d’autres termes, par exemple, si le texte source possède une caractéristique 0009 0 et que le texte source⇒traduit⇒source possède une caractéristique 0009 1 ou, pire, 0008, il a donc perdu sa signification source car il a changé de famille ou de classe sémantique. Il devrait idéalement posséder une caractéristique similaire au texte source. Ce qu’un traducteur humain se doit bien sûr de respecter, sinon il ne s’agit plus d’une traduction, mais d’une adaptation du texte source.
Source⇒anglais⇒source
En orange, nous allons noter les incohérences syntaxiques des textes traduits. En rouge, les pertes de sens rendant la signification source incompréhensible.
That is the simple truth, Mr. President, and it is appalling, it will remain a stain for your presidency. I suspect that you have no power in this affair, that you are the prisoner of the Constitution and of your entourage. You have none the less a duty of man, to whom you will think, and which you will fulfill. It is not, besides, that I despair the least in the world of triumph. I repeat it with more vehement certainty: the truth is on the march and nothing will stop it. It is only today that the affair begins, since today only the positions are clear: on the one hand, the guilty who do not want the light to be made; On the other, the justiciers who will give their lives for it to be made. I have said it elsewhere, and I repeat it here: when the truth is enclosed in the earth, it accumulates in it, it assumes such a force of explosion, that on the day when it bursts, she. We shall see that the most resounding disaster has not yet been prepared.
C’est la simple vérité, monsieur le président, et c’est épouvantable, cela restera une tache pour votre présidence. Je soupçonne que vous n’avez aucun pouvoir dans cette affaire, que vous êtes prisonnier de la Constitution et de votre entourage. Vous avez néanmoins le devoir de l’homme, à qui vous allez penser, et ce que vous allez remplir. Ce n’est pas, d’ailleurs, que je désespère le moins dans le monde du triomphe. Je le répète avec plus de véhément certitude: la vérité est en marche et rien ne l’arrêtera. Ce n’est qu’aujourd’hui que l’affaire commence, car aujourd’hui seulement les positions sont claires: d’une part, les coupables qui ne veulent pas que la lumière soit faite; D’autre part, les justiciers qui donneront leur vie pour que cela se fasse. Je l’ai dit ailleurs, et je le répète ici: lorsque la vérité est enfermée dans la terre, elle s’accumule, elle assume une telle explosion, que le jour où elle éclate, elle. Nous verrons que la catastrophe la plus retentissante n’a pas encore été préparée.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 9 Propositions remarquables 0 Épisode(s) détecté(s)caractéristiques 0011 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 politique et société 0004 0 droit et justice 0003 1 comportements et sentiments 0003 0 |
Analyse différentielle MEDITE : 23 remplacements, insertions 8, suppressions 12. Indice de Gulpease : 131.
Source⇒coréen⇒source
이러한 단순한 진리 대통령이며, 그것은 소름이 끼치는, 그것은 당신의 대통령의 얼룩 유지됩니다. 나는 당신이이 문제에 힘이 없다는 것을, 당신은 헌법과 측근의 죄수 생각한다. 당신은 당신이 생각하는 것 덜 사람의 의무를 가지고 있지 않으며, 당신은 채울 것입니다. 이것은 내가 모든 승리에 절망 것을, 우연히 아니다. 내가 가장 열렬한 확신을 반복 : 진실은 켜져 있고 아무것도 중지하지 않습니다. 그것은 사건이 오늘 이후에만 위치는 명확하다, 시작되는 오늘입니다 : 첫째, 빛이 싶지 않아 범인; 다른 한편으로, 그것을 위해 자신의 삶을주는 자경단이 될 수 있습니다. 내가 다른 곳에서 말했다, 내가 여기를 반복 하나는 지하 진실을 고정 할 때, 거기 수집, 그녀는 버스트 날이,이 모든 것이 함께 도약하게 같은 폭발력을한다 그것. 나중에 준비하기 위해 오지 않을 경우 우리는 재해의 가장 울려 퍼지는를 볼 수 있습니다.
Ce sont des vérités simples Président, il est consternant, il restera une tache sur votre présidence. Que je n’ai pas le pouvoir de vous délivrer, vous pensez à un des prisonniers de constitution et d’aides. Vous n’avez pas l’obligation moins de gens que vous pensez, vous devrez remplir. Il est pas que je suis désespérée de gagner tous par hasard. Je le répète, la conviction la plus passionnée: la vérité est en marche et ne cesse de rien. Il est aujourd’hui que c’est le cas que si clair à partir d’aujourd’hui, à commencer: Tout d’abord, les criminels ne veulent pas la lumière; D’autre part, il peut être un justicier donnant sa vie pour elle. Je l’ai dit ailleurs, que je le répète ici est d’obtenir la vérité du terrain, il recueille, elle fondit explosive de la journée, tout cela va sauter avec elle. Si vous ne venez pas pour se préparer à l’avenir, nous pouvons voir la catastrophe de l’anneau.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt énonciatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 0 Épisode(s) détecté(s)caractéristiques 0008 0 certitude et vérité 0003 1 vérité 0003 2 autres concepts 0007 0 politique et société 0004 0 droit et justice 0003 1 personnes et groupes sociaux 0003 0 |
Analyse différentielle MEDITE : 14 remplacements, insertions 14, suppressions 16. Indice de Gulpease : 116.
Source⇒russe⇒source
Такова простая истина, господин президент, и это ужасает, она останется пятном для вашего президентства. Я подозреваю, что у вас нет никакой власти в этом вопросе, вы узник Конституции и ваше окружение. Вы не обязаны любой меньше человека, которого вы будете думать, и вы будете заполнить. Это не так, между прочим, что я отчаялся на все торжества. Я повторяю с самим ярым осуждением: правда на и ничто не остановит его. Только сегодня, что дело начинается, так как сегодня только позиции понятны: во-первых, преступники, которые не хотят, чтобы свет, чтобы сделать; с другой стороны, дружинники, которые дают свою жизнь за него, чтобы быть сделаны. Я уже говорил в другом месте, и я повторяю это здесь: когда один запирает правду под землей, он собирает там, она принимает такую взрывную силу, что день он лопается, он делает все прыгает с это. Мы увидим, если он не приходит, чтобы подготовиться к позже, наиболее громким бедствиям.
Telle est la simple vérité, Monsieur le Président, et il est épouvantable, il restera une tache pour votre présidence. Je pense que vous n’avez pas autorité en la matière, vous êtes prisonnier de la Constitution et de votre entourage. Vous n’avez pas moins que la personne que vous allez penser, et vous serez rassasiés. Il n’est pas, par ailleurs, que je désespérais de toutes les célébrations. Je le répète, se ardente conviction: la vérité est en marche et rien ne l’arrêtera. Seulement maintenant qu’il commence, comme position aujourd’hui seulement claire: d’abord, les criminels, qui ne veulent pas la lumière pour faire; D’autre part, les terroristes, qui donnent leur vie pour lui être. Je l’ai déjà dit ailleurs, et je le répète ici: quand on enferme la vérité sous terre, elle s’y amasse, il prend une telle puissance explosive que le jour où elle éclate, elle fait tous les sauts avec elle. Nous verrons si elle vient, de se préparer à plus tard, les catastrophes les plus forts.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt énonciatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0007 0 certitude et vérité 0003 1 vérité 0003 2 personnes et groupes sociaux 0005 0 comportements et sentiments 0004 0 autres concepts 0004 0 politique et société 0003 0 crise et conflits 0003 0 |
Analyse différentielle MEDITE : 23 remplacements, insertions 6, suppressions 11. Indice de Gulpease : 127.
Source⇒allemand⇒source
Das ist die einfache Wahrheit, Herr Präsident, und es ist erschreckend, wird es ein Schandfleck für Ihre Präsidentschaft bleiben. Ich vermute, dass Sie keine Macht in dieser Angelegenheit hat, können Sie die Gefangene der Verfassung sind und Ihre Umgebung. Sie haben nicht weniger eines Mannes Pflicht, die Sie denken, und Sie werden füllen. Dies ist übrigens nicht, dass ich überhaupt den Sieg Verzweiflung. Ich wiederhole mit der heftigsten Überzeugung: Wahrheit ist und nichts wird es aufhören. Es ist nur heute, dass der Fall beginnt, da heute nur noch die Positionen sind klar: erstens die Täter, die das Licht nicht wollen, zu tun; auf der anderen Seite, der sie ihr Leben geben werden, machten die Ordnungshüter. Ich habe an anderer Stelle gesagt, und ich wiederhole es hier: wenn man die Wahrheit unter der Erde abstürzt, es sammelt sich dort, nimmt sie eine solche explosive Kraft, die den Tag es platzt, ist es alles mit Sprung macht es. Wir werden sehen, ob es nicht für später vorbereiten kommt, die meist durchschlagende von Katastrophen.
Telle est la simple vérité, Monsieur le Président, et il est épouvantable, il restera une tache pour votre présidence. Je soupçonne que vous avez pas de pouvoir en la matière, vous pouvez être le prisonnier de la Constitution et de votre environnement. Vous avez pas moins un devoir de l’homme que vous pensez et vous remplirez. Ce n’est pas la façon que je jamais de désespoir de la victoire. Je le répète, avec la conviction la plus véhémente: la vérité et rien ne l’arrêtera. Il est seulement aujourd’hui que l’affaire commence, puisque aujourd’hui seulement les positions sont claires: premièrement, les auteurs qui ne veulent pas que la lumière soit faite; d’autre part, ils donnent leur vie, a fait les policiers. Je l’ai dit ailleurs, et je le répète ici: quand on s’écrase la vérité sous terre, il accumule là, elle prend une telle force explosive qu’il éclate le jour, il est tout à la plongée le fait. Nous verrons si elle ne prépare pas pour plus tard, le plus retentissant des désastres.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0010 0 certitude et vérité 0003 1 vérité 0003 2 comportements et sentiments 0004 0 sentiments 0003 1 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 politique et société 0003 0 autres concepts 0003 0 |
Analyse différentielle MEDITE : 22 remplacements, insertions 12, suppressions 15. Indice de Gulpease : 129.
Source⇒hébreu⇒source
כזו היא האמת הפשוטה, אדוני הנשיא, וזה מזעזע, הוא יישאר כתם לנשיאות שלך. אני חושד כי אין לך כוח בעניין זה, אתה שבוי של החוקה ואת הפמליה שלך. אתה לא צריך להיות פחות מתלמיד חובתו של גבר, אשר תעלה בדעתכם, תוכל למלא. זהו לא, אגב, כי אני מיואש כל ניצחון. אני חוזר עם הרשעה החריפה: האמת היא על ושום דבר לא יעצור אותו. זה רק היום כי המקרה מתחיל, מאז היום רק את העמדות ברורות: ראשית, האשמים שלא רוצים את האור לעשות; מאידך גיסא, המנוול שנותנים את נפשם למענה להתבצע. שאמרתי במקום אחר, ואני חוזר על זה כאן: כאשר אחד נועל את האמת מתחת לאדמה, זה נאסף שם, היא לוקחת כוח מתפרץ כך ביום זה מתפרץ, זה עושה הכל לזנק עם זה. נחיה ונראה אם זה לא בא כדי להתכונן מאוחר יותר, המהדהד ביותר של אסונות.
Telle est la simple vérité, Monsieur le Président, et il est choquant, il restera une tache pour votre présidence. Je soupçonne que vous avez pas de pouvoir en la matière, vous êtes prisonnier de la Constitution et de votre entourage. Vous ne devez pas être moins le devoir d’un homme qui se lèvera à l’esprit, vous pouvez remplir. Ce n’est pas, d’ailleurs, que j’ai donné une victoire. Je suis de retour avec conviction féroce: la vérité est en marche et rien ne l’arrêtera. Il est seulement maintenant que l’affaire commence, puisque aujourd’hui seulement les positions sont claires: Tout d’abord, les coupables qui ne veulent pas la lumière à faire; D’autre part, le salaud qui donnent leur vie pour qu’elle soit effectuée. Je l’ai dit ailleurs, et je le répète ici: quand on enferme la vérité sous terre, où elle est recueillie, il prend la puissance explosive qu’il éclate, il fait tout sauter avec elle. Nous verrons si elle ne vient pas de se préparer à plus tard, le plus retentissant des désastres.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt argumentatif Mise en scène : ancrée dans le réel. Prise en charge à l’aide du “Je”. Tendances peu significatives 9 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0008 0 certitude et vérité 0003 1 vérité 0003 2 comportements et sentiments 0005 0 personnes et groupes sociaux 0004 0 autres concepts 0004 0 politique et société 0003 0 |
Analyse différentielle MEDITE : 21 remplacements, insertions 12, suppressions 12. Indice de Gulpease : 129.
Source⇒cingalais⇒source
එවැනි සරල සත්යය, ජනාධිපති ලේකම් වන අතර, එය අසා සිටින්නන් තැතිගන්වන, එය ඔබගේ ජනාධිපති සඳහා පැල්ලම් පවතිනු ඇත. මම ඔබට ආණ්ඩුක්රම ව්යවස්ථාව සහ ඔබේ පිරිවර වූ සිරකරුවෙක්, ඔබ මේ කාරණය ගැන කිසිදු බලය ඇති බව පොලිසිය සැක කරයි. ඔබ, ඕනෑම මිනිසෙකුගේ බදු අඩු කර නෑ ඔයා හිතන්නේ කරන අතර, ඔබ පූර්ණ වනු ඇත. මම මේ සියලු ජයග්රහණය ගැන ලත බව, මේ, නොවේ. මම ඉතාම දෘඪතර විශ්වාසය සමග නැවත: සත්යය මත වන අතර, කිසිවක් එය නතර කරනු ඇත. පළමු වැන්න නම්, ආලෝකය කරන්න ඕන නැති වැරදිකරුවන්;: අද පමණක් නඩුව ආරම්භ වන අද තනතුරු පමණක් පැහැදිලි වන නිසා ය අනෙක් මත, සිය ජීවිත පරිත්යාග කරන එය කළ යුතු සඳහා කරන්නා. එය හැම දෙයක්ම සමග පැන පැන කරයි, ඇය එය ලබාගෙන සිටියදී දිනකට එවන් පුපුරන සුලු බලය ගන්නා එක් බිම් යටතේ සත්යය දක්වා අගුල් විට, එය එහි එකතු: මම වෙනත් තැනක සඳහන් කර ඇති අතර මම එය මෙහි නැවත එය. එය, පසුව ආපදා වඩාත් අත්කරගත් සූදානම් පැමිණ නොමැති නම් අපි බලමු මොකද වෙන්නේ කියලා.
Une telle vérité simple, le président, et d’entendre les alarmants, il reste une tache pour votre présidence. Je Constitution et votre entourage du prisonnier, la police soupçonne que la puissance de l’un de vous dans cette affaire. Vous n’avez pas l’homme d’impôt que vous pensez, et vous serez plein. Je sais que, dans tout ce succès, il n’est pas. Je le répète avec la croyance la plus véhémente: la vérité, et rien ne l’arrêtera. Tout d’abord, ne pas besoin de la lumière que dans le cas de culpabilité;: les positions à partir d’aujourd’hui seulement en raison de l’évidence de l’autre, qui doit être remis à leur vie. Il fait le saut avec tout, quand elle enferme la vérité sous terre une journée a été prise à une telle puissance explosive, il est la collection: je l’ai dit ailleurs, et je le répète ici. Il est venu après la catastrophe la plus notable pas prêt, nous verrons ce qui se passe.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 9 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 politique et société 0006 0 droit et justice 0003 1 forces et quantités 0005 0 forces 0003 1 personnes et groupes sociaux 0003 0 autres concepts 0003 0 |
Analyse différentielle MEDITE : 8 remplacements, insertions 16, suppressions 18. Indice de Gulpease : 116.
Source⇒italien⇒espagnol⇒portugais⇒roumain⇒source
Tale è la semplice verità, signor presidente, ed è spaventosa, rimarrà una macchia per la sua Presidenza. Ho il sospetto che si dispone di alcun potere in questa materia, si sono prigioniero della Costituzione e il vostro entourage. Non avete il dovere di meno di un uomo, che si pensa, e si riempirà. Questo non è, per inciso, che mi dispero affatto il trionfo. Ripeto con la convinzione più veemente: la verità è acceso e niente potrà fermarla. E ‘solo oggi che il caso si avvia, dal momento che oggi solo le posizioni sono chiare: in primo luogo, i colpevoli che non vogliono la luce per fare; dall’altro, i vigilantes che danno la vita per poter essere fatte. Ho detto altrove, e lo ripeto qui: quando si blocca la verità sotto terra, raccoglie lì, lei prende tale potere esplosivo che il giorno in cui scoppia, rende tutto salto con Lei. Vedremo se non arriva per preparare in seguito, il più clamoroso dei disastri.
Esta es la simple verdad, señor Presidente, y es atroz, seguirá siendo una mancha en su presidencia. Sospecho que no tiene ningún poder en este asunto, que es un prisionero de la Constitución y su entorno. Usted tiene el deber de menos de un hombre, que piensa, y tiene que ser llenado. Esto no es, por cierto, que me desespero al triunfo. Repito con la convicción más vehemente: la verdad está en y nada lo detendrá. E ‘sólo ahora que el caso se inicia, ya que hoy en día sólo las posiciones son claras: en primer lugar, los culpables que no quieren hacer que la luz; por el otro, los vigilantes que dan su vida con el fin de hacerse. He dicho en otra parte, y lo repito aquí:. Cuando se bloquea la verdad bajo tierra, no recoge, se toma tal poder explosivo que el día que estalla, hace que todo salto con usted Veremos si no llega a prepararse para más tarde, el más rotundo desastre.
Esta é a simples verdade, Sr. Presidente, e é terrível, ele permanecerá uma mancha em sua presidência. Eu suspeito que não tem poder nesta matéria, que é um prisioneiro da Constituição e do seu ambiente. Você tem o dever menos do que um homem que pensa, e tem de ser preenchido. Esta não é, aliás, que me desespero para triunfar. Repita com a convicção mais veemente: a verdade está ligado e nada vai impedi-lo. E ‘só agora que o caso começa, já que hoje somente as posições são claras: em primeiro lugar, os culpados que não querem fazer a luz; por outro, os guardas que dão suas vidas a fim de ser feita. Eu já disse em outro lugar, e repito aqui:. Quando a verdade acidentes subterrâneos, não ajunta tal poder explosivo é tomado que o dia que ele explode, faz tudo o salto você verá que não se preparar para mais tarde, o desastre mais absoluto.
Acesta este adevărul simplu, domnule președinte, și este teribil, va rămâne o pată pe președinția sa. Bănuiesc că nu are nici o putere în această chestiune, care este un prizonier al Constituției și a mediului său. Ai o datorie mai mică decât un om care gândește, și trebuie să fie umplut. Acest lucru nu este, de fapt, că am disperare să triumfe. Se repetă cu convingerea cei mai vehemenți: adevărul este pornită și nimic nu se va opri. Este doar acum că acest caz începe, deoarece astăzi numai pozițiile sunt clare: în primul rând, vinovații care nu doresc să facă lumină; pe de altă parte, gardienii care dau viața pentru a fi făcute. Am spus în altă parte, și repet aici:. În cazul în care accidentele subterane de adevăr, nu se adună astfel o putere de explozie este luată ca în ziua în care exploziile, ea face tot ce salt va vedea că nu se pregătească pentru mai târziu, dezastrul cel mai cruțare.
Telle est la vérité simple, Monsieur le Président, et il est terrible, il restera une tache sur sa présidence. Je suppose qu’il n’a pas de pouvoir en la matière, qui est un prisonnier de la Constitution et de son environnement. Vous avez un devoir moins d’un homme qui pense, et doit être rempli. Ce n’est pas, en fait, que je désespère de triompher. Répéter l’opération avec la conviction la plus véhémente: la vérité est en marche et rien ne l’arrêtera. Il est seulement maintenant que l’affaire commence depuis aujourd’hui seulement les positions sont claires: premièrement, les coupables qui ne veulent pas faire la lumière; d’autre part, donner la vie garde à faire. Je l’ai dit ailleurs, et je le répète ici:. Si les accidents souterrains ne sont pas vraiment considérés comme la puissance explosive est considéré comme le jour où il éclate, il fait tout saut verra qu’il y préparer pour plus tard, la catastrophe la plus absolu.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt énonciatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 0 Épisode(s) détecté(s)caractéristiques 0008 0 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 politique et société 0003 0 crise et conflits 0003 0 comportements et sentiments 0003 0 |
Analyse différentielle MEDITE : 21 remplacements, insertions 10, suppressions 12. Indice de Gulpease : 120.
source⇒anglais⇒source 10 fois
Au bout de 6 allers-retours, le texte traduit est stabilisé :
C’est la simple vérité, monsieur le président, et c’est épouvantable, cela restera une tâche pour votre présidence. Je soupçonne que vous n’avez aucun pouvoir dans cette affaire, que vous êtes prisonnier de la Constitution et de votre entourage. Pourtant, vous avez le devoir de l’homme, à qui vous pensez, et ce que vous allez accomplir. Ce n’est pas, d’ailleurs, que je désespère le moins dans le monde du triomphe. Je le répète avec plus de véhémence: la vérité est en marche et rien ne l’arrêtera. C’est seulement aujourd’hui que commence l’affaire, car aujourd’hui seulement les positions sont claires: d’une part, les coupables qui ne veulent pas que la lumière soit faite; D’autre part, les justiciers qui donneront leur vie pour que cela se produise. Je l’ai dit ailleurs, et je le répète ici: lorsque la vérité est enfermée sur terre, elle s’accumule, elle suppose une telle explosion, que le jour où elle éclate. Nous verrons que la catastrophe la plus retentissante n’a pas encore été préparée.
Analyse Tropes :
Source | Source>Texte traduit>source |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 10 Propositions remarquables 2 Épisode(s) détecté(s)caractéristiques 0009 0 certitude et vérité 0004 1 vérité 0004 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 forces et quantités 0003 0 comportements et sentiments 0003 0 politique et société 0003 0 droit et justice 0003 1 |
Style plutôt argumentatif Prise en charge par le narrateur. Prise en charge à l’aide du “Je”. Tendances peu significatives 9 Propositions remarquables 0 Épisode(s) détecté(s)caractéristiques 0010 0 certitude et vérité 0003 1 vérité 0003 2 autres concepts 0005 0 personnes et groupes sociaux 0004 0 politique et société 0004 0 droit et justice 0003 1 comportements et sentiments 0003 0 |
Analyse différentielle MEDITE : 21 remplacements, insertions 10, suppressions 11. Indice de Gulpease : 129.
Analyse sémantique en IA : des progrès à faire…
Tout ceci montre qu’une machine n’est pas encore réellement apte à mener de l’analyse sémantique. Elle se fonde sur des structures, des cooccurences de lexèmes, des calques, mais ne “comprend” pas ce qu’elle fait.
Plus grave : en interprétant un texte, elle l’ampute de sa signification ou en ajoute de nouvelles. Ceci est objectivé par cette courte étude.
Dès lors, analyser en big data des téraoctets de données ne serait-ce que textuelles, avec précision pour comprendre, par exemple, l’appréhension des consommateurs d’une marque ou d’un produit sur un réseau social, semble pour l’heure voué à une importante marge d’erreur. Cette approche n’est donc pas encore fiable.
Il est sans doute possible de créer des regroupements de classes lexicales positives ou négatives. Mais sans doute pas d’interpréter des phrases complexes. Et encore moins les sous-entendus, les jeux de mots, l’ironie ou de second degré : la connotation du discours. La dénotation est elle-même encore bien trop déformée, parfois jusqu’à l’illisibilité.
Cependant, comme les technologies évoluent très rapidement, il n’est pas certain que cet état de fait soit encore d’actualité d’ici cinq ou dix ans… L’analyse sémantique par IA est donc à suivre de très près dans les années à venir, en marketing.
En savoir plus sur le sujet : https://discours.revues.org/8724