Les triggers inter-langues pour la Traduction Automatique - atala

cibles suivant la valeur de l'IMG. Les triggers inter-langues sont dÃ©j`a utilisÃ©s en modÃ©lisation du langage pour enrichir des langues faiblement dotÃ©es `a partir ...

Télécharger le PDF

74KB taille 3 téléchargements 360 vues

commentaire

Report

Les triggers inter-langues pour la Traduction Automatique

Caroline Lavecchia LORIA/Speech Group Vandoeuvre, France [email protected]

Kamel Sma¨ıli LORIA/Speech Group Vandoeuvre, France [email protected]

Résumé Dans cet article, nous décrivons le concept de triggers inter-langues. Nous expliquons ensuite comment nous avons utilisé de tels triggers pour construire automatiquement un dictionnaire bilingue. Nous avons par la suite e´ valué notre dictionnaire bilingue en le comparant a` deux dictionnaires existants, le premier fourni par ELRA et le second en libre accès sur Internet. Cependant, afin de rendre compte de la réelle contribution des triggers inter-langues en traduction automatique, nous avons produit une table de traduction a` partir de notre dictionnaire bilingue et l’avons testée avec le décodeur Pharaoh (Koehn, 2004). Nous avons comparé, en terme de score BLEU, les traductions automatiques obtenues a` l’aide de notre table de traduction avec celles produites en utilisant une table de traduction générée par l’outil Giza++ (Och and Ney, 2000). Les différents tests menés ont montré que le dictionnaire bilingue obtenu a` partir des triggers inter-langues est bien construit et convenable pour la traduction automatique. Le dictionnaire bilingue a e´ té construit et e´ valué sur un corpus parallèle de 19 millions de mots français et 17 millions de mots anglais extrait des actes du Parlement Européen.

1 Introduction Les méthodes statistiques sont utilisées dans de nombreux domaines du traitement de la langue naturelle notamment en reconnaissance de la Parole, en reconnaissance optique des caractères (OCR), en fouille de données, en traduction automatique Parole-Parole,. . .Elles nécessitent des quantités importantes de corpus afin d’apprendre les paramètres des différents modèles relatifs a` chacun des domaines. Les corpus sont par exemple utilisés en reconnaissance de la Parole, en OCR ou en indexation pour construire automatiquement des dictionnaires. Dans cet article, nous cherchons a` tirer profit de corpus parallèles alignés pour construire un dictionnaire bilingue. En d’autres termes, pour chaque mot e d’une langue source, l’objectif est de trouver les n meilleures traduc-

David Langlois LORIA/Speech Group Vandoeuvre, France [email protected]

tions probables f1 , f2 , . . . , fn dans une langue cible et vice versa. Il existe différents moyens pour créer un dictionnaire bilingue comme par exemple utiliser des connaissances linguistiques. C’est le cas pour la création de dictionnaires dits humains (Klavans and Tzoukermann, 1990). Il est e´ galement possible de construire automatiquement des dictionnaires bilingues a` partir de corpus parallèles en utilisant des techniques basées sur l’algorithme EM (Dempster et al., 1977) utilisées, par exemple, par l’outil Giza++ (Och and Ney, 2000). Hiemstra (Hiemstra, 1996) propose un algorithme EM symétrique pour définir un dictionnaire bi-directionnel qui donne selon lui une meilleure estimation des probabilités de traduction. Kumano et Hirakawa (Kumano and Hirakawa, 1994) combinent des connaissances linguistiques et des informations statistiques pour générer automatiquement a` partir de corpus parallèles anglais et japonnais un dictionnaire de traduction. Smadja et al (Smadja et al., 1996) proposent, quant a` eux, un outil nommé Champollion qui permet de traduire une liste de collocations a` partir de corpus parallèles en utilisant le coefficient Dice comme mesure de similarité entre une collocation et sa traduction. Nous proposons d’utiliser les triggers inter-langues pour construire un dictionnaire bilingue. Dans cet article, nous présentons dans la partie 2 la notion générale des triggers. La partie 3 définit le concept de triggers inter-langues qui associe a` chaque mot de la langue source une liste de traductions possibles. Dans la partie 4, les corpus utilisés et les résultats obtenus sont décrits et analysés. Nous terminons enfin par une conclusion qui met en avant les points forts de notre méthode et donne quelques perspectives futures des travaux de notre groupe de recherche.

2 Rappel sur les triggers

corpus selon les e´ quations suivantes :

Le concept de triggers est très souvent cité en modélisation du langage. Les triggers permettent entre autre d’améliorer et de généraliser le modèle Cache (Kuhn and DeMori, 1990). Le modèle Cache favorise la probabilité d’un mot wi récemment apparu dans le contexte gauche. Un modèle de triggers va plus loin et accorde une probabilité plus importante a` une liste de mots corrélés au mot wi (Tillmann and Ney, 1996). Les triggers sont sélectionnés selon la valeur de l’Information Mutuelle (IM) donnée par la formule suivante : IM (x, y) = log2

P (x, y) P (x)P (y)

(1)

Chaque mot appartenant au vocabulaire est alors associé a` n mots qui lui sont le plus fortement corrélés d’après la valeur de l’IM. Un trigger est un ensemble composé d’un mot appelé déclencheur et d’une liste des mots qu’il déclenche appelés déclenchés. La figure 1 illustre un exemple de triggers anglais. Les triggers sont utilisés en modélisation du langage. Ils permettent d’estimer les probabilités des mots sachant leur historique P (w|h). Ils sont généralement combinés avec les modèles classiques n-gramme (Tillmann and Ney, 1997).

3 Les triggers inter-langues Le concept des triggers est e´ tendu a` celui de triggers inter-langues. Un trigger inter-langue est défini comme e´ tant un ensemble composé d’un mot source déclencheur e et des mots cibles qui lui sont fortement corrélés f1 , f2 , . . . , fn . Nous formalisons cette notion ainsi : T rig(e) −→ f1 , f2 , . . . , fn . La méthode que nous proposons permet de générer des triggers inter-langues, c’esta` -dire de la langue source vers la langue cible mais aussi de la langue cible vers la langue source. Pour ce faire, les paires de phrases du corpus parallèle sont concaténées pour ne former qu’un simple et même corpus (la figure 2 montre un exemple de triggers inter-langues de l’Anglais vers le Français). Pour chaque couple de mots déclencheur-déclenché (eki ,fjk ) et pour chaque paire k de phrases concaténées du corpus, une Information Mutuelle Partielle (IMP ) est calculée. L’Information Mutuelle Globale (IMG ) est ensuite calculée pour le couple (ei ,fj ) sur tout le

IMP (eki , fjk ) = log

P (eki , fjk ) P (eki )P (fjk )

S 1X IMP (eki , fjk ) IMG (ei , fj ) = S

(2)

(3)

k=1

où S est le nombre de paires de phrases dans le corpus d’apprentissage. Notons que si ei et/ou fj n’apparaissent pas dans la kième paire alors l’information mutuelle partielle IMP (eki , fjk ) sera nulle. Pour chaque mot source e, nous conservons comme triggers inter-langues les n meilleurs mots cibles suivant la valeur de l’IMG . Les triggers inter-langues sont déjà utilisés en modélisation du langage pour enrichir des langues faiblement dotées a` partir d’autres langues très riches en termes de corpus (Kim and Khudanpur, 2004). Cependant l’originalité de l’équation (3) réside dans la variabilité de la taille de la fenêtre de calcul des IMG . En effet, pour chaque couple (mot source, mot cible), nous calculons son IMG au sein de chaque paire de traductions concaténées. Cela nous permet de détecter les mots fortement corrélés de la langue source vers la langue cible et ainsi de construire un dictionnaire bilingue. Plus clairement, nous souhaitons extraire un ensemble de mots cibles F = f1 , f2 , . . . , fn fortement corrélés a` un mot source e et trouver dans cet ensemble F un sous-ensemble de mots qui seraient des traductions possibles de e. Une normalisation de l’IMG associée a` chaque trigger nous permet aussi de leur attribuer une probabilité et de transformer le dictionnaire bilingue en table de traduction pour le processus de décodage.

4 Construction du dictionnaire Les expériences que nous allons présenter ont e´ té menées sur les actes du Parlement Européen (Koehn, 2005). Nous avons utilisé un corpus parallèle Anglais-Français de 598014 paires de phrases avec 19 millions de mots français (dont 78431 différents) et 17 millions de mots anglais (dont 56243 différents). Le vocabulaire utilisé est obtenu a` partir des 26811 (respectivement 19588) mots français (respectivement anglais) les plus fréquents1 . Une liste des 10 meilleurs triggers inter-langues est retenue pour chaque mot du vocabulaire. Aucun mot outil de la langue 1

Les mots de plus de 7 occurences.

Boris Kasparov is a chess champion

F IG . 1 – Exemples de triggers classiques

Boris Kasparov is a chess champion Boris Kasparov est un champion d’ échecs

F IG . 2 – Exemples de triggers inter-langues (généralement les mots courts en Anglais et en Français comme : or, it, in, thus ...., de, la, le, donc, ...) n’est pris en compte pour le calcul des triggers. Les mots outils ne sont ni des déclencheurs, ni des déclenchés. Leurs traductions sont ajoutées manuellement dans le dictionnaire. Notre méthode conduit a` de remarquables triggers inter-langues. De manière générale, nous avons constaté que les mots déclenchés pouvaient souvent eˆ tre apparentés a` de possibles traductions du mot déclencheur ou a` des mots vraiment très proches du point de vue du sens. Quelques exemples de triggers Anglais-Français sont présentés dans le tableau 1, de même des exemples de triggers Français-Anglais sont présentés dans le tableau 2. La troisième colonne des tableaux indique pour chaque couple de mots déclencheur-déclenché la valeur de l’Information Mutuelle Globale qui lui est associée. Au vu de ces premiers résultats, nous pensons que l’utilisation des triggers inter-langues peut eˆ tre le point de départ de beaucoup de techniques en Traduction Automatique. Notre premier objectif est de construire a` partir de ces triggers inter-langues un dictionnaire bilingue. Dans cet article, nous nous intéressons seulement au Français et a` l’Anglais, mais cette méthode pourrait eˆ tre appliquée a` beaucoup d’autres couples de langues. Une liste de p traductions est produite pour chaque mot source du vocabulaire. Les traductions d’un mot source e sont obtenues en sélectionnant parmi les mots cibles qu’il déclenche f1 , f2 , . . . , fn ceux qui le déclenchent en retour comme le montre la figure 3. Plus précisément, les traductions du mot source

TAB . 1 – Exemples de mots français déclenchés par des mots anglais Déclenchés M IG × 10−4 français coopération 38 Cooperation collaboration 7 développement 6 coopératives 0.31 Cooperatives entreprises 0.09 associations 0.09 difficulté 1.5 Difficulty difficultés 0.9 problème 0.5 disciplines 0.22 Disciplines règles 0.07 investissements 0.06 compétences 1.22 Competences pouvoirs 0.1 institutions 0.09 Déclencheur anglais

e dans le dictionnaire bilingue sont définies de la façon suivante : e: f1 , f2 , . . . , fp ⇔ ∀j ∈ [1..n], e ∈ T rig(fj ) (4) et fj ∈ T rig(e) Les tableaux 3 et 4 illustrent respectivement des extraits des dictionnaires Anglais-Franç ais et Français-Anglais obtenus en respectant la contrainte (4). Les traductions proposées sont données suivant l’ordre décroissant de l’Information Mutuelle Globale.

TAB . 2 – Exemples de mots anglais déclenchés par des mots français M IG × 10−4

Déclencheur Déclenchés français anglais cooperation Coopération development countries cooperatives Coopératives women associations difficulty Difficulté difficulties difficult disciplines Disciplines new different powers Compétences competences competence Source−Target Triggers

f

38 6 5 0.31 0.09 0.08 1.5 0.5 0.5 0.22 0.05 0.04 4 1.2 1

Target−Source Triggers

e e

...

. .

e

e e

. . . . . .

e

11

12

e.

1k 1

1

Bilingual dictionary

f f e

2

21

22

2k 2

3

. .

f

i

e e e i1

i2

. .. . .

. . . .

f

n

e e 11

n2

.. .

e.

. . . .

e:f. 1, fi , f n

e

. . .

ik i

. . en k

n

F IG . 3 – Illustration de la construction du dictionnaire bilingue

TAB . 3 – Un extrait du dictionnaire automatique Anglais-Français Mot anglais Fish Fisherman Flag Flexible Foods Henceforth

TAB . 4 – Un extrait du dictionnaire automatique Français-Anglais Mot français Humide Humble Maison Mort Sonnette Urgence

poisson pêcheurs drapeau souple alimentaire dorénavant

poissons pêche navires travail produits dès

wetland humble house death alarm urgent

wet opinion home penalty sound urgency

rainforest modest houses people bells emergency

5 Expérimentations et e´ valuations Nous avons construit un dictionnaire bilingue, que nous appelons TrigDic, selon la méthode présentée a` la partie 4. Chaque mot source est d’abord associé a` 10 mots cibles et inversement. Nous disposons ainsi de 284703 couples françaisanglais. Ensuite, en respectant la propriété de symétrisation (4) pour chaque mot français, nous gardons au plus les 5 meilleures traductions anglaises possibles. TrigDic compte ainsi 31569 couples de traductions possibles. Afin d’évaluer TrigDic, nous l’avons comparé a` deux dictionnaires. Le premier (ELRA) est distribué par ELRA2, le second (Internet) a e´ té téléchargé sur Internet3 . La comparaison a e´ té menée dans le sens Français-Anglais et seulement sur les mots français en commun avec TrigDic. 10405 mots français se trouvent a` la fois dans le dictionnaire ELRA et dans TrigDic alors que 11265 sont présents a` la fois dans le dictionnaire issu d’Internet et dans TrigDic. Nous avons utilisé la mesure du Rappel pour e´ valuer notre dictionnaire bilingue. Le tableau 5 indique les taux de Rappel entre TrigDic et les deux autres dictionnaires. TAB . 5 – Résultats en terme de Rappel

Traductions potentielles pêche pêcheur pavillon flexible alimentaires désormais

Traductions potentielles

ELRA Internet

Rang1 Rang5 53% 65% 41% 52%

Les résultats montrent qu’en ne prenant en compte que les traductions données en première 2

M0033-3 SCI-FRAN-EURADIC, 70832 entrées http ://xdxf.revdanica.com/down/index.php, 41398 entrées 3

position, c’est-à-dire la meilleure traduction selon l’IMG pour chaque mot français, le rappel est de 53% par rapport au dictionnaire ELRA et de 41% par rapport au dictionnaire d’Internet. Ces taux augmentent si nous considérons la totalité des traductions probables sans tenir compte de leur rang. Le rappel est, dans ce cas, de 65% par rapport au dictionnaire ELRA et de 52% par rapport au dictionnaire d’Internet. En prenant le dictionnaire ELRA comme dictionnaire de référence, nous pouvons dire, dans un premier temps, que dans 65% des cas, notre méthode basée sur les triggers inter-langues donnent une traduction satisfaisante d’un mot français. En contre-partie nous obtenons donc un taux d’échec de 35%. Toutefois, une analyse plus poussée nous permet de minimiser ce taux d’échec pour les raisons suivantes : – Nous ne retenons que les 5 meilleures traductions probables pour chaque mot français dans TrigDic – Nous avons remarqué que souvent les traductions de TrigDic non présentes dans le dictionnaire ELRA e´ taient tout de même correctes ou avaient un sens très proche de la traduction proposée par ELRA. – Dans d’autres cas, la traduction proposée par ELRA e´ tait beaucoup moins courante que celle proposée par TrigDic comme le montre les exemples du tableau 6. La traduction de TrigDic aussi correcte soit-elle e´ tait comptée comme fausse.

TAB . 6 – Comparaison entre les dictionnaires ELRA et TrigDic Word chevaux chimère

ELRA horsefles bubble

déléguée

deputy

TrigDic horses, animals, horse illusion, fantasy, dream, fancy delegated, united, delegate, legislative

En résumé de cette première analyse, nous pouvons dire que les résultats sont très intéressants et que le taux de Rappel est sûrement supérieur a` 65%. Afin d’évaluer TrigDic le plus précisément possible, il serait préférable de le comparer a` un dictionnaire de référence construit a` la main.

6 La traduction automatique avec les triggers inter-langues Pour rendre compte de la réelle contribution de notre méthode, basée sur les triggers inter-langues, en traduction automatique, nous avons intégré notre dictionnaire bilingue dans un processus complet de décodage. Nous avons pour cela utilisé le décodeur Pharaoh4 (Koehn, 2004). Nous nous sommes intéressés a` la qualité des traductions qu’il pouvait produire en utilisant un modèle de traduction basé sur les triggers inter-langues. Pour se faire, nous adaptons notre dictionnaire bilingue pour en faire une table de traduction. Nous assignons a` chaque traduction potentielle de TrigDic une probabilité résultant de la normalisation de l’Information Mutuelle Globale. Les probabilités de tous les couples de mots qui ne font pas partie du dictionnaire sont fixées a` 0. Cette table de traduction est ensuite donnée en paramètre a` Pharaoh. Dans un premier temps, nous avons mené des tests avec le dictionnaire TrigDic généré dans la partie 4 : une liste des 10 meilleurs triggers inter-langues est associée a` chaque mot source et chaque mot cible, et pour chaque mot nous conservons les 5 meilleures traductions suivant la contrainte formulée en (4) et selon l’IMG . Nous comparons ensuite, grâce a` la mesure BLEU (Papineni and al., 2001), la qualité des traductions automatiques produites par Pharaoh avec la table de traduction TrigDic sur une partie du corpus source avec la qualité de celles produites par le même décodeur et dans les mêmes conditions mais cette fois avec en entrée une table de traduction générée par l’outil Giza++ en utilisant le modèle 2 d’IBM (Brown and al., 1993). Les résultats du tableau 7 montrent que les traductions automatiques produites a` partir de notre dictionnaire TrigDic sont, d’après le critère BLEU, de moins bonne qualité que celles générées a` l’aide du dictionnaire de Giza++. Ces résultats sont confirmés quel que soit le nombre de traductions produites, la colonne Taille indique en effet le nombre de phrases a` traduire dans le corpus de test. Le tableau 8 nous montre pour plusieurs mots 4

Le modèle de langage de la langue cible est un modèle trigram (méthode de lissage de Good-Turing , cutoff a` 7 pour les bigrams et les trigrams). Les poids des différents modèles sont les suivants : 1 pour le modèle de langage, 1 pour le modèle de traduction, 1 pour le modèle de réordonnancement et enfin une pénalité de mot de 0. Le décodage est fait avec ré-ordonnancement.

TAB . 8 – Comparaison des tables de traduction Mots français Coopération

Coopératives

Disciplines

Compétences

Difficulté

Modèle 2 cooperation co-operation collaboration cooperatives cooperative partnerships disciplines non-conventional subjects powers competences competence difficulty difficult difficulties

TAB . 7 – Evaluation des traductions automatiques Taille GIZA++ TrigDic

TrigDic e´ tendu

59530 0.24 5000 0.24 250 0.25

0.19 0.20 0.20

0.18 0.19 0.20

TrigDic e´ tendu lissé 0.21 0.21 0.22

français les 3 traductions les plus probables proposées par les deux différentes tables de traduction. La deuxième colonne correspond a` la table de traduction générée par Giza++ et la troisième a` la table de traduction basée sur les triggers inter-langues. Nous pouvons remarquer que sur ces exemples, le modèle 2 d’IBM et les triggers inter-langues proposent toujours la même traduction en première position. Pour les mots coopératives et disciplines, nous remarquons que notre modèle de traduction ne propose qu’une seule traduction avec une probabilité de 1, alors que le modèle 2 propose d’autres alternatives avec toutesfois de faibles probabilités. Pour améliorer les performances de notre méthode, nous e´ tudions deux idées. La première est que la taille de la liste des triggers inter-langues (10) et le nombre de traductions probables pour chaque mot (5) sont peut-être trop restrictifs. Pour développer cette première idée, nous avons e´ tendu

0.87 0.04 0.008 0.75 0.10 0.03 0.63 0.05 0.05 0.39 0.10 0.11 0.40 0.15 0.14

TrigDic cooperation development countries cooperatives disciplines powers competences competence difficulty difficulties -

0.73 0.11 0.10 1.00

1.00

0.42 0.12 0.09 0.75 0.25

notre dictionnaire bilingue TrigDic : pour chaque mot source et cible nous avons sélectionné les 50 meilleurs triggers inter-langues et chaque mot, en respectant la contrainte (4), est associé a` 10 traductions probables. Les résultats obtenus avec ce nouveau dictionnaire sont présentés dans le tableau 7 a` la colonne intitulée ’TrigDic e´ tendu’. Ils montrent une légère amélioration de la qualité des traductions automatiques produites. La seconde idée concerne la probabilité nulle assignée a` chaque couple de mots ne faisant pas partie du dictionnaire retenu. Cette règle ne permet pas qu’un mot cible qui ne serait pas dans la liste des n meilleures traductions d’un mot source en soit pourtant une traduction possible. C’est pourquoi nous pensons qu’il est nécessaire de lisser les probabilités afin de laisser a` plus de mots la chance d’être une traduction possible. Rappelons que notre table de traduction TrigDic ne contient que 31569 couples de traductions alors que celle issue du modèle 2 d’IBM en contient plus de 3 millions. Dans un premier temps, nous avons simplement ajouté la possibilité qu’un mot ne se traduise par aucun autre, ou en d’autres termes, qu’un mot dans une phrase source ne soit pas traduit dans la phrase cible proposée par le décodeur. Les résultats de cette deuxième expérience sont présentés dans la colonne ’TrigDic e´ tendu lissé’ du tableau 7 (nous avons utilisé le dictionnaire TrigDic e´ largi pour le lissage des probabilités vers le mot vide).

Cette première solution très simple conduit a` une meilleure performance en terme de score BLEU. Des techniques de lissage plus efficaces sont a` définir par la suite pour améliorer d’avantage les performances. Nous avons débuté nos travaux en traduisant les phrases source mot-à-mot. Cependant, une traduction réaliste procède, non pas mot-à-mot mais séquence par séquence. C’est-à-dire qu’un mot source peut se traduire par 0 ou n mots cibles et qu’un mot cible peut eˆ tre la traduction de 0 ou n mots sources. Le décodeur Pharaoh permet de segmenter la phrase source en séquences et de la traduire selon les probabilités de traduction fournies en entrée. Si la table de traduction contient uniquement des probabilités mot-à-mot, alors Pharaoh ne pourra pas segmenter la phrase en séquences. Il est donc nécessaire de lui fournir des probabilités de traduction de mots mais aussi de séquences. Il existe plusieurs méthodes d’extraction et d’estimation des probabilités de séquences. (Och and Ney, 2004) utilisent notamment l’alignement au niveau des mots préalablement e´ tabli en utilisant les modèles d’IBM. Les traductions de séquences sont alors extraites a` partir de l’alignement des mots sur un corpus d’apprentissage parallèle. Nous pensons qu’un autre moyen efficace serait d’extraire indépendamment les séquences dans une langue, puis dans l’autre et d’ensuite estimer leur probabilité de traduction. Nous avons déjà a` disposition dans notre e´ quipe des algorithmes de détection de séquences basés sur des méthodes statistiques qui ont e´ té développées dans les années précédentes (Zitouni et al., 2003)(Langlois et al., 2002). La prochaine e´ tape de nos travaux sera de rée´ crire nos corpus parallèles en séquences et d’utiliser ensuite les triggers inter-langues pour construire un dictionnaire plus efficace pour la traduction automatique non plus de mots mais de séquences. Ce nouveau dictionnaire devrait nous permettre d’améliorer la qualité des traductions produites par le décodeur Pharaoh.

7 Conclusion et perspectives Nous avons présenté une méthode de traduction de mots basée sur les triggers inter-langues. Ces triggers ont e´ té sélectionnés a` partir d’un corpus parallèle aligné au niveau de la phrase. Ils permettent de définir pour chaque mot (français ou anglais) une liste des mots (français ou an-

glais) qui lui sont fortement corrélés. Ainsi un mot français est associé a` une liste de mots anglais et vice versa. Une entrée de notre dictionnaire bilingue est constituée d’un mot source et de ses meilleures traductions probables. Un mot cible f est une traduction probable d’un mot source e si e est un trigger inter-langue de f et si f est un trigger inter-langue de e. Grâce a` cette méthode, nous avons construit un dictionnaire bilingue pertinent. Nous avons ensuite mené deux tâches pour e´ valuer au mieux la pertinence de notre dictionnaire bilingue. Nous l’avons, dans un premier temps, comparé a` deux dictionnaires existants, le premier fourni par ELRA et le second téléchargé d’Internet. Les résultats sont encourageants puisqu’ils montrent un taux de rappel de 65%. Nous avons e´ galement montré que ce taux serait probablement meilleur si notre dictionnaire e´ tait comparé a` un dictionnaire humain. Par la suite, nous ferons vérifier la justesse de celui-ci par un expert humain. Dans un second temps, nous avons intégré au décodeur Pharaoh notre propre modèle de traduction basé sur les triggers inter-langues. Nous avons ensuite comparé la qualité des traductions ainsi produites en terme de score BLEU par rapport a` celles produites dans les mêmes conditions avec un dictionnaire généré par le toolkit Giza++. Les premiers résultats montrent que notre méthode basée sur les triggers inter-langues est moins performante que celle de Giza++. Ceci est dû au fait que les probabilités de traductions ne sont pas lissées avec notre méthode et que la liste des traductions potentielles pour chaque entrée du dictionnaire est trop restrictive. Nous devons donc mettre au point des techniques de lissage. De cette façon, nous pourrons proposer plus de traductions potentielles. A court terme, nous proposons d’utiliser les séquences. Pour cela, notre méthode consistera a` détecter indépendemment les séquences françaises et anglaises et ensuite a` utiliser les triggers interlangues pour construire un dictionnaire bilingue de séquences. Le concept de triggers inter-langues semble, d’après ces premiers résultats, eˆ tre très intéressant. Il peut eˆ tre utilisé de différentes manières en traduction statistique, comme par exemple en tant que mesure de confiance. Les triggers sont e´ galement un formalisme souple qui permet de prendre en compte des séquences, des alignements

multiples mais aussi des informations de diverses natures dans la phrase. La prochaine e´ tape de nos travaux constite a` déterminer des triggers de séquences de mots, c’est-à-dire, n mots sources déclenchent m mots cibles. Ces triggers nous permettront de construire une table de traduction de séquences qui pourra ensuite eˆ tre intégrée a` un décodeur. Plusieurs autres applications des triggers inter-langues ont e´ té envisagées et sont en cours de développement dans notre groupe de recherche.

8 Remerciements Ce travail est subventionné par la fondation d’entreprises EADS (European Aeronautic Defence and Space Company) dans le cadre d’une thèse sur la traduction Parole-Parole

References P. F. Brown and al. 1993. The mathematics of statistical machine translation : parameter estimation. Computational Linguistics, 19 :263–311. A. Dempster, N. Laird, and D. Rubin. 1977. Maximum likelihood from incomplete data via the em algorithm. Journal of the Royal Statistical Society B, 39 :1–38. D. Hiemstra. 1996. Using Statistical Methods to Create a Bilingual Dictionary. Ph.D. thesis, University of Twente, The Netherlands. Woosung Kim and Sanjeev Khudanpur. 2004. Lexical triggers and latent semantic analysis for crosslingual language model adaptation. ACM Transactions on Asian Language Information Processing (TALIP), 3(2) :94–112. J.L. Klavans and E. Tzoukermann. 1990. The bicord system, combining lexical information from bilingual corpora and machine readable dictionaries. In Proceedings of the 13th Annual Meeting of the Association of Computational Linguistics, pages 174– 179. P. Koehn. 2004. Pharaoh : A beam search decoder for phrase-based statistical machine translation models. In 6th Conference Of The Association For Machine Translation In The Americas, pages 115–224, Washington, DC, USA. P. Koehn. 2005. Europarl : A multilingual corpus for evaluation of machine translation. In MT Summit, Thailand. R. Kuhn and R. DeMori. 1990. A cache-based natural language model for speech recognition. IEEE Trans. PAMI, 12(6) :570–582. A. Kumano and H. Hirakawa. 1994. Building a MT dictionary from parallel texts based on linguistic and statistical information. In Proceedings of the 15th COLING, pages 76–81, Japan.

D. Langlois, K. Sma¨ıli, and J.-P. Haton. 2002. Retrieving phrases by selecting the history : application to automatic speech recognition. In Proc. ICSLP, pages 721–724, Denver. Franz Josef Och and Hermann Ney. 2000. Improved statistical alignment models. In ACL ’00 : Proceedings of the 38th Annual Meeting on Association for Computational Linguistics, pages 440–447, Morristown, NJ, USA. Association for Computational Linguistics. Franz Josef Och and Hermann Ney. 2004. The alignment template approach to statistical machine translation. In Proceedings of ACL. K. Papineni and al. 2001. Bleu : a method for automatic evaluation of machine translation. In Proceedings of the 40th Annual of the Association for Computational linguistics, pages 311–318, Philadelphia, USA. F. Smadja, K.R McKeown, and V. Hatzivassiloglou. 1996. Translating collocations for bilingual lexicons : A statistical approach. Association for Computational Linguistics, 22(1) :1–38. C. Tillmann and H. Ney, 1996. Selection criteria for word trigger pairs in language modeling, pages 98– 106. Lecture Notes in Artificial Intelligence 1147, Springer Verlag. C. Tillmann and H. Ney. 1997. Word trigger and the EM algorithm. In Proceedings of the Conference on Computational Natural Language Learning, pages 117–124, Madrid, Spain. I. Zitouni, K. Sma¨ıli, and J.-P. Haton. 2003. Statistical language modeling based on variable-length sequences. Computer Speech and Language, 17 :27– 41.

Les triggers inter-langues pour la Traduction Automatique - atala

des documents recommandant