Les triggers inter-langues pour la Traduction Automatique - atala

cibles suivant la valeur de l'IMG. Les triggers inter-langues sont déj`a utilisés en modélisation du langage pour enrichir des langues faiblement dotées `a partir ...
74KB taille 3 téléchargements 360 vues
Les triggers inter-langues pour la Traduction Automatique

Caroline Lavecchia LORIA/Speech Group Vandoeuvre, France [email protected]

Kamel Sma¨ıli LORIA/Speech Group Vandoeuvre, France [email protected]

R´esum´e Dans cet article, nous d´ecrivons le concept de triggers inter-langues. Nous expliquons ensuite comment nous avons utilis´e de tels triggers pour construire automatiquement un dictionnaire bilingue. Nous avons par la suite e´ valu´e notre dictionnaire bilingue en le comparant a` deux dictionnaires existants, le premier fourni par ELRA et le second en libre acc`es sur Internet. Cependant, afin de rendre compte de la r´eelle contribution des triggers inter-langues en traduction automatique, nous avons produit une table de traduction a` partir de notre dictionnaire bilingue et l’avons test´ee avec le d´ecodeur Pharaoh (Koehn, 2004). Nous avons compar´e, en terme de score BLEU, les traductions automatiques obtenues a` l’aide de notre table de traduction avec celles produites en utilisant une table de traduction g´en´er´ee par l’outil Giza++ (Och and Ney, 2000). Les diff´erents tests men´es ont montr´e que le dictionnaire bilingue obtenu a` partir des triggers inter-langues est bien construit et convenable pour la traduction automatique. Le dictionnaire bilingue a e´ t´e construit et e´ valu´e sur un corpus parall`ele de 19 millions de mots franc¸ais et 17 millions de mots anglais extrait des actes du Parlement Europ´een.

1 Introduction Les m´ethodes statistiques sont utilis´ees dans de nombreux domaines du traitement de la langue naturelle notamment en reconnaissance de la Parole, en reconnaissance optique des caract`eres (OCR), en fouille de donn´ees, en traduction automatique Parole-Parole,. . .Elles n´ecessitent des quantit´es importantes de corpus afin d’apprendre les param`etres des diff´erents mod`eles relatifs a` chacun des domaines. Les corpus sont par exemple utilis´es en reconnaissance de la Parole, en OCR ou en indexation pour construire automatiquement des dictionnaires. Dans cet article, nous cherchons a` tirer profit de corpus parall`eles align´es pour construire un dictionnaire bilingue. En d’autres termes, pour chaque mot e d’une langue source, l’objectif est de trouver les n meilleures traduc-

David Langlois LORIA/Speech Group Vandoeuvre, France [email protected]

tions probables f1 , f2 , . . . , fn dans une langue cible et vice versa. Il existe diff´erents moyens pour cr´eer un dictionnaire bilingue comme par exemple utiliser des connaissances linguistiques. C’est le cas pour la cr´eation de dictionnaires dits humains (Klavans and Tzoukermann, 1990). Il est e´ galement possible de construire automatiquement des dictionnaires bilingues a` partir de corpus parall`eles en utilisant des techniques bas´ees sur l’algorithme EM (Dempster et al., 1977) utilis´ees, par exemple, par l’outil Giza++ (Och and Ney, 2000). Hiemstra (Hiemstra, 1996) propose un algorithme EM sym´etrique pour d´efinir un dictionnaire bi-directionnel qui donne selon lui une meilleure estimation des probabilit´es de traduction. Kumano et Hirakawa (Kumano and Hirakawa, 1994) combinent des connaissances linguistiques et des informations statistiques pour g´en´erer automatiquement a` partir de corpus parall`eles anglais et japonnais un dictionnaire de traduction. Smadja et al (Smadja et al., 1996) proposent, quant a` eux, un outil nomm´e Champollion qui permet de traduire une liste de collocations a` partir de corpus parall`eles en utilisant le coefficient Dice comme mesure de similarit´e entre une collocation et sa traduction. Nous proposons d’utiliser les triggers inter-langues pour construire un dictionnaire bilingue. Dans cet article, nous pr´esentons dans la partie 2 la notion g´en´erale des triggers. La partie 3 d´efinit le concept de triggers inter-langues qui associe a` chaque mot de la langue source une liste de traductions possibles. Dans la partie 4, les corpus utilis´es et les r´esultats obtenus sont d´ecrits et analys´es. Nous terminons enfin par une conclusion qui met en avant les points forts de notre m´ethode et donne quelques perspectives futures des travaux de notre groupe de recherche.

2 Rappel sur les triggers

corpus selon les e´ quations suivantes :

Le concept de triggers est tr`es souvent cit´e en mod´elisation du langage. Les triggers permettent entre autre d’am´eliorer et de g´en´eraliser le mod`ele Cache (Kuhn and DeMori, 1990). Le mod`ele Cache favorise la probabilit´e d’un mot wi r´ecemment apparu dans le contexte gauche. Un mod`ele de triggers va plus loin et accorde une probabilit´e plus importante a` une liste de mots corr´el´es au mot wi (Tillmann and Ney, 1996). Les triggers sont s´electionn´es selon la valeur de l’Information Mutuelle (IM) donn´ee par la formule suivante : IM (x, y) = log2

P (x, y) P (x)P (y)

(1)

Chaque mot appartenant au vocabulaire est alors associ´e a` n mots qui lui sont le plus fortement corr´el´es d’apr`es la valeur de l’IM. Un trigger est un ensemble compos´e d’un mot appel´e d´eclencheur et d’une liste des mots qu’il d´eclenche appel´es d´eclench´es. La figure 1 illustre un exemple de triggers anglais. Les triggers sont utilis´es en mod´elisation du langage. Ils permettent d’estimer les probabilit´es des mots sachant leur historique P (w|h). Ils sont g´en´eralement combin´es avec les mod`eles classiques n-gramme (Tillmann and Ney, 1997).

3 Les triggers inter-langues Le concept des triggers est e´ tendu a` celui de triggers inter-langues. Un trigger inter-langue est d´efini comme e´ tant un ensemble compos´e d’un mot source d´eclencheur e et des mots cibles qui lui sont fortement corr´el´es f1 , f2 , . . . , fn . Nous formalisons cette notion ainsi : T rig(e) −→ f1 , f2 , . . . , fn . La m´ethode que nous proposons permet de g´en´erer des triggers inter-langues, c’esta` -dire de la langue source vers la langue cible mais aussi de la langue cible vers la langue source. Pour ce faire, les paires de phrases du corpus parall`ele sont concat´en´ees pour ne former qu’un simple et mˆeme corpus (la figure 2 montre un exemple de triggers inter-langues de l’Anglais vers le Franc¸ais). Pour chaque couple de mots d´eclencheur-d´eclench´e (eki ,fjk ) et pour chaque paire k de phrases concat´en´ees du corpus, une Information Mutuelle Partielle (IMP ) est calcul´ee. L’Information Mutuelle Globale (IMG ) est ensuite calcul´ee pour le couple (ei ,fj ) sur tout le

IMP (eki , fjk ) = log

P (eki , fjk ) P (eki )P (fjk )

S 1X IMP (eki , fjk ) IMG (ei , fj ) = S

(2)

(3)

k=1

o`u S est le nombre de paires de phrases dans le corpus d’apprentissage. Notons que si ei et/ou fj n’apparaissent pas dans la ki`eme paire alors l’information mutuelle partielle IMP (eki , fjk ) sera nulle. Pour chaque mot source e, nous conservons comme triggers inter-langues les n meilleurs mots cibles suivant la valeur de l’IMG . Les triggers inter-langues sont d´ej`a utilis´es en mod´elisation du langage pour enrichir des langues faiblement dot´ees a` partir d’autres langues tr`es riches en termes de corpus (Kim and Khudanpur, 2004). Cependant l’originalit´e de l’´equation (3) r´eside dans la variabilit´e de la taille de la fenˆetre de calcul des IMG . En effet, pour chaque couple (mot source, mot cible), nous calculons son IMG au sein de chaque paire de traductions concat´en´ees. Cela nous permet de d´etecter les mots fortement corr´el´es de la langue source vers la langue cible et ainsi de construire un dictionnaire bilingue. Plus clairement, nous souhaitons extraire un ensemble de mots cibles F = f1 , f2 , . . . , fn fortement corr´el´es a` un mot source e et trouver dans cet ensemble F un sous-ensemble de mots qui seraient des traductions possibles de e. Une normalisation de l’IMG associ´ee a` chaque trigger nous permet aussi de leur attribuer une probabilit´e et de transformer le dictionnaire bilingue en table de traduction pour le processus de d´ecodage.

4 Construction du dictionnaire Les exp´eriences que nous allons pr´esenter ont e´ t´e men´ees sur les actes du Parlement Europ´een (Koehn, 2005). Nous avons utilis´e un corpus parall`ele Anglais-Franc¸ais de 598014 paires de phrases avec 19 millions de mots franc¸ais (dont 78431 diff´erents) et 17 millions de mots anglais (dont 56243 diff´erents). Le vocabulaire utilis´e est obtenu a` partir des 26811 (respectivement 19588) mots franc¸ais (respectivement anglais) les plus fr´equents1 . Une liste des 10 meilleurs triggers inter-langues est retenue pour chaque mot du vocabulaire. Aucun mot outil de la langue 1

Les mots de plus de 7 occurences.

Boris Kasparov is a chess champion

F IG . 1 – Exemples de triggers classiques

Boris Kasparov is a chess champion Boris Kasparov est un champion d’ échecs

F IG . 2 – Exemples de triggers inter-langues (g´en´eralement les mots courts en Anglais et en Franc¸ais comme : or, it, in, thus ...., de, la, le, donc, ...) n’est pris en compte pour le calcul des triggers. Les mots outils ne sont ni des d´eclencheurs, ni des d´eclench´es. Leurs traductions sont ajout´ees manuellement dans le dictionnaire. Notre m´ethode conduit a` de remarquables triggers inter-langues. De mani`ere g´en´erale, nous avons constat´e que les mots d´eclench´es pouvaient souvent eˆ tre apparent´es a` de possibles traductions du mot d´eclencheur ou a` des mots vraiment tr`es proches du point de vue du sens. Quelques exemples de triggers Anglais-Franc¸ais sont pr´esent´es dans le tableau 1, de mˆeme des exemples de triggers Franc¸ais-Anglais sont pr´esent´es dans le tableau 2. La troisi`eme colonne des tableaux indique pour chaque couple de mots d´eclencheur-d´eclench´e la valeur de l’Information Mutuelle Globale qui lui est associ´ee. Au vu de ces premiers r´esultats, nous pensons que l’utilisation des triggers inter-langues peut eˆ tre le point de d´epart de beaucoup de techniques en Traduction Automatique. Notre premier objectif est de construire a` partir de ces triggers inter-langues un dictionnaire bilingue. Dans cet article, nous nous int´eressons seulement au Franc¸ais et a` l’Anglais, mais cette m´ethode pourrait eˆ tre appliqu´ee a` beaucoup d’autres couples de langues. Une liste de p traductions est produite pour chaque mot source du vocabulaire. Les traductions d’un mot source e sont obtenues en s´electionnant parmi les mots cibles qu’il d´eclenche f1 , f2 , . . . , fn ceux qui le d´eclenchent en retour comme le montre la figure 3. Plus pr´ecis´ement, les traductions du mot source

TAB . 1 – Exemples de mots franc¸ais d´eclench´es par des mots anglais D´eclench´es M IG × 10−4 franc¸ais coop´eration 38 Cooperation collaboration 7 d´eveloppement 6 coop´eratives 0.31 Cooperatives entreprises 0.09 associations 0.09 difficult´e 1.5 Difficulty difficult´es 0.9 probl`eme 0.5 disciplines 0.22 Disciplines r`egles 0.07 investissements 0.06 comp´etences 1.22 Competences pouvoirs 0.1 institutions 0.09 D´eclencheur anglais

e dans le dictionnaire bilingue sont d´efinies de la fac¸on suivante : e: f1 , f2 , . . . , fp ⇔ ∀j ∈ [1..n], e ∈ T rig(fj ) (4) et fj ∈ T rig(e) Les tableaux 3 et 4 illustrent respectivement des extraits des dictionnaires Anglais-Franc¸ ais et Franc¸ais-Anglais obtenus en respectant la contrainte (4). Les traductions propos´ees sont donn´ees suivant l’ordre d´ecroissant de l’Information Mutuelle Globale.

TAB . 2 – Exemples de mots anglais d´eclench´es par des mots franc¸ais M IG × 10−4

D´eclencheur D´eclench´es franc¸ais anglais cooperation Coop´eration development countries cooperatives Coop´eratives women associations difficulty Difficult´e difficulties difficult disciplines Disciplines new different powers Comp´etences competences competence Source−Target Triggers

f

38 6 5 0.31 0.09 0.08 1.5 0.5 0.5 0.22 0.05 0.04 4 1.2 1

Target−Source Triggers

e e

...

. .

e

e e

. . . . . .

e

11

12

e.

1k 1

1

Bilingual dictionary

f f e

2

21

22

2k 2

3

. .

f

i

e e e i1

i2

. .. . .

. . . .

f

n

e e 11

n2

.. .

e.

. . . .

e:f. 1, fi , f n

e

. . .

ik i

. . en k

n

F IG . 3 – Illustration de la construction du dictionnaire bilingue

TAB . 3 – Un extrait du dictionnaire automatique Anglais-Franc¸ais Mot anglais Fish Fisherman Flag Flexible Foods Henceforth

TAB . 4 – Un extrait du dictionnaire automatique Franc¸ais-Anglais Mot franc¸ais Humide Humble Maison Mort Sonnette Urgence

poisson pˆecheurs drapeau souple alimentaire dor´enavant

poissons pˆeche navires travail produits d`es

wetland humble house death alarm urgent

wet opinion home penalty sound urgency

rainforest modest houses people bells emergency

5 Exp´erimentations et e´ valuations Nous avons construit un dictionnaire bilingue, que nous appelons TrigDic, selon la m´ethode pr´esent´ee a` la partie 4. Chaque mot source est d’abord associ´e a` 10 mots cibles et inversement. Nous disposons ainsi de 284703 couples franc¸aisanglais. Ensuite, en respectant la propri´et´e de sym´etrisation (4) pour chaque mot franc¸ais, nous gardons au plus les 5 meilleures traductions anglaises possibles. TrigDic compte ainsi 31569 couples de traductions possibles. Afin d’´evaluer TrigDic, nous l’avons compar´e a` deux dictionnaires. Le premier (ELRA) est distribu´e par ELRA2, le second (Internet) a e´ t´e t´el´echarg´e sur Internet3 . La comparaison a e´ t´e men´ee dans le sens Franc¸ais-Anglais et seulement sur les mots franc¸ais en commun avec TrigDic. 10405 mots franc¸ais se trouvent a` la fois dans le dictionnaire ELRA et dans TrigDic alors que 11265 sont pr´esents a` la fois dans le dictionnaire issu d’Internet et dans TrigDic. Nous avons utilis´e la mesure du Rappel pour e´ valuer notre dictionnaire bilingue. Le tableau 5 indique les taux de Rappel entre TrigDic et les deux autres dictionnaires. TAB . 5 – R´esultats en terme de Rappel

Traductions potentielles pˆeche pˆecheur pavillon flexible alimentaires d´esormais

Traductions potentielles

ELRA Internet

Rang1 Rang5 53% 65% 41% 52%

Les r´esultats montrent qu’en ne prenant en compte que les traductions donn´ees en premi`ere 2

M0033-3 SCI-FRAN-EURADIC, 70832 entr´ees http ://xdxf.revdanica.com/down/index.php, 41398 entr´ees 3

position, c’est-`a-dire la meilleure traduction selon l’IMG pour chaque mot franc¸ais, le rappel est de 53% par rapport au dictionnaire ELRA et de 41% par rapport au dictionnaire d’Internet. Ces taux augmentent si nous consid´erons la totalit´e des traductions probables sans tenir compte de leur rang. Le rappel est, dans ce cas, de 65% par rapport au dictionnaire ELRA et de 52% par rapport au dictionnaire d’Internet. En prenant le dictionnaire ELRA comme dictionnaire de r´ef´erence, nous pouvons dire, dans un premier temps, que dans 65% des cas, notre m´ethode bas´ee sur les triggers inter-langues donnent une traduction satisfaisante d’un mot franc¸ais. En contre-partie nous obtenons donc un taux d’´echec de 35%. Toutefois, une analyse plus pouss´ee nous permet de minimiser ce taux d’´echec pour les raisons suivantes : – Nous ne retenons que les 5 meilleures traductions probables pour chaque mot franc¸ais dans TrigDic – Nous avons remarqu´e que souvent les traductions de TrigDic non pr´esentes dans le dictionnaire ELRA e´ taient tout de mˆeme correctes ou avaient un sens tr`es proche de la traduction propos´ee par ELRA. – Dans d’autres cas, la traduction propos´ee par ELRA e´ tait beaucoup moins courante que celle propos´ee par TrigDic comme le montre les exemples du tableau 6. La traduction de TrigDic aussi correcte soit-elle e´ tait compt´ee comme fausse.

TAB . 6 – Comparaison entre les dictionnaires ELRA et TrigDic Word chevaux chim`ere

ELRA horsefles bubble

d´el´egu´ee

deputy

TrigDic horses, animals, horse illusion, fantasy, dream, fancy delegated, united, delegate, legislative

En r´esum´e de cette premi`ere analyse, nous pouvons dire que les r´esultats sont tr`es int´eressants et que le taux de Rappel est sˆurement sup´erieur a` 65%. Afin d’´evaluer TrigDic le plus pr´ecis´ement possible, il serait pr´ef´erable de le comparer a` un dictionnaire de r´ef´erence construit a` la main.

6 La traduction automatique avec les triggers inter-langues Pour rendre compte de la r´eelle contribution de notre m´ethode, bas´ee sur les triggers inter-langues, en traduction automatique, nous avons int´egr´e notre dictionnaire bilingue dans un processus complet de d´ecodage. Nous avons pour cela utilis´e le d´ecodeur Pharaoh4 (Koehn, 2004). Nous nous sommes int´eress´es a` la qualit´e des traductions qu’il pouvait produire en utilisant un mod`ele de traduction bas´e sur les triggers inter-langues. Pour se faire, nous adaptons notre dictionnaire bilingue pour en faire une table de traduction. Nous assignons a` chaque traduction potentielle de TrigDic une probabilit´e r´esultant de la normalisation de l’Information Mutuelle Globale. Les probabilit´es de tous les couples de mots qui ne font pas partie du dictionnaire sont fix´ees a` 0. Cette table de traduction est ensuite donn´ee en param`etre a` Pharaoh. Dans un premier temps, nous avons men´e des tests avec le dictionnaire TrigDic g´en´er´e dans la partie 4 : une liste des 10 meilleurs triggers inter-langues est associ´ee a` chaque mot source et chaque mot cible, et pour chaque mot nous conservons les 5 meilleures traductions suivant la contrainte formul´ee en (4) et selon l’IMG . Nous comparons ensuite, grˆace a` la mesure BLEU (Papineni and al., 2001), la qualit´e des traductions automatiques produites par Pharaoh avec la table de traduction TrigDic sur une partie du corpus source avec la qualit´e de celles produites par le mˆeme d´ecodeur et dans les mˆemes conditions mais cette fois avec en entr´ee une table de traduction g´en´er´ee par l’outil Giza++ en utilisant le mod`ele 2 d’IBM (Brown and al., 1993). Les r´esultats du tableau 7 montrent que les traductions automatiques produites a` partir de notre dictionnaire TrigDic sont, d’apr`es le crit`ere BLEU, de moins bonne qualit´e que celles g´en´er´ees a` l’aide du dictionnaire de Giza++. Ces r´esultats sont confirm´es quel que soit le nombre de traductions produites, la colonne Taille indique en effet le nombre de phrases a` traduire dans le corpus de test. Le tableau 8 nous montre pour plusieurs mots 4

Le mod`ele de langage de la langue cible est un mod`ele trigram (m´ethode de lissage de Good-Turing , cutoff a` 7 pour les bigrams et les trigrams). Les poids des diff´erents mod`eles sont les suivants : 1 pour le mod`ele de langage, 1 pour le mod`ele de traduction, 1 pour le mod`ele de r´eordonnancement et enfin une p´enalit´e de mot de 0. Le d´ecodage est fait avec r´e-ordonnancement.

TAB . 8 – Comparaison des tables de traduction Mots franc¸ais Coop´eration

Coop´eratives

Disciplines

Comp´etences

Difficult´e

Mod`ele 2 cooperation co-operation collaboration cooperatives cooperative partnerships disciplines non-conventional subjects powers competences competence difficulty difficult difficulties

TAB . 7 – Evaluation des traductions automatiques Taille GIZA++ TrigDic

TrigDic e´ tendu

59530 0.24 5000 0.24 250 0.25

0.19 0.20 0.20

0.18 0.19 0.20

TrigDic e´ tendu liss´e 0.21 0.21 0.22

franc¸ais les 3 traductions les plus probables propos´ees par les deux diff´erentes tables de traduction. La deuxi`eme colonne correspond a` la table de traduction g´en´er´ee par Giza++ et la troisi`eme a` la table de traduction bas´ee sur les triggers inter-langues. Nous pouvons remarquer que sur ces exemples, le mod`ele 2 d’IBM et les triggers inter-langues proposent toujours la mˆeme traduction en premi`ere position. Pour les mots coop´eratives et disciplines, nous remarquons que notre mod`ele de traduction ne propose qu’une seule traduction avec une probabilit´e de 1, alors que le mod`ele 2 propose d’autres alternatives avec toutesfois de faibles probabilit´es. Pour am´eliorer les performances de notre m´ethode, nous e´ tudions deux id´ees. La premi`ere est que la taille de la liste des triggers inter-langues (10) et le nombre de traductions probables pour chaque mot (5) sont peut-ˆetre trop restrictifs. Pour d´evelopper cette premi`ere id´ee, nous avons e´ tendu

0.87 0.04 0.008 0.75 0.10 0.03 0.63 0.05 0.05 0.39 0.10 0.11 0.40 0.15 0.14

TrigDic cooperation development countries cooperatives disciplines powers competences competence difficulty difficulties -

0.73 0.11 0.10 1.00

1.00

0.42 0.12 0.09 0.75 0.25

notre dictionnaire bilingue TrigDic : pour chaque mot source et cible nous avons s´electionn´e les 50 meilleurs triggers inter-langues et chaque mot, en respectant la contrainte (4), est associ´e a` 10 traductions probables. Les r´esultats obtenus avec ce nouveau dictionnaire sont pr´esent´es dans le tableau 7 a` la colonne intitul´ee ’TrigDic e´ tendu’. Ils montrent une l´eg`ere am´elioration de la qualit´e des traductions automatiques produites. La seconde id´ee concerne la probabilit´e nulle assign´ee a` chaque couple de mots ne faisant pas partie du dictionnaire retenu. Cette r`egle ne permet pas qu’un mot cible qui ne serait pas dans la liste des n meilleures traductions d’un mot source en soit pourtant une traduction possible. C’est pourquoi nous pensons qu’il est n´ecessaire de lisser les probabilit´es afin de laisser a` plus de mots la chance d’ˆetre une traduction possible. Rappelons que notre table de traduction TrigDic ne contient que 31569 couples de traductions alors que celle issue du mod`ele 2 d’IBM en contient plus de 3 millions. Dans un premier temps, nous avons simplement ajout´e la possibilit´e qu’un mot ne se traduise par aucun autre, ou en d’autres termes, qu’un mot dans une phrase source ne soit pas traduit dans la phrase cible propos´ee par le d´ecodeur. Les r´esultats de cette deuxi`eme exp´erience sont pr´esent´es dans la colonne ’TrigDic e´ tendu liss´e’ du tableau 7 (nous avons utilis´e le dictionnaire TrigDic e´ largi pour le lissage des probabilit´es vers le mot vide).

Cette premi`ere solution tr`es simple conduit a` une meilleure performance en terme de score BLEU. Des techniques de lissage plus efficaces sont a` d´efinir par la suite pour am´eliorer d’avantage les performances. Nous avons d´ebut´e nos travaux en traduisant les phrases source mot-`a-mot. Cependant, une traduction r´ealiste proc`ede, non pas mot-`a-mot mais s´equence par s´equence. C’est-`a-dire qu’un mot source peut se traduire par 0 ou n mots cibles et qu’un mot cible peut eˆ tre la traduction de 0 ou n mots sources. Le d´ecodeur Pharaoh permet de segmenter la phrase source en s´equences et de la traduire selon les probabilit´es de traduction fournies en entr´ee. Si la table de traduction contient uniquement des probabilit´es mot-`a-mot, alors Pharaoh ne pourra pas segmenter la phrase en s´equences. Il est donc n´ecessaire de lui fournir des probabilit´es de traduction de mots mais aussi de s´equences. Il existe plusieurs m´ethodes d’extraction et d’estimation des probabilit´es de s´equences. (Och and Ney, 2004) utilisent notamment l’alignement au niveau des mots pr´ealablement e´ tabli en utilisant les mod`eles d’IBM. Les traductions de s´equences sont alors extraites a` partir de l’alignement des mots sur un corpus d’apprentissage parall`ele. Nous pensons qu’un autre moyen efficace serait d’extraire ind´ependamment les s´equences dans une langue, puis dans l’autre et d’ensuite estimer leur probabilit´e de traduction. Nous avons d´ej`a a` disposition dans notre e´ quipe des algorithmes de d´etection de s´equences bas´es sur des m´ethodes statistiques qui ont e´ t´e d´evelopp´ees dans les ann´ees pr´ec´edentes (Zitouni et al., 2003)(Langlois et al., 2002). La prochaine e´ tape de nos travaux sera de r´ee´ crire nos corpus parall`eles en s´equences et d’utiliser ensuite les triggers inter-langues pour construire un dictionnaire plus efficace pour la traduction automatique non plus de mots mais de s´equences. Ce nouveau dictionnaire devrait nous permettre d’am´eliorer la qualit´e des traductions produites par le d´ecodeur Pharaoh.

7 Conclusion et perspectives Nous avons pr´esent´e une m´ethode de traduction de mots bas´ee sur les triggers inter-langues. Ces triggers ont e´ t´e s´electionn´es a` partir d’un corpus parall`ele align´e au niveau de la phrase. Ils permettent de d´efinir pour chaque mot (franc¸ais ou anglais) une liste des mots (franc¸ais ou an-

glais) qui lui sont fortement corr´el´es. Ainsi un mot franc¸ais est associ´e a` une liste de mots anglais et vice versa. Une entr´ee de notre dictionnaire bilingue est constitu´ee d’un mot source et de ses meilleures traductions probables. Un mot cible f est une traduction probable d’un mot source e si e est un trigger inter-langue de f et si f est un trigger inter-langue de e. Grˆace a` cette m´ethode, nous avons construit un dictionnaire bilingue pertinent. Nous avons ensuite men´e deux tˆaches pour e´ valuer au mieux la pertinence de notre dictionnaire bilingue. Nous l’avons, dans un premier temps, compar´e a` deux dictionnaires existants, le premier fourni par ELRA et le second t´el´echarg´e d’Internet. Les r´esultats sont encourageants puisqu’ils montrent un taux de rappel de 65%. Nous avons e´ galement montr´e que ce taux serait probablement meilleur si notre dictionnaire e´ tait compar´e a` un dictionnaire humain. Par la suite, nous ferons v´erifier la justesse de celui-ci par un expert humain. Dans un second temps, nous avons int´egr´e au d´ecodeur Pharaoh notre propre mod`ele de traduction bas´e sur les triggers inter-langues. Nous avons ensuite compar´e la qualit´e des traductions ainsi produites en terme de score BLEU par rapport a` celles produites dans les mˆemes conditions avec un dictionnaire g´en´er´e par le toolkit Giza++. Les premiers r´esultats montrent que notre m´ethode bas´ee sur les triggers inter-langues est moins performante que celle de Giza++. Ceci est dˆu au fait que les probabilit´es de traductions ne sont pas liss´ees avec notre m´ethode et que la liste des traductions potentielles pour chaque entr´ee du dictionnaire est trop restrictive. Nous devons donc mettre au point des techniques de lissage. De cette fac¸on, nous pourrons proposer plus de traductions potentielles. A court terme, nous proposons d’utiliser les s´equences. Pour cela, notre m´ethode consistera a` d´etecter ind´ependemment les s´equences franc¸aises et anglaises et ensuite a` utiliser les triggers interlangues pour construire un dictionnaire bilingue de s´equences. Le concept de triggers inter-langues semble, d’apr`es ces premiers r´esultats, eˆ tre tr`es int´eressant. Il peut eˆ tre utilis´e de diff´erentes mani`eres en traduction statistique, comme par exemple en tant que mesure de confiance. Les triggers sont e´ galement un formalisme souple qui permet de prendre en compte des s´equences, des alignements

multiples mais aussi des informations de diverses natures dans la phrase. La prochaine e´ tape de nos travaux constite a` d´eterminer des triggers de s´equences de mots, c’est-`a-dire, n mots sources d´eclenchent m mots cibles. Ces triggers nous permettront de construire une table de traduction de s´equences qui pourra ensuite eˆ tre int´egr´ee a` un d´ecodeur. Plusieurs autres applications des triggers inter-langues ont e´ t´e envisag´ees et sont en cours de d´eveloppement dans notre groupe de recherche.

8 Remerciements Ce travail est subventionn´e par la fondation d’entreprises EADS (European Aeronautic Defence and Space Company) dans le cadre d’une th`ese sur la traduction Parole-Parole

References P. F. Brown and al. 1993. The mathematics of statistical machine translation : parameter estimation. Computational Linguistics, 19 :263–311. A. Dempster, N. Laird, and D. Rubin. 1977. Maximum likelihood from incomplete data via the em algorithm. Journal of the Royal Statistical Society B, 39 :1–38. D. Hiemstra. 1996. Using Statistical Methods to Create a Bilingual Dictionary. Ph.D. thesis, University of Twente, The Netherlands. Woosung Kim and Sanjeev Khudanpur. 2004. Lexical triggers and latent semantic analysis for crosslingual language model adaptation. ACM Transactions on Asian Language Information Processing (TALIP), 3(2) :94–112. J.L. Klavans and E. Tzoukermann. 1990. The bicord system, combining lexical information from bilingual corpora and machine readable dictionaries. In Proceedings of the 13th Annual Meeting of the Association of Computational Linguistics, pages 174– 179. P. Koehn. 2004. Pharaoh : A beam search decoder for phrase-based statistical machine translation models. In 6th Conference Of The Association For Machine Translation In The Americas, pages 115–224, Washington, DC, USA. P. Koehn. 2005. Europarl : A multilingual corpus for evaluation of machine translation. In MT Summit, Thailand. R. Kuhn and R. DeMori. 1990. A cache-based natural language model for speech recognition. IEEE Trans. PAMI, 12(6) :570–582. A. Kumano and H. Hirakawa. 1994. Building a MT dictionary from parallel texts based on linguistic and statistical information. In Proceedings of the 15th COLING, pages 76–81, Japan.

D. Langlois, K. Sma¨ıli, and J.-P. Haton. 2002. Retrieving phrases by selecting the history : application to automatic speech recognition. In Proc. ICSLP, pages 721–724, Denver. Franz Josef Och and Hermann Ney. 2000. Improved statistical alignment models. In ACL ’00 : Proceedings of the 38th Annual Meeting on Association for Computational Linguistics, pages 440–447, Morristown, NJ, USA. Association for Computational Linguistics. Franz Josef Och and Hermann Ney. 2004. The alignment template approach to statistical machine translation. In Proceedings of ACL. K. Papineni and al. 2001. Bleu : a method for automatic evaluation of machine translation. In Proceedings of the 40th Annual of the Association for Computational linguistics, pages 311–318, Philadelphia, USA. F. Smadja, K.R McKeown, and V. Hatzivassiloglou. 1996. Translating collocations for bilingual lexicons : A statistical approach. Association for Computational Linguistics, 22(1) :1–38. C. Tillmann and H. Ney, 1996. Selection criteria for word trigger pairs in language modeling, pages 98– 106. Lecture Notes in Artificial Intelligence 1147, Springer Verlag. C. Tillmann and H. Ney. 1997. Word trigger and the EM algorithm. In Proceedings of the Conference on Computational Natural Language Learning, pages 117–124, Madrid, Spain. I. Zitouni, K. Sma¨ıli, and J.-P. Haton. 2003. Statistical language modeling based on variable-length sequences. Computer Speech and Language, 17 :27– 41.