Diapo-PDF - Yayoi NAKAMURA-DELLOYE

Introduction
Introduction
Séminaire INALCO “Corpus parallèles”, 8 février 2008
Textes parallèles et
alignement 1/2
Alignement automatique
des propositions
français-japonais
Alignement = mise en correspondance entre des unités de
textes parallèles
Textes parallèles = ensemble de textes de langues
différentes, constitué d'un texte original et de ses
traductions
Corpus compilés anglais-japonais de taille importante
Ya y o i
N A K A M U R A - D E L L O Y E
Textes parallèles français-japonais
Le Monde Diplomatique
Label France
Manuels de logiciels libres
Textes G7, G8, etc.
Textes littéraires (Aozora Bunko : http://www.aozora.gr.jp/)
Université Paris VII, LATTICE - CNRS UMR 8094
Université Paris X, MoDyCo - CNRS UMR 7114
[email protected]
2 / 77
Séminaire INALCO, le 8 février 2008
Introduction
Introduction
Introduction
Textes parallèles et
alignement 2/2
Corpus alignés (bi- ou multitexte)
Différentes applications (e.g. mémoires de traduction,
dictionnaires)
Corpus alignés anglais-japonais disponibles sur le site du NICT
(National Institute of Information and Communications Technology)
Corpus aligné français-japonais dans le package d’évaluation
ARCADE II
Systèmes d’alignement
! disponibles sur Internet (ex. GIZA++)
! Système d’alignement phrastique Fr-Jp : AlALeR
(Nakamura-Delloye, 2005)
Yayoi NAKAMURA - DELLOYE
Introduction
Pourquoi la proposition ? 1/2
Nécessité d’une unité de traitement plus petite que la
phrase
! Proposition = bon candidat
la documentation technique ;
l’analyse discursive ;
...
Possibilité d’alignement à différents niveaux
Séminaire INALCO, le 8 février 2008
3 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
4 / 77
Yayoi NAKAMURA - DELLOYE
Introduction
Introduction
Pourquoi la proposition ? 2/2
Introduction
Schéma des travaux
Études linguistiques
Dans le cas de l’alignement : ex. mémoire de traduction
Études sur
le français
Par rapport à la phrase : réutilisabilité plus importante
Par rapport aux unités inférieures : portabilité plus élevée de la
correspondance
mot français « compte » = 10 définitions constituées de
noms japonais différents non interchangeables
« tenir compte » = « 考慮する »
Études sur
le japonais
Proposition
Réalisations informatiques
Détecteur
de propositions
du français
SIGLé
時雨
Mizolé
霙
Détecteur
de propositions
du japonais
SIGLé JP
時雨
Aligneur de propositions
Séminaire INALCO, le 8 février 2008
5 / 77
Yayoi NAKAMURA - DELLOYE
6 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Contexte
しぐれ 時雨【!i"#$e】n.
1. Brève averse. 2. inform. SIGLé
(Système d'Identification de
propositions avec Grammaire
Légère) système réalisant la détection
des propositions françaises caractérisé
par l'utilisation d'une grammaire hors
contexte écrite dans un formalisme DCG
et par une implémentation en langage
PROLOG.
Pré-traitement
A : Condition
Si ces chi!res peuvent
susciter l'étonnement, la
triste vérité est que les
habitants de Reay Road et
des autres poches de
misère qui prolifèrent n'ont
pas mieux où aller.
Système d’identification des
propositions du français
!
Si ces chi!res
peuvent susciter
l'étonnement,
Principale
[A] la triste vérité
est [B]
B : Complétive
Pré-traitement
Tagger
SIGLé FR
Résultat
Texte source
!
Chunker
Séminaire INALCO, le 8 février 2008
CS NP_mp VP_fin_p VP_inf
NP_ms
VIRGULE
NP_fs
VP_fin_s CS NP_mp PP_ms
CC P+D-mp NP_mp PP_fs
Pro_rel
VP_fin_s
AdvP
VP_fin_p
AdvP
Pro_int
VP_inf PONCT-S
8 / 77
que les habitants de Reay
Road et des autres poches
de misère [C] n'ont pas
mieux où aller
C : Relative
qui prolifèrent
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Plan
1. Détection des propositions du français
Études
linguistiques
Études linguistiques
But :
définir une grammaire permettant
de détecter des propositions à partir
d’un résultat de chunker
• Typologie des
propositions
Études linguistiques sur la proposition du français
• Classement des
subordonnées
Réalisation
Réalisation
Évaluation
Évaluation
! Typologie des propositions, basée sur
des critères formels
Perspectives
Perspectives
! Classement des subordonnées selon
la position d’apparition
9 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
10 / 77
Séminaire INALCO, le 8 février 2008
1. Détection des propositions du français
Notion principale :
Proposition
Études
linguistiques
Proposition = sujet + prédicat
• Typologie des
propositions
Types de proposition :
• Classement des
subordonnées
Réalisation
Perspectives
4. Incidente
linguistiques
Proposition = sujet + prédicat
• Typologie des
propositions
Subordonnée
Réalisation
Mon père est professeur et ma mère travaille à la banque.
3. Subordonnée
Notion principale :
Proposition
Études
subordonnées
2. Coordonnée
Évaluation
1. Détection des propositions du français
• Classement des
1. Racine (Principale)
Il était déjà rentré quand je suis arrivé.
Évaluation
Perspectives
+ Éléments extra-prédicatifs
(Charolles 1997) (Combettes 1998)
L’autre jour, ...
Cette affaire étant réglée, ...
En ce qui concerne X, ...
11 / 77
Yayoi NAKAMURA - DELLOYE
•
•
•
•
•
•
•
•
•
•
•
•
Il s’en est, me semble-t-il, bien sorti.
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
•
Séminaire INALCO, le 8 février 2008
Il était déjà rentré quand je suis arrivé.
Je pense qu’il viendra.
Je me demande s’il est parti.
La peinture qui m’a fascinée.
La déception du père quand il a entendu cette nouvelle.
Je voterai pour qui me promettra moins d’impôts.
Où il y a de la gène, il n’y a pas de plaisir.
Que le gouvernement propose une nouvelle loi,
l’opposition crie au scandale.
Il n’a pas pu lire cette lettre comme sa mère l’a deviné.
Tu peux poser ton manteau où tu veux.
Je pars, que cela vous plaise ou non.
Le crocodile n’eut pas le temps de se demander ce que lui
voulait ce lourdaud, que Gropopotin s’était déjà assis sur
son dos.
La maison est restée aussi conviviale qu’elle l’était avant.
12 / 77
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Études
linguistiques
Problèmes des typologies
usuelles
• Typologie des
Définitions des subordonnées souvent selon
la nature du connecteur qui les introduit
propositions
• Classement des
subordonnées
1. Détection des propositions du français
Études linguistiques
Travaux de Le Goffic 1/2
(Le Goffic 1992, 1993, 2002)
Termes en «qu-» = seuls connecteurs du français
Une vieille famille indo-européenne en «Kw-» :
• pronoms : qui, que, quoi, lequel ;
• adjectif : quel ;
• adverbes : où, quand, comme, comment, combien,
que, dont, pourquoi.
... MAIS
Réalisation
! Étiquetage automatique très difficile ;
! Comportements syntaxiques différents de
Évaluation
termes appartenant à la même catégorie
Perspectives
! Qu’est-ce qu’une locution conjonctive
(LC) ? Les LCs constituent-elles une liste
fermée ?
13 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
Subordonnées introduites par une LC = des GAdv
ou GPrép comprenant une subordonnée
constituée par un connecteur en «qu-»
! un traitement unifié et homogène des types de
subordonnées
Séminaire INALCO, le 8 février 2008
14 / 77
1. Détection des propositions du français
Études linguistiques
Travaux de Le Goffic 2/2
Je crois qu’il va pleuvoir...
Relative : relative avec antécédent
Le médecin qui est venu / la maison où je suis né...
Intégrative :
• Pronominale : relative sans antécédent
Qui dort dîne / embrassez qui vous voulez...
• Adverbiale : circonstancielle en qu- ou si
Quand on veut, on peut / si vous avez fini, vous pouvez
sortir / il est à peine sorti qu’il a commencé à pleuvoir...
Percontative : interrogative/exclamative indirecte
Je sais qui a gagné / où il est allé / comment il l’a fait...
15 / 77
1. Détection des propositions du français
Études linguistiques
Autres typologies
Typologie selon la catégorie du mot simple
équivalent : (Le Bon Usage, 11ème éd.) (Biskri et Desclés 2005)
Complétive : complétive
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
Yayoi NAKAMURA - DELLOYE
• Substantive : Je pense qu’il viendra / Que tu m’aimes me réjouit
• Adjective : La femme que tu vois / la ville où j’habite
• Adverbiale : Il était déjà rentré quand je suis arrivé
Typologie selon la fonction de la subordonnée dans
la principale : (Chevalier et al. 1964)(Grevisse 1969)(Wilmet 1997)
•
•
•
•
•
•
Sujet : Que je sois malade ne l’a jamais effleuré
Attribut : La triste vérité est qu’il est fou
Objet : Marie sait que Paul viendra
Circonstancielle : Il était déjà rentré quand je suis arrivé
Complément de nom : la certitude que son but était atteint
... etc.
Séminaire INALCO, le 8 février 2008
16 / 77
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Études linguistiques
Typologie des subordonnées
selon la position
1. Détection des propositions du français
Position post-verbale
(subordonnée complément : subQ)
Typologie selon la catégorie
Subordonnées substantives :
• Substantive, adverbiale, adjective
Typologie selon la position
Complétives
• Initiale/Finale :
-
• Post-verbale :
-
Que tu m’aimes me réjouit
-
La femme que tu vois / la ville où j’habite
Percontatives (ou interrogatives)
• Post-nominale :
Je me demande s’il est parti.
Il ne m’a pas dit quand il rentrerait.
Voyez comme c’est facile.
• Post-adj. et -adv. :
De même que ... / bien que ... / aujourd’hui que ...
! Description systématique de chaque type (Le Goffic, 2000)
17 / 77
1. Détection des propositions du français
Position initiale/finale
(subordonnée circonstancielle : subP)
Quand je suis arrivé, il était déjà rentré.
Si tu ne manges pas, tu ne guériras pas.
Comme elle est écrite en chinois, il n’a pas pu lire cette
lettre.
Où il y a de la gène, il n’y a pas de plaisir.
Que le gouvernement propose une nouvelle loi,
l’opposition crie au scandale.
Il n’a pas pu lire cette lettre comme sa mère l’a deviné.
Tu peux poser ton manteau où tu veux.
Je pars, que cela vous plaise ou non.
Le crocodile n’eut pas le temps de se demander ce que lui
voulait ce lourdaud, que Gropopotin s’était déjà assis
sur son dos.
La maison est restée aussi conviviale qu’elle l’était avant.
Séminaire INALCO, le 8 février 2008
Adverbiales
Adjectives
Adverbiales
Il a le droit d’embrasser qui il veut.
-
Séminaire INALCO, le 8 février 2008
Initiale/
Finale :
Intégratives pronominales (relatives sans ant.)
Je pense qu’il viendra
• Autres positions SN :
-
Substantives
Postnominale :
Je pense qu’il viendra.
Il était déjà rentré quand je suis arrivé
Postverbale :
19 / 77
Yayoi NAKAMURA - DELLOYE
Postverbale :
Substantives
Initiale/
Finale :
Adverbiales
Postnominale :
Adjectives
Adverbiales
Autres
positions
SN :
Substantives
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
18 / 77
1. Détection des propositions du français
Position post-nominale
(subordonnée déterminante : subR)
Adjectives : (relatives et complétives)
La peinture qui m’a fascinée
La peinture dans laquelle notre maison était
reproduite
Ce à quoi je m’attendais
L’idée que tout est fini.
Adverbiales : (intégratives adverbiales)
La déception du père quand il a entendu cette nouvelle
La télévision où je veux (publicité Orange)
Séminaire INALCO, le 8 février 2008
20 / 77
Autres
positions
SN :
Substantives
Yayoi NAKAMURA - DELLOYE
Postverbale :
Substantives
Initiale/
Finale :
Adverbiales
Postnominale :
Adjectives
Adverbiales
Autres
positions
SN :
Substantives
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
1. Détection des propositions du français
Postverbale :
Autres position SN
Études linguistiques
Notre typologie des
connecteurs
Substantives
(subordonnée substantive : subSN)
Initiale/
Finale :
Qui dort dîne. (Intégrative pronominale)
Postnominale :
Que vous avez menti me déçoit. (Complétive)
Comment il a commis ce crime n’a jamais été établi. (Percontative)
Adjectives
Adverbiales
Après une préposition :
Int/Fin
Sub.
Adverbiales
post-V
post-N
Autres SN
Intégrative pro.
△
△
Percontative
!
△
Complétive
!
△
!
Adj.
Position Sujet :
!
Relative
Adv.
Intégrative adv.
Position
△
!
post-V
I
! = fréquent ; △ = moins fréquent / rare
C
P
△
qui
post-N
R
I
Int /Fin
P
R
!
Autres
positions
SN :
Je partirai avant qu’il arrive. (Complétive)
Il faudra se poser la question de pourquoi nous avons été choisis.
(Percontative)
Substantives
Position initiale en prolepse :
Comment il a fait, je vous le demande ! (Percontative)
C
P
pos. SN
R
I
△
!
!
C
△
P
R
△
!
dont
Je voterai pour qui me promettra moins d’impôts. (Intég.pron.)
I
!
!
que
C
!
où
!
?
!
quand
!
△
comme
!
si
!
quoi
!
!
lequel
!
!
quel
!
combien
!
comment
!
pourquoi
!
△
△
△
!
△
△
!
△
△
!
△
△
△
△
△
△
I = Intégrative, C = Complétive, P = Percontative, R = Relative
21 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
22 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Réalisation
Études
linguistiques
• Typologie des
propositions
subordonnées
Réalisation
Évaluation
Perspectives
Nb de phr
Rappel
Préc.1
Préc. 2
Préc. T
propositions
G8
53
96,2
98,0
100,0
98,0
• Classement des
Unicode
274
81,4
96,2
97,8
94,1
Zadig
1206
88,6
92,8
95,3
88,4
LMD*
1713
84,9
89,2
98,0
87,4
• Typologie des
Règles
définissant
Résultats
de
tagger/chunker
les
subordonnées
rares
subordonnées
<prop id='1' etq='principale' pere='0' fils ='2;3;'>
[subP], la triste vérité est [subQ]
</prop>
<prop id='2' etq='subP' pere='1' fils =''>
si ces chi!res peuvent susciter l' étonnement
</prop>
<prop id='3' etq='subQ' pere='1' fils ='4;'>
que les habitants de Reay Road et des autres
poches de misère [subR]n' ont pas mieux où aller
</prop>
<prop id='4' etq='subR' pere='3' fils =''>
qui prolifèrent
</prop>
Grammaire
en DCG
+
Interpréteur
en analyse
tabulaire
PROLOG
(Pereira & Shieber 1987)
Séminaire INALCO, le 8 février 2008
Évaluation 1/8
Études
linguistiques
Ajout dynamique en cas
d’échec de la première analyse
pour chaque phrase
• Classement des
1. Détection des propositions du français
23 / 77
Yayoi NAKAMURA - DELLOYE
Réalisation
*Le Monde Diplomatique
Évaluation
Rappel (%) =
Perspectives
Précision 1
(%)
=
Précision 2
(%)
=
Précision T
(%)
=
Séminaire INALCO, le 8 février 2008
B
A
! 100
C
! 100
B
D
! 100
C
Préc. 1 ! Préc.2
100
24 / 77
A : Nombre total de phrases
B : Nombre de phrases dont l’analyse a abouti
C : Nombre de phrases dont les frontières de
propositions sont correctement détectées
D : Nombre de phrases dont les relations des
propositions sont correctement analysées
=
D
B
! 100
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
1. Détection des propositions du français
Évaluation 2/8
Si ces chiffres peuvent susciter l’étonnement, la triste vérité est que les
habitants de Reay Road et des autres poches de misère qui prolifèrent
n’ont pas mieux où aller.
XML
<prop id='1' etq='racine' pere='0' fils ='2;3;'>
Évaluation 3/8
En arrivant aux frontières qui séparent l'Arabie pétrée de la Syrie,
comme il passait près d'un château assez fort, des arabes armés en
sortirent.
XML
<prop id='1' etq='racine' pere='0' fils ='2;4;'>
[subP], la triste vérité est [subQ]
[ED] [subP], des arabes armés en sortirent
</prop>
</prop>
<prop id='2' etq='subP' pere='1' fils =''>
<prop id='2' etq='ED' pere='1' fils ='3;'>
si ces chi!res peuvent susciter l'étonnement
en arrivant aux frontières [subR],
</prop>
</prop>
<prop id='3' etq='subQ' pere='1' fils ='4;'>
que les habitants de Reay Road et des autres poches de misère [subR] n'ont pas
mieux où aller
<prop id='3' etq='subR' pere='2' fils =''>
qui séparent l'Arabie pétrée de la Syrie
</prop>
</prop>
<prop id='4' etq='subP' pere='1' fils =''>
<prop id='4' etq='subR' pere='3' fils =''>
comme il passait près_d' un château assez fort
qui prolifèrent
</prop>
</prop>
Séminaire INALCO, le 8 février 2008
25 / 77
Yayoi NAKAMURA - DELLOYE
26 / 77
Séminaire INALCO, le 8 février 2008
1. Détection des propositions du français
Évaluation 4/8
XML
Tout ce qui passe sur mes terres est à moi, dit -il, aussi bien que ce que je
trouve sur les terres des autres
<prop id='1' etq='racine' pere='0' fils ='2;3;4;'>
tout ce [subR] est à moi [Inc] aussi bien que ce [subR]
</prop>
1. Détection des propositions du français
Évaluation 5/8
Erreurs de l’analyse linéaire :
étiquettes erronées attribuées par le pré-traitement ;
mauvaise interprétation de connecteurs :
introducteur de proposition
intr. de syntagme (structure réduite sans verbe)
ambiguïté de la position post-prépositionnelle
intégrative pronominale (subSN)
subordonnée déterminante (subR)
<prop id='2' etq='subR' pere='1' fils =''>
qui passe sur mes terres
</prop>
<prop id='3' etq='Inc' pere='1' fils =''>
complétive 1
Et dire ![ qu’au moment de son apogée, dans les années 1950,
, dit -il,
</prop>
complétive 2
Cockerill employait encore plus de 25 000 personnes,
][ que la ville de
<prop id='4' etq='subR' pere='1' fils =''>
Seraing était toujours noire de fumée, de bruit, de monde, de travail.]
que je trouve sur les terres des autres
</prop>
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
27 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
28 / 77
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
1. Détection des propositions du français
Évaluation 6/8
Évaluation 7/8
Trois types d’erreurs de l’analyse structurale
(Paris avait estimé X) + (car Y) ?
Coordination de subordonnées sans connecteur
(une référence aux
valeurs religieuses n’était pas
acceptable + car Y) ?
Paris avait estimé
De son côté, Taikong Corp. explique (1) | que la firme n’a pas encore le droit de les
vendre en France (2) | , mais peut les exposer (3)
Relations ambiguës
Ambiguïté de la virgule précédant une subordonnée :
Subordonnée coordonnée ? subR simple ?
Paris avait estimé, à l’époque, (1)
! qu’une référence aux valeurs religieuses n’était pas
acceptable (2)
! car elle soulevait des problèmes politiques et
constitutionnels en France. (3)
Personne ne m’a expliqué (1) | qu’il s’agissait de la première étape de l’expansion
prétendument bienveillante d’une nation nouvelle (2) | , mais que cette expansion
signifiait en réalité l’expulsion violente des Indiens de la totalité du continent (3) | ,
qu’elle serait jalonnée d’atrocités indicibles (4) | à l’issue desquelles on parquerait les
survivants dans des réserves (5)
Ambiguïté des positions
1. C’est facile à dire (1) | quand on n’est pas concerné dans sa chair (2)
2. Le pontife trouva dans son coeur (1) | que cela valait beaucoup (2)
29 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
30 / 77
1. Détection des propositions du français
Évaluation 8/8
• Typologie des
Sub.
Adj.
Adv.
△
Percontative
!
Complétive
!
• Classement des
subordonnées
0 0
2 4
△
Réalisation
△
0,4 0,8
0 0
20 27
△
0,2 0
post-N
!
2 0,3
! amélioration des modules de pré-traitement
! utilisation d’autres systèmes : système de
segmentation en super-chunks (Blanc et al.,
2007)
Évaluation
Perspectives
60 57
△ 0 0
! 15
11
Introduction de plus d’informations
! risque de multiplication des calculs
Affinement des étiquettes
attribution d’étiquettes syntactico-sémantiques
! = fréquent ; △ = moins fréquent / rare
Séminaire INALCO, le 8 février 2008
Amélioration du pré-traitement
!
Relative
Intégrative adv.
propositions
Autres SN
post-V
Pistes d’amélioration
linguistiques
occurrence(%)
Intégrative pro.
1. Détection des propositions du français
Études
Fréquence des subordonnées
Int/Fin
Yayoi NAKAMURA - DELLOYE
31 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
32 / 77
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
1. Détection des propositions du français
Pistes d’amélioration
Affinement des étiquettes :
Affinement des étiquettes
Subordonnées en Comme
Comme
SubR
Intégrative
Comparaison
Position
post-V
I
C
△
qui
post-N
P
R
I
C
Int /Fin
R
!
I
C
!
P
!
!
La fille comme je l'avais imaginée
pos. SN
R
I
△
!
!
que
P
ex.
C
△
P
R
△
étiquette
syntaxique
SubQ
Percontative
Exclamation
Interrogation
ex 1. Voyez comme c'est facile
ex 2. Tu sais comme il est
!
dont
où
!
?
quand
!
△
comme
!
!
si
!
quoi
!
!
lequel
!
!
quel
!
combien
!
comment
!
pourquoi
!
△
△
△
!
△
!
△
!
Comme il entrait dans la bourgade
égyptienne, il se vit entouré par le peuple
ex 1.
Intégrative
△
initiale/détachée
△
△
△
△
SubP
△
Temps, Cause
Adv. d'énonciation
Comparaison
position
Comme vous n'avez pas répondu, il
est déjà vendu
ex 2.
ex 3. Comme
l'a démontré Olivier Roy,
l'épreuve du pouvoir a fait échouer cette
utopie de l'islam politique
△
△
Intégrative
I = Intégrative, C = Complétive, P = Percontative, R = Relative
finale
33 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
Manière
Comparaison
Paul n'a pas fait comme son père
lui avait dit de faire
ex 2. Il n'a pas pu lire cette lettre comme
sa mère l'avait deviné
ex 1.
34 / 77
Yayoi NAKAMURA - DELLOYE
1. Détection des propositions du français
Affinement des étiquettes :
Subordonnées en Que
Que
oui
SubR
étiquette
syntaxique
SubQ
non
initiale/détachée
SubSN
SubP
Relative
fonction
dans la
subordonnée
?
position
corrélatif
Complétive
Condition
Comparaison
ou
Conséquence
finale
nature de
connecteur
But
autre
Séminaire INALCO, le 8 février 2008
ou
Condition
35 / 77
ex. L'idée que j'ai eu en lisant un article
ex 1. L’idée que les groupes armés ont
été battus est acceptée par la majorité
ex 2. Le président déclare que notre
économie se porte bien
ex 3. Que vous ayez menti me déçoit
ex. Qu’il s’agisse des repentis ou des
anciens dirigeants et militants du FIS,
tous relèvent la tête
ex 1. Leurs adieux furent aussi tendres
que l'avait été leur reconnaissance
ex 2. Il confondait tellement toutes les
idées, que Zadig n'en put tirer aucun
éclaircissement
ex 1. Le crocodile n’eut pas le temps de
se demander ce que lui voulait ce
lourdaud, que Gropopotin s’était déjà
assis sur son dos
ex 2. Viens ici, que je t'embrasse
ex 3. Ces expériences apportent peu à
un historien, qu’il soit enseignant ou
écrivain
Yayoi NAKAMURA - DELLOYE
SIGLé JP
Système d’identification des
propositions du japonais
2. Détection des propositions du japonais
Plan
2. Détection des propositions du japonais
Études
linguistiques
Études linguistiques
But :
définir les propositions à l’aide
uniquement des critères formels
pour pouvoir les identifier
automatiquement
• Structure de la
phrase
Études linguistiques sur la phrase et la proposition
du japonais
Réalisation
• Classement des
propositions
Réalisation
Évaluation
Évaluation
1. Structure de la phrase japonaise, basée
sur l’opposition thème-rhème
2. Classement des propositions japonaises
Séminaire INALCO, le 8 février 2008
37 / 77
Yayoi NAKAMURA - DELLOYE
38 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
2. Détection des propositions du japonais
Quelques éléments
fondamentaux de la phrase
japonaise
運良く
本屋 で
探していた
辞書 を
見つけた
un’yoku
Par chance
hon’ya - de
librairie - [lieu]
sagashiteita
que (je) cherchais
jisho - wo
dictionnaire - [accusatif]
mitsuketa
trouver [passé]
«!Par chance, (j’ai) trouvé dans une librairie le dictionnaire que (je) cherchais!»
Études linguistiques
Phrase japonaise 1/2
Thème
中国は
Mikami (1953, 1955)
Proposition racine
の (no)
国力 が 伸びて 自分たちの国際的地位 を 高める
chûgoku wa
kokuryoku ga nobite
jibuntachinokokusaitekichii wo takameru
Chine [wa]
pouvoir national [ga] grandir
de la Chine
son statut sur le plan international [wo] élever
戦略 を 取っている
Mot prédicatif précédé par ses compléments
senryaku wo totteiru
stratégie [wo] adopter [progressif]
Marqueurs de fonction = variations de forme,
particules de cas
Omission très fréquente d’éléments
Séminaire INALCO, le 8 février 2008
39 / 77
Propositions subordonnées
が (ga)
La Chine [ga]
« Son pouvoir national ayant grandi, la Chine adopte une stratégie permettant d’élever son
statut sur le plan international »
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
40 / 77
Yayoi NAKAMURA - DELLOYE
2. Détection des propositions du japonais
2. Détection des propositions du japonais
Typologie des
subordonnées
Études linguistiques
Phrase japonaise 2/2
Études
linguistiques
• Structure de la
さいわいなことに 野球部員たちは、そこにあらわれたのが たまたま 七瀬という、
教務課職員とはいえ 私立手部高校随一の美人であったが為に、異変への関心をすぐ
失った。
Élément externe
phrase
• Classement des
propositions
Classement selon uniquement des critères morphosyntaxiques
(Teramura 82)
Subordonnées sans connecteur
1. Subordonnée neutre
2. Subordonnée de condition
3. Subordonnée déterminante sans connecteur
Réalisation
(saiwaina koto ni - yakyû buin tachi wa - sokoniarawareta no ga - tamatama - nanase to iu kyômuka shokuin towaie - shiritsu tebe kôkô zuiitsu ni bijin de atta ga tameni - ihen eno kanshin
wo sugu ushinatta)
Évaluation
Subordonnées avec connecteur
(par chance - équipes du club de baseball [wa] - personne apparaissant là [ga] - par
hasard - appelé Nanase - bien qu'une employée administrative - être la plus belle femme
du lycée privé Tebe [cause] - perdre l'intérêt pour l'événement extraordinaire [passé])
1.
2.
3.
4.
« Par chance, du fait que la personne apparue était par hasard Nanase, la plus belle fille
du lycée privé de Tebe, bien qu'employée administrative, les équipes du club de baseball
perdirent tout de suite tout intérêt pour cet événement extraordinaire »
Séminaire INALCO, le 8 février 2008
41 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
Subordonnée avec particule conjonctive
Subordonnée avec connecteur agglutinant
Subordonnée de citation
Subordonnée déterminante avec connecteur
42 / 77
Yayoi NAKAMURA - DELLOYE
2. Détection des propositions du japonais
Réalisation du
système
Études linguistiques
Problèmes liés aux connecteurs
Études
linguistiques
• Structure de la
Subordonnée déterminante sans connecteur
phrase
日本へ 行った 友達 Substantif
nihon e - itta - tomodachi
• Classement des
propositions
! Utilisation d’un analyseur des relations de dépendance (Kudo
& Matsumoto 2002)
Réalisation
Japon [e] - aller/partir [passé] - ami
« ami qui est parti au Japon »
Subordonnée avec particule conjonctive
日本へ 行った が Particule conjonctive
Méthode existante : CBAP (Maruyama et al. 2004) :
incapable de traiter les structures imbriquées
Évaluation
informations sur le chunk
informations sur chaque
unité constituant le chunk
nihon e - itta - ga
Japon [e] - aller/partir [passé] - [opposition]
« bien que (je sois/tu sois/il soit...) parti au Japon »
Subordonnée avec connecteur agglutinant
日本へ 行った 時 Mot agglutinant
(Sakuma 1940)
nihon e - itta - toki
Japon [e] - aller/partir [passé] - temps
« quand (je suis/tu es/il est...) parti au Japon »
Séminaire INALCO, le 8 février 2008
43 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
44 / 77
* 0 7D 0/0 4.09420658
!" #$%& !" '(-)(*+
O
, , , -.-/0
O
* 1 2D 0/1 0.36301976
12 334 12 '(-)(*+
O
5 6 5 7(-89:
O
* 2 3D 0/0 0.13490557
;<= >?>@AB ;<= '(-CD
, , , -.-/0
O
* 3 5D 1/2 0.95327759
E= FAB E= '(-CD
O
GH I&J4 GH '(-CD
O
K J K 7(-L7(-CD
O
* 4 5D 1/2 1.64770347
MN FOP& MN '(-CD
O
Q R$ Q '(-ST-CD
O
U V U 7(-W7(
O
* 5 6D 1/1 1.33629884
XY RZ>@ XY '(-[\S]
O
^_` abc ^_` d(-e=
Cf ghi
* 6 7D 1/2 0.00000000
<j >@P& <j '(-[\S]
O
Yk >@% Yk '(-CD
O
l m l 7(-L7(-CD
O
* 7 -1O 0/2 0.00000000
no [email protected] no` d(-e=
Cf 8qi O
r s r 7(-S]7(
O
t` &c t` d(-ue= Cf ghi O
v v v -.-w0
O
EOS
O
O
Yayoi NAKAMURA - DELLOYE
2. Détection des propositions du japonais
Réalisation du système
TOUR
0
1
Trait Fonc
[Det(no)]
Trait Thème
[-Theme]
情報 名詞-一般
O
技術 名詞-一般
* 10 11D|||!"#$%|
O
など ナド
など
助詞-副助詞
O
情報技術などの
の
の
助詞-連体化
O
ノ
2
5
6
7
8
3
4
5
6
7
8
Trait Mot Agg.
[-MotAgg]
linguistiques
• Structure de la
• Classement des
propositions
1b
1
Trait Prédicat
[-Pred]
4
TOUR
1
1
技術 ギジュツ
3
2
3
4
5
6
7
8
4
5
6
7
8
TOUR
2
1
2
3
LMD
Brevet
Asahi
Murakami
A
Nombre de phrases
124
158
112
149
B
Nombre de propositions
433
670
450
479
C
Nombre moyen de
propositions dans une phrase
3,49
4,24
3,99
3,21
LMD
Réalisation
Évaluation
2b
Corpus
Études
phrase
* 10 11D 2/5 1.62335824
情報 ジョウホウ
2
2. Détection des propositions du japonais
Évaluation
BREVET
ASAHI
MURAKAMI
40
30
1
2
3
4
5
6
7
8
20
Résultat
de
CaboCha
module 1
module 2
module 3
transCabo
cab2prop
cabprop2xml
liste des
propositions
détectées
.xml
45 / 77
0
1
2
3
4
5
6
7
8
9
10
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
46 / 77
2. Détection des propositions du japonais
Évaluation
2. Détection des propositions du japonais
Résultats 2/2
LMD
Brevet
Asahi
Murakami
A
Nombre de phrases
124
158
112
149
B
Nombre de propositions
433
670
450
479
C
Nombre moyen de
propositions dans une phrase
3,49
4,24
3,99
3,21
D
Nombre de propositions
détectées
444
672
453
490
E
Nombre de propositions
détectées correctement
389
589
391
426
F
Rappel (= E/B)
0,898
0,879
0,869
0,891
G
Précision (= E/D)
0,876
0,876
0,863
0,869
H
Analyse linéaire
= nombre de phrases
correctement analysées (H/A %)
99 (80%)
119 (75%)
85 (76%)
120 (81%)
I
Analyse structurale
= nombre de phrases
correctement analysées (I/H %)
94 (95%)
107 (90%)
79 (93%)
111 (93%)
47 / 77
Yayoi NAKAMURA - DELLOYE
Évaluation
Résultats 1/2
Séminaire INALCO, le 8 février 2008
>10
Fig. Distribution des phrases en fonction
du nombre de propositions
SIGLé JP
Séminaire INALCO, le 8 février 2008
10
LMD : traduction d’articles
d’un journal français
Brevet : traduction de
brevets techniques français
Asahi : articles d’un journal
japonais
FdT : texte littéraire, extrait
du roman « La fin des
temps » de MURAKAMI
Haruki.
Yayoi NAKAMURA - DELLOYE
Présence d’erreurs dues aux mauvaises analyses
fournies par le système de pré-traitement
Résultat des extractions expérimentales des
thèmes en wa et des éléments externes
démontrant la nécessité d’une étude linguistique
plus poussée
Séminaire INALCO, le 8 février 2008
48 / 77
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
Plan
みぞれ 霙【midzo!e】n.
Problèmes et éléments de solution
1. grésil, neige fondue. 2. dessert en
glaçon râpé au sirop. 3. radis blanc
râpé. 4. inform. MIZOLé système
réalisant l'alignement des propositions
sur la base de l'approche spectrale de
l'alignement des graphes ou de la
méthode inspirée de la classification
ascendante hiérarchique.
Trois méthodes réalisées
Procédure d’alignement
Évaluation
Constats sur les corpus utilisés
Résultats
Mizolé
Système d’alignement des propositions
Analyse des erreurs
50 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
Problèmes
Problèmes
et éléments
de solution
Peu de travaux (Boutsis & Piperidis 1998) (Wang & Ren
Trois
méthodes
3. Alignement des propositions
éléments de Solution
" Alignement à l’aide des graphes
2005)
qui semble
indissociablement lié à la
croissance,
Impossibilité d’une simple
application des méthodes classiques
d’alignement des phrases pour
l’alignement fr-jp due au nonparallélisme
Procédure
Évaluation
! Alignement à l’aide des graphes
Séminaire INALCO, le 8 février 2008
51 / 77
Yayoi NAKAMURA - DELLOYE
成長と不可分に結び付いて
いると思われる
Relative
Relative
開発手法が社会と環境にも
たらした
Au vu des dégâts sociaux et
écologiques d!un mode de
développement
マルクス主義、構造主
義、第3世界主義の流れ
を汲む
Relative
Relative
損害を前にして、
Cadre
反自由主義的な経済学者
は
Principale
Subordonnée
(Contexte)
les économistes antilibéraux, issus du
marxisme, du structuralisme ou du
tiers-mondisme ont beaucoup de mal
à faire valoir
Thème
との主張に大きな抵抗を
感じている。
Principale
Relative
Complétive
成長と開発を区別できる
qu!on peut distinguer
les deux notions.
Phrase française
Phrase japonaise
! Méthodes spectrales d’appariement des graphes
! Classification Ascendante Hiérarchique (CAH)
Séminaire INALCO, le 8 février 2008
52 / 77
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
Problèmes
et éléments
de solution
Trois
méthodes
Procédure
Évaluation
Algorithme 1
Méthodes spectrales
Appariements des graphes inexacts (Kosinov & Caelli
2002, 2004)
- Combinaison des avantages des techniques de
décomposition spectrale, de projection et de classification
- Projeter les nœuds sur un sous-espace propre et regrouper
les points projetés avec un algorithme de classification
3. Alignement des propositions
Algorithme 1
Méthodes spectrales 2/2
Amélioration pour des graphes valués (Lerallut 2006)
Mfinal = a
topo
Mcouleur
+ (1 - a) M topo
couleur
max(M
)
max(M
)
0,8
Graphe X
Y4,Y5,Y6
1
0,6
2
Graphe Y
0,4
1
0,2
3
X10,X13,X16
X7
0
0,8
1
1,2
Série1
Série2
X6
11
4
14
12
13
0,6
-0,4
5
-0,6
6
-0,8
15
X5
-1
10
0,4
1. Alignement avec la topologie (Kosinov)
3
7
8
0,2
-0,2
6
9
X8,X11,X14
0
2
5
! Adaptation à l’alignement des propositions
X9,X12,X15
Y3
4
16
X1 X2 X3 X4
Y2
2. Alignement des graphes valués par les types de
propositions (Lerallut)
Y1
-1,2
53 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
54 / 77
Séminaire INALCO, le 8 février 2008
3. Alignement des propositions
Algorithme 2
Méthode par CAH
Alignement = Regroupement des points
semblables
Deux matrices de base
1. Matrice de similarité :
Msim =
M11 M12
M21 M22
3. Alignement des propositions
Algorithme 2 : Méthode par CAH
Mise en correspondance des mots
Similarité des propositions calculée suite à la mise en
correspondance des mots
! Inefficacité de la simple consultation du dictionnaire
... une raison économique ...
M11(i,j) = synt(Xi, Xj)
M12(i,j) = simlex(Xi, Yj)
M21(i,j) = simlex(Xj, Yi)
M22(i,j) = synt(Yi, Yj)
... 経済的な理由 ...
Matrice principale : matrice courante
Mcourante(i, j) =
Séminaire INALCO, le 8 février 2008
Mraplong(i, j)
Msim(i, j)
55 / 77
Dictionnaire
économie (n)
— 経済
2. Matrice d’évolution du rapport des longueurs :
Mraplong(i,j) = (rap(F(i,j), J(i,j)) - min(rap(F(i), J(i)), rap(F(j), J(j))) · a
Yayoi NAKAMURA - DELLOYE
... une croissance économique ...
?
économique (adj.)
— 経済的な
... 経済成長 ...
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
56 / 77
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
Algorithme 2 : Méthode par CAH
Mise en correspondance des mots
Liste des mots JP
・・・
経済
Trois
méthodes
・・・
Dictionnaire
bilingue
・・・
économique
成長
・・・
a
e l es
ld
lcu ité d
a
C ilar es
n
sim chaî
Liste des traductions
affaires
Évaluation
Résultat de la détection
Ⓓ des propositions
...
...
...
</s>
<s id='251'>
</s>
Ali
g
pr nem
op e
os nt
itio de
ns s
...
...
...
des
on
éati s
Cr perle
Ⓒ
</s>
</perle>
Alignement des propositions
Racine
[...][...]悲しい現実である。
kanashii genjitsu dearu
[...][...] est la triste vérité
Ⓑ
.
.
.
Résultat de la détection
・・・
subComp
...
...
...
Détection des
propositions
[...]貧しい人々には、行くあ
que les habitants de Reay
Road et des autres
poches de misère [C]
n'ont pas mieux où aller
déterminant
レイ・ロードや似たような場所
C : Relative
にひしめく
qui prolifèrent
rei-rôdo ya nitayôna basho ni
hishimeku
(qui) prolifèrent à Reay Road ou
dans un endroit semblable
Yayoi NAKAMURA - DELLOYE
58 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
3. Alignement des propositions
Évaluation
Évaluation
Corpus
Problème
et éléments
de solution
B : Complétive
てもないというのが
mazushii hito ni wa iku ate
mo nai toiu no ga
(que) les gens pauvres n'ont pas
mieux où aller
</s>
(経済 - économique)
57 / 77
[A], la triste
vérité est [B]
kono shûji ni odoroku
kamoshiranai ga
Bien que ces chiffres puissent susciter
l'étonnement
・・・
Séminaire INALCO, le 8 février 2008
Racine
この数字に驚くかもしれないが、
Ⓔ des propositions
.
.
.
A : Condition
Si ces chi!res
peuvent susciter
l'étonnement
subAgg
<s id='251'>
<s id='251'> たちつ... </s>
Couple de mots
...
...
...
Détection des
propositions
<s id='1'> あいう... </s>
finance
Perle des phrases alignées
<perle id='239'>
<s id='235'>
<link xtargets='s1;s1'>
...
...
<link xtargets='s235;s251'>
...
Texte japonais
économie
Ⓕ
<s id='235'>
Résultat de l'alignement des phrases
Aligement des
phrases
・・・
・・・
Ⓐ
<s id='1'> abcde... </s>
.
.
.
<s id='235'> stuvw... </s>
.
.
.
Procédure
croissance
・・・
Procédure
d’alignement
Problèmes
et éléments
de solution
Texte français
Liste des mots FR
・・・
3. Alignement des propositions
Résultat
3-3
2-3 2-4
4-4 2-1
3-1
2-2
1-4
Trois
méthodes
1-3
Caractéristiques
1-0
0-1
2,1% 0,2%
1,4% 2,9%
0,2%
0,3% 1,5%
1,4%
46,3%
1-2
25,3%
1-1
Évaluation
F!J
1. LMD : articles du
journal LMD
2. BRVF : brevets
techniques
Séminaire INALCO, le 8 février 2008
(C)
(D)
(E)
Phr.
FR
JP
P.Prop
LMD
222/500
644
1026
583
M1 : Topologique
BRVF
161/339
447
854
444
BRVJ
44/66
146
280
141
FdT
99/200
286
428
251
4,0%
5,3%
9,1%
Procédure
(A/B)
59 / 77
J!F
3. BRVJ : brevets
techniques
4. FdT : texte
littéraire
Yayoi NAKAMURA - DELLOYE
Exact (F)
Trois méthodes :
Partiel (G)
M1
M2
M3
M1
M2
M3
LMD
0,127
0,200
0,591
0,643
0,784
0,951
M2 : Graphe valué
BRVF
0,081
0,158
0,706
0,619
0,705
0,977
M3 : CAH
BRVJ
0,048
0,078
0,537
0,663
0,689
0,990
FdT
0,138
0,151
0,464
0,670
0,659
0,932
Résultats non satisfaisants de M1 et de M2 :
informations insuffisantes pour l’alignement
Séminaire INALCO, le 8 février 2008
60 / 77
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
3. Alignement des propositions
Évaluation
Évaluation
Problèmes des M1 et M2
Racine
F1
J6
Racine
F1
0,8
J3,J4
0,6
sub.
post-verbale
F2
J1
J2
J5
élé.
extra-prédicatif
Thème
J5
0,4
sub.
de citation
0,2
F2
0
0
sub.
périphérique
Méthode CAH M3
1
0,2
0,4
0,6
0,8
1
1,2
Français
Japonais
-0,2
F3
J3
J4
Thème
sub.
de citation
L’introduction des informations lexicales a permis d’aligner
correctement des phrases pour lesquelles la topologie et les
informations sur les types des propositions ne suffisaient pas.
-0,4
J6
-0,6
J1,J2
-0,8
F3
1
-1
F3
0,8
J4
0,6
J3,J5
F2
0,4
0,2
0
0
0,2
0,4
0,6
0,8
1
Français
Japonais
-0,2
F1
-0,4
-0,6
J6
J1,J2
-0,8
-1
61 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
62 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
3. Alignement des propositions
Évaluation
Évaluation
Méthode CAH M3
J2
Ces innovations
F1
- qui suscitent l'opposition de
parlementaires européens et
divisent les gouvernements des
états membres F2
sont en partie le résultat d'un
lobbying des associations
religieuses, notamment
catholiques, au sein des
institutions de l'union.
Il s'agit de faire reconnaître la
dimension religieuse de la
construction européenne et
d'accorder ainsi aux églises un
droit de regard sur ses grandes
orientations
F3
Séminaire INALCO, le 8 février 2008
この新たな動きには、
Arbre FR
J1 カトリックをはじめとする
F1
宗教団体によるEUロビー活動が寄与している。
j'ai souhaité rappeler
Ces innovations sont en partie le résultat d'un lobbying
des associations religieuses, notamment catholiques, au
sein des institutions de l'union.
J3 草案の2つの規定が意味するのは、
F2
F3
Ce que signifient les deux règles de la proposition [thème]
J4 欧州建設には宗教的側面があり、
J5 その針路に関しては教会にも発言権があると
J6 認めるということだ。
Méthode CAH M3
Arbre JP
J2
J1
これらの規定は
J9
J3
J5
ces règles [thème]
欧州議会の反対に遭い、
J8
J9 加盟国間の対立を引き起こしている。
(ouvriers, gens de couleur,
richesse (ouvriers, gens de couleur, femmes) [même]
et protestent à l'échelle d'une
F5
nation,
se donnent un pouvoir
J7
J8
J4
qu'aucun gouvernement ne
peut aisément réprimer F6
susciter l'opposition de parlementaires européens et
diviser les gouvernements des états membres
63 / 77
Séminaire INALCO, le 8 février 2008
F2
Arbre JP
les gens qui semblent ne pas disposer d'arme ni de
みずからを組織化し、
J6 全国規模で抗議行動を起こすなら、
J5
s'(ils) s'organisent et protestent à l'échelle d'une nation,
J7 いかなる政府も容易には
押さえ込むことのできない
力をもてるということを、
F4
F3
J8
F6
J1
F5
J3
J4
J6
J7
J5
le fait qu'(on) peut se donner un pouvoir qu'aucun
gouvernement ne peut aisément réprimer
J8 読者に思い起こしてほしかったのです。
avoir souhaité rappeler aux lecteurs (...)
Yayoi NAKAMURA - DELLOYE
Arbre FR
F1
J2 武器も富ももたぬように
思われる
J3
者たち(つまり労働者、有色人種、女性)でも、
, sitôt qu'ils s'organisent F4
J6
J4
私は、
moi [thème]
F2 F3
qui semblent n'en pas disposer
femmes)
reconnaître que la construction européenne possède une
dimension religieuse et que les églises ont un droit de
regard sur ses grandes orientations
J7
F1
que les gens
J1
64 / 77
J2
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
3. Alignement des propositions
Évaluation
Évaluation
Méthode CAH M3
Différence du nombre des
propositions
それは
C’est
C’estune
unebouée
bouéede
desauvetage
sauvetage
Méthode prometteuse mais résultat non encore tout à fait satisfaisant
Mauvais résultat du calcul de similarité lexicale :
! Étude sur la réorganisation du dictionnaire
! Recherche d’une meilleure méthode de mise en correspondance
Causes peut-être plus complexes de cette inefficacité de mise en
correspondance des mots par dictionnaire
! À cause de l’absence d’unités dans le texte japonais ?
[ 集約農業を熱心に信奉し ]
[ 整備する ]
laquellese
seraccrochent
raccrochentles
les
ààlaquelle
gouvernementsfervents
fervents
gouvernements
partisansetetpourvoyeurs
pourvoyeursde
de
partisans
l’agricultureintensive,
intensive,
l’agriculture
leschefs
chefsd’entreprises
d’entreprises
les
multinationales
multinationales
諸国政府や
[ 資源を浪費し ]
[ 恥ずかしげもなく廃棄物を投棄し ]
[ ぼろぼろの老朽船をチャーターする ]
[ gaspillant les ressources, ]
[ déversant sans vergogne leurs déchets ]
[ et a!rétant des bateaux-poubelles ]
多国籍企業の経営者たち
[ もはや何をすればよいのか ]
[ 分からない ]
les
lesorganisations
organisationsnon
non
gouvernementales
gouvernementales
NGO そして
[ne
nesachant
sachantplus
plusque
quefaire
faire ]
[ 自然環境の課す ]
[ 制約に無知なことを暴かれた ]
et les économistes
pris en flagrant délit d’ignorance des
[ pris en flagrant délit d’ignorance des
contraintes naturelles.
contraintes naturelles. ]
経済学者たちがしがみついている
救命ブイである。
Séminaire INALCO, le 8 février 2008
65 / 77
Yayoi NAKAMURA - DELLOYE
66 / 77
Séminaire INALCO, le 8 février 2008
3. Alignement des propositions
Évaluation
Cas difficiles 1/4
3. Alignement des propositions
Évaluation
Cas difficiles 2/4
Sur le plan syntaxique
Différences de diverses natures
Phrase française :
Sur le plan lexical
[F1 racine c’est notamment lors des débats sur les programmes d’aide
aux pays du sud ] [F2 subR que les questions de la contraception et
du statut de la famille sont abordées ]
Phrase française :
[F1 racine À tel point que je ne savais plus ] [F2 subQ s’il progressait ou non ]
Phrase japonaise :
[J1 thème 避妊と家族の地位という問題は (hinin to kazoku no chii toiu mondai
Phrase japonaise :
[J1 subAgg 停まっているのか (tomatteiru no ka, s’il est arrêté)]
[J2 subAgg 動いているのかも (ugoiteiru no ka mo, s’il est en train de bouger) ]
[J3 racine わからないくらいだった (wakaranai kurai datta, À tel point que je
ne savais pas ...)]
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
67 / 77
Yayoi NAKAMURA - DELLOYE
wa, les questions de la contraception et du statut de la famille [thème])]
[J2 racine 特に開発途上国援助プログラムをめぐる議論の中で大きく取り上げら
れた (tokuni kaihatsu tojô koku enjo puroguramu wo meguru giron no nakade
ôkiku toriagerareta, être abordé, notamment lors des débats sur les
programmes d’aide aux pays en voie de développement) ]
Séminaire INALCO, le 8 février 2008
68 / 77
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
3. Alignement des propositions
Évaluation
Évaluation
Cas difficiles 3/4
Sur le plan rhétorique
Sur le plan rhétorique
Phrase française :
[F1 ED En y réfléchissant, ] [F2 ED les trucages, ] [F3 racine je n’étais pas près
de les découvrir : ] [F4 ED déjà, ] [F5 propcrd je ne savais pas ] [F6 subQ si
l’ascenseur marchait ou non ]
Phrase française :
[F1 racine Je n’arrivais pas à croire ] [F2 subQ que c'était moi ] [F3 subR qui
avais émis ce bruit ]
Phrase japonaise :
[J1 subCond 考えてみれば (kangaete mireba, si (je) réfléchis)] [J2 subCit たねどこ
Phrase japonaise :
[J1 racine 私には (watashi ni wa, à moi) [J2 subCit それが (sore ga, ceci [ga]) [J3
subR
Cas difficiles 4/4
自分の体から発せられた (jibun no karada kara hasserareta, émis de mon
corps) ] 音だとは (oto da to wa, être un son/bruit [citation+wa])] どうしても思
えなかった (dôshitemo omoenakatta, je n'arrivais pas à croire...)]
69 / 77
moi) [J3 subAgg エレベーターが動いているのか (erebêtâ ga ugoiteiru no ka, si
l’ascenseur est en train de bouger) ] [J4 subAgg 停まっているのかさえ
(tomatteiru no ka sae, s'il est arrêté)] わからないのだ (wakaranai no da, je ne
sais pas...)]
Je n’arrivais pas à croire que c’était un bruit émis de mon corps.
Séminaire INALCO, le 8 février 2008
ろか私には (tane dokoro ka watashi ni wa, sans aller jusqu’aux trucages, à
Yayoi NAKAMURA - DELLOYE
Si je réfléchis bien, je ne sais, sans aller jusqu’aux trucages,
même pas si l’ascenseur est en train de bouger ou s’il est arrêté
70 / 77
Séminaire INALCO, le 8 février 2008
Yayoi NAKAMURA - DELLOYE
3. Alignement des propositions
Évaluation
Alignement du Syntagme thématisé
3. Alignement des propositions
Évaluation
Alignement du Syntagme thématisé
Thème
Thème
一円玉と五円玉 は
Les pièces de un et de cinq yen,
je les mets dans ma
poche revolver,
ヒップ・ポケットに 入れる が
Coordonnée
Racine
en principe je ne m’en
sers pas dans les calculs.
原則として 計算には 使わない。
Séminaire INALCO, le 8 février 2008
71 / 77
La barrette de masse est
apparente sur la face arrière
du boîtier de module
が (ga)
モジュール筐体の背面に
露出したもので
Racine
Subordonnée
Racine
アースバー は
Élément détaché
Yayoi NAKAMURA - DELLOYE
Coordonnée
Subordonnée
, et réalise la connexion à la
terre du module par
connexion électrique entre le
plan de masse de cette plaque
de circuit imprimé et la
surface de contact avec les
modules
プリント基板のアースパターンとモ
ジュール当接面とを電気的に接続する
ことにより Subordonnée
が (ga)
モジュールの設置を行う。
Séminaire INALCO, le 8 février 2008
Racine
72 / 77
Yayoi NAKAMURA - DELLOYE
Conclusion & perspectives
Conclusion & Perspectives 1/2
Indépendance de chaque système : différentes pistes
d’amélioration pour chacun
Conclusion
Amélioration du concept même du système d’alignement
des propositions
Ré-examen des unités à aligner (alignement hiérarchique)
Séminaire INALCO, le 8 février 2008
74 / 77
Yayoi NAKAMURA - DELLOYE
Conclusion & perspectives
Conclusion & Perspectives
Alignement Hiérarchique
Conclusion & perspectives
Conclusion & Perspectives
Alignement Hiérarchique
S
VP
VP
PP
Mise en correspondance
d’unités de tout niveau
sans identification
préalable d’un type
d’unité déterminé
PP
NP
NP
NP
N
P
N
私
は
4 ドル
I
N
NP
Y
bought
Mise en correspondance de structures
! Liste des patrons parallèles
PP
N
a
P
N
P
V
で
車
を
買った
car with
V N Art
N
P
Yfour dollars
Adj
NP
N
NP
VP
PP
S
75 / 77
今年
オリンピック が 北京
kotoshi
orinpikku
ga
cette année les jeux olympiques [ga]
VP
Séminaire INALCO, le 8 février 2008
Cette année, les jeux olympiques auront lieu à Pékin.
で
pekin
de
Pékin [lieu]
開かれる
hirakareru
avoir lieu
(Kaji et al.1992)
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
76 / 77
Yayoi NAKAMURA - DELLOYE
Conclusion & perspectives
Conclusion & Perspectives 2/2
Fort investissement dans les études linguistiques, mais un
grand nombre de questions en suspens dans les travaux
linguistiques du japonais
! Problèmes liés au traitement des syntagmes thématisés
Conclusion & perspectives
Problèmes liés au
syntagme thématisé
一円玉と五円玉 は
Les pièces de un et de cinq yen,
les pièces de un et de cinq yen - [wa]
を (wo)
je
ma
je les mets dans ma
poche revolver,
ヒップ・ポケットに 入れる が
dans la poche revolver
- mettre - [opposit.]
を (wo)
原則として 計算には 使わない。
m’ en
en principe je ne m’en
sers pas dans les calculs.
en principe - dans les calculs - utiliser [nég.]
Séminaire INALCO, le 8 février 2008
77 / 77
Yayoi NAKAMURA - DELLOYE
Séminaire INALCO, le 8 février 2008
78 / 77
Conclusion & perspectives
??? La bière devient grosse
ビール は
la bière - [wa]
La bière, on grossit à
cause d’elle
Cause
太る。
grossir
La bière fait grossir
Séminaire INALCO, le 8 février 2008
79 / 77
Yayoi NAKAMURA - DELLOYE
Merci
Yayoi NAKAMURA - DELLOYE