Ar
Ar
Ar
2023 16:12
Découvrir la revue
Tous droits réservés © Prise de parole, 2015 Ce document est protégé par la loi sur le droit d’auteur. L’utilisation des
services d’Érudit (y compris la reproduction) est assujettie à sa politique
d’utilisation que vous pouvez consulter en ligne.
https://apropos.erudit.org/fr/usagers/politique-dutilisation/
Maria Zimina
Université Paris Diderot – Paris 7
Serge Fleury
Université de la Sorbonne nouvelle – Paris 3
5
Sur ces questions, on consultera, par exemple, Clément Pillias, « Reading
Bilingual Texts with Digital Tools : A State of the Art », Projet ANR 2012
CORD 015 TransRead, Lecture et interaction bilingues enrichies par les données
d’alignement, Deliverable 2.1, 2014, http://transread.limsi.fr/Deliverable2.1.pdf,
site consulté le 10 octobre 2015.
6
Brian Harris, « Bi-text : A New Concept in Translation Theory », Language
Monthly, no 54, 1988, p. 8-10.
7
ANR 2012 CORD 015, TransRead, Lecture et interaction bilingues enrichies par les
données d’alignement, 2015, http://transread.limsi.fr/, site consulté le 10 octobre.
8
ANR 07 CORP 030 01, Rhapsodie, Corpus prosodique de référence en français
parlé, 2015, http://www.projet-rhapsodie.fr/, site consulté le 10 octobre 2015.
9
Pour plus d’information, Harold Somers, Computers and Translation : A
translator’s guide, Amsterdam, John Benjamins B.V., 2003.
Figure 1
Prise en compte de l’axe paradigmatique et des
correspondances multiples dans les Mémoires de Traduction
10
On peut citer dans ce contexte des systèmes, tels que :
PDT (The Prague Dependency Treebank 2.0), 2015, ufal.mff.cuni.cz/pdt2.0, site
consulté le 10 octobre 2015.
GATE (General Architecture for Text Engineering), 2015, http://gate.ac.uk/gate,
site consulté le 10 octobre 2015.
ANNIS (ANNotation of Information Structure), 2015, http://annis-tools.org/,
site consulté le 10 octobre 2015.
MACAON, chaîne de traitement, 2015, http://macaon.lif.univ-mrs.fr/, site
consulté le 10 octobre 2015.
11
Ces recherches sont diffusées, par exemple, par la revue électronique
Lexicometrica, 2014, http://lexicometrica.univ-paris3.fr/, site consulté le
10 octobre 2015.
12
Serge Fleury, Le Trameur, 2015, http://www.tal.univ-paris3.fr/trameur/, site
consulté le 10 octobre 2015.
13
Pour en savoir plus sur l’approche textométrique, on consultera l’ouvrage de
Ludovic Lebart et André Salem, Statistique textuelle, Paris, Dunod, 1994. Sur
la formalisation des principes adoptés dans ce travail, on se reportera à :
Keyser Söze-Duval, Pour une textométrie opérationnelle, 2008, http://www.tal.
univ-paris3.fr/trameur/RTI6provisoire.doc, site consulté le 10 octobre 2015.
14
Sur l’utilisation des méthodes textométriques dans le contexte multilingue :
Maria Zimina, « Approches quantitatives de l’extraction de ressources traduc-
tionnelles à partir de corpus parallèles », thèse pour le Doctorat en Sciences
du langage, Paris, Université de la Sorbonne nouvelle – Paris 3, 2004.
16
L’approche topographique a été implémentée dans le logiciel Lexico3, puis
développée et élargie aux corpus multilingues au sein des outils mkAlign et
Le Trameur développés par l’équipe SYLED-CLA2T, Université Sorbonne
nouvelle-Paris 3.
17
Maria Zimina et Serge Fleury, « Approche systémique de la résonance tex-
tuelle multilingue », dans Émilie Née et al. (dir.), Actes JADT 2014 « Journées
Internationales d’Analyse Statistiques des Données Textuelles », JADT.org, 2014,
p. 717-728.
18
La méthode des spécificités est présentée, par exemple, dans l’ouvrage de
Ludovic Lebart et André Salem, op. cit.
19
Serge Fleury, Le Trameur, 2015, op. cit.
20
Serge Fleury, « Exploration du corpus Traductions alignées du discours d’investiture
de B. Obama (Tutoriel no 3, Explorations textométriques avec mkAlign) »,
Lexicometrica, no spécial Explorations textométriques, 2009, http://lexicometrica.
univ-paris3.fr/numspeciaux/special8.htm, site consulté le 10 octobre 2015.
21
mkAlign est conçu pour aider l’utilisateur dans l’alignement, la correction et
la validation de textes traduits. L’utilisateur garde la maîtrise sur l’ensemble
de ces processus, depuis la mise en correspondance initiale des segments
équivalents jusqu’à l’export final du bi-texte produit, comme cela est illustré
dans Serge Fleury et Maria Zimina, « Exploring translation corpora with
MkAlign », dans Gabe Bokor (dir.), Translation Journal, 2007, http://trans-
lationjournal.net/journal/39mk.htm, site consulté le 10 octobre 2015.
22
Le Trameur intègre par défaut le programme treetagger : un système d’étique-
tage automatique des catégories grammaticales des mots avec lemmatisation
développé par Helmut Schmid, « Probabilistic Part-of-Speech Tagging Using
Decision Trees », Proceedings of International Conference « New Methods in
Language Processing », Manchester, UMIST, p. 44-49, 1994.
23
Toutes les étapes de la construction d’une base textométrique de textes
bilingues alignés sont détaillées dans Serge Fleury, Base textométrique de textes
alignés, 2014, http://www.tal.univ-paris3.fr/trameur/MAJ-12.02.pdf, site
consulté le 10 octobre 2015.
Figure 2
Extrait de la base textométrique anglais/français Investiture Obama
Figure 3
Cadre de la base textométrique Investiture Obama affiché par
Le Trameur
25
Indice de spécificité : 24.1, fréquence totale : 83, fréquence dans la Sélection :
40. Sur la méthode des spécificités, on peut se référer à l’ouvrage de Ludovic
Lebart et André Salem, ibid.
Figure 4
26
Maria Zimina, « Equivalences traductionnelles », Lexicometrica, no spécial
Explorations textométriques, 2013, http://lexicometrica.univ-paris3.fr/
numspeciaux/special8.htm, site consulté le 10 octobre 2015.
27
Les principes de découverte itérative des appariements en cas de correspon-
dances traductionnelles multiples sont introduits par Maria Zimina
(« Alignement textométrique des unités lexicales à correspondances multiples
dans les corpus parallèles », dans Gérald Purnelle (dir.), Les poids des mots,
vol. 2, Louvain-La-Neuve, Presses Universitaires de Louvain, 2004,
p. 1195-1202.
28
Keyser Söze-Duval, op. cit.
34
Pour l’accès à la base ParTUT2Trameur et la documentation sur le processus
de construction : Serge Fleury, Le Trameur, 2015, op. cit.
35
Notons que l’annotation syntaxique mise en place dans le cadre du projet
ParTUT suit un schéma unifié et facilite les appariements entre les deux
langues (anglais/français). De façon générale, la parenté des langues, le type
de traduction (plus ou moins libre) et le schéma d’annotation mis en place
dans chaque volet du corpus ont des répercussions sur les alignements.
Figure 7
Fréquences des relations de dépendance entre les verbes (en
position source) et les noms (en position cible) dans la base
ParTUT2Trameur
Légende : On lit sur le tableau ci-dessus que les relations de dépendance RMOD_
RELCL (proposition relative) avec les verbes en position source et les noms en position
cible ont des fréquences très proches dans les deux volets (193 en français et 195 en
anglais).
Figure 9
Analyse de la résonance textuelle à l’aide de la carte des sections
parallèles dans ParTUT2Trameur
Légende : La carte des sections parallèles affiche la distribution du lemme anglais (to)
« demonstrate » et les sections miroirs en français. Comme l’indique la position du
curseur sur la capture d’écran, le calcul des spécificités est déclenché pour les zones
miroirs afin d’induire des correspondances par seuillage.
Figure 10
Alignements de cooccurrences sur relations dans
ParTUT2Trameur
39
ANR 07 CORP 030 01 Rhapsodie, Corpus prosodique de référence en français
parlé, op. cit.
40
ParTUT Project, op. cit.
Bibliographie
ANNIS (ANNotation of Information Structure), 2015, http://annis-tools.
org/, site consulté le 10 octobre 2015.
ANR 07 CORP 030 01, Rhapsodie, Corpus prosodique de référence en
français parlé, 2015, http://www.projet-rhapsodie.fr/, site consulté le
10 octobre 2015.
ANR 2012 CORD 015, TransRead, Lecture et interaction bilingues enrichies
par les données d’alignement, 2015, http://transread.limsi.fr/, site
consulté le 10 octobre 2015.
BAV (Biblioteca Apostolica Vaticana), 2015, https://www.vatlib.it/, site
consulté le 10 octobre 2015.
Buchholz Sabine and Erwin Marsi, « CoNLL-X Shared Task on Multilingual
Dependency Parsing », dans CoNLL-X’06 Proceedings of the Tenth
Conference on Computational Natural Language Learning, Stroudsburg (PA),
2006, p. 149-164.
Fleury, Serge, Base textométrique de textes alignés, 2014, http://www.tal.
univ-paris3.fr/trameur/MAJ-12.02.pdf, site consulté le 10 octobre 2015.
Fleury, Serge, « Exploration du corpus Traductions alignées du discours
d’investiture de B. Obama (Tutoriel no 3, Explorations textométriques
avec mkAlign) », Lexicometrica, no spécial Explorations textométriques,
2009, http://lexicometrica.univ-paris3.fr/numspeciaux/special8.htm,
site consulté le 10 octobre 2015.
Fleury, Serge, Le Trameur, 2015, http://www.tal.univ-paris3.fr/trameur/,
site consulté le 10 octobre 2015.
Fleury, Serge, Le Trameur. Propositions de description et d’implémentation des
objets textométriques, 2013, http://www.tal.univ-paris3.fr/trameur/
trameur-propositions-definitions-objets-textometriques.pdf, site
consulté le 10 octobre 2015.
Fleury, Serge et Maria Zimina, « Exploring translation corpora with
MkAlign », dans Gabe Bokor (dir.), Translation Journal, 2007, http://
translationjournal.net/journal/39mk.htm, site consulté le 10 octobre 2015.
Fleury, Serge et Maria Zimina, « Trameur : A Framework for Annotated
Text Corpora Exploration », dans Lamia Tounsi et al. (dir.) Proceedings
of COLING 2014, 25th International Conference on Computational
Linguistics : System Demonstrations, Dublin, 2014, p. 57-61, http://
www.aclweb.org/anthology/C14-2013.pdf, consulté le 10 octobre 2015.
GATE (General Architecture for Text Engineering), 2015, http://gate.
ac.uk/gate, site consulté le 10 octobre 2015.