Elaboration Du Dictionnaire-Tupuri-Français Par Tropes - Taiwe - F 2023
Elaboration Du Dictionnaire-Tupuri-Français Par Tropes - Taiwe - F 2023
Elaboration Du Dictionnaire-Tupuri-Français Par Tropes - Taiwe - F 2023
N
c::,
ANACLAC NACALCO N
Association Nationale des
Comités de langues
��ç ;,\
�/
: ,f;f,
··0
; &'0
National Association of
Cameroonian language
en
c::,
0
e,ft.NJOU
Camerounaises Committees
z
B.P. 2561 Yaoundé, CAMEROUN 0
/
B.P. 2561 Yaoundé, CAMEROUN
TÉL: (237) 699 61 07 67 . "fC'A\.J. / TÉL: (237) 699 61 07 67
-
e.mail:[email protected]
e.mail:[email protected] UJ
0 SPECIAL ISSUE
-
t IN HONOR OF
....,,
u,
PROF. MAURICE TADADJE U
::,
-
(!)
z
-1
-
C �
w
�
-1
CL
CL
<C �
LL
0
-1
<C
z
et::
::,
0
-,
z
<C
-
0
et::
DESCRIPTION DIGITALISATION AND SPREADING OF CAMEROONIAN
LANGAGES AND CULTURES FOR A SUSTAINABLE DEVELOPMENT
LL
<C Revue publiée par le
CENTRE ANACLAC DE LINGUISTIQUE
APPLIQUEE (CLA)
Mars2023
ISSN 1729-8695
Editorial Manager
Etienne SADEMBOUO, University ofYaounde I and CAL
Editor - in - Chief ote aux contributeurs
Gabriel Mba, University ofYaounde I African Journal of Applied Liguistics (AJAL) est un journal publié une ou deux
Assistant Editor fois par an. Les contributeurs sont encouragés à soumettre leurs articles,
particulièrement les articles qui promeuvent le développement linguistique et
Nguessimo M. Mutaka, University ofYaounde I l'enseignement/apprentissage des langues africaines. Quelques articles en
linguistique générale sont également considérés, si les résultats que ces articles
fournissent peuvent être utilsés pour le développement des langues africaines.
Editorial Board Les articles peuvent être redigés en anglais ou en français. Les contributeurs
doivent soumettre leurs articles à l'adresse E.Mail suivante: [email protected]
Beban S. Chumbow, Académie des sciences, CNE au plus tard le 30 juin 2022 (délais de rigueur). Les articles doivent être saisis
dans word, sous un format facile à convertir. La police utilisée: Times New
Frank ldiata, Grelago, CENAREST, Gabon Roman, taille 12. Pour les caractères spéciaux, pour ceux qui écrivent en langues
africaines, bien vouloir utiliser la police Doulos SIL. Bien vouloir laisser une
Maxime Da Cruz, Centre National de Linguistique Appliquée, marge de 3.39 cm à gauche et à droite, 2.5cm au-dessus et 4.89 cm en-dessous.
Bénin Interligne 1.5. L'article ne devrait pas dépasser 15 pages, y inclues les références
bibliographiques.
Florence Tabe University ofYaounde 1, Cameroon Les citations des auteurs dans le texte doivent être indiquées de cette façon:
Pulleyblank (1986) or Bird (1996: 57). Toute la reférence doit apparaître dans les
Ayu'nwi Neba, University of Buea, Cameroon références bibliographiques présentées de la manière suivante:
Jeff Good, University of Buffalo, USA
Un article ou partie signée d'un document:
Gratien Atindogbe, University of Buéa, Cameroon Nom, Prénom. date. "le titre de l'article entièrement" in le titre de l'ouvrage en
entier et en italique, N2 de la série: page début-page fin de l'aiticle.
Pierpaolo Dicardo, University of Buffalo, USA
Texte tiré d'un livre:
Nkeck A Bidias, University ofYaounde 1, Cameroon Nom, Prénom. date. "le titre entièrement" in Nom, Prenom. (ed.): titre du livre ou
Innocent Fozing, ENS-University ofYaounde I, Cameroon du document, collection, ville, edition, page debut - page fin du texte.
Editorial Secretary: Laurence NGOUMAMBA, University of Tadadjeu, M. et A.B. Chiatoh, 2002. " The challenge of sattelite communication
in African languages" ln African Journal of Applied Linguistics (AJAL). No 3,
Yaounde I, Cameroon NACALCO Center for Applied Linguistics (CLA), Yaoundé.
Address: P.O. Box 2561Yaounde, Cameroon
Reférenccs Web
E.Mail: [email protected] / [email protected] URL (date de visite (mois, année)
https://www.googlescholar.org (visité le 20 septembre 2019)
ISSN 1729-8695
African Journal of Applied Linguistics (AJAL)
Appui du logiciel Tropes dans le processus de
lemmatisation : quel enjeu pour l’élaboration du
dictionnaire tupuri-français ?
Fulbert TAÏWE
Université de Maroua (Cameroun)
[email protected]
Résumé
Cet article voudrait contribuer aux méthodes de confection des
dictionnaires bilingues. Il s’agit d’une expérience basée sur le
Dictionnaire tupuri-français en préparation qui a bénéficié de l’appui
du logiciel Tropes. Depuis les premiers travaux de statistique lexicale et
les progrès de l’informatique sur la traduction automatique des langues
naturelles, les corpus devenant plus grands, le traitement statistique a
cessé d’être manuel. Il faut cependant migrer vers des méthodes de
traitement plus rentable et économique. Le présent travail s’inscrit dans
le cadre théorique de la lemmatisation en lexicographie bilingue. Il est
question d’étudier quelques résultats issus des différentes méthodes en
soumettant le corpus à un traitement statistique par le logiciel de
lexicométrie (Tropes), et de mettre en parallèle la forme, le lemme et le
code, pour pouvoir arriver à un résultat probant. L’étude s’intéresse au
processus d’insertion des lexies dans les dictionnaires bilingues des
langues africaines (la langue tupuri précisément) vers la langue
française. À cet effet, il importe de faire usage des corpus (la Bible
traduite en tupuri, le Cantique tupuri et les contes tupuri) et de logiciel
qui permettent l’analyse des résultats. L’objectif poursuivi est de
réduire le temps de travail et d’arriver à des résultats qui puissent
satisfaire le besoin des usagers et des professionnels. Pour en arriver là,
il est important de procéder aux choix de la liste des lemmes candidats,
l’arrangement des lemmes, leur analyse par Tropes et l’extraction
terminologique.
Mots-clés : dictionnaire, lemmatisation, lexicographie, logiciel tropes,
tupuri, traitement automatique du langage.
Introduction
Depuis l’avènement des premiers travaux de l’ingénierie
linguistique et les progrès des travaux de traduction automatique des
langages naturels, la taille des corpus devenant plus grande, l’analyse
lexicale a cessé d’être mécanique. Il est par conséquent, plus indiqué de
migrer vers des méthodes de traitement qui ont prouvé leur efficacité.
1
AJAL NO 09
5
AJAL NO 09
6
3.1. À propos du logiciel Tropes
Le logiciel Tropes est un logiciel d’analyse sémantique et
également de text mining. Ce logiciel a été créé en 1994 et ne
fonctionne que sous Windows. Ce logiciel permet de déterminer, au
sein d’un ou plusieurs textes, qui sont les acteurs principaux, quelles
sont les relations qui les lient, etc… Il peut également faire ressortir le
sens global du texte. Actuellement, la dernière version disponible de
Tropes est la version v8.4.2. Ce logiciel est gratuit et disponible en
anglais ou en français et téléchargeable sur le site officiel de
Tropes : http://www.tropes.fr/download.htm.
Parmi les fonctions et outils d’analyse de textes proposés par
Tropes, on peut citer un éditeur d’ontologies, une classification
arborescente de la référence, l’analyse chronologique du récit, le
diagnostic du style du texte, la catégorisation des mots-outils,
l’extraction terminologique, l’analyse des acteurs et l’aide à la
constitution de résumés.
Le logiciel fait l’objet d’un développement régulier en plusieurs
langues (dont le français, l’anglais, l’espagnol et le portugais) dans
l’environnement Microsoft Windows. Nous utilisons dans le cadre de
ce travail, la dernière version V8.5. C’est un logiciel gratuit sous
licence spécifique.
8
Figure 3 : Tropes 8.5, Graphe aire d’un épisode fondé sur l’exemple de la
lexie taale (hangar)
Sur ce graphe, chaque Référence est représentée par une sphère
dont la surface est proportionnelle au nombre de mots qu’elle contient.
La distance entre la classe centrale et les autres références est
proportionnelle au nombre de relations qui les lient : autrement dit,
lorsque deux Références sont proches elles ont beaucoup de relations
en commun, et lorsque qu’elles sont éloignées elles n’ont que peu de
relations en commun.
Ce type de graphe permet d’analyser l'environnement d’une
Référence ou d’une catégorie. Ils sont orientés : les Références
affichées à gauche de la classe centrale sont ses prédécesseurs, celles
qui sont affichées à sa droite sont ses successeurs.
9
AJAL NO 09
10
Figure 6 : Tropes 8.5, Extraction terminologique
Cet outil permet d’extraire du texte analysé tous les substantifs
qui ne sont pas classés dans le Scénario et toutes les expressions ou
mots composés significatifs contenant des substantifs.
Ici, on a la possibilité de sélectionner plusieurs lignes pour les
ajouter dans le Scénario. Les éléments de la liste sont précédés par un
code de couleur indiquant leur fréquence d’occurrence. Quand l’Outil
Scénario est ouvert, les options [Localiser] permettent d’effectuer une
recherche automatique des termes dans le Scénario ou dans le texte.
4. Traitement des lemmes après extraction terminologique par
Tropes
Quand on vient à la compilation d’un corpus, il y a trois étapes à
considérer, à savoir : la conception du corpus, la collecte des textes, et
l’encodage des textes. La conception du corpus, qui est la planification
du corpus, doit s’efforcer de collecter des sources primaires,
secondaires et tertiaires pour n'importe quel dictionnaire planifié.
Les sources tertiaires, en particulier, incluent, par exemple
toutes les monographies, communications et grammaires linguistiques
utilisées pour la constitution de la base du dictionnaire (Gouws, 2001b :
69).
De la même manière, la collecte des textes peut être désignée
sous la dénomination de sources primaires du dictionnaire :
l’enregistrement d’une grande variété d’occurrences orales en
11
AJAL NO 09
3) danse.
12
(2) [krɛ᷆] n.[Culture]. Sorcellerie inconsciente, transmise
héréditairement (en général par la mère). Anthropophage malgré
lui, le sorcier est tenu responsable de la maladie et de la mort.
C’est par rêve que son identité se manifeste au malade dont la
famille exige une rétractation publique du sorcier pour la
guérison, qui consiste à « donner de l’eau » au malade.
(3) [sewna] n. esprit qui se manifeste chez les femmes par des
13
AJAL NO 09
14
Dans l’exemple, le regroupement : ~ cuu, ~ cwɛrɛ, ~ egre,
15
AJAL NO 09
2 bière préparée par tous les habitants d’un village suite à une
3 Cf.: ɛ ɛ ɛ.
Cf.: .
[…]
En ce qui concerne la recherche d’un item lexical dans un
ouvrage de référence, un dictionnaire à alphabet droit avec une rangée
verticale des lemmes est généralement considéré comme moins
problématique qu’une macrostructure avec regroupement des éléments
macrostructurels.
Les blocs lexicographiques niches et nids posent des problèmes
aux usagers parce qu’ils doivent faire une recherche fastidieuse à
16
l’intérieur de l’article du dictionnaire caractérisé par l’utilisation des
procédures de condensation textuelle (Hausmann et Wiegand, 1989 :
336). Les lexicographes se servent généralement de la condensation
textuelle là où les usagers cibles d’un dictionnaire ont une longue
tradition de consultation dictionnairique (Gouws, 1999 : 33).
Cependant, on peut arguer que la communauté linguistique tupuri
ne s’est pas encore bien familiarisé avec l’utilisation des dictionnaires
comme ouvrages de référence. Aussi, la question qui mérite d’être
posée est de savoir comment le lexicographe peut concilier l’utilisation
de la condensation textuelle pour l’économie de l'espace et les aptitudes
de référence des usagers. Voici un exemple illustratif :
(6) :
17
AJAL NO 09
Conclusion
Nos démarches théorique et méthodologique confrontées aux
données de terrain nous ont permis de relever un certain nombre de
résultats. Pour bâtir la macrostructure de ce dictionnaire en proposition,
nous avons été confrontés à deux problèmes principaux. Tout d’abord,
il doit donner une réponse à la question de savoir : quels items lexicaux
à inclure et lesquels à ne pas inclure ? Ceci doit être justifié. Ensuite, la
question de l’arrangement de ces éléments macrostructurels doit être
envisagée. Pour envisager la première question, le lexicographe peut
compter sur un outil utile: la fréquence d’emploi des lexèmes
(Hartmann, 1989 : 21). Selon Hausmann et Wiegand (1989 : 346), en se
penchant de prime abord sur les questions microstructurelles, les
lexicographes devraient être informés sur l’existence de la
microstructure obligatoire, la microstructure absolument obligatoire et
la microstructure obligatoire complète.
Nous avons tenté d’examiner certains problèmes liés à
l’inclusion des termes de spécialité. En ce qui concerne ces derniers,
nous croyons que leur inclusion peut servir comme véhicule de la
conceptualisation et probablement comme un point de départ pour la
communication technique dans la langue tupuri.
Il est clair que le dictionnaire à l’étude aura besoin d’une très
bonne structure de distribution de données afin d’être utilisé de la
manière la plus optimale. Ceci inclut des décisions claires concernant la
18
présentation d’un éventail de catégories de données ainsi que leur place
dans le dictionnaire en proposition. La méthode informatique s’est
avérée plus rentable que les méthodes mécaniques et classiques. Non
seulement cette méthode nous a permis de récolter d’importantes
données, mais aussi et surtout, elle nous permet de gagner en temps.
C’est ce qui nous a permis d’avoir un nombre de 17000 lemmes
environs (Taïwe, 2021).
On ne peut, sous aucun prétexte, négliger l’appui du logiciel
Tropes dans le processus de confection d’un dictionnaire. Seulement, la
description de la microstructure, c’est-à-dire la définition des entrées du
dictionnaire n’est pas prise en compte par le logiciel Tropes. C’est une
des limites dudit logiciel. Pour contourner cette limite, il est important
d’utiliser le logiciel Flex (Field works language explorer 8.2 est un
logiciel de création des projets de dictionnaires sous licence de la
Société Internationale de Linguistique.) pour faciliter l’ébauche du
dictionnaire.
Références
Barnbrook, G. 1996. Language and Computers: A Practical
Introduction to the Computer Analysis of Language. McEnery and
Andrew Wilson (Eds): Edinburgh Textbooks in Empirical
Linguistics, Edinburgh: Edinburgh University Press.
Cappelletti, Piergiorgio. 1996. Dictionnaire Tupuri-français. Mission
Catholique de Guidiguis. (Inédit).
Collectif .2005. Waare Baa (Bible en langue tupuri). Yaoundé :
Biblique du Cameroun.
Gouws, R. H.1996. « A Sequence for meeting Lexicographic Needs.
Lexicography as a financial asset in a multilingual South Africa »,
Language Planning Report No.5.3, octobre 1996, Séminaire tenu
19
AJAL NO 09
tembre 2019)
21