Elaboration Du Dictionnaire-Tupuri-Français Par Tropes - Taiwe - F 2023

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 23

M

N
c::,
ANACLAC NACALCO N
Association Nationale des
Comités de langues
��ç ;,\
�/
: ,f;f,
··0
; &'0
National Association of
Cameroonian language
en
c::,
0
e,ft.NJOU
Camerounaises Committees
z
B.P. 2561 Yaoundé, CAMEROUN 0
/
B.P. 2561 Yaoundé, CAMEROUN
TÉL: (237) 699 61 07 67 . "fC'A\.J. / TÉL: (237) 699 61 07 67

-
e.mail:[email protected]
e.mail:[email protected] UJ
0 SPECIAL ISSUE

-
t­ IN HONOR OF

....,,
u,
PROF. MAURICE TADADJE U
::,

-
(!)
z
-1

-
C �

w

-1
CL
CL
<C �

LL
0
-1
<C
z
et::
::,
0
-,
z
<C
-
0
et::
DESCRIPTION DIGITALISATION AND SPREADING OF CAMEROONIAN
LANGAGES AND CULTURES FOR A SUSTAINABLE DEVELOPMENT
LL
<C Revue publiée par le
CENTRE ANACLAC DE LINGUISTIQUE
APPLIQUEE (CLA)
Mars2023
ISSN 1729-8695
Editorial Manager
Etienne SADEMBOUO, University ofYaounde I and CAL
Editor - in - Chief ote aux contributeurs
Gabriel Mba, University ofYaounde I African Journal of Applied Liguistics (AJAL) est un journal publié une ou deux
Assistant Editor fois par an. Les contributeurs sont encouragés à soumettre leurs articles,
particulièrement les articles qui promeuvent le développement linguistique et
Nguessimo M. Mutaka, University ofYaounde I l'enseignement/apprentissage des langues africaines. Quelques articles en
linguistique générale sont également considérés, si les résultats que ces articles
fournissent peuvent être utilsés pour le développement des langues africaines.
Editorial Board Les articles peuvent être redigés en anglais ou en français. Les contributeurs
doivent soumettre leurs articles à l'adresse E.Mail suivante: [email protected]
Beban S. Chumbow, Académie des sciences, CNE au plus tard le 30 juin 2022 (délais de rigueur). Les articles doivent être saisis
dans word, sous un format facile à convertir. La police utilisée: Times New
Frank ldiata, Grelago, CENAREST, Gabon Roman, taille 12. Pour les caractères spéciaux, pour ceux qui écrivent en langues
africaines, bien vouloir utiliser la police Doulos SIL. Bien vouloir laisser une
Maxime Da Cruz, Centre National de Linguistique Appliquée, marge de 3.39 cm à gauche et à droite, 2.5cm au-dessus et 4.89 cm en-dessous.
Bénin Interligne 1.5. L'article ne devrait pas dépasser 15 pages, y inclues les références
bibliographiques.
Florence Tabe University ofYaounde 1, Cameroon Les citations des auteurs dans le texte doivent être indiquées de cette façon:
Pulleyblank (1986) or Bird (1996: 57). Toute la reférence doit apparaître dans les
Ayu'nwi Neba, University of Buea, Cameroon références bibliographiques présentées de la manière suivante:
Jeff Good, University of Buffalo, USA
Un article ou partie signée d'un document:
Gratien Atindogbe, University of Buéa, Cameroon Nom, Prénom. date. "le titre de l'article entièrement" in le titre de l'ouvrage en
entier et en italique, N2 de la série: page début-page fin de l'aiticle.
Pierpaolo Dicardo, University of Buffalo, USA
Texte tiré d'un livre:
Nkeck A Bidias, University ofYaounde 1, Cameroon Nom, Prénom. date. "le titre entièrement" in Nom, Prenom. (ed.): titre du livre ou
Innocent Fozing, ENS-University ofYaounde I, Cameroon du document, collection, ville, edition, page debut - page fin du texte.

Julia Messina Ethe, University ofYaounde I, Cameroon Un ouvrage édité:


Nom, Prénom. (éd.), date. Le titre du document ou du livre en italique, collection,
Prasidis Waïnkem, University ofYaounde I, Cameroon ville, edition
Ndamsah Gratiana Linyor, University ofYaounde 1, Cameroon
Exem1>les:
Pulleyblanck, Douglas. 1986. Tone in lexical phonology Studies in Natural
Language and Linguistics Theo,y. Dordrecht. Reidel.
Adresses: Bird Steven. 1996. Principes de marquage des ions en langues africaines
Editorial Manager: NACALCO Centre for Applied Linguistics Ms. University ofEdinburgh and SIL Cameroun.

Editorial Secretary: Laurence NGOUMAMBA, University of Tadadjeu, M. et A.B. Chiatoh, 2002. " The challenge of sattelite communication
in African languages" ln African Journal of Applied Linguistics (AJAL). No 3,
Yaounde I, Cameroon NACALCO Center for Applied Linguistics (CLA), Yaoundé.
Address: P.O. Box 2561Yaounde, Cameroon
Reférenccs Web
E.Mail: [email protected] / [email protected] URL (date de visite (mois, année)
https://www.googlescholar.org (visité le 20 septembre 2019)
ISSN 1729-8695
African Journal of Applied Linguistics (AJAL)
Appui du logiciel Tropes dans le processus de
lemmatisation : quel enjeu pour l’élaboration du
dictionnaire tupuri-français ?
Fulbert TAÏWE
Université de Maroua (Cameroun)
[email protected]

Résumé
Cet article voudrait contribuer aux méthodes de confection des
dictionnaires bilingues. Il s’agit d’une expérience basée sur le
Dictionnaire tupuri-français en préparation qui a bénéficié de l’appui
du logiciel Tropes. Depuis les premiers travaux de statistique lexicale et
les progrès de l’informatique sur la traduction automatique des langues
naturelles, les corpus devenant plus grands, le traitement statistique a
cessé d’être manuel. Il faut cependant migrer vers des méthodes de
traitement plus rentable et économique. Le présent travail s’inscrit dans
le cadre théorique de la lemmatisation en lexicographie bilingue. Il est
question d’étudier quelques résultats issus des différentes méthodes en
soumettant le corpus à un traitement statistique par le logiciel de
lexicométrie (Tropes), et de mettre en parallèle la forme, le lemme et le
code, pour pouvoir arriver à un résultat probant. L’étude s’intéresse au
processus d’insertion des lexies dans les dictionnaires bilingues des
langues africaines (la langue tupuri précisément) vers la langue
française. À cet effet, il importe de faire usage des corpus (la Bible
traduite en tupuri, le Cantique tupuri et les contes tupuri) et de logiciel
qui permettent l’analyse des résultats. L’objectif poursuivi est de
réduire le temps de travail et d’arriver à des résultats qui puissent
satisfaire le besoin des usagers et des professionnels. Pour en arriver là,
il est important de procéder aux choix de la liste des lemmes candidats,
l’arrangement des lemmes, leur analyse par Tropes et l’extraction
terminologique.
Mots-clés : dictionnaire, lemmatisation, lexicographie, logiciel tropes,
tupuri, traitement automatique du langage.

Introduction
Depuis l’avènement des premiers travaux de l’ingénierie
linguistique et les progrès des travaux de traduction automatique des
langages naturels, la taille des corpus devenant plus grande, l’analyse
lexicale a cessé d’être mécanique. Il est par conséquent, plus indiqué de
migrer vers des méthodes de traitement qui ont prouvé leur efficacité.

1
AJAL NO 09

Le débat de la lemmatisation, celle-ci difficilement standardisée par sa


nature, s’est alors installé et aujourd’hui encore, le choix de méthode
est controversé. L’étude propose d’étudier quelques résultats issus des
différentes méthodes en soumettant notre corpus à un traitement
statistique par le logiciel Tropes utilisé en lexicométrie, et de mettre en
parallèle la forme, le lemme et le code, pour pouvoir arriver à un
résultat probant. L’étude s’intéresse au processus d’insertion des lexies
dans les dictionnaires bilingues des langues africaines vers la langue
française. À cet effet, le corpus qui facilite l’analyse des résultats est
constitué sur la base de la Bible (2005) traduite en tupuri, le Cantique
(2021) tupuri et de logiciel. La lemmatisation est l’opération par
laquelle les formes d’un texte, ou d’un corpus de textes, sont classées
sous le mot qui pourrait leur servir d’adresse dans un dictionnaire. Cette
entrée est appelée lemme. Les méthodes de traitement automatique des
langues permettent d’effectuer des dénombrements et des tris sur les
mots d’un corpus afin d’y appliquer, ensuite, des traitements
statistiques.
Un certain nombre des progrès qui ont été accomplis s’insèrent
dans le contexte plus large de l’industrie de l’édition en général, tandis
que d’autres sont spécifiques à la lexicographie même. L’informatique
a joué un rôle primordial dans cette révolution, tant au niveau de la
rédaction même d’ouvrages lexicographiques qu’à celui de la
typographie et de la fabrication. La technologie des bases de données
existante, ainsi que celle des logiciels de rédaction conçus pour les
dictionnaires, ont permis à tous ceux qui travaillent dans le domaine de
la lexicographie, que ce soit dans le cadre d’un projet de recherche très
spécialisé ou dans celui de la confection d’un dictionnaire bilingue
d’avoir un résultat conséquent.
L’article s’intéresse primordialement au balisage de la théorie
dictionnairique, la méthode de collecte des données lexicales et le
2
traitement des lemmes candidats par Tropes. L’analyse par Tropes
procède par le choix de la liste des lemmes candidats, l’arrangement
des lemmes, leur traitement au moyen du logiciel indiqué et l’extraction
terminologique.
1. Approche théorique de la dictionnairique
Une bonne théorie constitue la base pour la production d’un bon
dictionnaire. Cependant, les données présentées dans les articles du
dictionnaire sont aussi importantes que la théorie. Par conséquent, la
théorie doit toujours être liée à un aspect pratique (Gouws, 1996 : 97).
1.1. Qu’est-ce que la lemmatisation
En linguistique, la lemmatisation est le fait de donner à un mot
la forme neutre canonique. C’est aussi et surtout un traitement lexical
apporté à un texte en vue de son analyse. Ce traitement consiste à
appliquer aux occurrences des lexèmes sujets à flexion un codage
renvoyant à leur entrée lexicale commune, que l’on désigne sous le
terme de lemme.
La question de l’arrangement des lemmes est liée à l’idée même
d’un dictionnaire à alphabet droit par opposition à un dictionnaire ayant
des sous-lemmes. Nous n’allons pas seulement décider ici des éléments
macrostructurels à inclure mais nous voulons également nous
prononcer sur la forme et la présentation de ces lemmes.

1.2. Orientations théoriques


Parlant de la dictionnairique, il convient de souligner son
caractère double. C’est d’un côté, un travail pratique sur la composition
des dictionnaires. C’est aussi de l’autre côté, une science qui traite des
principes de la composition des dictionnaires. Il existe plusieurs types
de dictionnaire, pour le cas présent, il est question d’un dictionnaire
bilingue bidirectionnel (Taïwe, 2017).
Wiegand (1984 : 13-30) identifie quatre constituants théoriques,
à savoir : une section générale (également connue sous le nom de
3
AJAL NO 09

constituant théorique A), une théorie de l’organisation (encore appelée


constituant théorique B), une théorie de la recherche lexicographique
sur la langue (également appelée constituant théorique C) et une théorie
de la description lexicographique de la langue (encore désignée sous
l’appellation de constituant théorique D). Ces constituants théoriques se
subdivisent à leur tour en différentes composantes.
Le constituant théorique A se compose de trois entités, à savoir :
les buts ou visées des dictionnaires, le lien entre la lexicographie et
d’autres théories et l’histoire de la lexicographie. La composante visée
des dictionnaires est au centre de l’interaction entre les dictionnaires et
la société. Les dictionnaires sont produits de sorte qu’ils puissent être
utilisés. Aussi, la visée des dictionnaires devrait toujours être identifiée
en fonction des besoins et des aptitudes du groupe d’usagers cibles
spécifique.
Le constituant théorique B traite du plan du dictionnaire, qui se
compose de deux entités, à savoir le plan d’organisation et le plan de
conceptualisation dictionnairique. Le plan d’organisation énonce
clairement la mission du projet de dictionnaire et propose un exposé
détaillé de toutes les structures impliquées dans la préparation d’un
dictionnaire ainsi qu’une estimation du temps et du capital nécessaire
pour le projet.
Le constituant théorique C se compose de trois entités, à savoir
la théorie de la collecte de données lexicographiques, la théorie de la
saisie des données et la théorie informatique ou encore lexicographie
assistée par ordinateur. Il est un fait bien attesté que la production de
n’importe quel dictionnaire est pratiquement impossible sans une base
de données fiable. Par conséquent, il est important que le lexicographe
entreprenne toutes les activités lexicographiques menant à la
constitution d’une base de dictionnaire. Selon Wiegand (1984 : 14), une
base de dictionnaire est « [...] le matériel linguistique complet formant
4
la base empirique pour la production d’un dictionnaire de langue [...] ».
En outre, une distinction est faite entre les sources primaires,
secondaires et tertiaires. Les sources primaires d’un dictionnaire se
composent habituellement de textes.
Cependant, des enregistrements sonores peuvent également être
utilisés en tant que sources primaires encore désignées sous le nom de
corpus lexicographique d'un dictionnaire. Les sources secondaires sont
tous les dictionnaires consultés pendant la phase de production et de
rédaction. Les sources tertiaires sont tous les travaux de référence
utilisés par le lexicographe pour aborder les questions grammaticales
concernant la langue traitée (Wiegand et Kučera, 1981 : 100 et Gouws,
1999 : 16).
2. Méthodologie de collecte des données lexicales et le choix de la
liste des lemmes candidats
Le balisage du cadre méthodologique constitue un volet
essentiel dans la compréhension des résultats de cette recherche. Il sera
ici question de la méthode de collecte et de l’analyse des données
lexicographiques sous la base de la science lexicographique et
sociolinguistique.

2.1. Méthodes de collecte des données lexicales


Le corpus collecté à ce jour a servi de base pour aborder les
questions métalexicographiques en tupuri. Bien évidemment, l’objectif
final est d’avoir une banque de données fiable qui pourrait justifier la
production du dictionnaire en préparation.
Il est difficile de produire un dictionnaire d’une langue à
tradition orale sur la base d’un corpus de textes. Pour quelques langues
à tradition orale (souvent appelées langues non écrites ou sans écriture)
des textes écrits (par opposition à textes oraux) sont disponibles, mais
dans la majorité des cas ils sont rares sinon inexistants.

5
AJAL NO 09

Lorsqu’il n’existe pas de corpus de textes écrits, les occurrences


à traiter dans un dictionnaire doivent être collectées au moyen
d’enquêtes linguistiques. La qualité des données dépendait énormément
du choix des informateurs. Le profil de l’informateur idéal a été établi
avec beaucoup de soins en tenant compte des ambitions et objectifs du
projet de dictionnaire. Pendant l’enquête, l’informateur répondait à la
fois à des critères objectifs et subjectifs.
Le lexique tupuri en constitution a été collecté à partir de
plusieurs méthodes :
1. L’observation participante ;
2. L’observation du discours spontané ;
3. L’enregistrement/la transcription des occurrences spontanées ;
4. L’enquête par questionnaires ou interview semi-structuré (ISS) ;
5. L’enquête par correspondance ;
6. L’utilisation des supports (Bible, cantique, dictionnaire, contes et
proverbes, etc.) existants.

3. L’analyse lexicale par tropes, logiciel de lexicométrie


La segmentation d’un texte contenant des mots écrits de manière
conjonctive en des mots libres est connue sous le nom de tokenisation.
Lorsqu’on vient à la tokenisation de mot, on a généralement affaire à
des nombres énormes de fichiers de textes. Afin de manipuler ces
fichiers de textes, le lexicographe ou n’importe quel autre spécialiste a
besoin de quelques logiciels. Il y a tout à fait un certain nombre de
logiciels, à savoir: Lexico 5, Iramuteq, Trameur, Field Language
Explorer et Tropes (Lafont, 1984). Dans le cadre de cet article, nous
avons jugé après simulations que le dernier est digne d’intérêt dans le
processus de rédaction du dictionnaire en préparation.

6
3.1. À propos du logiciel Tropes
Le logiciel Tropes est un logiciel d’analyse sémantique et
également de text mining. Ce logiciel a été créé en 1994 et ne
fonctionne que sous Windows. Ce logiciel permet de déterminer, au
sein d’un ou plusieurs textes, qui sont les acteurs principaux, quelles
sont les relations qui les lient, etc… Il peut également faire ressortir le
sens global du texte. Actuellement, la dernière version disponible de
Tropes est la version v8.4.2. Ce logiciel est gratuit et disponible en
anglais ou en français et téléchargeable sur le site officiel de
Tropes : http://www.tropes.fr/download.htm.
Parmi les fonctions et outils d’analyse de textes proposés par
Tropes, on peut citer un éditeur d’ontologies, une classification
arborescente de la référence, l’analyse chronologique du récit, le
diagnostic du style du texte, la catégorisation des mots-outils,
l’extraction terminologique, l’analyse des acteurs et l’aide à la
constitution de résumés.
Le logiciel fait l’objet d’un développement régulier en plusieurs
langues (dont le français, l’anglais, l’espagnol et le portugais) dans
l’environnement Microsoft Windows. Nous utilisons dans le cadre de
ce travail, la dernière version V8.5. C’est un logiciel gratuit sous
licence spécifique.

3.2. Étapes de la lemmatisation par Tropes


Voici une figure qui visualise l’interface du logiciel Tropes :

Figure 1 : Tropes 8.5, Interface du logiciel Tropes


7
AJAL NO 09

Pour analyser un texte, nous avons procédé par l’utilisation du


menu [Fichier][Ouvrir], ou procédé par prendre un fichier texte avec
l’Explorateur de fichiers et lâcher le texte sur la fenêtre de Tropes. Les
résultats affichent le Scénario qui été appliqué sur ce texte. Pour
modifier ou créer un Scénario, nous utilisons le menu [Outils]
[Scénario]. On peut avoir plusieurs Scénarios pour traiter différents
contenus.
Les Scénarios sont des classifications hiérarchiques qui
permettent de personnaliser les dictionnaires du logiciel et de structurer
l’information, en fonction de notre stratégie d’analyse. L’utilisation
d’un Scénario personnalisé est généralement indispensable pour
effectuer une analyse correcte d’un texte.
Nous allons succinctement montrer au travers de certaines
captures comment nous avons procédé obtenir les résultats escomptés.
Cette capture est un graphe qui visualise une partie du texte
introduit pour analyse.

Figure 2 : Tropes 8.5.2, Graphe d’Affichage de tout le texte

Voici une autre figure qui illustre à suffisance la procédure


d’extraction des ens du lexie vedette :

8
Figure 3 : Tropes 8.5, Graphe aire d’un épisode fondé sur l’exemple de la
lexie taale (hangar)
Sur ce graphe, chaque Référence est représentée par une sphère
dont la surface est proportionnelle au nombre de mots qu’elle contient.
La distance entre la classe centrale et les autres références est
proportionnelle au nombre de relations qui les lient : autrement dit,
lorsque deux Références sont proches elles ont beaucoup de relations
en commun, et lorsque qu’elles sont éloignées elles n’ont que peu de
relations en commun.
Ce type de graphe permet d’analyser l'environnement d’une
Référence ou d’une catégorie. Ils sont orientés : les Références
affichées à gauche de la classe centrale sont ses prédécesseurs, celles
qui sont affichées à sa droite sont ses successeurs.

Figure 4 : Tropes 8.5, Graphe acteurs de la lexie gurna (danse


traditionnelle)

9
AJAL NO 09

Ce graphe représente la concentration de relations entre acteurs.


Il permet de faire une comparaison visuelle du poids des relations entre
les principales références.
L’axe des X (horizontal) indique le taux d’actant / d’acté (de
gauche à droite). L’axe des Y (vertical) indique la concentration de
relations pour chaque référence affichée. Les traits indiquent les
relations entre la variable gurna sélectionnée et les autres références
affichées. Un trait en pointillé indique une relation peu fréquente.
Seules les références présentant un grand nombre de relations sont
représentées sur le graphe.

Figure 5 : Tropes 8.5, Graphe étoilé de la lexie jobo (quelqu’un)

Le graphe en étoile affiche les Relations entre Références, ou


entre une catégorie de mots et des Références. Les nombres qui
apparaissent sur le graphe indiquent la quantité de Relations (fréquence
de cooccurrence) existant entre les Références. Ce type de graphe
permet d'analyser l'environnement d'une Référence ou d'une catégorie.
Ils sont orientés : les Références affichées à gauche de la classe centrale
sont ses prédécesseurs, celles qui sont affichées à sa droite sont ses
successeurs.

10
Figure 6 : Tropes 8.5, Extraction terminologique
Cet outil permet d’extraire du texte analysé tous les substantifs
qui ne sont pas classés dans le Scénario et toutes les expressions ou
mots composés significatifs contenant des substantifs.
Ici, on a la possibilité de sélectionner plusieurs lignes pour les
ajouter dans le Scénario. Les éléments de la liste sont précédés par un
code de couleur indiquant leur fréquence d’occurrence. Quand l’Outil
Scénario est ouvert, les options [Localiser] permettent d’effectuer une
recherche automatique des termes dans le Scénario ou dans le texte.
4. Traitement des lemmes après extraction terminologique par
Tropes
Quand on vient à la compilation d’un corpus, il y a trois étapes à
considérer, à savoir : la conception du corpus, la collecte des textes, et
l’encodage des textes. La conception du corpus, qui est la planification
du corpus, doit s’efforcer de collecter des sources primaires,
secondaires et tertiaires pour n'importe quel dictionnaire planifié.
Les sources tertiaires, en particulier, incluent, par exemple
toutes les monographies, communications et grammaires linguistiques
utilisées pour la constitution de la base du dictionnaire (Gouws, 2001b :
69).
De la même manière, la collecte des textes peut être désignée
sous la dénomination de sources primaires du dictionnaire :
l’enregistrement d’une grande variété d’occurrences orales en

11
AJAL NO 09

provenance d’autant de domaines de recherche différents que possible


(Prinsloo, 2000 : 4) ou comme Gouws (2001b : 68) l’a formulé
« l’enregistrement de l’oralité ».
Selon Barnbrook (1996 : 50), « [...] le processus consistant à
produire une liste qui groupe l’ensemble de toutes les formes
appartenant à chaque lemme s’appelle souvent la lemmatisation ».
Etant donné la portée large des thèmes ci-dessus, l’analyse se focalisera
sur la tokenisation de mot, et la lemmatisation. Cette dernière est
particulièrement utile pour des buts lexicographiques (Prinsloo, 2000 :
4).

4.1. Quelques lexies à charges culturelles


Il faut reconnaitre que le traitement des lexies à forte charge
culturelle est une des composantes qui devrait être pris en compte en
évaluant et en planifiant un dictionnaire. Aussi, leur inclusion comme
lemmes dans le dictionnaire à l’étude est importante. En raison de leurs
différentes connotations (croyances traditionnelles, superstitions,
sorcellerie, danse traditionnelle, etc.) pour les Tupuri. Les termes tels
que ceux que nous allons lister ci-dessous méritent un traitement
spécial.

(1) [gurna] n.[Culture]. 1) groupement d’hommes autour d’un

troupeau de vaches laitières pendant la saison sèche, leur fonction


est de danser et de chanter aux levées de deuil ou funérailles y i
huul ’. ex : ndi kal gurna : j’entre dans le gurna. 2) cure de lait.

ex : : je vais boire à la cure de lait.

3) danse.

12
(2) [krɛ᷆] n.[Culture]. Sorcellerie inconsciente, transmise
héréditairement (en général par la mère). Anthropophage malgré
lui, le sorcier est tenu responsable de la maladie et de la mort.
C’est par rêve que son identité se manifeste au malade dont la
famille exige une rétractation publique du sorcier pour la
guérison, qui consiste à « donner de l’eau » au malade.

(3) [sewna] n. esprit qui se manifeste chez les femmes par des

crises de possession et de glossolalie (masana) ; les possédées


changent de nom et deviennent à leur tour guérisseuses’, formant
une congrégation de femmes qui se réunissent pour chanter et
danser en compagnie. ex : ɛ : est

possédée par cet esprit. Puisqu’ici il ne s’agit que de la


description macrostructurale, nous ne nous intéressons ici qu’aux
entrées. Comme ce fut le cas pour les unités lexicales centrées sur
la culture, les items lexicaux présentés dans les deux exemples
précédents seront inclus dans le dictionnaire en proposition non à
cause de leur appartenance au langage de spécialité ou au système
de parenté mais sur la base de leur fréquence d’emploi dans le
corpus.

4.2. L'arrangement des sous-lemmes


Il y a une distinction entre une macrostructure à alphabet droit et
une macrostructure présentant des sous-lemmes. Cette dernière résulte
des procédures de nichification et de nidification. Dans un dictionnaire
à niches, des blocs lexicographiques de lemmes qui n’entretiennent pas
nécessairement une relation sémantique sont présentés dans un ordre
alphabétique droit. En outre, l’ordre alphabétique doit également être
maintenu par rapport aux lemmes précédents et suivants dans

13
AJAL NO 09

l’arrangement vertical. Dans un dictionnaire à nids, deux niveaux


doivent également être identifiés.
Sur un plan externe, l’ordre horizontal ne correspond pas
nécessairement à l’arrangement alphabétique de l’ordre vertical. Ceci
est connu sous le nom de premier niveau de nidification (Gouws, 2001 :
106). Sur un plan interne, les sous lemmes dans un nid peuvent
également présenter une déviation par rapport à l’ordre alphabétique.
Ceci est désigné sous l’appellation de deuxième niveau de nidification
(Gouws, 2001 : 106).
La déviation au niveau alphabétique n’est pas seulement un
dispositif d’économie de l’espace mais permet également au
lexicographe d’exhiber les rapports morpho-sémantiques entre les sous-
lemmes (Hausmann et Wiegand, 1989: 336). Pour illustrer ce point, le
bloc lexicographique de lemmes avec (tresser) comme lemme

externe/partie du lemme en position d’entrée d’article et le signe-lemme


(vin) ont le traitement suivant que nous proposons :
(4) taa e v.intr. tresser (nattes, secco, paniers). Syn.: ɛ . taage

ɛɛrɛ contracter une dette. ~ cuu réduire en cendre les tiges

du mil ou autres matières, pour faire du sel. ~ cwɛrɛ

confectionner le piège cwɛr’ pour capturer des moineaux,


rouge-gorge et mange mil avec la tige supérieure des herbes des
champs waa-cay’ ou gulb y’ ou les jeunes herbes lɛwrɛ’. ~
egre prêter main-forte. ~ g de mopo Cf.: wuuri. ~ hiigi

tresser une natte. ~ kerge tresser un panier.

tresser la paille. ~ maa de lag laare point fantaisie (tressage).

14
Dans l’exemple, le regroupement : ~ cuu, ~ cwɛrɛ, ~ egre,

etc, présente certaines caractéristiques de condensation textuelle, à


savoir l’utilisation des procédures de substitution en particulier.
Nous avons utilisé le tilde (~) afin de substituer le signe-lemme
ge dans le présent exemple comme ont l’habitude de le faire certains
lexicographes dans les différents blocs lexicographiques. Cette
utilisation d’un symbole de représentation (le tilde ou le trait d’union
(Wolski, 1989 : 964) dans un signe-lemme condensé pose généralement
des problèmes aux usagers parce que ces derniers doivent reconstruire
par eux-mêmes les données réduites ou omises. Il devrait également
être noté que cet article est caractérisé par l’utilisation de ce qui appelé
parties du lemme (Wolski, 1989: 365). Dans le dictionnaire en
préparation, compte tenu de la cible ou des usagers, nous n’allons pas
utiliser le tilde. L’objectif étant de faciliter le repérage facile des entrées
aux usagers.
Les parties du lemme représentent généralement le lemme de
base, qui est un lemme entier/partiel fonctionnant en position d’entrée
de la niche ou encore du nid. En effet, tous les sous-lemmes incluent le
tilde plus le deuxième thème du mot composé respectif et
l’arrangement sinueux s’intègre à l’ordre vertical. Ces sous-lemmes
sont ainsi introduits par des parties de lemmes en position externe
d’entrée de la niche (Wolski, 1989: 365 et Gouws, 2001: 108).
Le lemme i présente toutes les caractéristiques de la
nichification étant donné que l’ordre alphabétique interne est maintenu
dans la file sinueuse. En outre, les dérivations et les mots composés
sont tous confondus dans l’article. Par conséquent, ce bloc
lexicographique de lemmes devrait être désigné sous le nom premier
niveau de nidification (Gouws, 2001 : 106). Voici un exemple typique
d’un nid de lemme :

15
AJAL NO 09

(5) y i n.[Culture]. 1) bière de mil; toute boisson alcoolisée. ex : y i


ne ay d uri : la bière a grandi chez une veuve. Syn.:
m ɛ ,c c . Var.: hii. 2) figure au jeu de pions ’ ou

’ composé de six pions placés de manière que les

frappes se suivent avec le déplacement du même pion.

1 bière pour remercier Dieu, accompagnée d’un bélier au début

de la saison des pluies, en principe par un chef de famille.

2 bière préparée par tous les habitants d’un village suite à une

annonce solennelle de la part du chef en début de saison des


pluies afin d’éviter d’éventuels malheurs.

3 Cf.: ɛ ɛ ɛ.

Cf.: .

n. bière pour recevoir les amis.

n. bière pour la cérémonie d’une naissance.

n. bière préparée à l’occasion de la grande chasse aw’; bière

pour le sacrifice de aw’. Cf.: .

c n. bière pour une cérémonie du mariage.

bière préparée pour le sacrifice aux ancêtres.

[…]
En ce qui concerne la recherche d’un item lexical dans un
ouvrage de référence, un dictionnaire à alphabet droit avec une rangée
verticale des lemmes est généralement considéré comme moins
problématique qu’une macrostructure avec regroupement des éléments
macrostructurels.
Les blocs lexicographiques niches et nids posent des problèmes
aux usagers parce qu’ils doivent faire une recherche fastidieuse à
16
l’intérieur de l’article du dictionnaire caractérisé par l’utilisation des
procédures de condensation textuelle (Hausmann et Wiegand, 1989 :
336). Les lexicographes se servent généralement de la condensation
textuelle là où les usagers cibles d’un dictionnaire ont une longue
tradition de consultation dictionnairique (Gouws, 1999 : 33).
Cependant, on peut arguer que la communauté linguistique tupuri
ne s’est pas encore bien familiarisé avec l’utilisation des dictionnaires
comme ouvrages de référence. Aussi, la question qui mérite d’être
posée est de savoir comment le lexicographe peut concilier l’utilisation
de la condensation textuelle pour l’économie de l'espace et les aptitudes
de référence des usagers. Voici un exemple illustratif :
(6) :

adj. grand, arrogant, vainqueur. ex : gob e sɛ

, ɛ j r gl c : pélican dit de ne pas

l’appeler vainqueur, cela le pousse à sʼénorgueillir. Syn.:


bogawla.

aŋ-kaɓraw nom du chef supérieur dans les contes.

-kluu 1) Seigneur. 2) chef du lignage D rɛ’, qui réside à D rɛ’,

au pied du mont Illi ; il est d’abord le chef religieux et il est


choisi par les gens de Illi. Toutes les activités religieuses sont
régies par les lois issues de ce chef suprême des Tupuri. C’est lui
qui fixe les divers calendriers des manifestations chez les Tupuri.
Il inaugure la chasse en y participant lui-même, soulignant ainsi
l’aspect social de l’évènement. L’année tupuri commence en
octobre, avec la fête du coq et la récolte du mil rouge. Les
activités secondaires sont dépendantes des saisons. Les autres
manifestations rituelles telles le ’ ’, fête marquant la période

17
AJAL NO 09

des grandes chasses, et ouvrant la saison des pêches, lui


reviennent aussi.

Dans cette macrostructure avec regroupements dominés par une


approche centrée sur l’usager (Taïwe, 2021 : 313), les lemmes
principaux , -ka raw, et -kluu sont arrangés dans un

ordre alphabétique droit.

Conclusion
Nos démarches théorique et méthodologique confrontées aux
données de terrain nous ont permis de relever un certain nombre de
résultats. Pour bâtir la macrostructure de ce dictionnaire en proposition,
nous avons été confrontés à deux problèmes principaux. Tout d’abord,
il doit donner une réponse à la question de savoir : quels items lexicaux
à inclure et lesquels à ne pas inclure ? Ceci doit être justifié. Ensuite, la
question de l’arrangement de ces éléments macrostructurels doit être
envisagée. Pour envisager la première question, le lexicographe peut
compter sur un outil utile: la fréquence d’emploi des lexèmes
(Hartmann, 1989 : 21). Selon Hausmann et Wiegand (1989 : 346), en se
penchant de prime abord sur les questions microstructurelles, les
lexicographes devraient être informés sur l’existence de la
microstructure obligatoire, la microstructure absolument obligatoire et
la microstructure obligatoire complète.
Nous avons tenté d’examiner certains problèmes liés à
l’inclusion des termes de spécialité. En ce qui concerne ces derniers,
nous croyons que leur inclusion peut servir comme véhicule de la
conceptualisation et probablement comme un point de départ pour la
communication technique dans la langue tupuri.
Il est clair que le dictionnaire à l’étude aura besoin d’une très
bonne structure de distribution de données afin d’être utilisé de la
manière la plus optimale. Ceci inclut des décisions claires concernant la
18
présentation d’un éventail de catégories de données ainsi que leur place
dans le dictionnaire en proposition. La méthode informatique s’est
avérée plus rentable que les méthodes mécaniques et classiques. Non
seulement cette méthode nous a permis de récolter d’importantes
données, mais aussi et surtout, elle nous permet de gagner en temps.
C’est ce qui nous a permis d’avoir un nombre de 17000 lemmes
environs (Taïwe, 2021).
On ne peut, sous aucun prétexte, négliger l’appui du logiciel
Tropes dans le processus de confection d’un dictionnaire. Seulement, la
description de la microstructure, c’est-à-dire la définition des entrées du
dictionnaire n’est pas prise en compte par le logiciel Tropes. C’est une
des limites dudit logiciel. Pour contourner cette limite, il est important
d’utiliser le logiciel Flex (Field works language explorer 8.2 est un
logiciel de création des projets de dictionnaires sous licence de la
Société Internationale de Linguistique.) pour faciliter l’ébauche du
dictionnaire.
Références
Barnbrook, G. 1996. Language and Computers: A Practical
Introduction to the Computer Analysis of Language. McEnery and
Andrew Wilson (Eds): Edinburgh Textbooks in Empirical
Linguistics, Edinburgh: Edinburgh University Press.
Cappelletti, Piergiorgio. 1996. Dictionnaire Tupuri-français. Mission
Catholique de Guidiguis. (Inédit).
Collectif .2005. Waare Baa (Bible en langue tupuri). Yaoundé :

Alliance Biblique du Cameroun.


Collectif. 2021. Naa Togod Baa, (Cantique tupuri). Yaoundé : Alliance

Biblique du Cameroun.
Gouws, R. H.1996. « A Sequence for meeting Lexicographic Needs.
Lexicography as a financial asset in a multilingual South Africa »,
Language Planning Report No.5.3, octobre 1996, Séminaire tenu
19
AJAL NO 09

au Bureau du WAT le 12 April 1996, Department of Art, Culture,


Science and Technology (Ed.). pp. 97-108.
Gouws, R. H. 2001. The Use of an Improved Access Structure in
Dictionaries. Lexikos 11, pp. 101-111.
Gouws, R.H. 1999. Mediostructural Representation, Textual
Condensation and User Orientation in the WAT X »,
Lexicographica15: Tübingen: Max Niemeyer, pp.4-37.
Hartmann, R.R.K. (Ed.). 1989. Sociology of the Dictionary User:
Hypotheses and Empirical studies, Hausmann, F. J. et alii. (Eds.).
1989-1991. Dictionaries. An International Encyclopedia of
Lexicography/Dictionnaires. Berlin: Walter de Gruyter. pp.102-
111
Hausmann, F. J. et H. E. Wiegand. 1989. Component Parts and
Structures of General Monolingual Dictionaries: A Survey, in
Hausmann, F. J. et al. (Eds.). 1989 1991. Dictionaries. An
International Encyclopedia of Lexicography, Berlin: Walter de
Gruyter, pp. 328-360.
Lafon, Pierre. 1984. Dépouillements et statistiques en lexicométrie,
Slatkine-Champion.
Lebart L. et Salem A.1994. Statistique textuelle. Dunod.
Prinsloo, D.J. 2000. The Compilation of Electronic Corpora, with
Special Reference to the African Languages, Cours de
lexicographie, Département d’Afrikaans et néerlandais, Université
de Pretoria/Université de Stellenbosch.
Ruelland, Suzanne. 1988. Dictionnaire Tupuri-Français-Anglais :
Région de Mindaoré, Tchad. Paris : Peeters/Selaf. 342p.
Taïwe, Fulbert. 2017. Anal se sémantique d’un ouvrage
lexicographique interlinguistique : Cas du Dictionnaire tupuri-
français-anglais de Suzanne Ruelland. Master en Sciences du
langage, Université de Ngaoundéré, Cameroun.
20
https//www.academia.edu.
Taïwe, Fulbert. 2020a. Vers une dynamique des pratiques
lexicographiques bilingues des langues africaines/langue française
: le DITFA à l’épreuve de la lexicologie explicative et
combinatoire. MASHAMBA. Linguistique, littérature, didactique
en Afrique des grands lacs, 1(1). https:/
/www.revues.scienceafrique.org/mashamba/texte/taiwe2020/
Taïwe, Fulbert et Calaina, Théophile. 2020b. La lexicographie tupuri et
le problème de traitement sémantique in Calaïna Théophile (dir.),
Langues africaines et développement, Paris : Challenges littéraires
éditions. pp.100-115.
Taïwe, Fulbert. 2021. Description lexicologique et lexicographique
tupuri (Cameroun-Tchad) : ébauche d’un dictionnaire bi-
unilingue tupuri-français. Thèse de Doctorat Ph. D en linguistique
africaine. Ngaoundéré : Université de Ngaoundéré.
Wolski, W. 1989. Das Lemma und die verschiedenen Lemma typen,
Hausmann, F.J. et alii (Eds.), 1989-1991,pp.360-371.

tembre 2019)

21

Vous aimerez peut-être aussi