Démarrer rapidement  |  1. Le mlatin  |  2. Principe de fonctionnement des dictionnaires d'ispell  |  3. Le fichier d'affixes du mlatin  |  4. Ajouter au dictionnaire un nouveau mot  |  5. Quelques options utiles d'ispell  |  6. Et maintenant ?

màj 30 oct. 2001

mlatin, un dictionnaire latin pour ispell ?

Non, un dictionnaire du latin d'un mathématicien de la Renaissance.

Jean-Pierre Sutto


Démarrer rapidement

Dans le même répertoire que celui de mlatin.dico et mlatin.aff, construire le fichier mlatin.hash indispensable pour ispell:

buildhash mlatin.dico mlatin.aff mlatin.hash
On peut alors utiliser le correcteur de manière interactive:
ispell -d ./mlatin file
Ispell fait alors des suggestions pour les mots qu'il ne reconnaît pas. Il peut remplacer (R) un tel mot, l'accepter temporairement (A), l'enregistrer dans un dictionnaire personnel (I), etc. Taper ? pour avoir une aide en ligne.

Si le fichier est en TeX ou LaTeX, utiliser l'option -t:

ispell -t -d ./mlatin file
Pour avoir une liste des erreurs détectés, utiliser l'option -l:
cat file | ispell -d ./mlatin -l
Si l'on installe les fichiers mlatin.aff et mlatin.hash avec les autres dictionnaires de ispell, généralement dans /usr/lib/ispell/, il est alors possible d'appeler le correcteur de n'importe quel répertoire en utilisant l'option -d mlatin.

1. Le mlatin

Dans le cadre du projet d'édition des travaux scientifiques de Francesco Maurolico, mathématicien italien de la Renaissance (1594-1575), il était utile de pouvoir corriger l'orthographe des transcriptions des textes latins édités. Un correcteur libre du latin n'existant pas à notre connaissance, ispell a fourni un cadre libre, simple et relativement bien documenté pour en construire un. On l'a nommé mlatin (pour Maurolico ou Mathematical Latin). Ce dictionnaire (fichier d'affixes mlatin.aff et vocabulaire mlatin.dico) est mis gratuitement et librement à la disposition de tous sous licence GPL.

Un correcteur du latin uniquement orthographique est-il pertinent ? Grammaire et orthographe semblent indissociables dans la langue latine, à tel point que l'on peut s'interroger sur l'efficacité de ce correcteur. Il est facile de se tromper de déclinaison, rendant ainsi le texte erroné, sans toutefois que la terminaison ne le soit « orthographiquement ». A priori, les fautes de ce genre sont d'une fréquence telle, qu'un correcteur uniquement orthographique semble inefficace. En fait, dans la pratique, il n'en est rien et un tel correcteur rend des services signalés, corrigeant bon nombre d'erreurs dues aux fautes de frappe, par exemple les inversions ou les lacunes de lettres (amaums, rosrum), mais aussi les déclinaisons et conjugaisons impossibles (rosibus, amabint). Étant donné le nombre de flexions que peut prendre un lemme latin, plus de 150 pour un verbe par exemple, un tel correcteur uniquement orthographique du latin sera certes moins efficace qu'un correcteur de l'anglais; mais il n'en restera pas moins, d'après l'expérience que nous en avons, utile.

La variété du latin est un autre écueil. Pour créer un dictionnaire de mots latins qu'utilisera ispell, plusieurs méthodes sont possibles. On peut partir d'un dictionnaire déjà existant et lui faire subir un traitement informatique. Mais de quel dictionnaire partir ? D'un dictionnaire du latin classique, d'un dictionnaire médiéval ? Sera-t-il complet dans tous les domaines, en particulier scientifique ? Faut-il admettre toutes les graphies possibles ? Différencier ou non les u et les v, les i et les j, les i et les y ? On a choisi une deuxième voie, moins ambitieuse mais paradoxalement plus précise (sans parler du temps nécessaire pour créer un vocabulaire « général » pour ispell): partir des textes sur lesquels on travaille et enrichir au fur et à mesure la base du vocabulaire. Le correcteur orthographique du latin présenté ici est avant tout un dictionnaire du vocabulaire d'un mathématicien de la Renaissance. Il contient à ce jour environ 4800 mots et corrige bien les textes de cet auteur, corrigera sans doute honorablement les textes mathématiques d'autres auteurs de la même époque et très probablement très mal un texte littéraire de l'époque classique !

C'est évidemment une limite fondamentale de ce travail. Il ne tient cependant qu'au lecteur d'y remédier. À l'aide des explications fournies ici, il est facile d'adapter ce dictionnaire pour son propre usage, et d'ailleurs de construire, si c'est le but recherché, un correcteur du latin classique. Cette limitation est paradoxalement aussi un avantage si l'on sort du cadre strictement orthographique, pour entrer dans celui de l'édition: si n textes ont servi à construire le dictionnaire, les mots non reconnus d'un (n+1)e texte sont intéressants à plus d'un titre et incitent à se poser quelques questions avant de les intégrer dans la base. S'agit-il d'un texte avec un nouveau vocabulaire ? S'agit-il d'une nouvelle graphie ? Comment expliquer la variation ?

2. Principe de fonctionnement des dictionnaires d'ispell

Ispell est un correcteur orthographique libre qui fonctionne sur plate-forme unix et dos. Il est très répandu dans le monde unix, traite de nombreuses langues et s'interface aisément avec tous les éditeurs de texte ainsi qu'avec LaTeX. Le mlatin a été construit et testé avec ispell 3.1.20. Ispell fonctionne suivant un principe assez simple: quand on lui présente un texte ou une liste de mots à tester, il cherche chacun d'entre eux dans une liste de mots donnés (le dictionnaire) et s'il ne trouve pas un mot, suggère une ou des corrections en se basant sur les ressemblances graphiques avec les mots qu'il possède dans son dictionnaire.

Ispell a quelques lacunes reconnues. Il est impossible de travailler sur plusieurs langues à la fois et ses suggestions de correction laissent quelques fois à désirer, en particulier parce que son algorithme simplifié l'empêche de faire une suggestion pour un mot qui comportent deux erreurs ou plus. Il est possible de contourner ces problèmes et d'utiliser les pipe du shell pour interroger consécutivement deux dictionnaires: cat file | ispell -d italian -l | ispell -d mlatin -l; on peut aussi penser que les suggestions ne sont pas vraiment indispensables dans la plupart des cas: localiser les erreurs suffit le plus souvent. Ces deux lacunes constituent les avantages d'un autre correcteur orthographique sous unix: aspell. Mais ce dernier est encore en développement et surtout, n'utilise pas un système d'affixes comme celui d'ispell, ce qui le rend infiniment plus complexe pour créer un dictionnaire latin. Il n'est toutefois pas difficile de transformer un dictionnaire créé pour l'un en un dictionnaire pour l'autre, et leur efficacité, la quantité de mots reconnus, sera de toute façon identique. Malgré sa simplicité, ispell n'en est pas moins un correcteur très efficace et utile.

D'un point de vue technique, la liste de mots qu'utilise ispell est dite « hachée », c'est-à-dire mise sous un format optimisé pour le travail d'ispell, mais peu lisible pour l'oeil humain. Heureusement, ce « hachage » est fait automatiquement par un utilitaire fourni avec ispell (buildhash), à partir d'une liste primitive de mots présentant quant à elle un format et une syntaxe particulièrement simples: un mot pour une ligne. Pour la construction du dictionnaire, c'est ce fichier de vocabulaire qui nous importe ici. En voici un échantillon:

rosa
rosam
rosae
dominus

Pour réduire la longueur et faciliter l'entrée des mots du vocabulaire, il est possible d'ajouter aux mots des balises, ou affixes, que l'on définit dans un autre fichier, le fichier d'affixes, permettant de définir les flexions possibles d'un mot. Nous nous sommes appuyés sur cette fonction pour les flexions des mots dues aux déclinaisons ou aux conjugaisons. Exemple: si l'on construit l'affixe à laquelle on attribuera l'étiquette arbitraire /a dans le fichier d'affixes, permettant toutes les flexions de la première déclinaison latine, il suffira que l'on entre dans la liste de mots:

rosa/a

pour qu'ispell connaissent alors tous les mots issus de la déclinaison de rosa, c'est à dire que cette unique entrée dans la liste de mots sera équivalente à l'entrée multiple:

rosa
rosam
rosae
rosas
rosarum
rosis

Un dictionnaire ispell est ainsi constitué d'un fichier d'affixes et d'un fichier de vocabulaire « affixé ». La syntaxe d'un fichier d'affixes est un peu plus subtile que celle du fichier de vocabulaire et il convient de lire attentivement la page de manuel correspondante (man 4 ispell) si l'on souhaite modifier ce fichier. Le principe reste cependant simple. Des drapeaux indiquent les modifications qu'est susceptible de subir un mot servant de radical. Ainsi, le drapeau qui servira pour les mots de la première déclinaison comportera les lignes suivantes:

flag *a:	
	
	a	>	-a,ae
	a	>	-a,am
	a	>	-a,as
	a	>	-a,arum
	a	>	-a,is

Il est facile sur cet exemple de comprendre le principe de la construction du fichier. La première ligne indique le nom du drapeau/affixe /a qui est défini après les deux points. Les a de la première colonne indiquent que cette règle s'applique aux mots qui finissent par la lettre a (et qui d'après le drapeau ont pour affixe /a). La règle alors suivie est indiquée après le >: on enlève la lettre a qui finit le mot et on la remplace par ae, am, etc. On donne de cette façon les différentes flexions que peut prendre ce mot. La première colonne peut être une condition plus complexe. Avec deux lettres séparées par un espace, on indique que la règle s'applique aux mots finissant par ces deux lettres. Il est aussi possible d'indiquer des conditions négatives avec le caractère clef ^. Ainsi,

flag *f:	
	
	[^i] [^s]	>	-s,em
signifie que les mots ayant l'affixe /f et ne finissant pas par les lettres is, ont une flexion admise en retirant le s final et on ajoutant un em. Ce système de drapeau/affixe et les conditions sur les terminaisons des mots permettent de créer facilement un nombre important de mots dérivés à partir d'un unique mot radical.

D'autres possibilités existent, mais sont plus complexes. Il est en particulier possible de créer aussi bien des drapeaux de préfixes que de suffixes. Il est préférable de lire la page de manuel (man 4 ispell) pour avoir toutes les possibilités en mémoire.

3. Le fichier d'affixes du mlatin

Le fichier d'affixes que l'on a créé se veut simple et fonctionnel. Il est sans aucun doute possible de l'optimiser, c'est à dire d'en supprimer les redondances en regroupant certaines affixes, d'en créer d'autres plus subtiles gérant des cas particuliers dans le but de minimiser la longueur des fichiers d'affixes ou de vocabulaire. La capacité des disques durs et la vitesse des processeurs semblent rendre ces gains négligeables et surtout devoir se faire au détriment de la facilité de lecture et d'utilisation de ces fichiers. Le fichier d'affixes ici créé l'a été dans le but de rendre aussi facile que possible l'introduction de nouveaux mots dans le dictionnaire. Il présente un nombre réduit d'affixes, chacune de celles-ci s'appuyant directement sur les cinq déclinaisons et les cinq conjugaisons.

affixedéclinaison, type, groupe verbal
Déclinaisons
/a1ère
/b2e masculin
/c2e neutre
/d3e imparisyllabique masculin/féminin
/e3e imparisyllabique neutre
/f3e parisyllabique masculin/féminin
/g3e parisyllabique neutre
/h4e
/i5e
Comparatifs, superlatifs, adverbes
/rcomparatif
/ssuperlatif
/tadverbe régulier des adjectifs de la 2e classe
Conjugaisons
/A1er (infinitif en -are)
/B2e, 3e et 3e mixte (infinitif en -ere)
/C4e (infinitif en -ire)
/Pparfait
/Ssupin
Enclitiques
/qgestion des enclitiques -que, -ne et -ve

En fonction des terminaisons des lemmes affixés, il est possible de construire des sous-groupes en nombres suffisants pour satisfaire la plupart des besoins du latin. Ainsi par exemple, l'affixe /A servira autant aux verbes réguliers du premier groupe du type amo se terminant par -o, qu'aux verbes déponents du premier groupe du type imitor se terminant par -or. Des groupements d'affixes permettent de définir des cas multiples. Par exemple, les adjectifs de la première classe du type bonus, a, um seront affixés par un bonus/abc, ceux de la deuxième classe du type similis, e par similis/fg. Si ces derniers possèdent en plus un superlatif, un comparatif et un adverbe réguliers, on entrera dans le dictionnaire similis/fgrst.

L'idée directrice pour construire les affixes a été d'utiliser la première forme simple et stable des mots, telle qu'on la trouve dans un dictionnaire. À savoir, on affixera dans le vocabulaire:

- pour un mot, le nominatif singulier d'un mot, à défaut son génitif;

- pour un verbe, la première personne du présent de l'indicatif, du parfait et le supin;

- pour un adjectif, la déclinaison du nominatif masculin singulier, à défaut son génitif.

L'affixe /a permettra par exemple de créer toutes les flexions de rosa, ae, f. à partir de son nominatif singulier. Pour un mot présentant un nominatif différent de son lemme stable donné par son génitif, on affixera son génitif et donnera le nominatif sans affixe. Par exemple, il suffira d'entrer dans la base du dictionnaire diffinitio et diffinitionis/d pour en obtenir toutes les flexions.

Remarque 1: attention, le fichier d'affixes et le dictionnaire du mlatin différencient les u et les v, les i et les y mais n'utilisent que le i et jamais le j. (Le dictionnaire est facilement modifiable sur ce point si besoin est.)

Remarque 2: ispell ne permet pas de gérer de façon simple les conjonctions enclitiques du type -que, -ne, -ve: c'est une grave lacune pour le latin. Nous avons toutefois fait en sorte que ces enclitiques soient gérés dans le fichier d'affixes pour tous les mots déclinables et les verbes, et nous avons créé une affixe /q pour les mots invariants ou qui apparaîtraient seuls dans le dictionnaire.

4. Ajouter au dictionnaire un nouveau mot

Puisque l'idée directrice de la construction du fichier d'affixes a été de faciliter la création du fichier de vocabulaire, il convient maintenant de voir comment il se construit. Pour ajouter un mot à la base à l'aide de ces affixes, il est relativement facile de suivre quelques règles et exemples canoniques. Tous les mots qui se déclineront ou se conjugueront comme les exemples canoniques cités pourront être ajoutés dans la base avec l'affixe correspondante. Attention cependant, la conception relativement simple et la pauvreté du jeu d'affixes ont une conséquence importante: tout mot présentant la moindre irrégularité par rapport aux canons définis, devra être entré manuellement dans la base, c'est-à-dire qu'il sera nécessaire d'écrire dans la base toutes ses flexions ! (La plupart des verbes irréguliers et leurs composés sont néanmoins déjà entrés dans la base: 491 formes pour sum et ses composés, 1082 pour fero, 1589 pour eo, etc.) Enfin, si l'entrée d'un nouveau mot dans le dictionnaire est une opération relativement simple, il est plus difficile d'y localiser d'éventuelles erreurs et donc de les corriger. Il faut être particulièrement vigilant lorsque l'on entre un mot dans la base.

Le tableau suivant présente différents types de mots que l'on rencontrera dans un texte, leur description dans un dictionnaire « papier », et leur entrée « affixée » dans le fichier de vocabulaire, utilisant la première forme stable rencontrée.

#TypeEntrée d'un dictionnaire « papier »Entrée dans le
vocabulaire du
correcteur
affixe
Noms
1nom de la 1ère déclinaison de nominatif en -a rosa, ae, f. rosa/a /a
2nom masculin ou féminin de la 2e déclinaison dont le lemme stable est donné par le nominatif singulier en -us ou en -r, à défaut par le génitif singulier en -i dominus, i, m.
puer, pueri, m.
liber, libri, m.
dominus/b
puer/b
liber/q
libri/b
/b
3nom neutre de la 2e déclinaison dont le le lemme stable est donné par le nominatif en -um templum, i, n. templum/c /c
4nom masculin ou féminin imparisyllabique de la 3e déclinaison dont le lemme stable est donné par le nominatif singulier, à défaut par le génitif en -is (génitif pluriel indifféremment en -um ou -ium) consul, consulis, m.
diffinitio, diffinitionis, f.
ars, artis, f.
consul/d
diffinitio/q
diffinitionis/d
ars/q
artis/d
/d
5nom neutre imparisyllabique de la 3e déclinaison dont le lemme stable est donné par le génitif en -is (génitif pluriel indifféremment en -um ou -ium) corpus, corporis, n.
os, ossis, n.
corpus/q
corporis/e
os/q
ossis/e
/e
6nom masculin ou féminin parisyllabique de la 3e déclinaison dont le lemme stable est donné par le nominatif singulier en -is civis, civis, m. civis/f /f
7nom neutre parisyllabique de la 3e déclinaison dont le lemme stable est donné par le génitif singulier en -is mare, maris, n. mare/q
maris/g
/g
8nom de la 4e déclinaison dont le lemme stable est donné par le nominatif singulier en -us ou -u manus, us, f.
cornu, cornus, n.
manus/h
cornu/h
/h
9nom de la 5e déclinaison dont le lemme stable est donné par le nominatif singulier en -es res, rei, f. res/i /i
Adjectifs
10adjectif de la première classe dont le lemme stable est donné par le nominatif masculin singulier en -us ou -r, à défaut par le génitif masculin singulier en -i bonus, a, um
tener, tenera, tenerum
pulcher, pulchra, pulchrum
bonus/abc
tener/abc
pulcher/q
pulchri/abc
/abc
11adjectif de la deuxième classe imparisyllabique dont le lemme stable est donné par le génitif singulier masculin en -is vetus, veteris vetus/q
veteris/de
/de
12adjectif de la deuxième classe parisyllabique et ancien parisyllabique dont le lemme stable est donné par le nominatif singulier masculin en -is, à défaut le génitif en -is fortis, e
prudens, prudentis
fortis/fg
prudens/q
prudentis/fg
/fg
13comparatif des adjectifs de la première classe dont le lemme stable est donné par le nominatif singulier masculin en -us ou le génitif en -i, ou de la deuxième classe par le nominatif ou génitif singulier masculin en -is, ainsi que les irréguliers en -or doctior
proprior
pulchrior
fortior
audacior
major
doctus/r
proprius/r
pulchri/r
fortis/r
audacis/r
major/r
/r
14superlatif des adjectifs de première classe dont le lemme stable pour le superlatif est donné par le nominatif singulier masculin en -us ou ou -er, de la deuxième classe en -is ou -er, à défaut par le génitif en -is doctissimus
pulcherrimus
fortissimus
acerrimus
audacissimus
doctus/s
pulcher/s
fortis/s
acer/s
audacis/s
/s
15adverbe régulier d'un adjectif de la deuxième classe se terminant par -is similiter similis/t /t
Verbes
16verbe du 1er groupe (infinitif en -are) et déponent amo
imitor
amo/A
imitor/A
/A
17verbe des groupes 2e, 3e, 3e mixte (infinitif en -ere) et déponent deleo
vereor
lego
sequor
capio
patior
deleo/B
vereor/B
lego/B
sequor/B
capio/B
patior/B
/B
18verbe du 4e groupe (infinitif en -ire) et déponent audio
largior
audio/C
largior/C
/C
19parfait amavi
delevi
legi
cepi
audivi
amavi/P
delevi/P
legi/P
cepi/P
audivi/P
/P
20supin ou participe passé amatum
deletum
lectum
captum
auditum
imitatus
veritus
secutus
passus
largitus
amatum/S
deletum/S
lectum/S
captum/S
auditum/S
imitatus/S
veritus/S
secutus/S
passus/S
largitus/S
/S

Remarque 1: il est bien entendu avantageux d'agglomérer les affixes. Ainsi on écrira:

acer/q
acris/fgrst
altus/abcrs
pulcher/qs
pulchri/abcr

Remarque 2: il n'est pas prévu (pour le moment) de gérer avec ce système d'affixes les mots qui ne se déclinent qu'au pluriel. Il faudra entrer chaque flexion dans la base.

Remarque 3: les enclitiques -que, -ne et -ve sont gérés automatiquement pour les mots qui possèdent une déclinaison ou une conjugaison affixée dans le fichier d'affixes. Mais les mots invariants ou qui apparaîtraient seuls dans le fichier de vocabulaire doivent être affixés avec /q. Ainsi on trouvera:

diffinitio/q
diffinitionis/d
semper/q

Remarque 4: pour chaque verbe, il convient donc d'entrer dans le vocabulaire les trois formes suivantes: première personne du présent de l'indicatif, première personne du parfait, supin, et de les affixer (respectivement /A, /B ou /C; /P; /S).

Raccourci: pour les verbes de la première conjugaison dont le parfait et le supin sont réguliers (-o, -avi, -atus; la plupart en fait), le fichier d'affixes permet aussi de créer les parfaits et supins directement à partir de la première personne du présent de l'indicatif. On pourra ainsi écrire

amo/APS
à la place de:
amo/A
amavi/P
amatum/S

5. Quelques options utiles d'ispell

En plus des options données dans la toute première partie, ispell, combiné avec les outils standards du shell, fournit de nombreuses options intéressantes autant pour corriger que pour analyser les fichiers. Toutes les options sont décrites dans la page de manuel (man ispell), mais on peut insister sur les suivantes:

- avec l'option -Wn, ispell ne tiendra compte que des mots de plus de n caractères;

- il est possible de tester un couple mot/affixe avec l'option -c et fournir la liste des flexions correspondantes au mot et à l'affixe:

$ echo binomium/c | ispell -d mlatin -e
binomium binomia binomii binomiorum binomio binomiis

- inversement, l'option -c permet de connaître tous les affixes éventuellement compatibles avec un mot:

$ echo binomium | ispell -d mlatin -c
binomium binomius/b binomii/b binomius/c binomii/c binomiis/d
binomi/d binomiis/e binomius/h binomius/h binomium/S binomius/S
binomius/S binomis/f binomis/g binomis/l

- l'option -C permet d'admettre les mots composés de deux mots accolés. Si par exemple, la base contient la préposition inter et le verbe pello, ispell connaîtra aussi le verbe interpello. Attention cependant, cette option est risquée: elle laissera inévitablement passer des erreurs.

Avant de lancer buildhash sur un fichier de vocabulaire et un fichier d'affixes pour construire le fichier « haché », il est nécessaire que le fichier de vocabulaire soit trié par ordre alphabétique. La commande standard sort d'unix convient très bien:

$ cat mondico.dico | sort | uniq > mlatin.dico

Pour avoir quelques chiffres sur le dictionnaire:

$ cat mlatin.dico | ispell -d mlatin -e | wc
  11409  991372 12667172

Ces nombres s'interprètent ainsi: le fichier de vocabulaire contient 11409 entrées, permettant de créer à l'aide du fichier d'affixes 991372 formes différentes (incluant les formes avec enclitiques -que, -ve et -ne). Le troisième nombre donne la taille en octet du fichier de vocabulaire si on avait entré tous les mots un par un.

La commande suivante

$ grep '/[abcdefghijklABC]' mlatin.dico | wc
   4290    4290   51636

fournit le nombre de mots (4290) du fichier de vocabulaire qui possèdent une affixe directement liée à une déclinaison ou une conjugaison. Si l'on y ajoute le nombre de mots invariants, on obtient le nombre de mots que contient le dictionnaire.

Enfin, le script sh qui suit permet, un ou plusieurs mots étant donnés, de savoir s'ils sont dans le dictionnaire et de trouver la manière dont ils ont été affixés:

#!/bin/sh

liste=`tr A-Z a-z | ispell -d mlatin -c`

chemin=/home/jp/pise/mlatin/

echo > tmpdeclin

for i in $liste
do
  
  radical=`echo $i | sed -e 's:/.\+::g'`
  extension=`echo $i | grep '/' | sed -e 's:.\+/::g'`
  if test w$extension == w
  then  
    cherche='^'$radical'\($\|/\)'
  else
    cherche='^'$radical'/.*'$extension
  fi
  
  grep $cherche $chemin'mlatin.dico' >> tmpdeclin

done

cat tmpdeclin | grep '^.\+' | sort | uniq
rm -f tmpdeclin

exit 0

Si on nomme ce script declin.sh, et si l'on veut avoir des renseignements sur un mot, par exemple diffinitionibus, on interrogera le dictionnaire de la façon suivante:

$ echo diffinitionibus | ./declin.sh 
diffinitionis/d

Puisque le fichier d'affixes suit les déclinaisons et les conjugaisons, on a par ce script un moyen primitif de connaître la racine et la déclinaison d'un mot. On aura avantage à le coupler à son éditeur de texte pour que, un ou plusieurs mots sélectionnés dans le texte, une macro lance son exécution.

6. Et maintenant ?

L'amélioration de ce dictionnaire peut prendre trois directions:

- continuer à augmenter le vocabulaire au fur et à mesure des nouveaux manuscrits et imprimés transcrits dans le cadre de l'édition des oeuvres mathématiques de Francesco Maurolico. Nous le ferons sans aucun doute;

- enrichir le vocabulaire pour en faire un bon dictionnaire du latin classique. Cela n'est pas particulièrement difficile à faire, mais peut prendre du temps. Une première étape consisterait à entrer le vocabulaire latin le plus courant. On trouvera sur la page web latwords.html, une liste d'environ 5000 mots latins courants. Le dictionnaire mlatin en reconnaît aujourd'hui la moitié. À raison de trois minutes par mot entré (le temps de le vérifier dans un bon dictionnaire papier), il faudrait trois semaines de travail pour insérer le reste. Sans compter, cette difficulté a déjà été mentionnée, les arbitrages inévitables concernant la graphie des mots. Faudra-t-il entrer dans la base adfero, affero ou les deux ?

- enfin, enrichir les possibilités de ce dictionnaire et d'ispell à l'aide d'une gestion différente du vocabulaire et de quelques scripts. Le format des fichiers de vocabulaire étant en effet très pauvre, une liste de mots et leurs affixes, il est difficile de l'utiliser à autre chose que ce pourquoi il a été conçu. Un format un peu plus riche pourtant, pourrait le transformer en un outil utile pour une analyse, même sommaire, des textes, tout en facilitant grandement la maintenance (mises à jour et corrections) du vocabulaire. On peut penser par exemple, à mettre sur une même ligne les mots affixés ayant une même racine, puis diverses indications pouvant être utiles, la déclinaison ou la conjugaison complète, des graphies différentes, des synonymes, une éventuelle traduction, des commentaires divers, etc. Des scripts très simples pourraient alors en tirer les informations nécessaires autant pour sa transformation en dictionnaire pour ispell, que pour l'analyse d'un mot et de sa construction. On retombe cependant sur le même écueil que précédemment: il faut recréer toute la base du vocabulaire...


Démarrer rapidement  |  1. Le mlatin  |  2. Principe de fonctionnement des dictionnaires d'ispell  |  3. Le fichier d'affixes du mlatin  |  4. Ajouter au dictionnaire un nouveau mot  |  5. Quelques options utiles d'ispell  |  6. Et maintenant ?  ||  Haut de la page