LEXIQUES DE BASE A TRAVAILLER PAR DES PERSONNES COMPETENTES. Les lexiques au format "tab" (texte tabulé) présents dans ce dossier ont été réalisés automatiquement par héritage, à partir des lexiques Apertium, à l'aide du logiciel Linguae. La création d'un lexique par héritage se fait à partir de deux dictionnaires sources : un lexique "langue 1-langue 2" et un lexique "langue 2-langue 3" permet la création, par héritage, d'un lexique "langue 1-langue 3". Tous les lexiques contenus dans ce dossier ont été créés à partir de lexiques ayant comme "langue 2" (langue intermédiaire) la langue espagnole. Avant d'être utilisés, ces lexiques, créés à partir d'automatismes informatiques, doivent être révisés "à la main" par des humains compétents. Mais ils constituent une base de travail sérieuse pour des volontaires désireux d'enrichir le nombre et la qualité des dictionnaires informatiques "libres". Les lexiques sources provenant du projet Apertium sous sous licence GNU-GPL... Ils sont donc à corriger et à compléter en conservant cette licence. Si vous souhaitez corriger et compléter l'un de ces lexiques, merci de le signaler à l'adresse du projet "Polyglotte"... Vous serez bien sûr compté parmi les auteurs du lexique complété. Lors des vérifications et des corrections, on sera particulièrement attentifs aux points suivants : - les codes grammaticaux n'ont pas été inclus lors de l'analyse permettant la création des dictionnaires par héritage. Si, pour une entrée donnée du lexiques, les codes grammaticaux ne correspondent pas du tout, cette entrée doit probablement être corrigée; c'est la cas par exemple lorsque le code indiquée pour le mot de la langue 1 est "vblex" (verbe) et celui de la langue 2 "n" (nom). - les dictionnaires des noms propres sont à réviser avec une grande attention. Souvent, les noms propres n'ont pas été traduits dans l'un des deux lexiques source. Dans ce cas, le mot ou la traduction indiquée est restée en espagnol (langue intermédiaire ayant servi à la création de ces lexiques par héritage). L'architecture des lexiques est la suivante : mot langue 1 (tabulation) [code grammatical du mot langue 1] - mot langue 2 [code grammatical du mot langue 2] Cette architecture doit être rigoureusement conservée lors des révisions, corrections et compléments apportés. C'est une condition pour permettre ensuite la conversion des lexiques à des formats adpatés à leur lecture par divers logiciel, ou simplement pour permettre leur lecture correcte. Les noms de lexiques se terminant par "snp" indiquent qu'il s'agit de lexiques sans nom propre. Les noms de lexiques se terminant par "np" indiquent qu'il s'agit de lexiques de noms propres. ------------------------------------------------------------------------------------------ lexique nombre d'entrées (un même mot est parfois répété plusieurs fois avec des codes grammaticaux différents). roumain-francais_snp.tab 12363 roumain-francais_np.tab 240 francais-roumain_snp.tab 9832 francais-roumain_np.tab 239 italien-francais_snp.tab 5926 italien-francais_np.tab 370 francais-italien_snp.tab 6901 francais-italien_np.tab 403 portugais-francais_snp.tab 6758 portugais-francais_np.tab 293 francais-portugais_snp.tab 7876 francais-portugais_np.tab 288