TLA – Introduction
Le Thesaurus Linguae Aegyptiae (TLA) est la plateforme non commerciale et en libre accès de publication numérique du projet des Académies, « Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache: Text- und Wissenskultur im Alten Ägypten » (« Structure et transformation du vocabulaire de la langue égyptienne : textes et connaissances dans la culture de l’Égypte antique »). Il est financé par le programme académique de l’Union des académies allemandes des sciences et des lettres et mis en œuvre à l’Académie des sciences et des lettres de Berlin-Brandebourg (Berlin) et à l’Académie des sciences et des lettres de Saxe (Leipzig).
Le TLA fournit un corpus numérique de textes égyptiens anciens lemmatisés et annotés en écriture hiéroglyphique, hiératique et démotique, ainsi que des listes de lemmes propres à ces textes.
Le corpus de textes du TLA et ses listes de lemmes permettent de recueillir un large éventail d’informations et d’aborder des questions de recherche historique, anthropologique et linguistique relatives à une civilisation et une langue qui font partie des plus anciennes connues. Grâce au travail constant de l’équipe du projet et aux coopérations internationales, le corpus de textes et les listes de lemmes ne cessent de s’enrichir, offrant une anthologie toujours plus vaste de textes égyptiens anciens préservés.
Le corpus de textes du TLA et ses listes de lemmes peuvent être utilisés séparément ou en combinaison. Les résultats de recherche dans le corpus de textes se présentent sous la forme de parties de textes en translittération égyptologique au niveau de la phrase, qui conduisent à leur tour au cotexte, jusqu’au niveau du texte intégral. Toutes les phrases sont accompagnées d’une traduction en allemand et, dans certains cas, d’une traduction en anglais ou en français. En outre, un nombre croissant de textes hiéroglyphiques et hiératiques sont transcrits sous forme de chaînes de hiéroglyphes encodés numériquement (JSesh Manuel de Codage et Unicode). Chaque élément des listes de lemmes et chaque élément de texte est annoté avec des métadonnées, telles que des références bibliographiques, des commentaires, une datation, etc.
TLA – Histoire du TLA
Le TLA s’appuie sur les travaux lexicographiques sur l’égyptien ancien menés sous la direction d’Adolf Erman à la Königliche Akademie der Wissenschaften zu Berlin à partir de 1897, qui ont abouti à la publication du dictionnaire de Berlin(A. Erman & H. Grapow, Wörterbuch der aegyptischen Sprache, 5 vol., 1926-1931, et à sept volumes supplémentaires jusqu’en 1961). En 1992, le projet « Altägyptisches Wörterbuch » (1992-2012) a été inauguré dans la même académie (aujourd’hui : Académie des sciences et des lettres de Berlin-Brandebourg, BBAW). Ce projet numérique reposait sur une nouvelle ambition : créer un corpus électronique lemmatisé de textes égyptiens. En 1996, une deuxième équipe de l’Académie des sciences et des lettres de Saxe (Leipzig) s’est jointe au projet.
En 1999, les fiches du corpus de textes qui avaient été imprimées, éditées et classées dans des boîtes selon des critères lexicographiques au cours des décennies de travail sur le Wörterbuch original, ont été numérisées et publiées en ligne sous le nom de Digitalisiertes Zettelarchiv (DZA) [des Wörterbuchs der ägyptischen Sprache]. Ce fut la première étape du projet numérique. Alors que les volumes imprimés du projet original du Wörterbuch au début du XXe siècle ne faisaient référence qu’à environ 10 % du contenu des volumes Belegstellen complémentaires (1935-1953), les archives de fiches numérisées ont offert et continuent d’offrir un accès gratuit dans le monde entier à la base textuelle intégrale du projet du Wörterbuch original.
La première application web du TLA a été principalement programmée par l’ancien coordinateur de recherche et chef de projet Stephan Seidlmayer, et mise en ligne le 31 octobre 2004, date du 150e anniversaire d’Adolf Erman. Depuis, le TLA est devenu une ressource fiable et efficace pour les égyptologues. Ses différentes fonctionnalités, telles que la recherche de mots égyptiens (lemmes), de collocations et de combinaisons de mots, de graphies hiéroglyphiques (de lemmes), sont conçues pour aider les chercheuses et chercheurs à élargir leurs perspectives en matière de problématiques philologiques, linguistiques et/ou historiques. En 2014, année de la dernière mise à jour de ce premier TLA (l’« ancien » TLA), le corpus de textes s’était enrichi pour atteindre environ 1,2 million d’occurrences (unités) de lemmes égyptiens.
Le système éditorial du TLA (Berlin Text System, BTS) contient quant à lui environ 1,69 millions de lemmes. Toutefois, seuls les textes dont les autrices et auteurs ont accepté de partager leurs contributions sous une licence libre seront publiés dans le nouveau TLA. La version actuelle du « nouveau TLA » n’offre que des fonctionnalités limitées. Par conséquent, l’« ancien TLA » restera en ligne aussi longtemps que la technique le permettra, ou jusqu’à ce que les fonctionnalités constamment améliorées du « nouveau TLA » rendent l’« ancien TLA » obsolète.
Quelques perspectives d’avenir
Un réseau complet de lemmes de la langue copte égyptienne
Les deux listes de référence déjà mises en œuvre pour la lemmatisation, la liste de lemmes hiéroglyphiques/hiératiques et la liste de lemmes démotiques, seront complétées par une troisième composante : la liste de lemmes coptes, comprenant les mots grecs empruntés qui ont été intégrés au lexique égyptien au cours du premier millénaire de notre ère (voir listes de lemmes).
Données brutes du TLA : JSON et TEI/EpiDoc XML
Les textes, les listes de lemmes et les thésaurus édités dans l’application de saisie BTS ne seront pas seulement publiés sur le site Internet du TLA, ils seront également disponibles dans un répertoire permanent en ligne sous la forme de fichiers JSON bruts ainsi que de fichiers XML de la Text Encoding Initiative (TEI).