TLA – Einleitung
Der Thesaurus Linguae Aegyptiae (TLA) ist die nicht-kommerzielle, frei zugängliche digitale Publikationsplattform des Akademienprojekts „Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache: Text- und Wissenskultur im Alten Ägypten‟. Es wird durch das Akademienprogramm der Union der deutschen Akademien der Wissenschaften finanziert und an der Berlin-Brandenburgischen Akademie der Wissenschaften (Berlin) und der Sächsischen Akademie der Wissenschaften (Leipzig) durchgeführt.
Der TLA bietet ein digitales Textkorpus mit lemmatisierten und kommentierten altägyptischen Texten in hieroglyphischer, hieratischer und demotischer Schrift zusammen mit einem entsprechenden Satz von Lemmalisten.
Das TLA-Textkorpus und seine Lemmalisten ermöglichen es, ein breites Spektrum an Informationen zu sammeln und historische, anthropologische und linguistische Forschungsfragen zu einer der frühesten bezeugten menschlichen Zivilisationen und Sprachen zu beantworten. Dank der ständigen Arbeit des Projektteams und der weltweiten Zusammenarbeit werden der Textkorpus und die Lemmalisten ständig erweitert und bieten eine ständig wachsende Anthologie der erhaltenen altägyptischen Texte.
Das TLA-Textkorpus und seine Lemmalisten können einzeln oder in Kombination durchsucht werden. Die Suchergebnisse im Textkorpus haben die Form von Textteilen in ägyptologischer Transkription auf Satzebene, die wiederum zum Kotext bis hin zur Volltextebene führen. Alle Sätze sind mit einer deutschen Übersetzung versehen, und in einigen Fällen gibt es auch eine englische oder französische Übersetzung. Darüber hinaus werden in einer zunehmenden Zahl von hieroglyphischen und hieratischen Texten auch die einzelnen Wörter als Zeichenketten von digital kodierten Hieroglyphen zitiert (JSesh-Manuel de Codage und Unicode). Jedes Element der Lemmaliste (Lemma) und jedes Textelement ist mit zusätzlichen Metadaten versehen, wie z.B. bibliographische Angaben, kommentierende Anmerkungen, Datierung usw.
TLA – Geschichte des TLA
Der TLA baut auf lexikographischen Arbeiten zur altägyptischen Sprache auf, die unter der Leitung von Adolf Erman an der Königlichen Akademie der Wissenschaften zu Berlin ab 1897 durchgeführt wurden und zu dem gedruckten Berliner Wörterbuch führten (A. Erman & H. Grapow, Wörterbuch der aegyptischen Sprache, 5 Bde., 1926–1931, sieben weitere Ergänzungsbände bis 1961). 1992 wurde an derselben Akademie (heute: Berlin-Brandenburgische Akademie der Wissenschaften, BBAW) das Projekt „Altägyptisches Wörterbuch‟ (1992–2012) ins Leben gerufen. Seine neue digitale Agenda war die Erstellung eines elektronischen lemmatisierten Korpus ägyptischer Texte. 1996 schloss sich ein zweites Team an der Sächsischen Akademie der Wissenschaften zu Leipzig dem Projekt an.
Der erste Schritt der digitalen Agenda wurde 1999 unternommen, als die in den Jahrzehnten der Arbeit am originalen Wörterbuch gedruckten, redigierten und lexikographisch in Kästen angeordneten Zettel des Textkorpus digitalisiert und als Digitalisiertes Zettelarchiv (DZA) [des Wörterbuchs der ägyptischen Sprache] online veröffentlicht wurden. Während das gedruckte Ergebnis des ursprünglichen Wörterbuch-Projekts im frühen 20. Jahrhundert nur etwa 10% des gesammelten Materials in den ergänzenden Belegstellen-Bänden (1935–1953) referenzierte, bot und bietet das Digitalisierte Zettelarchiv weltweit freien Zugang zur vollständigen Textgrundlage des ursprünglichen Wörterbuch-Projekts.
Die erste TLA-Webanwendung wurde hauptsächlich von dem ehemaligen Arbeitsstellenleiter und Projektleiter Stephan Seidlmayer programmiert und am 31. Oktober 2004—dem 150. Geburtstag von Adolf Erman—online gestellt. Seitdem hat sich der TLA zu einem zuverlässigen und leistungsstarken Forschungsinstrument für Ägyptolog:innen entwickelt. Seine verschiedenen Suchfunktionen, wie die Suche nach ägyptischen Wörtern (Lemmata), die Suche nach Wortkollokationen und -kombinationen und die Suche nach hieroglyphischen Schreibweisen (von Lemmata), sollen Wissenschaftlern helfen, ihre philologischen, linguistischen oder historischen Forschungsinteressen zu verfolgen. Bis 2014, dem Jahr der letzten Aktualisierung dieses ersten, jetzt „alten‟ TLA, war der Textkorpus auf etwa 1,2 Millionen Instanzen ägyptischer Lemmata angewachsen.
Inzwischen beinhaltet das Eingabesystem des TLA (Berliner Texterfassungssystem, BTS) etwa 1,58 Mill. Lemma-Instanzen. Allerdings werden im neuen TLA nur Texte veröffentlicht, deren Autor:innen zugestimmt haben, ihre Beiträge unter einer freien Lizenz zu veröffentlichen. Die aktuelle Version des „neuen TLA‟ bietet zunächst nur eine begrenzte Funktionalität. Daher wird der „alte TLA‟ so lange online bleiben, wie es technisch möglich ist, oder bis die nach und nach verbesserten Funktionalitäten des „neuen TLA‟ den „alten TLA‟ überflüssig machen.
Zukunftsaussichten
Ein integriertes Lemma-Netzwerk der ägyptisch-koptischen Sprache
Die beiden bereits implementierten Referenzlisten für die Lemmatisierung, die hieroglyphisch-hieratische Lemmaliste und die demotische Lemmaliste, sollen durch eine dritte Komponente ergänzt werden: die koptische Lemmaliste, einschließlich der griechischen Lehnwörter, die im 1. Jahrtausend n.Chr. in das ägyptische Lexikon aufgenommen wurden (siehe Lemmalisten).
TLA-Rohdaten: JSON und TEI/EpiDoc XML
Die Texte, Lemmalisten und Thesauri, die in der Eingabe-Software BTS bearbeitet werden, werden nicht nur auf der TLA-Website veröffentlicht, sondern werden auch in einem dauerhaften Online-Repository in Form von JSON-Rohdateien sowie in Form von Text Encoding Initiative (TEI) XML-Dateien zur Verfügung stehen.