Künstliche Intelligenz: KI entschlüsselt historische Geheimtexte
Rund ein Prozent des Materials in Bibliotheken und Archiven weltweit ist vollständig oder teilweise verschlüsselt. Diese Dokumente enthalten diplomatische Berichte, Rituale von Geheimgesellschaften, medizinische Erkenntnisse oder private Aufzeichnungen. Forscher nutzen zunehmend maschinelles Lernen, um diese historischen Texte digital lesbar zu machen, wie die BBC berichtet(öffnet im neuen Fenster).
Ein Beispiel für den Erfolg dieser Methoden ist das Borg-Chiffre(öffnet im neuen Fenster) aus der Vatikanischen Bibliothek. Das 408 Seiten umfassende Buch war über 400 Jahre lang unlesbar. Es kombiniert 34 Symbole mit wenigen lateinischen Buchstaben und einer arabischen Titelseite. Ein Team um Beáta Megyesi, Professorin für Computerlinguistik an der Universität Stockholm, knackte den Code(öffnet im neuen Fenster).
Der Text enthielt medizinische Ratschläge(öffnet im neuen Fenster) gegen die Ruhr (eine Infektionskrankheit des Darms), deren Geheimhaltung damals vor dem Vorwurf der Hexerei schützen sollte. Das Dokument basiert auf einer einfachen Substitution, bei der Symbole durch lateinische Buchstaben ersetzt wurden.
Vor der eigentlichen Entschlüsselung müssen handschriftliche Dokumente digitalisiert werden. Verblasste Tinte und unleserliche Handschriften erschweren diesen Schritt. Das Online-KI-Tool Transkribus half Forschern der Universität Oslo, einen teilweise verschlüsselten Brief des Adligen Sigismund Heusner von Wandersleben aus dem Jahr 1637 zu transkribieren. Die KI scannt Texte Zeichen für Zeichen, stößt bei erfundenen Zeichen oder astrologischen Symbolen jedoch an Grenzen. Im Rahmen des multinationalen Descrypt-Projekts entwickeln Wissenschaftler daher flexibler anpassbare Modelle.
Chatbots kombinieren Transkription und Entschlüsselung
Während herkömmliche Software auf Frequenzanalysen von Symbolen setzt, um einfache Codes zu brechen, testen Forscher nun den Verzicht auf eine manuelle Transkription. Das System lernt durch Bilderkennung direkt aus Fotografien der Seiten. Am Copiale-Chiffre, einem Manuskript einer deutschen Geheimgesellschaft aus dem 18. Jahrhundert, wurde dieses Verfahren erprobt. Nach dem Training mit generischen Handschriften und decodierten Textzeilen konnte die KI unbekannte Abschnitte selbstständig übersetzen.
Megysis Team entwickelte zudem ein Chatbot-Werkzeug, das Transkription und Entschlüsselung verbindet. Es kombiniert Decodierungsalgorithmen mit großen Sprachmodellen, die mit historischen Texten trainiert wurden. Bei einem Test mit dem Borg-Chiffre übersetzte das System einen Ausschnitt aus 500 Symbolen in etwas mehr als 29 Minuten in die englische Sprache. Das System dokumentiert den Prozess schrittweise, um Fehlinterpretationen auszuschließen. Solche Werkzeuge könnten künftig auch bei der Analyse antiker Schriften helfen, deren Alphabete bisher unbekannt sind, wie der Diskos von Phaistos oder die frühe griechische Sprache Linear A.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



