"Eine künstliche Intelligenz, die in einer Klosterbibliothek Bücher entziffert", lautete die Bildvorgabe für die KI-Plattform Midjourney.
Illustration: Midjourney

Maschinen sind begriffsstutzig, bockig und störrisch wie Esel. Sie sehen nicht das große Bild, das "Augenfällige". Und für sie sind eine zittrige Unterschrift und ein Prachtband aus dem 12. Jahrhundert in karolingischer Minuskel-Schrift zuerst einmal nichts anderes als ein großer Pixelhaufen. Diese Erfahrung machte zumindest Markus Seidl vom Institut für Creative Media Technologies an der FH St. Pölten. Er und sein Team betreuen das Projekt "Scribe ID AI", in dem mit der Stiftsbibliothek Klosterneuburg "Active Machine Learning" für die Schreibstilanalyse von Handschriften aus dem 12. Jahrhundert entwickelt wird.

"Wir haben zuerst versucht, der künstlichen Intelligenz die Analysemethoden beizubringen, die in der Paläografie, also der Handschriftenkunde, eingesetzt werden", sagt Seidl. Dazu musste die Maschine zunächst verstehen lernen, was eine "karolingische Minuskel" überhaupt ist. Diese Schriftart wurde bereits im 8. Jahrhundert entwickelt und hielt sich über mehrere Jahrhunderte als Buchhandschrift in den Skriptorien mittelalterlicher Klöster. Über die Jahre und Jahrhunderte veränderte sie aber immer wieder ihr Erscheinungsbild. Buchstaben wurden dabei über die Jahre mal mehr, mal weniger verbunden, mit An- und Abstrichen versehen, runde Formen entwickelten sich in Richtung ovale, die mal mehr oder weniger in Schriftrichtung oder dagegen geneigt wurden.

Forensische Arbeit mit Buchstaben

Für Experten wie Martin Haltrich, Paläograf und Leiter der Forschungsstelle für Kulturwissenschaftliche Studien im Klosterneuburger Stift, sind solche Unterschiede dann auch gleichzeitig Erkennungsmerkmal. Sie zeigen nicht nur, wo und in welchem Jahrhundert, manchmal sogar Jahrzehnt, eine Handschrift produziert worden ist. Mit geradezu forensischer Akkuratesse können er und seine Kolleginnen und Kollegen sogar aus dem Schriftbild Eigenheiten von unterschiedlichen Schreibstuben und einzelner Schreiber mittelalterlicher Klöster herausdestillieren. Mitunter funktioniert das gar mit ein paar Schnipseln, auf denen nur einige Wörter geschrieben sind.

Die Verknüpfung künstlicher Intelligenz mit freiem maschinellem Lernen birgt großes Anwendungspotenzial für die Analyse mittelalterlicher Handschriften in Bibliotheken.
Illustration: Midjourney

Versucht man allerdings, Maschinen dieses Expertenwissen geläufig zu machen, ist das ein schwieriges Unterfangen. Paläografische Expertise, wonach ein Schreiber von Handschriften identifiziert werden kann, weil er etwa Buchstaben perfekt an einem Grundlinienraster ausrichtet oder nicht, sagt einer künstlichen Intelligenz so gut wie nichts. "Die Ergebnisse waren nicht überzeugend", sagt Seidl. "Die Fehlerquote blieb bei diesem Ansatz hoch."

Freies, maschinelles Lernen

Eine Maschine scheint offensichtlich anders zu lernen, eigenständig und mit der Herausbildung eigenständiger Merkmalserkennung. Seidl änderte daher die Methode – und strich die allzu sekkante menschliche Expertise in der Trainingsphase des Systems völlig.

Das Rezept, das funktionierte, war dann das freie maschinelle Lernen. Gibt man einer künstlichen Intelligenz ein paar Einflussgrößen, die sie selbstständig auswerten und verknüpfen kann, ändert sich plötzlich ihre Begriffsstutzigkeit. Plötzlich wird sie fähig, Ähnlichkeiten zu entdecken. Am besten funktioniert das, wenn sie "alleine" lernen kann, also eben ohne menschliche Expertise.

Umgesetzt wurde dieser Ansatz, indem der künstlichen Intelligenz digitales Textmaterial aus der Klosterneuburger Stiftsbibliothek eingespielt wurde, von dem die Schreiberhände eindeutig bekannt waren. An diesem Material konnte das System die Schreibeigenheiten nach eigenen Maschinenregeln erlernen. Im Prinzip sind das Bildpixelanalysen, bei denen nach einer (maschinen)spezifischen Formgebung des vorgegebenen Alphabets gefahndet wird. "Es geht um Kantenform, Schriftgradienten und Kurvenschwung", sagt Seidl.

Digitales Textmaterial aus der Klosterneuburger Stiftsbibliothek diente als Grundlage zum Training einer künstlichen Intelligenz. Der Vorteil des KI-Einsatzes besteht darin, dass diese auch nach der Analyse tausender Seiten nicht müde wird.
Illustration: Midjourney

Pingpong mit Menschen

Das Ergebnis nach mehr als 3000 Trainingsseiten war eine umfassende Grundreferenz, auch "Ground Truth" genannt, für Schreiberhände aus dem 12. Jahrhundert. In Schritt zwei wurden dem System unbekannte, für die Paläografie aber bekannte Texte vorgelegt. Menschen urteilten dann, ob die Einstufung der künstlichen Intelligenz richtig oder falsch war. Damit wurde in einem Pingpong-Prozess das aktive maschinenbasierte Lernen weitertrainiert.

Nun liegt ein System vor, das die Arbeit von Paläografinnen und Paläografen deutlich erleichtern kann. "Eine Maschine wird nicht müde", sagt Seidl. "Damit urteilt sie auch nach der tausendsten Seite genauso objektiv wie nach der ersten." Für die paläografische Arbeit, die etwa Reisetätigkeiten und Arbeitsplatzwechsel von Schreibern des Mittelalters erforscht und so die monastische Schriftlichkeit rekonstruiert, ist das eine große Hilfe. Denn allein in der Klosterneuburger Stiftsbibliothek lagern noch zehntausende Handschriftseiten, deren Schreiber noch nicht (eindeutig) identifiziert worden sind. (Norbert Regitnig-Tillian, 26.1.2023)