Matthew Munson/Christoph Walther: Von der Handschrift zur EditionNeue Wege durch Digitalisierung. Das automatisierte Kollationierungsverfahren des Formulae – Litterae – Chartae Projekts
22. November 2021
Abstract:
Zu den Zielen des Forschungsvorhabens Formulae-Litterae-Chartae gehören die kritische Edition der frühmittelalterlichen Formulae sowie ihre Bereitstellung über eine digitale Forschungsinfrastruktur. Das Vorgehen einer kritischen Edition nach wissenschaftlichen Maßstäben folgt immer denselben Schritten. Nachdem die maßgeblichen Textzeugen identifiziert wurden, müssen die Texte sorgfältig transkribiert werden. Im Anschluss werden diese Texte miteinander verglichen und kollationiert, um zu einer ersten rohen Fassung der Edition zu gelangen, die dann weiterbearbeitet wird. Wichtigster Schritt ist dabei die Kollationierung der einzelnen Textzeugen, für die ein sorgfältiger Wort-für-Wort-Vergleich der unterschiedlichen Textüberlieferungen unabdingbar ist. Dieser Vergleich mehrerer Zeugen, der sich mitunter auf der Buchstabenebene bewegt, ist ein mühsamer Prozess, der in hohem Maße für Lese- und Kopierfehler anfällig ist; gleiches gilt für das manuelle Erstellen des Editonstextes mit seinem Apparat.
Wir haben ein computergestütztes Kollationierungsverfahren entwickelt, das innerhalb weniger Minuten mehrere Textzeugen kollationiert. Unser Verfahren generiert sowohl eine .csv-Datei, die den Wort-für-Wort Vergleich vereinfacht, als auch eine .xml-Datei, die sofort in den CLASSICAL TEXT EDITORTM (CTE), ein Textverarbeitungsprogramm für kritische Editionen, das die dynamische Verwaltung mehrerer Apparate und Paralleltexte sowie die Erstellung und Neudefinition von Siglen ermöglicht, importiert und dort weiterbearbeitet werden kann. Ziel ist die automatische Gewinnung einer rohen Edition aus den vorhandenen Transkripten, bei der sämtliche editorischen Entscheidungen in der Hand des Editors liegen und die Editionskriterien klar und nachvollziehbar bleiben. Für den Textvergleich selbst wird die spezialisierte Kollationierungssoftware CollateXTM genutzt, ein freizugängliches Tool auf Open Source Grundlage, das einen automatischen Wort-für-Wort-Vergleich durchführt. Transkribierte Texte im .xml-Format werden durch ein neu geschaffenes Script automatisch mit CollateX bearbeitet und die Ergebnisse jeweils in ein auslesbares Format transformiert, wobei bereits eine erste Fassung der Edition samt textkritischem Apparat generiert wird. Bei dieser Rohfassung handelt es sich nicht um einen computergenerierten Text auf unklarer Grundlage, sondern um den Text der zugrunde gelegten Handschrift, dem sämtliche Varianten der übrigen Textzeugen beigegeben sind. Alle editorischen Entscheidungen sind offen, nachvollziehbar und vertretbar. Das Verfahren automatisiert manuelle Arbeitsschritte und beschleunigt das Editionstempo. Sind die notwendigen Texte transkribiert, lassen sich innerhalb kürzester Zeit rohe Fassungen von Editionen anlegen, die dann von Editor, Übersetzer und Kommentator überprüft und in gewohnter Art und Weise weiterbearbeitet werden können. Am Ende des Arbeitsprozesses steht die fertige Edition, aus der sich sowohl Online- als auch Printfassung erzeugen lassen.
Weitergehende Informationen über das Verfahren samt einer detaillierten Anleitung finden sich im Beitrag.