OCR mit der Cloud: Computer liest historische Handschriften

(Bild: Transkribus.eu)

Habt ihr schon einmal im Museum versucht, alte Handschriften zu lesen? Das ist nicht gerade leicht. Forscher haben nun eine Methode entwickelt, mit der auch historische Handschriften automatisch entschlüsselt werden können.

Ein von der Universität Innsbruck koordiniertes EU-Projekt will eine Art OCR für alte Handschriften nun einer breiten Öffentlichkeit zugänglich machen und das System noch verbessern.

Wer sich schwer tut, einen in Kurrentschrift verfassten Brief seines Großvaters zu entziffern, der könnte bald digitale Unterstützung erhalten. Denn seit einigen Jahren arbeiten Wissenschaftler weltweit daran, digitalisierte historische Dokumente vom Computer automatisch entschlüsseln zu lassen.

„Die Grundlagenforschung zur Handschriftenerkennung ist schon recht weit fortgeschritten. Nun geht es darum, diese Forschungsergebnisse auch für eine breite Öffentlichkeit nutzbar zu machen“, so Günter Mühlberger, Leiter der Gruppe Digitalisierung und Elektronische Archivierung an der Universität Innsbruck.

Mit seinem Team arbeitet Mühlberger am Aufbau einer Serviceplattform, die sich besonders an Archive und Historiker richtet. „Mit den von der Technischen Universität Valencia und dem Nationalen Forschungszentrum in Athen gelieferten Algorithmen können wir heute bereits 70 bis 80 Prozent eines Dokuments automatisch entziffern. “ Schwierigkeiten bereiten den Computerprogrammen bisher vor allem das komplexe Layout historischer Dokumente, die unterschiedlich geformten Handschriften, aber auch die verschiedenen Sprachen, die sich im Laufe der Zeit auch stark gewandelt haben. „Die Maschine muss zunächst einmal erkennen, wo auf einem Dokument ein Text steht und die einzelnen Zeilen richtig erkennen – eine technische Herausforderung, die nicht zu unterschätzen ist“, sagt Mühlberger.

Mit Unterstützung der Crowd

„Gemeinsam mit unseren Partnern aus Deutschland, Finnland, Frankreich, Griechenland, Großbritannien und Spanien werden wir eine Serviceplattform entwickeln, über die jede und jeder historische Handschriften bearbeiten kann“, sagt Mühlberger.

Mit der Software und der Unterstützung anderer Nutzer sollte es dann auch möglich sein, den in Kurrentschrift verfassten Brief des Großvaters rasch zu entziffern. So sollen in den nächsten Jahren Katasterbände, Kirchenbücher, Briefe, aber auch unterschiedlichste Personenlisten und viele andere historische Dokumente computerlesbar gemacht werden. Die Forscher werden dafür auch eine App für Smartphones anbieten, mit der die Handschriften direkt eingescannt werden können.

Eine experimentelle Version der Software steht im Internet bereits zum Download zur Verfügung.

Tags :
  1. Sehr geehrte Damen und Herren,

    ich verfüge aus einem Nachlass meiner Vorfahren einen Briefverkehr in Kurrent/Sütterlinschriften, den ich gern über eine Texterkennung bearbeiten würde, um ihn den Nachfahren zugänglich zu machen.
    Sehen Sie eine Möglichkeit, die von Ihnen angestrebte OCR Softwarelösung individuelle für eine persönliche Lösung anwenden zu können.
    Mit freundlichen Grüßen
    Wolfgang Schneider

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Advertising