Das Kompetenzzentrum OCR der UB Tübingen und der UB Mannheim hat in Kooperation mit dem Forschungsdatenzentrum in der Love Data Week (13. bis 17. Februar) einen Transcribathon auf der Texterkennungs- und Transkriptionsplattform eScriptorium veranstaltet. Die Teilnehmenden bekamen die Möglichkeit, die handschriftlichen Reisetagebücher des Tübinger Orientalisten Julius Euting (1839–1913) zu transkribieren.
Die Veranstaltung war ein großer Erfolg: Insgesamt wurden circa 135 Seiten von acht aktiven Teilnehmenden transkribiert. Zu Vorführungszwecken wurden bereits mit den Rohdaten zwei erste Modelle trainiert, die eine Genauigkeit zwischen 81 und 86 % erzielten. Mit diesen Ergebnissen ist unser Ziel natürlich noch lange nicht erreicht. Im nächsten Schritt werden alle transkribierten Seiten korrigiert und auf einen einheitlichen Transkriptionsstandard gebracht. Anschließend wird damit das universale Handschriftenmodell german_handwriting für Kraken nachtrainiert und die kompletten Reisetagebücher Eutings online mit Volltexten bereitgestellt.
Wir werden Sie darüber informieren, wenn die Ergebnisse veröffentlicht werden!
Das Kompetenzzentrum OCR wünscht Ihnen schöne Osterfeiertage! 🐰