Schlagwort-Archive: Workshop

Kompetenzzentrum OCR auf der DHd 2024 in Passau

Nächste Woche (26.02 bis 01.03.) findet in Passau die DHd 2024 statt, die Konferenz für Digital Humanities im deutschsprachigen Raum. Die Tagung findet dieses Jahr bereits zum zehnten Mal statt und steht dieses Mal unter dem Motto „DH Quo Vadis“. Das Kompetenzzentrum OCR wird sowohl am Workshop „Das richtige Werkzeug für die Volltextdigitalisierung“ mitwirken und die Texterkennungs- und Transkriptionsplattform eScriptorium vorstellen als auch in der Postersession am Donnerstag mit einem Poster zur FAIRen Bereitstellung von Ground-Truth-Daten vertreten sein.

Wir freuen uns darauf, Sie vielleicht in Passau zu treffen!

eScriptorium-Workshop im Rahmen der Love Data Week 2024

Historische Dokumente erschließen leicht gemacht: Ein Crashkurs zur Transkriptions­plattform eScriptorium

Datum und Uhrzeit: 14.02.2024 von 14:00 bis 16:15 Uhr

Format: Online

Ob Editions­vorhaben, handschriftenkundliche Seminare oder Citizen-Science-Projekte – die Entzifferung und maschinelle Verarbeitung von Schriftstücken aus der Vergangenheit ist oft eine Herausforderung.

Die Texterkennungs- und Transkriptions­plattform eScriptorium hilft bei der Erschließung historischer Quellen. Dabei spielt es keine Rolle, ob es sich um eine Postkarte, eine historische Zeitung oder ein amtliches Dokument handelt. eScriptorium ist eine freie Open-Source-Alternative zur proprietären Software Transkribus.

Im Workshop durchlaufen Sie anhand eigener oder bereitgestellter Dokumente den gesamten Workflow der Erschließung. Von der Layouterkennung und -korrektur über die automatische Texterkennung bis hin zur manuellen Korrektur der OCR-Ergebnisse und dem Training eigener Modelle bietet der Workshop einen spannenden Einstieg in die Welt der modernen Transkriptions­arbeit.

Kurssprache: Deutsch

Kompetenzzentrum OCR auf der FORGE 2023 in Tübingen

Vom 4. bis 6. Oktober ist das Kompetenzzentrum OCR auf der Konferenz Forschungsdaten in den Geisteswissenschaften, kurz FORGE, vertreten. Die Tagung wird vom DH Center der Universität Tübingen, der DAASI International GmbH und dem DHd Arbeitskreis Datenzentren organisiert und widmet sich in diesem Jahr der kritischen Auseinandersetzung mit Forschungsdaten in den Geisteswissenschaften.


Das Kompetenzzentrum OCR wird mit einem Workshop zu eScriptorium und Transkribus, einem Poster zu FAIRen Ground-Truth-Daten sowie einem Vortrag zur Qualität und Standardisierung von GT-Daten in der Praxis vertreten sein.

Sie finden weitere Informationen im Konferenzprogramm.


Wir freuen uns auf den Austausch mit Kolleg*innen und auf spannende Beiträge!

Erfolgreicher 3. OCR-BW-Workshop

Am 22. Juni fand im Mannheimer Schloss der dritte und letzte Workshop des Projektes OCR-BW statt. Während der Projektlaufzeit wurde von allen Seiten stets die Wichtigkeit und Richtigkeit des Themas automatisierter Texterkennung sowie der Bedarf an Beratung bei Forschenden und Institutionen bestätigt. Dies spiegelte sich auch in der Resonanz wider, die der Workshop bekam. Es zeigte sich auch, dass inzwischen Forschende die Möglichkeit zur Online-Teilnahme schätzen gelernt haben. So begrüßte das Projektteam knapp 30 Teilnehmende vor Ort und ungefähr 50 Online-Teilnehmende beim Workshop.

Nach der Begrüßung durch die Direktorinnen der Universitätsbibliotheken Mannheim und Tübingen und einem Rückblick auf die Projektlaufzeit folgten vier spannende Vorträge aus Forschung und Praxis. Die Reihe begann mit einem Vortrag von Milanka Matić-Chalkitis (Universität Freiburg) zum Training „smarter“ Modelle im MultiHTR-Projekt. Anschließend gaben Eric Veyel und Rainer Gräbeldinger einen praktischen Einblick in das neue Druckschriftenportal des Mannheimer Stadtarchivs MARCHIVUM. Daran schloss sich ein interessanter Einblick in die Zukunft des Fachs Geschichte in Lehre und Forschung von Professor Dr. Hiram Kümper (Universität Mannheim) an. Abschließend berichtete Carlos Martínez von BIOfid über nachfolgende Anwendungen der Handschriftenerkennung und bildete somit das Finale einer anregenden und vielfältigen Vortragsreihe. Die Links zu den Präsentationen finden Sie weiter unten.

Nachmittags konnten die Teilnehmenden nach einer Einführung selbst die Texterkennungs- und Transkriptionsplattformen Transkribus Lite und eScriptorium ausprobieren.

Wir möchten uns an dieser Stelle noch einmal für die positiven Rückmeldungen und Anregungen bedanken! Auch den Vortragenden, den Teilnehmenden sowie allen, die uns bei der Ausrichtung des Workshops unterstützt haben, gilt unser herzlicher Dank!

Das OCR-BW-Team aus Tübingen und Mannheim.

Links zu den Präsentationen des Workshops:

Einleitung durch die Projektpartner:

Vorträge:

Save-the-Date: 3. OCR-BW-Workshop am 22.06.2022

Der diesjährige Projektworkshop von OCR-BW findet am Mittwoch, dem 22. Juni 2022, an der Universität Mannheim statt. Die Veranstaltung wird in einem hybriden Format abgehalten, so können Interessierte sowohl vor Ort als auch vom eigenen Büro aus virtuell teilnehmen.

Neben Berichten des Projektteams der UB Tübingen und der UB Mannheim sind auch Vorträge von verschiedenen Wissenschaftlerinnen und Wissenschaftlern sowie Institutionen über deren Erfahrungen mit automatisierter Texterkennung geplant. Ergänzt wird das Programm durch praktische Hands-On-Sessions, die den Teilnehmerinnen und Teilnehmern einen Einblick in die praktische Anwendung von Texterkennungsprogrammen gewähren. Ein Thema des Workshops ist unter anderem der Einsatz von Texterkennungs- und Transkriptionssoftware in der Lehre.

Weitere Informationen zum genauen Ablauf des Workshops werden in den nächsten Wochen bekannt gegeben.

1. Workshop zu OCR und Handschriftenerkennung an der UB Tübingen

Am 19. Februar 2020 richtete die UB Tübingen den ersten Workshop des Projekts OCR-BW aus. Nachdem das Projekt 2019 gestartet war, stellte sich schnell heraus, dass im Bereich OCR und HTR starkes Interesse sowohl von Seiten der Wissenschaft wie auch von anderen Gedächtnisinstitutionen besteht. Dementsprechend war auch der Workshop mit etwa 50 Teilnehmerinnen und Teilnehmern aus dem ganzen Bundesland sehr gut besucht. Es wurde deutlich, dass OCR/HTR kein Thema ist, das nur für Geisteswissenschaften Relevanz hat. Auch aus vielen anderen Fachdisziplinen kamen Interessierte, die vor dem Problem stehen, gedruckte oder handschriftliche Materialien für verschiedene Fragestellungen maschinell verarbeiten zu müssen. Die Spannbreite reicht hier vom mittelalterlichen Manuskript über maschinengeschriebene Katalogkarten bis hin zu einer aktuellen Textedition mit Sonderzeichen.

Im Rahmen des Workshops wurden Tesseract und Transkribus vorgestellt und mögliche Einsatzgebiete gezeigt. Die diskutierten Beispiele verdeutlichten den technischen Fortschritt und zeigten, dass für verschiedene Quellengattungen bereits sehr gute Ergebnisse möglich sind. Bei aller eigener Begeisterung musste jedoch auch betont werden, dass die Ergebnisse zwar überzeugend sind, aber das Verhältnis von notwendigem Aufwand zum erzielten Ergebnis nicht außer Acht gelassen werden sollte. Das Projektteam steht nun vor der Aufgabe, die Anregungen der Teilnehmerinnen und Teilnehmer in die weitere Projektarbeit und Entwicklung des Kompetenzzentrums miteinzubeziehen sowie einen Modus zu finden, wie die Wissenschaft und andere Gedächtniseinrichtungen im Bereich der automatischen Volltexterkennung bestmöglich mit den zur Verfügung stehenden Ressourcen unterstützt werden können. Wir bedanken uns für die vielen positiven Rückmeldungen und freuen uns über weitere Anregungen!

Das OCR-BW Projektteam der UB Mannheim und UB Tübingen (Foto: A. Rempfer)