Archiv der Kategorie: News

Erfolgreicher 3. OCR-BW-Workshop

Am 22. Juni fand im Mannheimer Schloss der dritte und letzte Workshop des Projektes OCR-BW statt. Während der Projektlaufzeit wurde von allen Seiten stets die Wichtigkeit und Richtigkeit des Themas automatisierter Texterkennung sowie der Bedarf an Beratung bei Forschenden und Institutionen bestätigt. Dies spiegelte sich auch in der Resonanz wider, die der Workshop bekam. Es zeigte sich auch, dass inzwischen Forschende die Möglichkeit zur Online-Teilnahme schätzen gelernt haben. So begrüßte das Projektteam knapp 30 Teilnehmende vor Ort und ungefähr 50 Online-Teilnehmende beim Workshop.

Nach der Begrüßung durch die Direktorinnen der Universitätsbibliotheken Mannheim und Tübingen und einem Rückblick auf die Projektlaufzeit folgten vier spannende Vorträge aus Forschung und Praxis. Die Reihe begann mit einem Vortrag von Milanka Matić-Chalkitis (Universität Freiburg) zum Training „smarter“ Modelle im MultiHTR-Projekt. Anschließend gaben Eric Veyel und Rainer Gräbeldinger einen praktischen Einblick in das neue Druckschriftenportal des Mannheimer Stadtarchivs MARCHIVUM. Daran schloss sich ein interessanter Einblick in die Zukunft des Fachs Geschichte in Lehre und Forschung von Professor Dr. Hiram Kümper (Universität Mannheim) an. Abschließend berichtete Carlos Martínez von BIOfid über nachfolgende Anwendungen der Handschriftenerkennung und bildete somit das Finale einer anregenden und vielfältigen Vortragsreihe. Die Links zu den Präsentationen finden Sie weiter unten.

Nachmittags konnten die Teilnehmenden nach einer Einführung selbst die Texterkennungs- und Transkriptionsplattformen Transkribus Lite und eScriptorium ausprobieren.

Wir möchten uns an dieser Stelle noch einmal für die positiven Rückmeldungen und Anregungen bedanken! Auch den Vortragenden, den Teilnehmenden sowie allen, die uns bei der Ausrichtung des Workshops unterstützt haben, gilt unser herzlicher Dank!

Das OCR-BW-Team aus Tübingen und Mannheim.

Links zu den Präsentationen des Workshops:

Einleitung durch die Projektpartner:

Vorträge:

3. OCR-BW-Workshop am 22. Juni 2022

Die Universitätsbibliotheken Mannheim und Tübingen veranstalten den dritten Workshop des vom MWK geförderten Projektes OCR-BW am 22. Juni 2022 an der Universität Mannheim, aber mit der Möglichkeit, auch online teilzunehmen. Der Workshop richtet sich sowohl an fortgeschrittene Anwender:innen als auch an alle Interessierten zum Thema „Texterkennung von Handschriften und Druckwerken“. Der Fokus liegt diesmal auf den Texterkennungs- und Transkriptionsplattformen eScriptorium und Transkribus sowie deren Einsatz in Forschung und Lehre.

Viele Einrichtungen und Institutionen in Baden-Württemberg digitalisieren bereits ihre historischen Drucke und Handschriften. Damit verbunden ist die Erschließung der Digitalisate durch gute Texterkennung. Das Projekt OCR-BW unterstützt und berät seit fast drei Jahren bei der Anwendung aktueller Programme zur Texterkennung. Der Workshop soll die Teilnehmenden vertieft über das Projekt, aktuelle Forschungen und Programmanwendungen informieren.

Neben der Vorstellung der im Projekt erreichten Meilensteine umfasst der Workshop verschiedene praxisnahe Vorträge und praktische Hands-On-Labs, die Sie nacheinander besuchen können. Jedem Vortrag folgt eine Diskussionsrunde, in der Fragen zur vorangegangenen Präsentation thematisiert werden können. Eine an die Vorträge anschließende Abschlussdiskussion und die Pausen bieten darüber hinaus eine Gelegenheit für den Erfahrungsaustausch. In den Hands-On-Labs zeigen Ihnen die Projektmitarbeiterinnen anhand Ihrer eigenen mitgebrachten Digitalisate, wie Sie eScriptorium und Transkribus nutzen können. Bringen Sie hierfür bitte Ihren eigenen Laptop mit.

Alle Infos auf einen Blick

  • Was: 3. OCR-BW Workshop (Format: hybrid)
  • Wer: veranstaltet von den Universitätsbibliotheken Mannheim und Tübingen
  • Wann: 22. Juni 2022, ab 9.30 Uhr
  • Anmeldung: Für die Teilnahme in Präsenz bitten wir um eine Registrierung bis Mittwoch, den 15.06.2022. Für die Online-Teilnahme reicht eine Rückmeldung bis Montag, den 20.06.2022.
  • Wo: Universität Mannheim (Fuchs-Petrolub-Saal – O 138) oder online

Registrierung:

Die Zugangsdaten für die Online-Teilnahme: werden wenige Tage vor der Veranstaltung an alle registrierten Teilnehmenden verschickt

OCR-BW-Programmaushang_22_06

Fragen

Bei Fragen wenden Sie sich bitte an Larissa Will.

E-Mail: larissa.will@uni-mannheim.de oder Tel.: 0621 181–2754

OCR-BW auf dem Südwestdeutschen Archivtag am 20.05.2022

Dieses Jahr ist OCR-BW auf dem 81. Südwestdeutschen Archivtag in Reutlingen vertreten. Die Veranstaltung widmet sich den Herausforderungen, mit denen Archive im digitalen Zeitalter konfrontiert sind.

Passend dazu steht Ihnen das Team von OCR-BW auf der dazugehörigen Fachmesse am 20.05.2022 in der Reutlinger Stadthalle für alle Fragen rund um die Anwendung von Texterkennungs- und Transkriptionssoftware zur Verfügung. Weitere Informationen zur Veranstaltung finden Sie unter: https://www.landesarchiv-bw.de/de/aktuelles/termine/73866.

Wir freuen uns, nach der Pandemie endlich wieder persönlich mit Ihnen ins Gespräch zu kommen!

Save-the-Date: 3. OCR-BW-Workshop am 22.06.2022

Der diesjährige Projektworkshop von OCR-BW findet am Mittwoch, dem 22. Juni 2022, an der Universität Mannheim statt. Die Veranstaltung wird in einem hybriden Format abgehalten, so können Interessierte sowohl vor Ort als auch vom eigenen Büro aus virtuell teilnehmen.

Neben Berichten des Projektteams der UB Tübingen und der UB Mannheim sind auch Vorträge von verschiedenen Wissenschaftlerinnen und Wissenschaftlern sowie Institutionen über deren Erfahrungen mit automatisierter Texterkennung geplant. Ergänzt wird das Programm durch praktische Hands-On-Sessions, die den Teilnehmerinnen und Teilnehmern einen Einblick in die praktische Anwendung von Texterkennungsprogrammen gewähren. Ein Thema des Workshops ist unter anderem der Einsatz von Texterkennungs- und Transkriptionssoftware in der Lehre.

Weitere Informationen zum genauen Ablauf des Workshops werden in den nächsten Wochen bekannt gegeben.

Einführung in die Transkriptionsplattform eScriptorium

Am Freitag den, 25.03.2022 um 11 Uhr findet eine kleine Einführung in die Arbeit mit der Transkriptionsplattform eScriptorium statt. Falls Sie gerne teilnehmen würden, senden Sie uns einfach eine Mail an larissa.will(at)uni-mannheim.de. Anschließend erhalten Sie einen Link zum virtuellen Veranstaltungsraum.

Wir freuen uns Ihnen eScriptorium in kleinem Rahmen vorführen und Ihre Fragen dazu beantworten zu können.

eScriptorium im Produktionsbetrieb

Inzwischen ist unser eScriptorium über die URL https://ocr-bw.bib.uni-mannheim.de/escriptorium/ erreichbar. Die neue Instanz läuft auf einem leistungsfähigen Server mit GPU-Unterstützung, was die Geschwindigkeit von Segmentierung, automatisierter Texterkennung und Modelltraining deutlich erhöht. Der produktiven Nutzung von eScriptorium steht somit nichts mehr im Weg.

Für die Erkennung von Frakturschrift des 19. Jahrhunderts haben wir mit Hilfe des Datensatzes „Austrian Newspapers“ ein Modell für die OCR-Software Kraken trainiert. Auf Basis dieses Frakturschriftmodells führten wir innerhalb von eScriptorium diverse Nachtrainings mit unterschiedlichen historischen Dokumenten der Universitätsbibliothek Tübingen durch. Eines der so erzeugten Modelle erzielt mit einer Zeichenerkennungsrate von 99,9 % (11 Fehler auf 9567 Zeichen) ein außerordentlich gutes Ergebnis. Auch die anderen Modelle erzielen mit Genauigkeiten von über 92 % sehr ordentliche Ergebnisse.

Sollten Sie Fragen oder Interesse an der Nutzung von eScriptorium haben, wenden Sie sich an Larissa Will unter: larissa.will(at)uni-mannheim.de.

Neues Jahr – Neue Herausforderungen

Das Projektteam wünscht allen ein frohes neues Jahr! Mit dem Jahr 2021 ist ein ereignisreiches Jahr für das Projekt OCR BW zu Ende gegangen. Welche Meilensteine das Projekt im letzten Jahr verzeichnen konnte, können Sie gerne im Jahresrückblick nachlesen. Das Team ist bereits tatkräftig in das neue Jahr gestartet und arbeitet weiterhin an einer verbesserten Usability von eScriptorium sowie dem Ausbau der OCR-BW-Homepage mit detaillierten Anleitungen zur OCR-Texterkennung.

Falls Interesse an eScriptorium besteht, können wir Ihnen Anleitungen in deutscher Sprache zur Nutzung von eScriptorium, zum Import von Daten aus Transkribus nach eScriptorium sowie zur lokalen Installation von eScriptorium (auch mit deutscher Benutzungsoberfläche) bereitstellen.

Sollten Sie Fragen haben, wenden Sie sich gerne an Larissa Will unter: larissa.will(at)bib.uni-mannheim.de.

Hinweise zur OCR von Fraktur und dem richtigen Scannen

Das Projektteam erreichen in den letzten Wochen immer wieder Anfragen bzgl. der Texterkennung von Frakturschrift. Dies ist nicht verwunderlich, so war Fraktur doch Mitte des 16. bis Anfang des 20. Jahrhunderts die meistverwendete Schrift für Drucke im deutschsprachigen Raum. Sie finden deshalb nun ab sofort Hinweise zur Texterkennung von Fraktur und Hinweise zum richtigen Scannen von Dokumenten auf unserer Homepage.

Sollten dennoch Fragen offenbleiben, kann das Projektteam jederzeit kontaktiert werden.

Ansprechpartnerin: Larissa Will (larissa.will(at)bib.uni-mannheim.de)

Digitalisierte Druckschriften zur Mannheimer Stadtgeschichte

Volltextsuche nach „Schloßbibliothek“

Das Mannheimer Stadtarchiv MARCHIVUM hat sich selbst und allen, die sich für die Mannheimer Geschichte interessieren, ein vorgezogenes Weihnachtsgeschenk gemacht und ausgewählte digitalisierte Druckschriften online gestellt. Schwerpunkt sind dabei Mannheimer Zeitungen. Dank der im Rahmen von OCR-BW an der Universitätsbibliothek Mannheim erstellten Volltexte lassen sich diese Zeitungen systematisch nach interessanten Schlagworten durchsuchen.