Schlagwort-Archive: MARCHIVUM

Aufsatz zum Projekt „Mannheims historische Zeitungen online“

Passend zum Vortrag beim 3. OCR-BW-Workshop von Eric Veyel und Rainer Gräbeldinger (MARCHIVUM) über das Projekt „Mannheims historische Zeitungen online“ finden Sie in der 42. Ausgabe der Mannheimer Geschichtsblätter einen spannenden Artikel dazu.

Dr. Harald Stockert und Eric Veyel berichten hierbei über das Vorgehen von der Digitalisierung bis zur Online-Präsentation von insgesamt 300 Zeitungsbänden mit über 350.000 Einzelseiten. Das MARCHIVUM war schon vor der Pandemie Vorreiter in Sachen Digitalisierung, und von einer kleinen Ein-Personen-Scanstation im Haus entwickelte sich die Abteilung zu einem Digitalisierungszentrum mit hoher Expertise und entsprechender Ausstattung. Das MARCHIVUM leistet so einen wichtigen Beitrag zur Erforschung und Aufarbeitung der Mannheimer Stadtgeschichte. Auch weiterhin sollen nach und nach historische Druckerzeugnisse auf dem Portal veröffentlicht werden, wie beispielsweise Theaterzettel des Mannheimer Nationaltheaters, aber auch weitere Zeitungen.

Das Projektteam von OCR-BW freut sich, durch die die bisherige sowie zukünftige Beratung sowie die Bereitstellung von Frakturmodellen Teil dieses erfolgreichen Projekts zu sein!

Stockert, Harald/Eric Veyel, Dank Corona-Förderung: Das Projekt „Mannheims historische Zeitungen online‟, in: Mannheimer Geschichtsblätter 42 (2022), S. 111-116.

Erfolgreicher 3. OCR-BW-Workshop

Am 22. Juni fand im Mannheimer Schloss der dritte und letzte Workshop des Projektes OCR-BW statt. Während der Projektlaufzeit wurde von allen Seiten stets die Wichtigkeit und Richtigkeit des Themas automatisierter Texterkennung sowie der Bedarf an Beratung bei Forschenden und Institutionen bestätigt. Dies spiegelte sich auch in der Resonanz wider, die der Workshop bekam. Es zeigte sich auch, dass inzwischen Forschende die Möglichkeit zur Online-Teilnahme schätzen gelernt haben. So begrüßte das Projektteam knapp 30 Teilnehmende vor Ort und ungefähr 50 Online-Teilnehmende beim Workshop.

Nach der Begrüßung durch die Direktorinnen der Universitätsbibliotheken Mannheim und Tübingen und einem Rückblick auf die Projektlaufzeit folgten vier spannende Vorträge aus Forschung und Praxis. Die Reihe begann mit einem Vortrag von Milanka Matić-Chalkitis (Universität Freiburg) zum Training „smarter“ Modelle im MultiHTR-Projekt. Anschließend gaben Eric Veyel und Rainer Gräbeldinger einen praktischen Einblick in das neue Druckschriftenportal des Mannheimer Stadtarchivs MARCHIVUM. Daran schloss sich ein interessanter Einblick in die Zukunft des Fachs Geschichte in Lehre und Forschung von Professor Dr. Hiram Kümper (Universität Mannheim) an. Abschließend berichtete Carlos Martínez von BIOfid über nachfolgende Anwendungen der Handschriftenerkennung und bildete somit das Finale einer anregenden und vielfältigen Vortragsreihe. Die Links zu den Präsentationen finden Sie weiter unten.

Nachmittags konnten die Teilnehmenden nach einer Einführung selbst die Texterkennungs- und Transkriptionsplattformen Transkribus Lite und eScriptorium ausprobieren.

Wir möchten uns an dieser Stelle noch einmal für die positiven Rückmeldungen und Anregungen bedanken! Auch den Vortragenden, den Teilnehmenden sowie allen, die uns bei der Ausrichtung des Workshops unterstützt haben, gilt unser herzlicher Dank!

Das OCR-BW-Team aus Tübingen und Mannheim.

Links zu den Präsentationen des Workshops:

Einleitung durch die Projektpartner:

Vorträge:

Jahresrückblick 2021

Das Team von OCR-BW ist mit dem Projektverlauf im letzten Jahr durchaus zufrieden. Zahlreichen Einrichtungen wie der Badischen Landesbibliothek Karlsruhe, dem MARCHIVUM oder der Bibliothèque Nationale et Universitaire de Strasbourg konnte bei der voranschreitenden Digitalisierung und dem Umgang mit Texterkennung unter die Arme gegriffen werden. Auch einzelne Forschende von Universitäten wandten sich wiederholt an das Projektteam sowie auch immer wieder die interessierte Öffentlichkeit.

Im Bereich der Handwritten Text Recognition gab es in den letzten Monaten neue Entwicklungen. Während der Expert Client von Transkribus durch die READ COOP beständig weiterentwickelt wird und aufgrund seiner vielen Funktionalitäten sowie zufriedenstellenden Ergebnisse im Projektzusammenhang für die automatische Handschriftenerkennung auch das Mittel der Wahl bleibt, gibt es vielversprechende Weiter- und Neuentwicklungen, die eine einfachere Handhabung von Transkribus ermöglichen und neue Anwendungsszenarien eröffnen. Mit der Browserversion Transkribus Lite gestaltet sich Handhabung intuitiver und ist zudem auf die Grundfunktionen von Transkribus beschränkt, sodass Gelegenheitsnutzende nicht überfordert werden. Wenn das Material also nicht zu anspruchsvoll ist und die Texterkennung hauptsächlich als Lesehilfe dient wie z. B. bei Transkriptionen im Rahmen von Citizen Science Projekten, stellt Transkribus Lite eine gute Alternative dar. Zudem befindet sich aktuell eine API in Entwicklung, die eine schnellere Verarbeitung von großen Materialmengen hinsichtlich der automatischen Texterkennung ermöglichen soll.

Aber auch bei der Open-Source-Alternative eScriptorium hat sich einiges getan seitdem die UB Mannheim im November letzten Jahres ihre Testinstanz in Betrieb genommen hat. Momentan hat eScriptorium gegenüber Transkribus zwar noch einige Nachteile wie die erschwerte Usability oder die fehlende Möglichkeit zur Aufteilung von Trainingsmaterialien sowie der Beeinflussung von Parametereinstellungen oder Epochenzahl. Dies macht eine Reproduzierbarkeit bzw. Vergleichbarkeit der Ergebnisse der Texterkennung momentan schwierig. Prinzipiell bringt eScriptorium aber auch Vorteile mit sich wie die einfache Weitergabe von trainierten Modellen bzw. die Nachnutzung von Modellen, die in anderen Umgebungen trainiert wurden.

Auch softwaretechnisch hat das Mannheimer Team an eScriptorium gearbeitet. So gibt es jetzt neben der englischen auch eine deutsche Benutzeroberfläche (auch in der lokalen Version), um eventuell vorhandene sprachliche Hürden abzubauen. Mannheimer Entwickler stellen einige Verbesserungen bzw. Korrekturen sowohl für eScriptorium als auch für Kraken auf GitHub bereit (https://github.com/UB-Mannheim/escriptorium). Momentan arbeitet das Team daran, die Usability von eScriptorium weiter zu verbessern. In den letzten Wochen hat das Team bereits Dokumentationen in deutscher Sprache zur Benutzung von eScriptorium, zum Import von Daten aus Transkribus sowie zur lokalen Installation von eScriptorium erstellt.

Sollten Sie Interesse an der Installation bzw. der Nutzung von eScriptorium haben, zögern Sie nicht und wenden Sie sich an Larissa Will unter: larissa.will@bib.uni-mannheim.de.

Digitalisierte Druckschriften zur Mannheimer Stadtgeschichte

Volltextsuche nach „Schloßbibliothek“

Das Mannheimer Stadtarchiv MARCHIVUM hat sich selbst und allen, die sich für die Mannheimer Geschichte interessieren, ein vorgezogenes Weihnachtsgeschenk gemacht und ausgewählte digitalisierte Druckschriften online gestellt. Schwerpunkt sind dabei Mannheimer Zeitungen. Dank der im Rahmen von OCR-BW an der Universitätsbibliothek Mannheim erstellten Volltexte lassen sich diese Zeitungen systematisch nach interessanten Schlagworten durchsuchen.