Archiv der Kategorie: News

Offene Sprechstunde am 15. Juni 2023 von 15 bis 16 Uhr

Aufgrund des Feiertags in Baden-Württemberg findet die nächste offene OCR-Sprechstunde via Zoom erst am Donnerstag, den 15.06.2023 um 15 Uhr statt. Bei dieser Gelegenheit können Sie wieder Fragen zum Thema automatische Texterkennung von Handschriften und Drucken stellen.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Wir freuen uns auf Ihre Teilnahme!

Kompetenzzentrum OCR auf der BiblioCon 2023 in Hannover

Die Universitätsbibliotheken Mannheim und Tübingen sind dieses Jahr auf der BiblioCon in Hannover (23. bis 26. Mai 2023) mit mehreren Veranstaltungen zum Thema automatisierte Texterkennung von historischen Handschriften und Drucken vertreten:

Wir freuen uns, wenn wir Sie auf einer oder mehrerer unserer Veranstaltungen in Hannover begrüßen dürfen!

Offene OCR-Sprechstunde am 11. Mai 2023 von 15 bis 16 Uhr

Am Donnerstag, den 11.05.2023 um 15 Uhr findet die nächste offene OCR-Sprechstunde via Zoom statt. Bei dieser Gelegenheit können Sie wieder Fragen zum Thema automatische Texterkennung von Handschriften und Drucken stellen.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Wir freuen uns auf Sie!

Rückblick: Transcribathon

Das Kompetenzzentrum OCR der UB Tübingen und der UB Mannheim hat in Kooperation mit dem Forschungsdatenzentrum in der Love Data Week (13. bis 17. Februar) einen Transcribathon auf der Texterkennungs- und Transkriptions­plattform eScriptorium veranstaltet. Die Teilnehmenden bekamen die Möglichkeit,  die handschriftlichen Reisetagebücher des Tübinger Orientalisten Julius Euting (1839–1913) zu transkribieren.

Die Veranstaltung war ein großer Erfolg: Insgesamt wurden circa 135 Seiten von acht aktiven Teilnehmenden transkribiert. Zu Vorführungszwecken wurden bereits mit den Rohdaten zwei erste Modelle trainiert, die eine Genauigkeit zwischen 81 und 86 % erzielten. Mit diesen Ergebnissen ist unser Ziel natürlich noch lange nicht erreicht. Im nächsten Schritt werden alle transkribierten Seiten korrigiert und auf einen einheitlichen Transkriptionsstandard gebracht. Anschließend wird damit das universale Handschriftenmodell german_handwriting für Kraken nachtrainiert und die kompletten Reisetagebücher Eutings online mit Volltexten bereitgestellt.

Wir werden Sie darüber informieren, wenn die Ergebnisse veröffentlicht werden!

Das Kompetenzzentrum OCR wünscht Ihnen schöne Osterfeiertage! 🐰

Offene OCR-Sprechstunde am 9. März 2023 von 15 bis 16 Uhr

Am Donnerstag, den 09.03.2023 um 15 Uhr findet die nächste offene OCR-Sprechstunde via Zoom statt. Bei dieser Gelegenheit können Sie wieder Fragen zum Thema automatische Texterkennung von Handschriften und Drucken stellen.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Offene OCR-Sprechstunde am 09.02.2023, 15-16 Uhr

Am Donnerstag, den 09.02.2023 um 15 Uhr findet die nächste offene OCR-Sprechstunde via Zoom statt. Bei dieser Gelegenheit können Sie wieder Fragen zum Thema automatische Texterkennung von Handschriften und Drucken stellen.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Transcribathon durch den Orient (13.02.-17.02.2022)

Das Kompetenzzentrum OCR der UB Tübingen und der UB Mannheim veranstaltet in Kooperation mit dem Forschungsdatenzentrum in der Love Data Week (13. bis 17. Februar) einen Transcribathon auf der Texterkennungs- und Transkriptions­plattform eScriptorium. Die Teilnehmenden bekommen die Möglichkeit,  die handschriftlichen Reisetagebücher des Tübinger Orientalisten Julius Euting (1839–1913) zu transkribieren.

Zum Auftakt des Transcribathons treffen wir uns am Montag, dem 13.02.2023, um 13.30 Uhr online via Zoom und besprechen die Funktionalitäten von eScriptorium sowie die Ziele des Transcribathons. Über die Woche können die Teilnehmenden dann fleißig transkribieren und in die spannenden Reiseberichte aus fernen Ländern wie Syrien, Ägypten und Algerien eintauchen. Am Freitag, dem 17.02.2023, um 13.30 Uhr treffen wir uns dann erneut, besprechen die Ergebnisse und küren die Sieger:innen des Transcribathons.

Anmeldung zum Auftakt: https://www2.bib.uni-mannheim.de/event-registration/index.php?eventkey=LDW-2023-02-13-online

Anmeldung zum Finale: https://www2.bib.uni-mannheim.de/event-registration/index.php?eventkey=LDW-2023-02-17-online

Sollten Sie am Auftakt nicht teilnehmen können, aber würden gerne am Transcribathon teilnehmen, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de)

Bild: Universitätsbibliothek Tübingen

OCR-Sprechstunde

Am Donnerstag, den 12.01.2023 um 15 Uhr findet die erste OCR-Sprechstunde des neuen Jahres via Zoom statt. Bei dieser Gelegenheit können Sie wieder Fragen zum Thema automatische Texterkennung von Handschriften und Drucken stellen.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071). Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Viele Wege führen zum Texterkennungsmodell

UAT 84/14, S. 867

Der Frage nach dem bestmöglichen Ansatz beim Training von eigenen Modellen für die automatische Texterkennung von Handschriften ist die UB Tübingen nachgegangen. An verschiedenen Textkorpora vom mittelalterlichen Gebetbuch über Großbestände wie Juristische Konsilien bis hin zum Expeditionstagebuch des 20. Jahrhunderts wurden unterschiedliche Herangehensweisen getestet, wie sich mit dem geringstmöglichen Aufwand ein möglichst gutes Modell entwickeln lässt. Die Ergebnisse können im aktuellen o-bib-Heft Bd. 9 Nr. 4 (2022) nachgelesen werden.