Anwendung

Anwendung von Texterkennungs- und Transkriptionssoftware


Die Universitätsbibliotheken Mannheim und Tübingen blicken auf langjährige Erfahrung mit kommerzieller und nicht-kommerzieller Software im Bereich der Texterkennung von Drucken und Handschriften zurück.

Auf der folgenden Seiten finden Sie detaillierte Informationen zur Anwendung der eingesetzten Technologien, mit der die Tübingen und Mannheim bereits Erfahrung gesammelt haben. Darüber hinaus finden Sie weitere interessante Ressourcen und Informationen rund um das Thema OCR.

eScriptorium

OCRmyPDF

Tesseract

OCR-D

Eine Nutzungs- und Installationsanleitung zu OCR-D finden Sie auf der Projekthomepage von OCR-D.

Erstellung von Ground Truth

Ground-Truth zum Training bzw. Nachtraining eigener Modelle finden Sie bei OCR-D und Github unter den folgenden Links:

Hilfreich bei der Erstellung von Ground-Truth kann auch ein virtuelles Keyboard mit den benötigten Sonderzeichen sein. Hilfen für unterschiedliche Transkriptionsplattformen hierzu finden Sie ebenfalls auf Github.

Hilfen für Virtuelle Keyboards

Sie wissen noch gar nicht, welche Software für Ihr Projekt in Frage kommt? Dann finden Sie es heraus mit dem OCR Recommender.