Weiter mit Tracking durch Dritte

Besuchen Sie unsere Website mit externen Inhalten, personalisierter Werbung und Werbetracking durch Dritte. Details und Informationen zu Cookies, Verarbeitungszwecken sowie Ihrer jederzeitigen Widerrufsmöglichkeit finden Sie in der Datenschutzerklärung und in den Privatsphäre-Einstellungen.

Weiter mit dem PUR-Abo

Nutzen Sie unser Angebot ohne Werbetracking durch Dritte für 4,99 Euro/Monat. Kunden mit einem bestehenden Abo (Tageszeitung, e-Paper oder PLUS) zahlen nur 0,99 Euro/Monat. Informationen zur Datenverarbeitung im Rahmen des PUR-Abos finden Sie in der Datenschutzerklärung.

Zum Angebot Bereits PUR-Abonnent? Hier anmelden

Einwilligung: Durch das Klicken des "Akzeptieren und weiter"-Buttons stimmen Sie der Verarbeitung der auf Ihrem Gerät bzw. Ihrer Endeinrichtung gespeicherten Daten wie z.B. persönlichen Identifikatoren oder IP-Adressen für die beschriebenen Verarbeitungszwecke gem. § 25 Abs. 1 TTDSG sowie Art. 6 Abs. 1 lit. a DSGVO durch uns und unsere bis zu 220 Partner zu. Darüber hinaus nehmen Sie Kenntnis davon, dass mit ihrer Einwilligung ihre Daten auch in Staaten außerhalb der EU mit einem niedrigeren Datenschutz-Niveau verarbeitet werden können.

Tracking durch Dritte: Zur Finanzierung unseres journalistischen Angebots spielen wir Ihnen Werbung aus, die von Drittanbietern kommt. Zu diesem Zweck setzen diese Dienste Tracking-Technologien ein. Hierbei werden auf Ihrem Gerät Cookies gespeichert und ausgelesen oder Informationen wie die Gerätekennung abgerufen, um Anzeigen und Inhalte über verschiedene Websites hinweg basierend auf einem Profil und der Nutzungshistorie personalisiert auszuspielen.

Externe Inhalte: Zur Ergänzung unserer redaktionellen Texte, nutzen wir in unseren Angeboten externe Inhalte und Dienste Dritter („Embeds“) wie interaktive Grafiken, Videos oder Podcasts. Die Anbieter, von denen wir diese externen Inhalten und Dienste beziehen, können ggf. Informationen auf Ihrem Gerät speichern oder abrufen und Ihre personenbezogenen Daten erheben und verarbeiten.

Verarbeitungszwecke: Personalisierte Werbung mit Profilbildung, externe Inhalte anzeigen, Optimierung des Angebots (Nutzungsanalyse, Marktforschung, A/B-Testing, Inhaltsempfehlungen), technisch erforderliche Cookies oder vergleichbare Technologien. Die Verarbeitungszwecke für unsere Partner sind insbesondere:
Informationen auf einem Gerät speichern und/oder abrufen

Für die Ihnen angezeigten Verarbeitungszwecke können Cookies, Gerätekennungen oder andere Informationen auf Ihrem Gerät gespeichert oder abgerufen werden.

Personalisierte Anzeigen und Inhalte, Anzeigen und Inhaltsmessungen, Erkenntnisse über Zielgruppen und Produktentwicklungen

Anzeigen und Inhalte können basierend auf einem Profil personalisiert werden. Es können mehr Daten hinzugefügt werden, um Anzeigen und Inhalte besser zu personalisieren. Die Performance von Anzeigen und Inhalten kann gemessen werden. Erkenntnisse über Zielgruppen, die die Anzeigen und Inhalte betrachtet haben, können abgeleitet werden. Daten können verwendet werden, um Benutzerfreundlichkeit, Systeme und Software aufzubauen oder zu verbessern.

▌▉▍▉▉▍▉▌▌▉▍▉▌ ▉▌▌▉▍▉▌▌▉▍▉▍▉▍ ;▌▉▍▉▉▍▉▌▌▉▍▉▌
  1. Startseite
  2. Bayern
  3. Forschung: Computer liest alte Texte

Forschung
24.04.2019

Computer liest alte Texte

Die Software Würzburger Wissenschaftler kann digitalisierte historische Drucke fast fehlerfrei entziffern.
Foto: Klaus-Dietmar Gabbert, dpa

Würzburger Wissenschaftler haben ein Werkzeug entwickelt, das historische Drucke fast fehlerfrei entziffert. Wo die Probleme lagen

Wissenschaftler der Julius-Maximilians-Universität Würzburg (JMU) haben ein Computertool für alte Texte entwickelt. Es setzt digitalisierte historische Drucke mit einer Fehlerquote von weniger als einem Prozent in einen computerlesbaren Text um, wie die Uni mitteilte. Zudem biete OCR4all eine grafische Benutzeroberfläche, für deren Bedienung kein Informatik-Fachwissen nötig sei. Das neue elektronische Werkzeug sei unter der Leitung von Christian Reul mit Informatik-Fachkollegen und vielen Studenten konzipiert worden.

Seine Wurzeln hat OCR4all laut Mitteilung im Kallimachos-Verbundprojekt der Uni, das vom Bundesbildungsministerium gefördert wird. Diese Kooperation zwischen Geisteswissenschaften und Informatik werde im neugegründeten Zentrum für Philologie und Digitalität weitergeführt und institutionalisiert. Bei der Entwicklung hätten die Informatiker eng mit geisteswissenschaftlichen Disziplinen der JMU zusammengearbeitet, unter anderem mit der Germanistik und der Romanistik. Dort sei es darum gegangen, das „Narrenschiff“, eine Moralsatire von Sebastian Brant aus dem 15. Jahrhundert, digital aufzubereiten.

Laut Reul war eines der größten Probleme die Typografie. Das liege unter anderem daran, dass die ersten Druckereien des 15. Jahrhunderts keine einheitlichen Schriften verwendeten. „Ihre Druckstempel waren alle selbstgeschnitzt, jede Druckerei hatte praktisch ihre jeweils eigenen Buchstaben und Zeichen.“ In alten Drucken seien e oder c, v oder r oft nicht einfach zu unterscheiden. Eine Software könne aber lernen, solche Feinheiten zu erkennen.

Wie es heißt, hat Reul auch externe Partner von der Qualität der Forschung überzeugt. Mit dem „Zentrum für digitale Lexikografie der deutschen Sprache“ in Berlin sei Daniel Sanders’ „Wörterbuch der deutschen Sprache“ digital erschlossen worden. Dieses Werk enthalte pro Textzeile oft verschiedene Schrifttypen, die für jeweils andere semantische Informationen stünden. Hier sei der bestehende Ansatz zur Zeichenerkennung so erweitert worden, dass sich neben dem Text auch die Typografie und damit die komplexe inhaltliche Struktur des Lexikons exakt abbilden ließen. (kna)

Themen folgen

Die Diskussion ist geschlossen.