Entscheidungsfindung in der Digitalisierung durch experimentelles Workflow-Design

Impact CoCNews

Sven Schlarb from the Austrian National Library talked about the challenges of integrating the 22 software tools developed within IMPACT,  and how they were met in the IMPACT Interoperability Framework (IIF), a workflow design and management platform.

http://vimeo.com/32259264

[slideshare id=9696849&doc=03schlarbworkflow-design-111014090958-phpapp02]

Sven Schlarb, tätig an der Österreichischen Nationalbibliothek, thematisierte die Zusammenarbeit der verschiedenen in IMPACT entwickelten Software-Werkzeuge.

Zu Anfang gab er einen kurzen Überblick über die vielfältigen Herausforderungen bei der Volltexterkennung historischer Titel (materielle, Digitalisat-immanente und linguistische Probleme. Um dieser Vielfalt von Herausforderungen Herr zu werden, entwickelte IMPACT eine Vielfalt von insgesamt 22 Werkzeugen – die miteinander zur Zusammenarbeit gebracht werden mussten.

Die Werkzeuge mussten skalierbar, stabil und transparent sein. Als Lösung wurde das IMPACT Interoperability Framework (IIF) entwickelt.

Ein Ziel des IIF war es, eine allgemeine und flexible Plattform zu schaffen, mit denen die verschiedenen Werkzeuge immer wieder neu zu experimentellen Workflows kombiniert werden können – sehr wichtig auch bei der Planung eines jeden Digitalisierungs- und Volltextprojekts.

Die Erstellung von Workflows und ihr Management geschieht über externe entwickelte Ressourcen, die Taverna Workbench und die myexperiment-Plattform, die eigentlich aus dem Bioinformatikbereich stammen, sich aber sehr gut für die Ziele von IMPACT eignen.

Anschließend stellte Herr Schlarb einen ausgewählten Beispielworkflow vor, der die OCR-Ergebnisse von Abbyy FineReader 9 und 10 für beliebiges Bilder vergleicht (sofern neben den Bildern auch GroundTruth, also annähernd 100% richtiger Volltext, vorliegt) und Ergebnisse auf Zeichen- und Wortgenauigkeitsebene ausgibt.

Bei Bedarf können alle Zwischen- und Endergebnisse auch in einem zentralen Ergebnisspeicher von IMPACT abgelegt werden.

RM (BSB); Mark-Oliver Fischer (BSB)