Hildelies Balk introduces the project. The IMPACT consortium was formed 2007 in the EC Seventh Framework Programme for Research & Development and started on 1 January 2008.
What are the challenges for OCR?
- Warping of text
- Shine through / bleed through
- Annotations
- Old fonts: gothic, long S
- Incomplete letters
- Historical language
IMPACT will help solving these OCR problems and during this day each step in the digitisation process will be further explained.
———————————————————————————————————————-
Hildelies Balk introduceert het project. IMPACT is ontstaan in 2007 binnen het Zevende Kaderprogramma voor Research & Development en gestart op 1 januari 2008.
Welke uitdagingen zijn er voor OCR?
- Verbogen tekst door vocht
- Doorschijnen van de andere pagina door dikke inkt of dun papier
- Annotaties
- Oude lettertypen; Gotisch, lange s
- Incomplete letters, door versleten zetletters
- Historische taalproblemen
IMPACT draagt bij aan het oplossing van deze problemen voor de OCR software en deze dag zal ingaan op elke stap in het digitaliseringsproces.
Lotte Wilms, Koninklijke Bibliotheek
Share this Post