Van een gedigitaliseerde krant of boek verwacht iedereen dat je meteen door de inhoud kan zoeken zoals bij een Word-document of een website. Een flitscamera herkent probleemloos je nummerplaat en Facebook herkent je op foto’s op het web. Dus waarom zou een pagina uit een gedigitaliseerde krant of boek niet doorzoekbaar zijn? Deze Uitgepakt gaat over Optical Character Recognition of OCR en hoe je de foutenmarge in ge-ocr’de tekst zo laag mogelijk houdt.