Distributed Proofreaders (z angličtiny - “Distributed Proofreaders”) je webový projekt pro digitalizaci knih pro projekt Gutenberg . Myšlenkou projektu je, aby množství dobrovolníků spolupracovalo na vytváření e-knih, od fáze skenování až po zveřejnění hotového textu na webové stránky projektu Gutenberg.
Projekt vznikl v roce 2000 , od té doby se úsilím jeho členů podařilo doplnit katalog projektu Gutenberg o více než 15 tisíc knih [1] . Toto číslo se zvyšuje v průměru o 150-200 knih měsíčně. Každý den projde první etapou korektur více než 2 tisíce stran.
Z historických důvodů stránka nepodporuje Unicode , takže počet jazyků, ve kterých jsou knihy v rámci projektu digitalizovány, je značně omezený. Od dubna 2009 je seznam jazyků následující:
O knihy v některých dalších jazycích, včetně slovanských, se stará projekt Distributed Proofreaders Europe , který udržuje Unicode.
V první fázi jsou naskenovány a rozpoznány knihy, které nejsou chráněny autorským právem [2] . Poměrně významná část knih se do projektu dostane a obejde fázi skenování – z Internet Archive , Google Books a dalších podobných zdrojů.
V důsledku rozpoznávání se zpravidla získá text obsahující určitý počet chyb v rozpoznávání ( anglicky scannos ). Text v tomto ohledu prochází třífázovou korekturou , při které korektor vidí na obrazovce jak obrázek přijatý ze skeneru , tak aktuální verzi textu.
Kniha pak prochází procesem formátování ve dvou krocích, přičemž stejně jako v předchozím kroku je nejvyšší prioritou, aby text byl co nejblíže autorově verzi.
Formátovaný text prochází tzv. post-processingem a následně finálním ověřením. Poté je kniha považována za připravenou k nahrání na web projektu Gutenberg. [3]