pondělí 25. června 2012

EPUB jako formát pro dlouhodobou ochranu

Jedna novinka z Openplanetsfoundation: Studie z KB o formátu EPUB z pohledu dlouhodobé ochrany digitálních dat.
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation18062012ExternalDistribution_0.pdf
resp.:
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation20072012ExternalDistribution.pdf
Text se zabývá současnými možnostmi identifikace a validace tohoto formátu, rozdíli mezi verzí 2 a 3, a nakonec obsahuje i nějaké základní doporučení pro dlouhodobou ochranu. Autorem studie je opět Johan van der Knijff, text není součástí výstupů projektu SCAPE, ale je skutečně jen paperem vydaným KB. 
Zatím jsou Johanova doporučení jasná: 
1) Nepřijímat EPUB jako archivní formát, dokud se formát více nerozšíří a dokud nebude lepší podpora v prohlížečích.
2) Nepřijímat k archivaci dokumenty v EPUBu, které jsou opatřeny DRM.
3) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují zdroje, jež nejsou na seznamu Core media types (tzv. foreign resources) .
4)  Nepřijímat k archivaci dokumenty v EPUBu, které obsahují remote resources.
5) Dávat pozor na EPUB dokumenty, které obsahují javascript resources.
6) Vyhnout se DTBook obsahu.
7) K verifikaci shody EPUBu se specifikací používat Epubcheck
8) Prozatím nepřijímat k archivaci publikace v EPUBu, které obsahují pokročilejší typografické prvky a layout (např. vědecké a technické dokumenty, které obsahují specialni znaky, matematické rovnice apod.).


Johan slibuje další testování nástrojů pro validaci a extrakci technických metadat, a další analýzy. Vzhledem k probíhajícím projektům v ČR, které se týkají e-knih, je tohle velmi aktuální téma, kterému bude třeba se věnovat i u nás.