čtvrtek 27. prosince 2012

Poznámky z konference Culture Heritage online

https://duha.mzk.cz/blog/konference-cultural-heritage-online-data-seal-approval

Na blogu P. Švástové v časopise Duha MZK se objevil příspěvek o konferenci CULTURAL HERITAGE on line a předcházející akci k Data Seal of Approval. 

středa 19. prosince 2012

Hodí se epub k dlouhodobé archivaci?

Jedním ze základních předpokladů formátu vhodného pro dlouhodobou archivaci je dostupnost kvalitních validátorů, (vedle dalších věcí jako jsou standardizace, rozšířenost, podpora SW, metadat atd. k tomu viz nedávný příspěvek na tomto blogu). V praxi nemusí být vždy jednoduché rozhodnout, co je validní  nebo nevalidní. Který soubor bychom měli pustit do dlouhodobého archivu, a který má už vlastnosti, jež ohrozí trvalou dostupnost uloženého obsahu?

Na příkladě born digital dokumentů si ukážeme, jak velkou roli mohou hrát právě validátory. Použili jsme soubor 595 dokumentů ve formátu epub z různých zdrojů, část je v českém jazyce z volných zdrojů a část je v cizích jazycích. Tento soubor jsme identifikovali DROIDem verze 6.01, signature files v 65. Pak jsme zkusili dva nejrozšířenější validátory, Epubcheck a Flightcrew v posledních verzích. S obvyklými nástroji jako je Jhove tady moc nepořídíme, Jhove označuje všechny epuby za bytestreamy a pokud je tedy nerozbalíme, a nevalidujeme jejich obsah samostatně, nemá jeho použití moc smysl.

A co jsme se dozvěděli?

neděle 16. prosince 2012

Co nového přináší PDF/A-3 a jak to ovlivní dlouhodobou ochranu digitálních dat?

Butch Lazorchak před dvěma měsíci publikoval na svém blogu http://blogs.loc.gov/digitalpreservation/2012/11/all-in-embedded-files-in-pdfa/ zajímavý článek shrnující nový formát PDF/A-3. Krátce vysvětluje jeho podstatu a implikace pro dlouhodobou ochranu. Jádrem debaty je schopnost nového formátu vložit jakýkoliv jiný soubor v jakémkoliv formátu, tedy např. MS Excel tabulku, video apod. Tento objekt by měl být zobrazitelný a pokud uživatel má odpovídající softwarovou aplikaci, tak také editovatelný. Zajímavá je i debata pod samotným blogem.

čtvrtek 13. prosince 2012

PDF/A v praxi v Národní lékařské knihovně

Zajímavý článek z českého projektu, kde se testovaly různé nástroje pro konverzi PDF dokumentů do PDF/A od Filipa Kříže a spol. z NLK je zde:

http://sites-final.uclouvain.be/EAHIL2012/conference/?q=node/984

Primárně asi pracovali s e-born daty, takže pro mnohé instituce, které dnes mají v repozitářích vysokoškolské kvalifikační práce v různých verzích PDF, je tohle určitě velmi cenný test.


středa 12. prosince 2012

Jaké vlastnosti má vlastně mít otevřený datový formát, aby se hodil pro dlouhodobou ochranu?


V odborném časopise Information technology and libraries vyšla zajímavá studie Examining Attributes of Open Standard File Formats for Long-term Preservation and Open Access (autoři Eun G Park a Sam Oh).
Velmi čtivou formou zkoumá a popisuje vlastnosti tzv. open standard formátů, které jsou považovány právě pro svoji otevřenost za vhodné pro dlouhodobou ochranu. Autoři rozebírají v úvodu předchozí podobné analýzy kritérií, které různí autoři a instituce aplikovali při výběru vhodných datových formátů pro dlouhodobou ochranu svých dat. Na konci je přehledná tabulka s kompilací jednotlivých kritérií a vlastností tzv. otevřených formátů. Ukázalo se, že nejčastější kritéria mohou být rozdělena do 5 kategorií: funkcionalita, metadata, otevřenost, interoperabilita a nezávislost. Doplňková kritéria jsou zobrazení, autenticita, rozšířenost použití a další.



pondělí 10. prosince 2012

Odhady nákladů na dlouhodobou ochranu digitálních informací

V oblasti měření nebo odhadu nákladů na dlouhodobou archivaci digitálních informací vznikla v posledních letech řada modelů. Na tomto blogu jsme informovali například o projektu California Digital Library,  projektu Life nebo o projektu Královské knihovny v Dánsku.

Pěkný seznam projektů a článků z téhle oblasti teď vzniká na wiki Open Planets Foundation.
http://wiki.opf-labs.org/display/CDP/Home