pátek 27. dubna 2012

Propagační video z KB.NL k dlouhodobé ochraně digitálních dat


Pěkné je, že mluví o "sustainable digital preservation." Jak asi vypadá nebo bude vypadat nový E-Depot?

středa 18. dubna 2012

úterý 17. dubna 2012

Dlouhodobá ochrana digitálních dat na LTO 4 - Family Search

Pěkná praktická ukázka archivace velkého objemu dat na páskových mediích. Pánové z https://www.familysearch.org/ ukládájí 10TB dat denně, mají 400milionů losless JP2 souborů ve dvou kopiích, 6800 pásek LTO 4, 2,6 PB dat na discích pro zpřístupnění s lossy JP2.

Jejich Digital preservation system (SDB) management páskového úložiště nijak neřeší. Pro správu dat na páskách a správu pásek mají jiný systém, který je zcela oddělený od preservation systému. To umožňuje k systému pro management pásek připojit jiný preservation system.

Zajímavé je povídání o tom, jak reálně provádějí ukládání na pásky (do not RAID accross the tapes, ukládají 2MB bloky v Mime Packege Files, collections společně, fixity kontrolují pro soubory, ale i pro logické jednotky). Jejich LTP systém ukládá logická AIP.

https://lib.stanford.edu/files/pasig-jan2012/12B2%20Jason_Pierson_PASIG_2012.pdf
http://www.savingthedigitalworld.org/pasig/mp4/12B2.mp4

čtvrtek 12. dubna 2012

http://www.bitcurator.net/

http://www.bitcurator.net/
Možná zajímavý a užitečný projekt. I u nás mají instituce svoje "šuplíkové sbírky" z minulých let na všemožných nosičích a ve všelijaké kvalitě. Když už se přihodilo to, že jejich dlouhodobou ochranu nikdo neplánoval, můžeme se snažit vytěžit maximum z těch bitů, které nám zbyly:-)

Cílem projektu Bitcurator je analyzovat a otestovat, co všechno umí různé volně dostupné nástroje pro digital forensics.

Hezký poster:
http://www.bitcurator.net/wp-content/uploads/2011/12/idcc-2011-poster-v6.pdf

úterý 3. dubna 2012

Zabavná hra na prodloužený velikonoční víkend - CURATE: The Digital Curator Game

Hra CURATE je určena pro zábavu, která zavede hráče do situací, kterým by čelili jako kurátoři digitálních sbírek. Hráči musí řešit problémy vyplývající z praxe dlouhodobé ochrany digitálních dat a digital curation vůbec. Ke stažení hry je potřebná registrace, hra je zdarma.

pondělí 2. dubna 2012

Náklady na dlouhodobou ochranu digitálních dat - Cost model z CDL

Kolik stojí archivace digitálních dat? Co všechno bychom měli do ceny započítat? Jak je nejvýhodnější pro danou instituci dlouhodobou archivaci financovat?

Abrams, Kunze a Cruse počítají se dvěma modely financování dlouhodobého archivu - pay-as-you-go a paid up. Tj. průběžný nebo předplacený systém. Do celkových nákladů na dlouhodobou archivaci započítávají náklady na systém, služby, servery, zaměstnance,  dodavatele dat, workflow, typy obsahu, storage, monitoring, zásahy údržby.
Takhle vyjmenované vypadají možná jednotlivé kategorie trochu nejasně. "Typy obsahu" se například myslí náklady na analýzu, plánování a pořízení softwaru potřebného pro zpracování určitého typu dat. Náklady na "dodavatele dat" se tady myslí náklady na analýzu a implementaci procesů pro jednotlivé dodavatele dat, na zajištění podpory při vkládání dat, školení atd.

Total Cost of Preservation (TCP): Cost Modeling for Sustainable Services

Stephen Abrams, Patricia Cruse, John Kunze

http://wiki.ucop.edu/display/Curation/Cost+Modeling