pátek 29. června 2012

Digital Preservation na Stack Exchange - vyjádřete svou podporu

Na Stack Exchange se formuje nová stránka otázek a odpovědí na téma Digital Preservation. Momentálně se nachází ve fázi rekrutování dostatečně velké komunity potenciálních aktivních uživatelů, kteří mají zájem aktivně přispívat k vytváření obsahu formou kladení a zodpovídání dotazů. To je podmínkou pro spuštění stránky. Pokud se takovou komunitu podaří vybudovat, může jít o potenicálně velmi zajímavou znalostní bázi pro oblast dlouhodobého digitálního uchování. Pokud máte zájem podpořit tento projekt, klikněte na obrázek.


Stack Exchange Q&A site proposal: Digital Preservation

pondělí 25. června 2012

EPUB jako formát pro dlouhodobou ochranu

Jedna novinka z Openplanetsfoundation: Studie z KB o formátu EPUB z pohledu dlouhodobé ochrany digitálních dat.
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation18062012ExternalDistribution_0.pdf
resp.:
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation20072012ExternalDistribution.pdf
Text se zabývá současnými možnostmi identifikace a validace tohoto formátu, rozdíli mezi verzí 2 a 3, a nakonec obsahuje i nějaké základní doporučení pro dlouhodobou ochranu. Autorem studie je opět Johan van der Knijff, text není součástí výstupů projektu SCAPE, ale je skutečně jen paperem vydaným KB. 
Zatím jsou Johanova doporučení jasná: 
1) Nepřijímat EPUB jako archivní formát, dokud se formát více nerozšíří a dokud nebude lepší podpora v prohlížečích.
2) Nepřijímat k archivaci dokumenty v EPUBu, které jsou opatřeny DRM.
3) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují zdroje, jež nejsou na seznamu Core media types (tzv. foreign resources) .
4)  Nepřijímat k archivaci dokumenty v EPUBu, které obsahují remote resources.
5) Dávat pozor na EPUB dokumenty, které obsahují javascript resources.
6) Vyhnout se DTBook obsahu.
7) K verifikaci shody EPUBu se specifikací používat Epubcheck
8) Prozatím nepřijímat k archivaci publikace v EPUBu, které obsahují pokročilejší typografické prvky a layout (např. vědecké a technické dokumenty, které obsahují specialni znaky, matematické rovnice apod.).


Johan slibuje další testování nástrojů pro validaci a extrakci technických metadat, a další analýzy. Vzhledem k probíhajícím projektům v ČR, které se týkají e-knih, je tohle velmi aktuální téma, kterému bude třeba se věnovat i u nás.

pondělí 18. června 2012

Zajímavé články: ontologie pro digital preservation



McHugh, A. (2012) A model for digital preservation repository risk relationships. In: World Library and Information Congress: 78th IFLA General Conference and Assembly, 11-17 Aug 2012, Helsinki, Finland.
http://eprints.gla.ac.uk/65420/

A analýza limitů v oblasti dlouhodobé ochrany: hlavním limitem není podle autora už technologie, ale jsou jím finance. Objem digitálních informací, který bychom mohli chtít dlouhodobě ochraňovat stále dramaticky roste, ovšem finance dostupné na tuto činnosti nerostou podle autora zdaleka dostatečně.
https://escholarship.bc.edu/ojs/index.php/ital/article/view/2167/pdf

pondělí 11. června 2012

Potřebné znalosti a zkušenosti pro "digital preservation"

Jedním z prvních výstupů evropského projektu DigCurV (Digital Curator Vocational Education) je analýza potřeb školení v této oblasti a také analýza znalostí a zkušeností, které pracovníci mají mít. Dotazníky vyplnilo více než 400 knihoven a archivů ze 44 zemí světa. 
Na stránkách 33-59 studie [zde] naleznete, jaké znalosti tyto instituce u svých pracovníků preferují.

Náklady na "digital preservation" a projekt dánského národního archivu a královské knihovny

Královská knihovna a národní archiv v Dánsku publikovaly výsledky několikaletého výzkumu v oblasti nákladů na uložení, ochranu digitálních dat. Jejich projekt Cost Model for Digital Preservation (CMDP) začal v roce 2009 na základě předchozích aktivit a pokračuje dodnes. Nástroj ve formě excelové tabulky [zde] je neustále doplňován a vyvíjen. Pokrývá OAIS moduly "Preservation planning", "Archival Storage", "Ingest" a částečně "Administration". Ke všemu je dostupná dokumentace.

čtvrtek 7. června 2012

Pravěk, aneb kde jsou ta data dnes?

Někdy je dobré se ohlédnout. Doufejme, že za 40 let bude na naši dobu pohled lepší a data z našich dnešních systémů a archivů budou dostupná a použitelná.

K tomu pohledu zpět nám můžou pomoci nejen zahraniční weby a instituce (http://www.vintage-computer.comhttp://www.computerhistory.org nebo http://www.oldcomputers.net/) ale také řada zajímavých česky psaných a na lokální informace bohatších zdrojů. Přece jen o SAPO, Uralu, Minsku a TNS se v anglických zdrojích moc nepíše.

Moc hezky udělaný web z jedné diplomky je tady:
http://www.historiepocitacu.cz
Ledacos zajímavého je k viděni tady:
http://www.kormus.cz/mvt/
Dokonce máme u nás i HW muzeum:
http://technodrom.cz/index.html
A další zajímavé odkazy k tomuto tématu:
http://sen.felk.cvut.cz/sen/index_cz.html?historie/gen2.html
http://extrahardware.cnews.cz/historie-pocitacu-i-pocitacovy-pravek a dalších 9 pokračování
http://www.vesmir.cz/clanek/pocatky-pocitacove-techniky-nebyly-jednoduche

Poslední odkaz není na HW, ale přece jen si ho v tomto kontextu nedopustím. Je to bestseller loňského roku, kniha Jamese Gleicka "The Information: A History, A Theory, A Flood."

A trocha atmosféry 80tých let: