pátek 19. října 2018

Oxford Common File Layout Specification 0.1

Hodně zajímavá aktivita směřující ke specifikaci toho, jak by měla být pro dlouhodobé ukládání strukturována data a metadata na úložišti tak, aby se dala použít v budoucnu v novém repozitáři.

A key goal of OCFL is the rebuildability of a repository from an OCFL storage root without additional information resources. Consequently, a key implementation consideration should be to ensure that OCFL objects contain all the data and metadata required to achieve this. With reference to the OAIS model, this would include all the descriptive, administrative, structural, representation, and preservation metadata relevant to the object.

Draft specifikace je zde: https://ocfl.io/0.1/spec/

středa 30. května 2018

Archives in Digital Age (AiDA) 2018 v NA ČR - krátké shrnutí

10. a 11. května 2018 se v Národním archivu ČR uskutečnil Seminář Archives in Digital Age (AiDA) 2018. Šlo již o třetí ročník akce a tentokrát byl seminář tematicky zaměřen na audit a certifikaci digitálních repozitářů. Jedním z pozitiv akce bylo i propojení archivářské a knihovnické komunity kolem digitálních repozitářů. I když byli archiváři zastoupeni rozhodně početněji, tak knihovny zde měly své zástupce alespoň z NK ČR a MZK. 

Nejpřínosnější byly rozhodně příspěvky Christiana Keitela ze State Archives Baden-Württemberg, který je členem německého sdružení nestor. Toto sdružení vypracovalo normu DIN 31644, která se v Německu používá pro certifikaci důvěryhodných digitálních repozitářů (ať už jsou tyto repozitáře v knihovnách, archivech, nebo jiných paměťových institucích). Zkušenosti Christiana Keitela z vývoje této normy a z průběhu auditů se ukázaly jako velmi poučné a cenné. I když norma DIN 31644 reflektuje německé prostředí, tak díky silnému napojení kolegů z Národního archivu na Německo se zde rýsuje možnost spolupráce a přenesení této normy do českého (alespoň archivního) prostředí. Národní archiv ČR má nyní v plánu přeložit „Explanatory Notes on the nestor Seal for Trustworthy Digital Archives“. To by mohlo být velmi přínosné, protože norma DIN 31644 není tak komplikovaná jako mezinárodní ISO 16 363, ale poskytuje potřebnou certifikaci důvěryhodného digitálního repozitáře. Norma DIN 31644 by se teoreticky mohla stát náhradou auditu nebo dokonce certifikace podle ISO 16 363 v českém prostředí.

Zdeněk Vašek z Archivu Univerzity Karlovy ve své prezentaci shrnul přínosy certifikace a stav v ČR – zajímavé je, že dva ze tří repozitářů, které získaly Data Seal of Approval (DSA), si po vypršení certifikaci neobnovily. Nejspíš je to způsobené tím, že v původním projektu byly finance na přípravu dokumentace a absolvování certifikace, ale poté už se na re-certifikaci zdroje nenašly. V prezentaci byly také zmíněny zajímavé poznámky k situaci v ČR – o certifikaci se hodně mluví, norma DSA je tu hodné populární (viz dva překlady z let 2013 a 2016) a všichni si přínosy certifikace uvědomují, ale prakticky nikdo nepracuje na certifikaci svého digitálního repozitáře. Autor to připisuje náročnosti certifikace na čas a zaměstnance, roztříštěnosti komunity a tomu, že v našem prostředí nepanuje shoda na jednom standardu. V tomto ohledu bude důležité sledovat postoj Národní knihovny ČR, která má jako jediná z knihoven v ČR LTP úložiště. Plány Národní knihovny ČR na certifikaci svého LTP úložiště podle některé z norem důvěryhodnosti digitálních repozitářů jsou už několik let známy, mluvilo se o hodnocení podle DSA (nyní CoreTrustSeal), po kterém by mohl následovat (interní) audit dle ISO 16 363.

Zdeněk Hruška mluvil o důležitosti stanovování nákladů v digitální repozitářích a o nástrojích LIFE3 a KRDS2, které ke kalkulaci nákladů slouží. Dlouhodobé financování a schopnost repozitáře vytvářet rozpočtové alternativy jsou z hlediska důvěryhodnosti klíčové (viz norma ISO 363, kapitola 3.4 Economical Sustainability). Nákladové modely podporují tyto schopnosti, stejně jako schopnost činit rozhodnutí na základě stanovení různých rozpočtových možností. I když je využití některého z nákladových modelů náročné (na čas a lidské zdroje), tak přínosy jsou jasně patrné. Konec konců i interní audit podle některé z norem pro důvěryhodné repozitáře je nákladný na zdroje, ale přínosy jsou neoddiskutovatelné.

Zoltán Lux z  Hungarian National Archives představil jiný pohled na certifikaci digitálních repozitářů, protože maďarský repozitář nemá certifikaci podle mezinárodních norem pro důvěryhodné repozitáře, ale v tuto chvíli se snaží vyhovět pouze národní legislativě a požadavkům na IT zabezpečení. V Maďarsku jdou cestou důrazu na risk management, aby vynaložené zdroje nepřevážily případnou vzniklou škodu. Zajímavé bylo, že po příspěvcích ostatních přednášejících přiznal pan Lux, že budou muset začít přemýšlet i o certifikaci dle mezinárodně uznávaných norem, jako jen CoreTrustSeal, nestor seal, nebo ISO 16 363. Zdá se, že osvěta a setkání na mezinárodní úrovni mají svůj smysl a výměna zkušeností je pro rozvoj komunity klíčová.

Katarína Tomková z Centrálneho Dátového Archívu (CDA) představila cíle projektu i zkušenosti s auditem v minulosti stejně jako plány do budoucna. Vzhledem k tomu, že povinnost auditu byla pro repozitář zakotvena v samotném projektu, tak CDA prošel externím „pre-certifikačním“ auditem dle normy ISO 16 363 v roce 2014 a také získal certifikaci podle normy ISO 27 001. Plány byly rovněž na certifikaci dle DSA, ale vzhledem k tomu, že z této normy se stala norma CoreTrustSeal, tak nyní repozitář CDA vyčkává s dalšími kroky.  

čtvrtek 17. května 2018

2047!

https://www.novinky.cz/domaci/468997-narodni-knihovna-prechazi-do-digitalniho-veku-cekaji-ji-desitky-let-skenovani.html

Národní knihovna přechází do digitálního věku, čekají ji desítky let skenování

Převedení celkem 310 miliónů stran různých knižních a novinových titulů do digitální podoby. To je cíl Národní knihovny, která s tímto projektem začala již před několika lety. Do roku 2047 chce naskenovat přes 300 miliónů stránek. Nahlédli jsme do samotného centra veškerého skenování a podívali se, jakým procesem jednotlivé knihy musí projít.


Jen otazka, jestli budeme jeste knihy potrebovat v roce 2047:-)


středa 28. března 2018

Kongres FIAF v Praze - Symposium: Sharing - 23.-24. dubna 2018

Narodní filmový archiv pořádá v Praze v týdnu od 23. dubna kongres FIAF. Program je velmi rozsáhlý, a najdou se tam i příspěvky zajímavé z hlediska dlouhodobého uchovávání auidiovizuálních dokumentů v digitální podobě.

Více informací především v části Symposia Sharing na webu kongresu http://fiaf2018.nfa.cz/

Zájemci o účast z řad místní odborné veřejnosti se mohou obrátit na koordinátora symposia (matej.strnad@nfa.cz)

Seminář Archives in Digital Age (AiDA) 10. a 11. května 2018 - certifikace a audit

Národní archiv pořádá ve dnech 10. a 11. května 2018 další workshop z řady Archives in Digital Age (AiDA), tentokrát zaměřený na problematiku certifikace a auditu digitálních repozitářů a digitálních
archivů. Pozvání přijal Christian Keitel ze zemského archivu Bádenska-Württemberska, přední odborník v této oblasti, který se mj. podílel na přípravě DIN 31644 a disponuje zkušenostmi z průběhu certifikace knihoven a archivů dle této normy (nestor-Siegel) v německy mluvících zemích. Své zkušenosti z této oblasti představí zástupce Univerzitní knihovny v Bratislavě a pohled z Maďarska zprostředkuje Zoltán Lux, vedoucí digitálního archivu Maďarského národního archivu. Diskuse nad dosavadní praxí v českém prostředí by měla zahrnout jak oblast knihoven, tak i archivů.

Vzhledem k omezené kapacitě a diskusnímu charakteru setkání prosíme o registraci, případně o přihlášení příslušných pracovníků z Vašeho pracoviště do 18. dubna 2018
zde:http://web.nacr.cz/konference/prihlaska.aspx?konf=AIDA. Potvrzení
o účasti se zobrazí na obrazovce, e-mailem se nezasílá.


Předběžný program:

Archives in Digital Age
Self-Audit and Certification of Digital Archives
in Central European Perspective

Národní archiv, Archivní 2257/4, Praha 4 – Chodovec (Lecture Room)
Th 10. 5. 2018
10:00-10:30 Registration, coffee
10:30-10:40 Opening speech

Eva Drašarová, Director-General of National Archives Prague
Block A: Possibilities for Self-Audit and Certification of Digital Archives
10:45-13:00 DIN 31644 and Explanatory Notes on the nestor Seal for Trustworthy Digital Archives

Christian Keitel, State Archives Baden-Württemberg

13:00-13:45 Snack break
13:45-14:30 Translation of Explanatory Notes on the nestor Seal for Trustworthy Digital Archives
and Possibilities for Accreditation of Digital Archives in the Czech Republic
Zbyšek Stodůlka, Milan Vojáček, National Archives Prague

14:30-15:15 Certification of the Digital Repositories in the Czech Republic, Current Situation and

Perspectives
Zdeněk Vašek, Charles University Archives Prague

15:15-16:00 Discussion

Fr 11. 5. 2018
Block B: Practical experiences with Audit and Certification of Digital Archives
9:00-9:45 Certification of Digital Archive in Perspective of Hungarian National Archives

Zoltán Lux, Hungarian National Archives

9:45-10:30 Certification by Data Seal of Approval and Audit by ISO 16363
The University Library in Bratislava - Central Data Archive

10:30-11:00 Coffee break
11:00-12:00 nestor Seal – Practical Experience

Christian Keitel, State Archives Baden-Württemberg

12:00-12:30 Summary

úterý 20. února 2018

Hodnocení souborových formátů z pohledu digitální archivace

Na webu jsou dostupné dva zajímavé a průběžně aktualizované zdroje věnující se hodnocení souborových formátů pro dlouhodobé uchovávání:

1. British Library

http://wiki.dpconline.org/index.php?title=File_Formats_Assessments
Britská knihovna provádí postupně hodnocení formátů (File formats assessments) a výsledné zprávy zveřejňuje. Zprávy mívají stejnou strukturu, sleduje se vývojový stav formátu, rozšíření v paměťové komunitě, softwarová podpora (včetně nástrojů pro digitální archivaci), dostupnost dokumentace, existující patenty, rizika pro dlouhodobou archivaci. Na závěr jsou formulována doporučení týkající se použití formátu příp. dalšího vývoje.
Hodnoceny byly například formáty TIFF, JPEG2000, EPUB, PDF, MOBI, WAVE, FLAC apod. Formáty průběžně přibývají.

2. KOST-CECO

Jedná se o švýcarskou skupinu expertů, jejichž cílem je podpora archivů při archivaci digitálních dokumentů, mimo jiné se podílí na specifikaci archivní verze formátu TIFF a vytvořily minimálně dva nástroje zajímavé pro digitální archivaci- KOST-Val a KOST-Simy.

Na webu https://kost-ceco.ch/wiki/whelp/KaD/index.php?ld=https://kost-ceco.ch/wiki/whelp/KaD/pages/KaD.html  skupina zpřístupnila své hodnocení formátů. Hodnotí je dle následujících kritérií: existence a dostupnost dokumentace, existence patentů, rozšíření, funkčnost, softwarová podpora, validovatelnost, existence best practice s tímto formátem, perspektiva formátu. Podle těchto kritérií je formát bodově ohodnocen (čím vyšší tím lepší, maximem jsou zřejmě 4 body), body jsou přepočítány a výsledkem je tabulka srovnávající formáty:
https://kost-ceco.ch/wiki/whelp/KaD/index.php?ld=https://kost-ceco.ch/wiki/whelp/KaD/pages/Bewertungsmatrix.html
Zeleně označené (v dolním řádku) jsou formáty vhodné pro archivaci, červeně označené jsou nevhodné pro archivaci. Například pro obrazová data je nyní zřejmě na prvním místě formát JPEG2000 (v listopadu 2017 byl ještě na druhém místě za formáty TIFF a PDF/A-2)

Hodnocení a tabulka jsou průběžně aktualizovány, naposledy v prosinci 2017.

pátek 1. prosince 2017

Nové verze (a hned dvě)

Od včerejška je dostupný JHOVE ve verzi 1.18. Za zmínku stojí asi hlavně přidání validace ICC profilů do JPEG modulu.
Release notes: https://github.com/openpreserve/jhove/releases/latest.
Download JHOVE 1.18: http://software.openpreservation.org/rel/jhove-latest.jar.

K oslavě mezinárodního dne digital preservation se přidala i VeraPDF, která přišla s verzí 1.10. Bude to chtít trochu testování, ale zdá se mi, že se pustili do řešení několika velice nepříjemných potíží v oblasti validace unicode.

Release notes: https://github.com/veraPDF/veraPDF-library/releases/latest.
Download veraPDF:  http://downloads.verapdf.org/rel/verapdf-installer.zip.

středa 1. listopadu 2017

zajímavý nástroj: isolyzer

https://github.com/KBNLresearch/isolyzer/

Isolyzer verifies if the file size of a CD / DVD image ("ISO image") is consistent with the information in its filesystem-level headers. The following file systems are supported:
ISO 9660
Universal Disk Format (UDF)
Apple Hierarchical File System (HFS)
Apple HFS+
Hybrids of the above file systems, e.g. ISO 9660 + HFS; UDF Bridge (UDF + ISO 9660)

Isolyzer uses the information in the filesystem-level headers to calculate the expected file size (typically based on a block size field and a number of blocks field). This is then compared against the actual file size, which can be useful for detecting incomplete (e.g. truncated) ISO images. Isolyzer also extracts and reports some technical metadata from the filesystem-level headers.

30.11. 2017 International Digital Preservation Day!

čtvrtek 21. září 2017

CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov

Na programu (http://cda.kultury.sk/sk/program) jsou tři příspěvky z projektu NDK, což je určitě jeden z důvodů proč konferenci navštívit. Zajímavý by mohl být také příspěvěk o projektu Elektronický archív Slovenska, o kterém se toho tak moc neví. 

Konefernce je zaměřená na velké národní projekty, akdemické instituce s výjimkou KNAV tady nepřednášejí. Škoda, že se nedozvíme nic o českém projektu NDA a aktivitách českých archivů...

registrace: http://cda.kultury.sk/sk/node/249
9.11.2017,  Univerzitná knižnica v Bratislave, Centrálny dátový archív
Miesto konania: Prednášková sála UKB, Ventúrska 11, Bratislava