středa 29. března 2017

Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?

Ve středu 29. března 2017 od 10 do 12:30 hod se v kinosále NA konala akce nazvaná docela vtipně "Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?"

Po prezentacích pánů z Národního digitálního archivu představily svoje projekty v oblasti elektronických dokumentů čtyři specializované archivy (UK, ČRO, ČTV, NFA)

Zdaleka nejzajímavější pro mě byly úvodní prezentace o stavu projektu NDA a Národním archivním portálu. Prezentace, které by měly zaznít v podobném rozsahu i na konferenci ISSS 2017 přístí týden přednesli pan Bernas (Současný stav a střednědobá perspektiva Národního digitálního archivu) a Stodůlka (Výběr archiválií prostřednictvím Národního archivního portálu) a doplnila je informace o nové verzi standardu NSESSS od pana Kunta (Informace o novele národního standardu elektronických systémů spisové služby)

Z prezentace pana Bernase jsme se mimo jiné dozvěděli, že v ostrém prostředí Národního digitálního archivu jsou dnes uložena data z 9 skartačních řízení (5 přejímek). Řešení NDA je složeno ze systému Archivematica a modulů vyvinutých kolem. Prezentace obsahovala i praktické reflexe z provozu NDA od roku 2015:
  • Největším kamenem úrazu jsou SIP balíčky, jejich kvalita. 
  • Proto NDA poskytuje validátory SIP a PDF/A. 
  • V současnosti systémy NDA nejsou moc robustní a bude se na nich pracovat dále v projektu NDA II. Moduly vyvinuté vlastními silami NA budou dále upraveny dodavatelem. 
  • Byla zmíněna potřeba sladit aplikační rozhraní jednotlivých modulů, webové služby. Systém je záměrně budován z menších částí, aby se lépe udržoval, ale to předpokládá koordinaci rozhraní. 
  • Strojové rozhraní bude mít i modul přístup. 
  • V rámci NDA II budou vylepšeny možnosti autentizace. 
  • Skartační řízení - dlouhodobým cílem je zjednodušení procesů. 
  • Bezpečnost je pro NDA velmi důležitá, produkční systém je fyzicky oddělený, NDA je významný informační systémy ve smyslu zákona o kybernetické bezpečnosti, bude auditován z hlediska informační bezpečnosti (vedle ISO 16363 a dalších) .
Provozní zkušenosti:
  • kolísavá kvalita SIPů, chyby 
  •  chyby v zachycení struktury spisu a ve spisovém plánu, při tvorbě SIPu 
  • dokumenty předstírající něco, co nejsou (doc tváři se jako pdf/a) 
  • formální plnění - jen proto, aby tam něco bylo - například mimetype 
  • chybějící údaje od původce - které jistě původce zná (název, ičo) 
  • deklarace nepotřebných názvových prostorů 
  • NDA neposkytuje template pro SIP – vstupy jsou variabilní – možnosti plnění jsou velké, ale původci stejně dělají chyby 
V celém tom povídání o SIPech se nějak ztratilo, že předmětem ochrany OAIS archivu je balíček AIP – o tom jak vypadá AIP NDA jsme se nedozvěděli nic, tak snad se to dozvědí alespoň auditoři, kteří budou hodnotit soulad NDA s ISO 16363... 

Archiv na národní úrovni, který chce působit jako důvěryhodný, by měl zcela transparentně komunikovat o svých postupech zajištění dlouhodobého uchovávání (a ne jen říct, že se něco někam migruje) a o tom, jak vypadá jeho AIP.
Přitom NDA tak trochu odrazuje zájemce z dalších archivů od budování vlastního digitálního archivu (tj. archivu s oprávněním ukládat digitální data ve smyslu zákona), říkají:
  • nemá smysl budovat digitální archiv za každou cenu, z prestižních důvodu, jen proto, abychom ho měli! 
  • soustředit se raději na spisovou službu a uložit data v NDA 
  • postupy LTP vyzkoušet nejprve na digitalizátech 
  • teprve až když jsou zkušenosti přejit k digitální archivaci - menší riziko
V další prezentaci pan Stodůlka shrnul funkce národního archivního portálu v oblasti předarchivního zpracování,  příjmu a skartace. Zajímavá byla informace, že ve státních archivech bylo k dnešku proškoleno k používání portálu 100 lidí (online + prezenční školení) a Národní archiv také vyškolil pro jednotlivé regiony metodiky pro digitální archivací, kteří jsou k dispozici i specializovaným archivům.

úterý 28. března 2017

Dokument "Understanding PREMIS" v nové updatované verzi

Známý úvod do metadatového formátu PREMIS od Priscilly Caplan byl vydán v nové aktualizované verzi. Nová verze reflektuje poslední změny a úpravy PREMISu. Originální verze dokumentu vznikla v roce 2009, aktualizace tedy již byla nutná.

Dostupné na

středa 22. března 2017

Uvolněná nová verze JHOVE - 1.16

OPF (Open Preservation Foundation) vydalo novou verzi open source identifikátoru formátů JHOVE 1.16, podrobnější informace v tiskové zprávě.

Nová verze kromě oprav nabízí i lepší zpracování souborů v PDF a WAV modulech. V British Library byl JHOVE pro validaci PDF otestován, zde jsou výsledky.

pátek 17. března 2017

Archivematica 1.6

https://groups.google.com/forum/#!msg/archivematica/AVP4ARbomA4/SbaGxXaGBgAJ

Novinky: Appraisal/Arrangement tab, ArchivesSpace integration, Improvements to transfer backlog management,Full AIP re-ingest and AIP re-ingest improvements, DIP upload to AtoM improvements, Support multiple checksum algorithms, a další...

Guetzli: Perceptually Guided JPEG Encoder

https://arxiv.org/pdf/1703.04421.pdf

Guetzli: Perceptually Guided JPEG Encoder
J. Alakuijala, R. Obryk∗ , O. Stoliarchuk, Z. Szabadka, L. Vandevenne, and J. Wassenberg
Google Research Europe
March 14, 2017

Guetzli is a new JPEG encoder that aims to produce visually indistinguishable images at a lower bit-rate than other common JPEG encoders. It optimizes both the JPEG global quantization tables and the DCT coefficient values in each JPEG block using a closed-loop optimizer. Guetzli uses Butteraugli [1], our perceptual distance metric, as the source of feedback in its optimization process. We reach a 29-45% reduction in data size for a given perceptual distance, according to Butteraugli, in comparison to other compressors we tried. Guetzli’s computation is currently extremely slow, which limits its applicability to compressing static content and serving as a proof- of-concept that we can achieve significant reductions in size by combining advanced psychovisual models with lossy compression techniques

Storage pro dlouhodobou archivaci

Tohle je opravdu moc pěkný článek na blogu Davida Rosenthala.
http://blog.dshr.org/2016/12/the-medium-term-prospects-for-long-term.html

čtvrtek 16. března 2017