středa 30. května 2018

Archives in Digital Age (AiDA) 2018 v NA ČR - krátké shrnutí

10. a 11. května 2018 se v Národním archivu ČR uskutečnil Seminář Archives in Digital Age (AiDA) 2018. Šlo již o třetí ročník akce a tentokrát byl seminář tematicky zaměřen na audit a certifikaci digitálních repozitářů. Jedním z pozitiv akce bylo i propojení archivářské a knihovnické komunity kolem digitálních repozitářů. I když byli archiváři zastoupeni rozhodně početněji, tak knihovny zde měly své zástupce alespoň z NK ČR a MZK. 

Nejpřínosnější byly rozhodně příspěvky Christiana Keitela ze State Archives Baden-Württemberg, který je členem německého sdružení nestor. Toto sdružení vypracovalo normu DIN 31644, která se v Německu používá pro certifikaci důvěryhodných digitálních repozitářů (ať už jsou tyto repozitáře v knihovnách, archivech, nebo jiných paměťových institucích). Zkušenosti Christiana Keitela z vývoje této normy a z průběhu auditů se ukázaly jako velmi poučné a cenné. I když norma DIN 31644 reflektuje německé prostředí, tak díky silnému napojení kolegů z Národního archivu na Německo se zde rýsuje možnost spolupráce a přenesení této normy do českého (alespoň archivního) prostředí. Národní archiv ČR má nyní v plánu přeložit „Explanatory Notes on the nestor Seal for Trustworthy Digital Archives“. To by mohlo být velmi přínosné, protože norma DIN 31644 není tak komplikovaná jako mezinárodní ISO 16 363, ale poskytuje potřebnou certifikaci důvěryhodného digitálního repozitáře. Norma DIN 31644 by se teoreticky mohla stát náhradou auditu nebo dokonce certifikace podle ISO 16 363 v českém prostředí.

Zdeněk Vašek z Archivu Univerzity Karlovy ve své prezentaci shrnul přínosy certifikace a stav v ČR – zajímavé je, že dva ze tří repozitářů, které získaly Data Seal of Approval (DSA), si po vypršení certifikaci neobnovily. Nejspíš je to způsobené tím, že v původním projektu byly finance na přípravu dokumentace a absolvování certifikace, ale poté už se na re-certifikaci zdroje nenašly. V prezentaci byly také zmíněny zajímavé poznámky k situaci v ČR – o certifikaci se hodně mluví, norma DSA je tu hodné populární (viz dva překlady z let 2013 a 2016) a všichni si přínosy certifikace uvědomují, ale prakticky nikdo nepracuje na certifikaci svého digitálního repozitáře. Autor to připisuje náročnosti certifikace na čas a zaměstnance, roztříštěnosti komunity a tomu, že v našem prostředí nepanuje shoda na jednom standardu. V tomto ohledu bude důležité sledovat postoj Národní knihovny ČR, která má jako jediná z knihoven v ČR LTP úložiště. Plány Národní knihovny ČR na certifikaci svého LTP úložiště podle některé z norem důvěryhodnosti digitálních repozitářů jsou už několik let známy, mluvilo se o hodnocení podle DSA (nyní CoreTrustSeal), po kterém by mohl následovat (interní) audit dle ISO 16 363.

Zdeněk Hruška mluvil o důležitosti stanovování nákladů v digitální repozitářích a o nástrojích LIFE3 a KRDS2, které ke kalkulaci nákladů slouží. Dlouhodobé financování a schopnost repozitáře vytvářet rozpočtové alternativy jsou z hlediska důvěryhodnosti klíčové (viz norma ISO 363, kapitola 3.4 Economical Sustainability). Nákladové modely podporují tyto schopnosti, stejně jako schopnost činit rozhodnutí na základě stanovení různých rozpočtových možností. I když je využití některého z nákladových modelů náročné (na čas a lidské zdroje), tak přínosy jsou jasně patrné. Konec konců i interní audit podle některé z norem pro důvěryhodné repozitáře je nákladný na zdroje, ale přínosy jsou neoddiskutovatelné.

Zoltán Lux z  Hungarian National Archives představil jiný pohled na certifikaci digitálních repozitářů, protože maďarský repozitář nemá certifikaci podle mezinárodních norem pro důvěryhodné repozitáře, ale v tuto chvíli se snaží vyhovět pouze národní legislativě a požadavkům na IT zabezpečení. V Maďarsku jdou cestou důrazu na risk management, aby vynaložené zdroje nepřevážily případnou vzniklou škodu. Zajímavé bylo, že po příspěvcích ostatních přednášejících přiznal pan Lux, že budou muset začít přemýšlet i o certifikaci dle mezinárodně uznávaných norem, jako jen CoreTrustSeal, nestor seal, nebo ISO 16 363. Zdá se, že osvěta a setkání na mezinárodní úrovni mají svůj smysl a výměna zkušeností je pro rozvoj komunity klíčová.

Katarína Tomková z Centrálneho Dátového Archívu (CDA) představila cíle projektu i zkušenosti s auditem v minulosti stejně jako plány do budoucna. Vzhledem k tomu, že povinnost auditu byla pro repozitář zakotvena v samotném projektu, tak CDA prošel externím „pre-certifikačním“ auditem dle normy ISO 16 363 v roce 2014 a také získal certifikaci podle normy ISO 27 001. Plány byly rovněž na certifikaci dle DSA, ale vzhledem k tomu, že z této normy se stala norma CoreTrustSeal, tak nyní repozitář CDA vyčkává s dalšími kroky.  

čtvrtek 17. května 2018

2047!

https://www.novinky.cz/domaci/468997-narodni-knihovna-prechazi-do-digitalniho-veku-cekaji-ji-desitky-let-skenovani.html

Národní knihovna přechází do digitálního věku, čekají ji desítky let skenování

Převedení celkem 310 miliónů stran různých knižních a novinových titulů do digitální podoby. To je cíl Národní knihovny, která s tímto projektem začala již před několika lety. Do roku 2047 chce naskenovat přes 300 miliónů stránek. Nahlédli jsme do samotného centra veškerého skenování a podívali se, jakým procesem jednotlivé knihy musí projít.


Jen otazka, jestli budeme jeste knihy potrebovat v roce 2047:-)


středa 28. března 2018

Kongres FIAF v Praze - Symposium: Sharing - 23.-24. dubna 2018

Narodní filmový archiv pořádá v Praze v týdnu od 23. dubna kongres FIAF. Program je velmi rozsáhlý, a najdou se tam i příspěvky zajímavé z hlediska dlouhodobého uchovávání auidiovizuálních dokumentů v digitální podobě.

Více informací především v části Symposia Sharing na webu kongresu http://fiaf2018.nfa.cz/

Zájemci o účast z řad místní odborné veřejnosti se mohou obrátit na koordinátora symposia (matej.strnad@nfa.cz)

Seminář Archives in Digital Age (AiDA) 10. a 11. května 2018 - certifikace a audit

Národní archiv pořádá ve dnech 10. a 11. května 2018 další workshop z řady Archives in Digital Age (AiDA), tentokrát zaměřený na problematiku certifikace a auditu digitálních repozitářů a digitálních
archivů. Pozvání přijal Christian Keitel ze zemského archivu Bádenska-Württemberska, přední odborník v této oblasti, který se mj. podílel na přípravě DIN 31644 a disponuje zkušenostmi z průběhu certifikace knihoven a archivů dle této normy (nestor-Siegel) v německy mluvících zemích. Své zkušenosti z této oblasti představí zástupce Univerzitní knihovny v Bratislavě a pohled z Maďarska zprostředkuje Zoltán Lux, vedoucí digitálního archivu Maďarského národního archivu. Diskuse nad dosavadní praxí v českém prostředí by měla zahrnout jak oblast knihoven, tak i archivů.

Vzhledem k omezené kapacitě a diskusnímu charakteru setkání prosíme o registraci, případně o přihlášení příslušných pracovníků z Vašeho pracoviště do 18. dubna 2018
zde:http://web.nacr.cz/konference/prihlaska.aspx?konf=AIDA. Potvrzení
o účasti se zobrazí na obrazovce, e-mailem se nezasílá.


Předběžný program:

Archives in Digital Age
Self-Audit and Certification of Digital Archives
in Central European Perspective

Národní archiv, Archivní 2257/4, Praha 4 – Chodovec (Lecture Room)
Th 10. 5. 2018
10:00-10:30 Registration, coffee
10:30-10:40 Opening speech

Eva Drašarová, Director-General of National Archives Prague
Block A: Possibilities for Self-Audit and Certification of Digital Archives
10:45-13:00 DIN 31644 and Explanatory Notes on the nestor Seal for Trustworthy Digital Archives

Christian Keitel, State Archives Baden-Württemberg

13:00-13:45 Snack break
13:45-14:30 Translation of Explanatory Notes on the nestor Seal for Trustworthy Digital Archives
and Possibilities for Accreditation of Digital Archives in the Czech Republic
Zbyšek Stodůlka, Milan Vojáček, National Archives Prague

14:30-15:15 Certification of the Digital Repositories in the Czech Republic, Current Situation and

Perspectives
Zdeněk Vašek, Charles University Archives Prague

15:15-16:00 Discussion

Fr 11. 5. 2018
Block B: Practical experiences with Audit and Certification of Digital Archives
9:00-9:45 Certification of Digital Archive in Perspective of Hungarian National Archives

Zoltán Lux, Hungarian National Archives

9:45-10:30 Certification by Data Seal of Approval and Audit by ISO 16363
The University Library in Bratislava - Central Data Archive

10:30-11:00 Coffee break
11:00-12:00 nestor Seal – Practical Experience

Christian Keitel, State Archives Baden-Württemberg

12:00-12:30 Summary

úterý 20. února 2018

Hodnocení souborových formátů z pohledu digitální archivace

Na webu jsou dostupné dva zajímavé a průběžně aktualizované zdroje věnující se hodnocení souborových formátů pro dlouhodobé uchovávání:

1. British Library

http://wiki.dpconline.org/index.php?title=File_Formats_Assessments
Britská knihovna provádí postupně hodnocení formátů (File formats assessments) a výsledné zprávy zveřejňuje. Zprávy mívají stejnou strukturu, sleduje se vývojový stav formátu, rozšíření v paměťové komunitě, softwarová podpora (včetně nástrojů pro digitální archivaci), dostupnost dokumentace, existující patenty, rizika pro dlouhodobou archivaci. Na závěr jsou formulována doporučení týkající se použití formátu příp. dalšího vývoje.
Hodnoceny byly například formáty TIFF, JPEG2000, EPUB, PDF, MOBI, WAVE, FLAC apod. Formáty průběžně přibývají.

2. KOST-CECO

Jedná se o švýcarskou skupinu expertů, jejichž cílem je podpora archivů při archivaci digitálních dokumentů, mimo jiné se podílí na specifikaci archivní verze formátu TIFF a vytvořily minimálně dva nástroje zajímavé pro digitální archivaci- KOST-Val a KOST-Simy.

Na webu https://kost-ceco.ch/wiki/whelp/KaD/index.php?ld=https://kost-ceco.ch/wiki/whelp/KaD/pages/KaD.html  skupina zpřístupnila své hodnocení formátů. Hodnotí je dle následujících kritérií: existence a dostupnost dokumentace, existence patentů, rozšíření, funkčnost, softwarová podpora, validovatelnost, existence best practice s tímto formátem, perspektiva formátu. Podle těchto kritérií je formát bodově ohodnocen (čím vyšší tím lepší, maximem jsou zřejmě 4 body), body jsou přepočítány a výsledkem je tabulka srovnávající formáty:
https://kost-ceco.ch/wiki/whelp/KaD/index.php?ld=https://kost-ceco.ch/wiki/whelp/KaD/pages/Bewertungsmatrix.html
Zeleně označené (v dolním řádku) jsou formáty vhodné pro archivaci, červeně označené jsou nevhodné pro archivaci. Například pro obrazová data je nyní zřejmě na prvním místě formát JPEG2000 (v listopadu 2017 byl ještě na druhém místě za formáty TIFF a PDF/A-2)

Hodnocení a tabulka jsou průběžně aktualizovány, naposledy v prosinci 2017.

pátek 1. prosince 2017

Nové verze (a hned dvě)

Od včerejška je dostupný JHOVE ve verzi 1.18. Za zmínku stojí asi hlavně přidání validace ICC profilů do JPEG modulu.
Release notes: https://github.com/openpreserve/jhove/releases/latest.
Download JHOVE 1.18: http://software.openpreservation.org/rel/jhove-latest.jar.

K oslavě mezinárodního dne digital preservation se přidala i VeraPDF, která přišla s verzí 1.10. Bude to chtít trochu testování, ale zdá se mi, že se pustili do řešení několika velice nepříjemných potíží v oblasti validace unicode.

Release notes: https://github.com/veraPDF/veraPDF-library/releases/latest.
Download veraPDF:  http://downloads.verapdf.org/rel/verapdf-installer.zip.

středa 1. listopadu 2017

zajímavý nástroj: isolyzer

https://github.com/KBNLresearch/isolyzer/

Isolyzer verifies if the file size of a CD / DVD image ("ISO image") is consistent with the information in its filesystem-level headers. The following file systems are supported:
ISO 9660
Universal Disk Format (UDF)
Apple Hierarchical File System (HFS)
Apple HFS+
Hybrids of the above file systems, e.g. ISO 9660 + HFS; UDF Bridge (UDF + ISO 9660)

Isolyzer uses the information in the filesystem-level headers to calculate the expected file size (typically based on a block size field and a number of blocks field). This is then compared against the actual file size, which can be useful for detecting incomplete (e.g. truncated) ISO images. Isolyzer also extracts and reports some technical metadata from the filesystem-level headers.

30.11. 2017 International Digital Preservation Day!

čtvrtek 21. září 2017

CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov

Na programu (http://cda.kultury.sk/sk/program) jsou tři příspěvky z projektu NDK, což je určitě jeden z důvodů proč konferenci navštívit. Zajímavý by mohl být také příspěvěk o projektu Elektronický archív Slovenska, o kterém se toho tak moc neví. 

Konefernce je zaměřená na velké národní projekty, akdemické instituce s výjimkou KNAV tady nepřednášejí. Škoda, že se nedozvíme nic o českém projektu NDA a aktivitách českých archivů...

registrace: http://cda.kultury.sk/sk/node/249
9.11.2017,  Univerzitná knižnica v Bratislave, Centrálny dátový archív
Miesto konania: Prednášková sála UKB, Ventúrska 11, Bratislava

sobota 16. září 2017

Digital Dunhuang: A Standard for Digital Preservation

Tenhle projekt je v digitální podobě skoro stejně impresivní, jako fyzický originál. Nejrozsáhlejší jeskynní komplex na Hedvábné stezce, který proslul pozoruhodnými freskami a také obrovskou knihovnou rukopisů (kde se mimo jiné našly nejstarší verze řady čínských textů, asi 50 tis. rukopisů, 15.tisk knih atd. ) je postupně převáděn do digitální podoby.

Digitalizace 3D objektů v nebývalém rozsahu a kvalitě, včetně HD video snímání jednotlivých jeskyní, jejich modelace v CADu atd. A samozřejmě se také řeší, jak data z takového projektu dlouhodobě uchovat (a zpřístupnit, protože "dunhuangologie" je už samostatný obor, o data mají zájem badatelé po celém světě). Zajímavé je, že projekt také uchovávání informace o měřeních klimatických podmínek v jeskynních.

Komplex, který je pod ochranou UNESCO, je dokumentován do digitální podoby mj. s pomocí Getty Institute a Mellon Foundation.

Škoda, že je článek tak stručný, bylo by pěkné vědět jaké technologie se používají.

Digital Dunhuang: A Standard for Digital Preservation, Peter Zhou University of California, Berkeley 
https://ipres2017.jp/wp-content/uploads/Keynote-peter-edited-by-Nakayama.pdf 

čtvrtek 14. září 2017

Za Pasigem 2017, Oxford 11-13.9.

(slidy z prezentací budou dostupné na https://pasigoxford.figshare.com/)

Tohle jsou nesystematické poznámky a dojmy z Pasigu v Oxfordu. Trochu přitom přemýšlím nahlas a snažím se zaznamenat zajímavé příspěvky.
  • Lokalita – místo konání konference byla doslova koloniální (Oxford University Museum of Natural History, a hned za ním bylo Pitt Rivers Museum). Koloniální nádech pak měly i samotné příspěvky, kde dominovaly velmi výrazně příspěvky z USA a UK. Jako by dřívější tahouni digital preservation v EU usnuli….bohužel. Koloniální byla i forma podání příspěvků – žádné velké technikálie, trochu show…
  • Vendors – rozhodně pozoruhodná byla rozsáhlá účast sponzorů, poskytovatelů komerčních řešení pro digital preservation. Celkem 11 sponzorů velmi silně ovlivnilo program konference…(lightnig talks, vender demos, a uživatelské prezentace). Několik příspěvků, které se tvářily jako odborné, končilo dobrou zprávou, že si po problémech instituce pořídila profesionální SW a teď už je všechno v pořádku (příspěvky Eduardo del Valle, University of the Balearic Islands, Catherine Taylor, Waddesdon Manor a další…). 
  •  Audiance – více než polovina účastníků byla na Pasigu poprvé. Takže jim asi nevadilo poslouchat příspěvky během prvního dne (Introduction to DP, Standard and Models, Certification and validation). Zazněla také řada příspěvků institucí, které se začaly zabývat LTP teprve nedávno, a člověk si trochu připadal jako před deseti lety….(Josefien Schuurman, Netherlands Institute for Sound and Vision, Angeline Takawira, UN MICT, Behrang Mousavi, Dutch Institute for Architecture – HNI). Zvlášť příspěvek Josefien Schuurman z Holandska mě vyděsil, vypadá to, že Královská knihovna v Haagu jiným institucím moc nepomáhá a úroveň spolupráce mezi knihovnou a dalšími institucemi v Holandsku asi nebude nijak valná…a propos spolupráce
  •  Spolupráce – pořád opakované zaklínadlo, že LTP nelze dělat bez komunity a spolupráce. Tohle asi době funguje v USA, kde sítě jako DPN nebo LOCKSS (které se díky financím z Mellon foundation znovu probouzí k novému vývoji – viz příspěvek Art Pasquinelli, Stanford University Libraries) a možná v UK díky JISCu nebo DPC. 
  • Vědecká data – určitě stojí za to sledovat vývoj v projektu JISC RDSS ("Jisc Research Data Shared Services (RDSS) inititive" John Kaye, "Jisc RDSS use case: Arkivum/Archivematica" Matthew Addis, Arkivum & Justin Simpson, Artefactual) kde se děje něco dramatického v oblasti správy a uchovávání vědeckých dat. V pilotním projektu dodavatelé komerčních LTP (Arkivum, Preservica, Archivematica) a repozitářů (velká řada repozitářů) spolupracují s JISCem na vývoj komponent, která mají zajistit sdílené řešení pro LTP s využitím LTP systémů, které instituce již používají. Také další příspěvek byl o vědeckých datech, resp. velkých vědeckých datech, kde zdá se mají velké plány ("Long term data preservation meets the European Open Science Cloud" Jamie Shiers, CERN) a během příštího roku projdou ISO 16363 certifikací. 
  • Open source - Kde je Roda? U Artefactual jsem přestal věřit, že jde o „open source“ – je to jen business model. V oblasti LTP systémů (ne repozitářů už) neexistuje open source, ale spíš jen softwarová řešení, kde je kód veřejný – jak zaznělo, neexistuje žádná komunita, která by aktivně vyvíjela LOCKSS, u Archivematicy a Rody o tom mám také vážně pochybnosti. Něco jiného jsou asi konkrétní nástroje na identifikaci formátů a jejich validaci (jako jhove, droid, apache tikka apod) nebo různých částí infrastruktury (Fedora, duraspace apod) tam je asi zapojení komunity větší… 
  •  „Data together: Communities & institutions using decentralized technologies to make a better web" Matt Zumwalt, Protocol Labs, DataBindery – 100% pro!
  • "The Eclair Archive cinema heritage use case: Rising to the challenges of complex formats at large scale" Mathieu Giannecchini, Ymagis. LTP pro AV obsah (http://www.eclair.digital/)
  • https://github.com/artefactual/binder/blob/qa/0.8.x/README.md - další produkt Artefaktual využívající Archivematica Storage Service