pátek 1. prosince 2017

Nové verze (a hned dvě)

Od včerejška je dostupný JHOVE ve verzi 1.18. Za zmínku stojí asi hlavně přidání validace ICC profilů do JPEG modulu.
Release notes: https://github.com/openpreserve/jhove/releases/latest.
Download JHOVE 1.18: http://software.openpreservation.org/rel/jhove-latest.jar.

K oslavě mezinárodního dne digital preservation se přidala i VeraPDF, která přišla s verzí 1.10. Bude to chtít trochu testování, ale zdá se mi, že se pustili do řešení několika velice nepříjemných potíží v oblasti validace unicode.

Release notes: https://github.com/veraPDF/veraPDF-library/releases/latest.
Download veraPDF:  http://downloads.verapdf.org/rel/verapdf-installer.zip.

středa 22. listopadu 2017

středa 1. listopadu 2017

zajímavý nástroj: isolyzer

https://github.com/KBNLresearch/isolyzer/

Isolyzer verifies if the file size of a CD / DVD image ("ISO image") is consistent with the information in its filesystem-level headers. The following file systems are supported:
ISO 9660
Universal Disk Format (UDF)
Apple Hierarchical File System (HFS)
Apple HFS+
Hybrids of the above file systems, e.g. ISO 9660 + HFS; UDF Bridge (UDF + ISO 9660)

Isolyzer uses the information in the filesystem-level headers to calculate the expected file size (typically based on a block size field and a number of blocks field). This is then compared against the actual file size, which can be useful for detecting incomplete (e.g. truncated) ISO images. Isolyzer also extracts and reports some technical metadata from the filesystem-level headers.

30.11. 2017 International Digital Preservation Day!

středa 4. října 2017

Příspěvky z iPres2017

Příspěvky z iPresu 2017 v Japonsku jsou online (https://ipres2017.jp/programme/). Je tam docela hodně zajímavých textů. Na rozdíl od Pasigu tady jsou k dispozici full texty a některé články jsou i delší a techničtější.

Chtěl  bych upozornit na dva zabývající se PDF, ale ja tam řada dalších zajímavých:


Michelle Lindlar, Yvonne Tunnat and Carl Wilson. A Test-Set for Well-Formedness Validation in JHOVE – The Good, the Bad and the Ugly

Marco Klindt. A considered harmful for digital preservation 

International Digital Preservation Day - 30th November 2017



http://www.dpconline.org/events/international-digital-preservation-day

Třeba se v ČR také někdo zapojí:-)

čtvrtek 21. září 2017

CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov

Na programu (http://cda.kultury.sk/sk/program) jsou tři příspěvky z projektu NDK, což je určitě jeden z důvodů proč konferenci navštívit. Zajímavý by mohl být také příspěvěk o projektu Elektronický archív Slovenska, o kterém se toho tak moc neví. 

Konefernce je zaměřená na velké národní projekty, akdemické instituce s výjimkou KNAV tady nepřednášejí. Škoda, že se nedozvíme nic o českém projektu NDA a aktivitách českých archivů...

registrace: http://cda.kultury.sk/sk/node/249
9.11.2017,  Univerzitná knižnica v Bratislave, Centrálny dátový archív
Miesto konania: Prednášková sála UKB, Ventúrska 11, Bratislava

sobota 16. září 2017

Digital Dunhuang: A Standard for Digital Preservation

Tenhle projekt je v digitální podobě skoro stejně impresivní, jako fyzický originál. Nejrozsáhlejší jeskynní komplex na Hedvábné stezce, který proslul pozoruhodnými freskami a také obrovskou knihovnou rukopisů (kde se mimo jiné našly nejstarší verze řady čínských textů, asi 50 tis. rukopisů, 15.tisk knih atd. ) je postupně převáděn do digitální podoby.

Digitalizace 3D objektů v nebývalém rozsahu a kvalitě, včetně HD video snímání jednotlivých jeskyní, jejich modelace v CADu atd. A samozřejmě se také řeší, jak data z takového projektu dlouhodobě uchovat (a zpřístupnit, protože "dunhuangologie" je už samostatný obor, o data mají zájem badatelé po celém světě). Zajímavé je, že projekt také uchovávání informace o měřeních klimatických podmínek v jeskynních.

Komplex, který je pod ochranou UNESCO, je dokumentován do digitální podoby mj. s pomocí Getty Institute a Mellon Foundation.

Škoda, že je článek tak stručný, bylo by pěkné vědět jaké technologie se používají.

Digital Dunhuang: A Standard for Digital Preservation, Peter Zhou University of California, Berkeley 
https://ipres2017.jp/wp-content/uploads/Keynote-peter-edited-by-Nakayama.pdf 

čtvrtek 14. září 2017

Za Pasigem 2017, Oxford 11-13.9.

(slidy z prezentací budou dostupné na https://pasigoxford.figshare.com/)

Tohle jsou nesystematické poznámky a dojmy z Pasigu v Oxfordu. Trochu přitom přemýšlím nahlas a snažím se zaznamenat zajímavé příspěvky.
  • Lokalita – místo konání konference byla doslova koloniální (Oxford University Museum of Natural History, a hned za ním bylo Pitt Rivers Museum). Koloniální nádech pak měly i samotné příspěvky, kde dominovaly velmi výrazně příspěvky z USA a UK. Jako by dřívější tahouni digital preservation v EU usnuli….bohužel. Koloniální byla i forma podání příspěvků – žádné velké technikálie, trochu show…
  • Vendors – rozhodně pozoruhodná byla rozsáhlá účast sponzorů, poskytovatelů komerčních řešení pro digital preservation. Celkem 11 sponzorů velmi silně ovlivnilo program konference…(lightnig talks, vender demos, a uživatelské prezentace). Několik příspěvků, které se tvářily jako odborné, končilo dobrou zprávou, že si po problémech instituce pořídila profesionální SW a teď už je všechno v pořádku (příspěvky Eduardo del Valle, University of the Balearic Islands, Catherine Taylor, Waddesdon Manor a další…). 
  •  Audiance – více než polovina účastníků byla na Pasigu poprvé. Takže jim asi nevadilo poslouchat příspěvky během prvního dne (Introduction to DP, Standard and Models, Certification and validation). Zazněla také řada příspěvků institucí, které se začaly zabývat LTP teprve nedávno, a člověk si trochu připadal jako před deseti lety….(Josefien Schuurman, Netherlands Institute for Sound and Vision, Angeline Takawira, UN MICT, Behrang Mousavi, Dutch Institute for Architecture – HNI). Zvlášť příspěvek Josefien Schuurman z Holandska mě vyděsil, vypadá to, že Královská knihovna v Haagu jiným institucím moc nepomáhá a úroveň spolupráce mezi knihovnou a dalšími institucemi v Holandsku asi nebude nijak valná…a propos spolupráce
  •  Spolupráce – pořád opakované zaklínadlo, že LTP nelze dělat bez komunity a spolupráce. Tohle asi době funguje v USA, kde sítě jako DPN nebo LOCKSS (které se díky financím z Mellon foundation znovu probouzí k novému vývoji – viz příspěvek Art Pasquinelli, Stanford University Libraries) a možná v UK díky JISCu nebo DPC. 
  • Vědecká data – určitě stojí za to sledovat vývoj v projektu JISC RDSS ("Jisc Research Data Shared Services (RDSS) inititive" John Kaye, "Jisc RDSS use case: Arkivum/Archivematica" Matthew Addis, Arkivum & Justin Simpson, Artefactual) kde se děje něco dramatického v oblasti správy a uchovávání vědeckých dat. V pilotním projektu dodavatelé komerčních LTP (Arkivum, Preservica, Archivematica) a repozitářů (velká řada repozitářů) spolupracují s JISCem na vývoj komponent, která mají zajistit sdílené řešení pro LTP s využitím LTP systémů, které instituce již používají. Také další příspěvek byl o vědeckých datech, resp. velkých vědeckých datech, kde zdá se mají velké plány ("Long term data preservation meets the European Open Science Cloud" Jamie Shiers, CERN) a během příštího roku projdou ISO 16363 certifikací. 
  • Open source - Kde je Roda? U Artefactual jsem přestal věřit, že jde o „open source“ – je to jen business model. V oblasti LTP systémů (ne repozitářů už) neexistuje open source, ale spíš jen softwarová řešení, kde je kód veřejný – jak zaznělo, neexistuje žádná komunita, která by aktivně vyvíjela LOCKSS, u Archivematicy a Rody o tom mám také vážně pochybnosti. Něco jiného jsou asi konkrétní nástroje na identifikaci formátů a jejich validaci (jako jhove, droid, apache tikka apod) nebo různých částí infrastruktury (Fedora, duraspace apod) tam je asi zapojení komunity větší… 
  •  „Data together: Communities & institutions using decentralized technologies to make a better web" Matt Zumwalt, Protocol Labs, DataBindery – 100% pro!
  • "The Eclair Archive cinema heritage use case: Rising to the challenges of complex formats at large scale" Mathieu Giannecchini, Ymagis. LTP pro AV obsah (http://www.eclair.digital/)
  • https://github.com/artefactual/binder/blob/qa/0.8.x/README.md - další produkt Artefaktual využívající Archivematica Storage Service







pondělí 11. září 2017

CoreTrustSeal

Certifikace DSA (Data seal of approval) se definitivně přetransformoval v CoreTrustSeal (https://www.coretrustseal.org/about/). Konsolidace snah několika institucí, která me směřovat mj. také zahájení certfikace podle ISO 16363.

pátek 8. září 2017

Náklady na dlouhodobou ochranu digitálních dokumentů

V českém prostředí ojedinělá diplomová práce na téma Digital preservation cost od Zdenka Hrušky. Velmi pěkný je přehled existujících modelů a aplikace modelu Life3 na repozitář MZK.
https://is.muni.cz/th/217895/ff_m/Diplomka_final_IS.pdf


čtvrtek 31. srpna 2017

Reference rot

Dlouhodobá archivace digitálních dokumentů není jen o formátech. Reference nebo link rot je příkladem problému, který zatím nemá žadné rozumné řešení. Především výzkumné publikace a vysokoškolské kvalifikační práce stojí a padají s odkazy a citacemi, ovšem jak ukazuje tenhle empirickými daty podložený poster, po pěti letech může být polovina linků neplatná a desetina linkovaného obsahu může být ztracena zcela.

Doporučení autorů posteru - make and save mementos - znamená, že vyzývají autory textů a provozovatele repozitářů, aby zajistili možnost archivace obsahů v repozitářích a linkovaných obsahů projekty jako je Webvarchive. Tj. aby technicky umožnili crawlerům sklízení obsahu repozitářů. A sami autoři mohou archivaci iniciovat pomocí služeb jako je ArchiveIT.

http://scholarworks.umass.edu/acrl_nec_conf/2017/posters/6/

sobota 26. srpna 2017

NLA Digital Preservation Knowledge Base

Článek o knowledge base, o níž mluvil Libor na jaře v Praze:

Backing up digital preservation practice with empirical research
The National Library of Australia’s Digital Preservation Knowledge Base
https://doi.org/10.1177/0955749017724630
Gareth Kay, Libor Coufal,Mark Pearson
Digital Preservation Unit, National Library of Australia, Canberra, AustraliaThis article introduces the National Library of Australia’s Digital Preservation Knowledge Base which helps the Library to manage digital objects from its collections over the long term. The Knowledge Base includes information on file formats, rendering software, operating systems, hardware and, most importantly, the relationships between them. Most of the work on the Knowledge Base over the last few years has been focused on the mapping of functional relationships between file formats, their versions and software applications. The information is gathered through unique empirical research and is initially being recorded in a multiple-worksheet Excel file in a semi-structured format, though development of a prototype graph database is underway.

Full text: http://www.nla.gov.au/our-publications/staff-papers/backing-up-digital-preservation-practice-with-empirical-research-the

Informační specialista v NFA

Oddělení metodiky Národního filmového archivu hledá vhodné uchazeče pro pozici Informační specialista

http://nfa.cz/cz/o-nas/volna-mista/


Popis práce:
  • Spolupráce na konsolidaci filmografických a sbírkových databází NFA
  • Koordinace filmografické a katalogizační agendy v Sekci audiovizuálních sbírek NFA
  • Implementace filmografického standardu EN 15907
  • Perspektivně vedení dedikovaného týmu
  • Možnost seberealizace ve výzkumných projektech, studijní cesty, stáže apod.
  • Metodická supervize filmografů a katalogizátorů NFA
  • Systematický odborný rozvoj vlastní kvalifikace
Požadavky:
  • VŠ vzdělání (vhodné i pro čerstvé absolventy), informační vědy nebo knihovnictví výhodou
  • Zkušenost s vedením a koordinací lidí a projektů či komplexních úkolů
  • Zkušenost s pořádáním informací v databázích
  • Zájem o český film a filmografická data
  • Velmi dobrá znalost angličtiny
  • Velmi dobrá počítačová gramotnost
  • Znalost FRBR výhodou, znalost FRBRoo velkou výhodou

Místo výkonu práce: Praha
Předpokládaný nástup: nástup dle dohody
Úvazek: 1,0

Plat: 11. platová třída (Nařízení vlády č. 564/2006 Sb. v platném znění, příloha č. 1), osobní příplatek dle osobního výkonu.

Zaměstnanecké benefity: možnost zvyšování kvalifikace, stravenky, dovolená pět týdnů, zdravotní volno, služební mobil, příspěvek na dětskou letní rekreaci, volný vstup do kina Ponrepo.

Profesní životopis, motivační dopis a kontakty na dvě referenční osoby zasílejte na adresu barbora.ligacova@nfa.cz s označením informační specialista.

Vybraní uchazeči budou pozváni k osobnímu rozhovoru.

pátek 25. srpna 2017

Seznam collection management systémů

Ashley Blewer dala dohromady seznam systémů na správu digitálního obsahu. Seznam míchá různé typy systémů (DAM, LTP apod.), i tak ovšem může být pěkným přehledem pro zájemce o implementaci podobného systému.

https://ablwr.github.io/blog/2017/08/09/collection-management-system-collection/

seznam je tady  https://docs.google.com/spreadsheets/d/1cXOug3qM0pNNeD_wssiVEv9c0W1Y5I1VDTnSPTk7fb4/edit#gid=0

pondělí 21. srpna 2017

Hodnocení úrovně dlouhodobé ochrany dat podle NDSA Levels of Preservation v praxi

NDSA Level of Preservation existují již nějakou dobu a jsou dobrou pomůckou pro posuzování "dospělosti" digitálních repozitářů a jejich procesů. Jenny Mitcham z Univerzity v Yorku publikovala článek, kde popisuje stav jejich univerzitního repozitáře a hodnocení pomocí NDSA metodiky. Zajímavé a inspirující čtení i pro české prostředí.

Jenny Mitcham. Benchmarking with the NDSA Levels of Preservation.
http://digital-archiving.blogspot.co.nz/2017/08/benchmarking-with-ndsa-levels-of.html

čtvrtek 8. června 2017

Oficiální certifikace podle ISO 16363 - první oficiálně akredirovaný poskytovatel?

PTAB získala jako první oficální akreditaci k vykonávání auditu podle normy ISO 16363:

 http://www.iso16363.org/ptab-accredited-for-iso-16363-audit-and-certification/.

Trochu me překvapuje, že odkazují na Register of Certification Bodies of National Accreditation Board for Certification Bodies (NABCB), což je indická instituce a nikoli americká nebo britská, PTAB sídlí ve Velké Británii, takže proč ne UKAS? ..No, kdoví, jak to s tou akreditací je.

středa 24. května 2017

Distributed OAIS-based Digital Preservation System with HDFS Technology

Pro některé probíhající projekty u nás by určitě mohl být inspirativní článek z Ruska o architektuře archivu budovaného v souladu s OAIS s využitím HDFS:

http://fruct.org/publications/fruct20/files/Voi.pdf

Distributed OAIS-based Digital Preservation System with HDFS Technology
Nikita Voinov, Pavel Drobintsev, Vsevolod Kotlyarov Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Igor Nikiforov Dell EMC/Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia 

Abstract—The paper describes architecture of a distributed OAIS-based
digital preservation system which uses HDFS as a file storage system
and supports wide distribution on a number of cluster’s nodes. It is
based on Apache Hadoop framework - a reliable open source solution
with well horizontally scalable distributed architecture. Novelty of
the proposed system is defined by the fact that none of existing OAIS
digital preservation systems use HDFS storage for both structured and
unstructured data archiving. Implementation of the system’s prototype
and results of its testing are also shown.

úterý 25. dubna 2017

Archivace IETF/ISOC RFC - konec papíru....

Možná byste čekali, že zrovna tenhle typ materiálu (RFC) ani nikdy papírovou dobou neprošel, ale ouha. Teprve nedávno vydaná RFC 81533 - Digital Preservation Considerations for the RFC Series s papírem definitivně končí.

RFC editor ma zjevně zkušenosti se ztrátami dat (In the past, nearly 800 RFCs had to be manually transcribed from paper back to electronic format due to a failed server migration and insufficient backups), a teď se chce obejit úplně bez papíru.

Dokument stojí za přečtení celý, ale zde uvedu jen:

For most of the existence of the RFC Series, the digital preservation process has been fairly simple, focusing on bitstream preservation and relying on paper copies of digital files. 
...
Given the need to balance cost and complexity with retention of information for historic, legal, and informational purposes, preservation efforts should focus on the XML canonical format files, the PDF/A-3 format files, the xml2rfc tool and its documentation, and at least two PDF reader applications capable of extracting the embedded XML. Care should be taken that the software being included in this archive has a provision for free copies for backup or archival purposes. All other formats and the overall computing environment should be stored as described in "best effort" data retention (Section 2.4.1), which should in turn be described in the appropriate vendor contract for the RFC Publisher. 

https://www.rfc-editor.org/rfc/pdfrfc/rfc8153.txt.pdf

úterý 4. dubna 2017

středa 29. března 2017

Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?

Ve středu 29. března 2017 od 10 do 12:30 hod se v kinosále NA konala akce nazvaná docela vtipně "Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?"

Po prezentacích pánů z Národního digitálního archivu představily svoje projekty v oblasti elektronických dokumentů čtyři specializované archivy (UK, ČRO, ČTV, NFA)

Zdaleka nejzajímavější pro mě byly úvodní prezentace o stavu projektu NDA a Národním archivním portálu. Prezentace, které by měly zaznít v podobném rozsahu i na konferenci ISSS 2017 přístí týden přednesli pan Bernas (Současný stav a střednědobá perspektiva Národního digitálního archivu) a Stodůlka (Výběr archiválií prostřednictvím Národního archivního portálu) a doplnila je informace o nové verzi standardu NSESSS od pana Kunta (Informace o novele národního standardu elektronických systémů spisové služby)

Z prezentace pana Bernase jsme se mimo jiné dozvěděli, že v ostrém prostředí Národního digitálního archivu jsou dnes uložena data z 9 skartačních řízení (5 přejímek). Řešení NDA je složeno ze systému Archivematica a modulů vyvinutých kolem. Prezentace obsahovala i praktické reflexe z provozu NDA od roku 2015:
  • Největším kamenem úrazu jsou SIP balíčky, jejich kvalita. 
  • Proto NDA poskytuje validátory SIP a PDF/A. 
  • V současnosti systémy NDA nejsou moc robustní a bude se na nich pracovat dále v projektu NDA II. Moduly vyvinuté vlastními silami NA budou dále upraveny dodavatelem. 
  • Byla zmíněna potřeba sladit aplikační rozhraní jednotlivých modulů, webové služby. Systém je záměrně budován z menších částí, aby se lépe udržoval, ale to předpokládá koordinaci rozhraní. 
  • Strojové rozhraní bude mít i modul přístup. 
  • V rámci NDA II budou vylepšeny možnosti autentizace. 
  • Skartační řízení - dlouhodobým cílem je zjednodušení procesů. 
  • Bezpečnost je pro NDA velmi důležitá, produkční systém je fyzicky oddělený, NDA je významný informační systémy ve smyslu zákona o kybernetické bezpečnosti, bude auditován z hlediska informační bezpečnosti (vedle ISO 16363 a dalších) .
Provozní zkušenosti:
  • kolísavá kvalita SIPů, chyby 
  •  chyby v zachycení struktury spisu a ve spisovém plánu, při tvorbě SIPu 
  • dokumenty předstírající něco, co nejsou (doc tváři se jako pdf/a) 
  • formální plnění - jen proto, aby tam něco bylo - například mimetype 
  • chybějící údaje od původce - které jistě původce zná (název, ičo) 
  • deklarace nepotřebných názvových prostorů 
  • NDA neposkytuje template pro SIP – vstupy jsou variabilní – možnosti plnění jsou velké, ale původci stejně dělají chyby 
V celém tom povídání o SIPech se nějak ztratilo, že předmětem ochrany OAIS archivu je balíček AIP – o tom jak vypadá AIP NDA jsme se nedozvěděli nic, tak snad se to dozvědí alespoň auditoři, kteří budou hodnotit soulad NDA s ISO 16363... 

Archiv na národní úrovni, který chce působit jako důvěryhodný, by měl zcela transparentně komunikovat o svých postupech zajištění dlouhodobého uchovávání (a ne jen říct, že se něco někam migruje) a o tom, jak vypadá jeho AIP.
Přitom NDA tak trochu odrazuje zájemce z dalších archivů od budování vlastního digitálního archivu (tj. archivu s oprávněním ukládat digitální data ve smyslu zákona), říkají:
  • nemá smysl budovat digitální archiv za každou cenu, z prestižních důvodu, jen proto, abychom ho měli! 
  • soustředit se raději na spisovou službu a uložit data v NDA 
  • postupy LTP vyzkoušet nejprve na digitalizátech 
  • teprve až když jsou zkušenosti přejit k digitální archivaci - menší riziko
V další prezentaci pan Stodůlka shrnul funkce národního archivního portálu v oblasti předarchivního zpracování,  příjmu a skartace. Zajímavá byla informace, že ve státních archivech bylo k dnešku proškoleno k používání portálu 100 lidí (online + prezenční školení) a Národní archiv také vyškolil pro jednotlivé regiony metodiky pro digitální archivací, kteří jsou k dispozici i specializovaným archivům.

úterý 28. března 2017

Dokument "Understanding PREMIS" v nové updatované verzi

Známý úvod do metadatového formátu PREMIS od Priscilly Caplan byl vydán v nové aktualizované verzi. Nová verze reflektuje poslední změny a úpravy PREMISu. Originální verze dokumentu vznikla v roce 2009, aktualizace tedy již byla nutná.

Dostupné na

středa 22. března 2017

Uvolněná nová verze JHOVE - 1.16

OPF (Open Preservation Foundation) vydalo novou verzi open source identifikátoru formátů JHOVE 1.16, podrobnější informace v tiskové zprávě.

Nová verze kromě oprav nabízí i lepší zpracování souborů v PDF a WAV modulech. V British Library byl JHOVE pro validaci PDF otestován, zde jsou výsledky.

pátek 17. března 2017

Archivematica 1.6

https://groups.google.com/forum/#!msg/archivematica/AVP4ARbomA4/SbaGxXaGBgAJ

Novinky: Appraisal/Arrangement tab, ArchivesSpace integration, Improvements to transfer backlog management,Full AIP re-ingest and AIP re-ingest improvements, DIP upload to AtoM improvements, Support multiple checksum algorithms, a další...

Guetzli: Perceptually Guided JPEG Encoder

https://arxiv.org/pdf/1703.04421.pdf

Guetzli: Perceptually Guided JPEG Encoder
J. Alakuijala, R. Obryk∗ , O. Stoliarchuk, Z. Szabadka, L. Vandevenne, and J. Wassenberg
Google Research Europe
March 14, 2017

Guetzli is a new JPEG encoder that aims to produce visually indistinguishable images at a lower bit-rate than other common JPEG encoders. It optimizes both the JPEG global quantization tables and the DCT coefficient values in each JPEG block using a closed-loop optimizer. Guetzli uses Butteraugli [1], our perceptual distance metric, as the source of feedback in its optimization process. We reach a 29-45% reduction in data size for a given perceptual distance, according to Butteraugli, in comparison to other compressors we tried. Guetzli’s computation is currently extremely slow, which limits its applicability to compressing static content and serving as a proof- of-concept that we can achieve significant reductions in size by combining advanced psychovisual models with lossy compression techniques

Storage pro dlouhodobou archivaci

Tohle je opravdu moc pěkný článek na blogu Davida Rosenthala.
http://blog.dshr.org/2016/12/the-medium-term-prospects-for-long-term.html

čtvrtek 16. března 2017

úterý 21. února 2017

Přednáška "Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie"

Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie

Registrační formulář na přednášku Libora Coufala.
https://goo.gl/forms/13EBnUjWlf2Q3WUB3

Pořadatel: Česká informační společnost, z. s.
Termín: 22.3.2017, 13:00 - 16:30 hodin
Místo konání: Český svaz vědeckotechnických společností z.s., Novotného lávka 5110 00 Praha 1, učebna 2017

Původně vystudovaný finančník, Libor Coufal je knihovnický "mutant". Knihovnickou dráhu započal ve Fisherově knihovně na University of Sydney. Poté působil v Národní knihovně ČR na oddělení elektronických informačních zdrojů, později přejmenované na oddělení archivace webu, které od roku 2008 vedl. Od roku 2012 pracuje v Národní knihovně Austrálie, kde v současnosti řídí oddělení dlouhodobého digitálního uchovávání.

Program
13:00 - 14:30  Národní knihovna Austrálie v digitálním světě (fondy, služby a projekty), diskuse
14:30 - 15:00  Přestávka s malým občerstvením
15:00 - 16:30  Digitální uchovávání "vzhůru nohama", diskuse

úterý 14. února 2017

PIQL v ČRO - technologie spolehlivejší než digitální nosiče?

Záznam debaty o archivaci v Českem rozhlasu. Každý může posoudit sám, jestli je tohle přístup vhodný pro disaster recovery pro data jeho instituce. PIQL řeší problém s uchováváním digitálních dat odsunutím na trvalé médium, které ukládá na proprietární typ filmového pásu, zapisuje a čte na proprietárním zařízení, v binární podobě.

Vytvoření věčné kopie digitálních dat, trvalého digitálního objektu, bohužel není cesta pro všechny typy archivů. Neměli bychom podlehnout iluzi, že tohle je řešení pro všechny typy dat a institucí - řada institucí potřebuje nástroje pro efektivní správu dat a metadat, pro aktivní ochranu. Musí zajistit trvalou dostupnost dat uživatelům v novém technologickém prostředí; uživatelům, kteří mají nové potřeby a očekávání, kteří potřebují metadata, identifikátory a formáty použitelné v aktuálním technickém a informačním kontextu. Proto existují srandardy jako OAIS a ISO 16363, které popisují obrysy takových řešení. Tzv. longterm preservation systémy (LTP) toho musí obsahovat mnohem více, než jen storage. Nikdo nečeká, že nějaké konkrétní LTP řešení bude existovat navždy - naopak je žadoucí, aby se LTP systémy měnily spolu s technologiemi kolem, archivní balíčky se aktivně kontrolují a migrují do nových formátů, obohacují se jejich metadata a migrují se formáty. PIQL není reprezentantem aktivního přístupu k digital preservation, nezajistí, že budete mít svá data uspořádáná, dobře popsaná, validní, a použitelná v technickém a informačním kontextu uživatelů za 100 let.




úterý 7. února 2017

Archivace videoartu v České republice?

Trvalé uchovávání videoartu, nových medií nebo řekněme audiovizuálního umění asi není nic snadného. Na serveru artalk.cz je zajímavý rozhovor se Slávou Sobotovičovou http://artalk.cz/2016/06/03/videoart-zabava-pro-excentriky/ o archivech videoartu v České republice.
Především se mluví o archivu Vědecko-výzkumného pracoviště AVU (http://vvp.avu.cz/videoarchiv/), jsou zmíněny i další lokální projekty jako Mediabáze FAMU (http://mediabaze.cz/) nebo Media Archive FaVU VUT Brno (http://media-archiv.ffa.vutbr.cz/index.php). 

Bohužel z toho nemám pocit, že by u nás v téhle komunitě byl velký zájem o trvalé uchovávání tohoto obsahu, o logickou ochranu a archivaci ve smyslu ISO 14721 nebo ISO 16363 atp. Snad jen na FAMU se tohle téma trochu řeší. V rozhovoru se mluví o normalizaci souborových formátů a digitalizaci, ale na webech archivů žádné metodiky popsány nejsou, ani nevidím žádné popisy formátových politik, metadatové standardy, žádné pokusy o DSA apod. "Archivy" jsou  zaměřené spíš na zpřístupňování - streamů nebo metadat. 

I v téhle oblasti také vznikají standardy pro metadata jako Media Art Notation System (MANS) nebo se používají standardy vytvořené jinde jako DIDL. 

Archivací "New Media Art" se ve světě zabývá už poměrně hodně institucí (seznam v EU http://www.newmediaart.eu/), například Netherlands Media Art Institute (http://nimk.nl/eng/preservation/media-art-preservation-links), Electronic Arts Intermix (EAI) (https://www.eai.org/), ZKM v Německu (http://zkm.de/en/topic/conservation-of-media-art), ADA (http://www.virtualart.at/nc/home.html). Sbírky videoartu a nových médií mají i některé další knihovny nebo archivy jako Corrnell uni, Getty archives a další. 



pondělí 6. února 2017

Archivace soukromých digitálních dat se zaměřením na fotografie a videa

Richard Wright sepsal "Case NotePersonal Digital PreservationPhotographs and Video",  kde vysvětluje, jak on osobně čelí rostoucím objemům soukromých digitálních dat jako soukromý archivář.

V posledních letech vyprodukoval jeho život desítky tisíc rodinných a soukromých fotografií a videí. Richard ví o ca 55 000  fotografiích, které jsou všude možně - na některém z jeho 4 počítačů a laptopů, mobilním telefonu, ve foťácích, kamerách, na některém ze tří počítačů partnerky, na domácím NASu nebo některém z cca sedmi USB úložištích, další jsou na Dropboxu, Amazon Photos, Googlu a Microsoft drive, další materiál je v jeho profilech na sociálních sítích, na blozích atd. Všechno pod názvy, které generují fotoaparáty nebo software, ve formátech skrývajících se za MPEG kontejnery, nebo v proprietárních formátech, v RAW, a to bez velké kontroly, bez systematických záloh, bez katalogu.

Tohle všechno zná asi každý. Richard jako archivář svého soukromého archivu doporučuje:

  1. deduplikovat (http://www.joerg-rosenthal.com/en/antitwin/
  2. vytvořit si seznam, katalog všech sbírek (asi ne úroveň každého souboru, ale v rozumné míře) -inspirovat se http://preservationweek.wixsite.com/personalarchiving nebo zvážit použití něčeho jako http://www.resourcespace.com/get tam kde se používají cloudová služby, inspirovat se http://www.cdwinder.de/http://www.cdfinder.de/en/info.html nebo jako Richard investovat do http://www.wincatalog.com/
  3. omezit počet použitých formátů
  4. zálohovat a udržovat zálohy, pokud možno automaticky (třeba s využitím https://www.microsoft.com/en-gb/download/details.aspx?id=15155https://fastglacier.com/ )
  5. kontrolovat, že jsou zálohy a data nepoškozené (fixity check, třeba s použitím https://www.avpreserve.com/tools/fixity/ nebo http://www.md5summer.org/ apod.)
Pokud máte nápady na další užitečné nástroje a služby, můžete je sdílet v komentářích:-)

pátek 27. ledna 2017

PIQL v ČRO

Po úspěchu ve Slovenském rádiu se podařilo PIQLu přesvědčit i Český rozhlas, že tohle je ta správná cesta, jak se zbavit problémů s trvalou archivací digitálního obsahu....

http://www.parabola.cz/zpravicky/27282/cro-pro-archivaci-cennych-zaznamu-vyuzije-technologii-piql/

úterý 24. ledna 2017

Diplomky na UK pouze digitálně

Univerzita Karlova se rozhodla pro archivaci závěrečných kvalifikačních prací (tedy bakalářek, diplomek i rigorózních a disertačních prací) pouze v elektronické podobě. Konkrétním vyjádřením tohoto rozhodnutí je Opatření rektora č. 23/2016, které možnost odevzdání textu omezuje pouze na formát PDF/A (verze 1a nebo 2u). Byla zpřísněna také pravidla pro odevzdávání příloh. Studentům je k dispozici seznam schválených formátů, které budou akceptovány automaticky, a možnost zažádat o přijetí přílohy v neschváleném formátu. Studenti jsou povinni odevzdávat PDF/A od 1. 2. 2016.
Opatření rektora doplňuje metodický pokyn a prozatímní informační stránka pro studenty.
Validace PDF/A bude probíhat pomocí nástroje veraPDF, formáty ostatních souborů budou pouze identifikovány pomocí nástroje Fido.
Otázka zrušení povinnosti odevzdávat i tištěnou verzi práce byla ponechána na rozhodnutí fakult. Je tedy možné, že tištěné verze budou i nadále zpřístupňovány v některých knihovnách.

Jak si vlastně vede "digital preservation" komunita? Komentáře vítány

Andy Jackson a Paul Wheatley tento víkend rozeslali pomocí Google fóra https://groups.google.com/group/digital-curation emails s prosbou o spolupráci. Obracejí se v něm na všechny zapojené v komunitě okolo dlouhodobé archivace s otázkou, zda současný způsob práce, spolupráce a publicity v této komunitě je dostatečný. Oba dlouhodobě stojí za webem www.digipres.org, kde se celkem úspěšně snaží spojovat roztříštěné aktivity různých registrů, diskuzních fór apod. Ideou je mít vše pod jednou střechou a poskytnout zájemcům web jak pro prvotní tak i pro detailní orientaci v problému.
Originální znění emailu je níže, zmíněné otázky znějí
Poslední otázka je asi nejpalčivější. Pokud máte na tyto otázky odpověď nebo názor, napište jej přímo na diskuzní forum https://groups.google.com/forum/#!forum/digipres, nebo do diskuze pod tímto příspěvkem. 

Děkujeme





Calling All Digital Preservers!

The digital preservation community is small and under resourced. This means we have to work together if we want to make a real impact. To this end, a small group of us has been attempting to help the members of the digital preservation community better support each other. The results of this include:
  • The http://www.digipres.org site, which aims to provide a gateway to all of the wonderful community-owned and community-oriented resources out there that are dedicated to digital preservation.
  • The Digital Preservation Q&A site (http://qanda.digipres.org/), which is a Q&A site set up in the wake of the failure of the efforts to set up suitable Stack Exchange sites for our field.
  • The COPTR Tool Registry (http://coptr.digipres.org), which was formed by the merger of many of the previous tool registry efforts, and which seeks to be a primary reference for those working in practical digital preservation.
  • The POWRR Tool Grid v.2 (http://www.digipres.org/tools/), which is generated from COPTR registry.
  • The Formats Overview (http://www.digipres.org/formats/), built by aggregating information from a number of different format registries.
If, like us, you believe we all need to work together, we’d love to hear from you….
The last one is really important. We’ve been in digital preservation long enough to see a lot of portals and projects come and go, and we recognise that making it possible to build on past work sometimes requires changing what we've built so far.

Please get in touch if you have any questions. You could talk to us directly, or use the digipres community forum we set up for this purpose. We’re happy to hear any and all ideas and criticisms!

Best wishes,
Andy Jackson (@anjacks0n) and Paul Wheatley (@prwheatley)
--

čtvrtek 19. ledna 2017

Digital Preservation: Putting It to Work - nová publikace ze Springeru

Ano, je to tak, EU chválení kolegové z Polska vydali publikací ve Springeru. A ze 2/3 v ní prezentují svůj projekt dlouhodobého repozitáře CREDO.

Digital Preservation: Putting It to Work
http://www.springer.com/us/book/9783319518008 
Editors: Tomasz Traczyk, Włodzimierz Ogryczak, Piotr Pałka, Tomasz Śliwiński, 
DOI 10.1007/978-3-319-51801-5

Kniha není sice nijak rozsáhlá (158 stran), uvolněná kapitola o metadatech (odkaz na webu Springeru, 48 stran, přehledový text o všech typech metadat včetně technických pro různé typy obsahu a ochranných, popisných atd.) a obsah ale vypadají docela zajímavě. Obsah je zde:

Part I Problems of Long-Term Digital Preservation
Requirements for Digital Preservation.............................................. 3
Tomasz Traczyk
Metadata in Long-Term Digital Preservation ..................................15
Grzegorz Płoszajski

Part II Solutions Proposed by the CREDO Project
The CREDO Project.................................................... ....................65
Tomasz Traczyk and Włodzimierz Ogryczak
CREDO Repository Architecture.....................................................77
Tomasz Traczyk
Information Processing in CREDO Long-Term Archive ................93
Tomasz Traczyk
Metadata in CREDO Long-Term Archive .................................... 109
Tomasz Traczyk and Grzegorz Płoszajski
Persistence Management in Long-Term Digital Archive ............. 123
Piotr Pałka
Power Efficiency and Scheduling Access to the Archive.............. 133
Tomasz Śliwiński
Information Management in Federated Digital Archives ............. 143
Piotr Pałka and Tomasz Traczyk
Index .............................................................................................. 157

středa 18. ledna 2017

Konference ILIDE 2017 a PASIG

Chtěl bych upozornit na konferenci ILIDE 3-5. dubna 2017 na Slovensku v Jasné. Organizátorům se daří zajistit celou řadu zahraničních speakerů, v programu jsou například David Minor nebo Tom Cramer, ale také disco nebo Aquarium Night:-)

Přísti PASIG se koná opět trochu blíž, v Oxfordu 11. až 13. září 2017https://pasigoxford.org/.

Stále jsou online jsou k dispozici slidy z webinářů PASIGu

Jeden veselý slide z pravidelné prezentace Oracle o vývoji storage technologíí pro archivy je dole:-)


úterý 17. ledna 2017

Ako na certifikáciu repozitára podľa Data Seal of Approval - článek v ITLib

Název: Ako na certifikáciu repozitára podľa Data Seal of Approval
Autor: Andrea Miranda
Číslo: 4/2016
PDF link: http://itlib.cvtisr.sk/buxus/docs/Miranda-ITlib%204_2016.pdf
Abstrakt:
Cieľom príspevku je oboznámiť s kritériami hodnotenia digitálnych repozitárov podľa certifikácie Data Seal of Approval (DSA). Certifikát slúži ako „záruka“ dôvery pre dané kľúčové skupiny, ktoré využívajú či odovzdávajú dáta do cieľového repozitára. DSA predstavuje pomerne jednoduchý spôsob auditu a certifikácie, najmä pre za- čínajúce repozitáre či repozitáre menšieho rozsahu. Popísané sú pôvodné a pripravované Zásady DSA a podrobne spísané sú potrebné podklady a doklady, ktoré bude repozitár potrebovať pre svoju úspešnú certifikáciu.

pondělí 16. ledna 2017

Kdy vydá NDA xml profil pro validaci PDF/A?

V návaznosti na předešlou zprávu o publikaci verze 1.0 validátoru PDF/A veraPDF mě napadá, že by vlastně bylo logické, aby Národní archiv (resp. NDA) vydal xml profil pro validaci PDF/A podle jeho požadavků.

Legislativně deklarovaný požadavek na PDF/A-1a potřebuje doplnění a vysvětlení - je validní reprezentací PDF/A-1a takový soubor PDF/A, které neprojde validací PDF/A-2u nebo 3a? Validace úrovně 2u nebo 3a je podrobnější než validace podle profilu úrovně 1a (kontroluje se více pravidel)....


úterý 10. ledna 2017

veraPDF 1.0 je tu!

Konzorcium veraPDF dnes oznámilo uvolnění verze veraPDF 1.0. 
http://verapdf.org/2017/01/10/verapdf-1-0-released/?utm_source=veraPDF+News

veraPDF je PDF/A validátor, open source, vyvíjený v projektu Open Preservation Foundation a PDF Association, validuje všechny části a úrovně ISO 19005 (PDF/A). Je dostupný pod licencemi MPLv2+/GLPv3+.

Jak důležitý krok je to pro použitelnost PDF/A v archivech asi není třeba vysvětlovat, naše archivní legislativa o tom, jak se prokazuje shoda s ISO 19005, taktně mlčí. veraPDF dává archivům do ruky nástroj, který jim umožní posoudit shodu s touto normou nebo s vlastním profilem -  v případech, kdy je archiv připraven přijmout PDF/A nedovídající některým požadavkům zcela přesně.

Digitální archivace v Rogue One: Star Wars Story - Jedi Archives

Nemůžu neupozornit na příspěvek na blogu Preservicy. "How Not to Build a Digital Archive: Lessons from the Dark Side of the Force" komentuje poslední díl filmové ságy Star Wars z hlediska digitální archivace.

Možná si řeknete, že to je jen chytrý marketingový tah. Pokud to přitáhne  pozornost a povede k popularizaci základních principů digitální archivace, tak proč ne:-)

A je k tomu dokonce i webinář, kde si můžeme poslechnout o chybách Jedi Archive více od Jedi Mastera Jona Tilbura...

A teď koukám, že Zdeněk Hruška už to dokonce i přeložil:
http://ltp-portal.mzk.cz/home/Novinky/jaknebudovatdigitalniarchiv-poucenizestarwarsrogueone