čtvrtek 21. září 2017

CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov

Na programu (http://cda.kultury.sk/sk/program) jsou tři příspěvky z projektu NDK, což je určitě jeden z důvodů proč konferenci navštívit. Zajímavý by mohl být také příspěvěk o projektu Elektronický archív Slovenska, o kterém se toho tak moc neví. 

Konefernce je zaměřená na velké národní projekty, akdemické instituce s výjimkou KNAV tady nepřednášejí. Škoda, že se nedozvíme nic o českém projektu NDA a aktivitách českých archivů...

registrace: http://cda.kultury.sk/sk/node/249
9.11.2017,  Univerzitná knižnica v Bratislave, Centrálny dátový archív
Miesto konania: Prednášková sála UKB, Ventúrska 11, Bratislava

sobota 16. září 2017

Digital Dunhuang: A Standard for Digital Preservation

Tenhle projekt je v digitální podobě skoro stejně impresivní, jako fyzický originál. Nejrozsáhlejší jeskynní komplex na Hedvábné stezce, který proslul pozoruhodnými freskami a také obrovskou knihovnou rukopisů (kde se mimo jiné našly nejstarší verze řady čínských textů, asi 50 tis. rukopisů, 15.tisk knih atd. ) je postupně převáděn do digitální podoby.

Digitalizace 3D objektů v nebývalém rozsahu a kvalitě, včetně HD video snímání jednotlivých jeskyní, jejich modelace v CADu atd. A samozřejmě se také řeší, jak data z takového projektu dlouhodobě uchovat (a zpřístupnit, protože "dunhuangologie" je už samostatný obor, o data mají zájem badatelé po celém světě). Zajímavé je, že projekt také uchovávání informace o měřeních klimatických podmínek v jeskynních.

Komplex, který je pod ochranou UNESCO, je dokumentován do digitální podoby mj. s pomocí Getty Institute a Mellon Foundation.

Škoda, že je článek tak stručný, bylo by pěkné vědět jaké technologie se používají.

Digital Dunhuang: A Standard for Digital Preservation, Peter Zhou University of California, Berkeley 
https://ipres2017.jp/wp-content/uploads/Keynote-peter-edited-by-Nakayama.pdf 

čtvrtek 14. září 2017

Za Pasigem 2017, Oxford 11-13.9.

(slidy z prezentací budou dostupné na https://pasigoxford.figshare.com/)

Tohle jsou nesystematické poznámky a dojmy z Pasigu v Oxfordu. Trochu přitom přemýšlím nahlas a snažím se zaznamenat zajímavé příspěvky.
  • Lokalita – místo konání konference byla doslova koloniální (Oxford University Museum of Natural History, a hned za ním bylo Pitt Rivers Museum). Koloniální nádech pak měly i samotné příspěvky, kde dominovaly velmi výrazně příspěvky z USA a UK. Jako by dřívější tahouni digital preservation v EU usnuli….bohužel. Koloniální byla i forma podání příspěvků – žádné velké technikálie, trochu show…
  • Vendors – rozhodně pozoruhodná byla rozsáhlá účast sponzorů, poskytovatelů komerčních řešení pro digital preservation. Celkem 11 sponzorů velmi silně ovlivnilo program konference…(lightnig talks, vender demos, a uživatelské prezentace). Několik příspěvků, které se tvářily jako odborné, končilo dobrou zprávou, že si po problémech instituce pořídila profesionální SW a teď už je všechno v pořádku (příspěvky Eduardo del Valle, University of the Balearic Islands, Catherine Taylor, Waddesdon Manor a další…). 
  •  Audiance – více než polovina účastníků byla na Pasigu poprvé. Takže jim asi nevadilo poslouchat příspěvky během prvního dne (Introduction to DP, Standard and Models, Certification and validation). Zazněla také řada příspěvků institucí, které se začaly zabývat LTP teprve nedávno, a člověk si trochu připadal jako před deseti lety….(Josefien Schuurman, Netherlands Institute for Sound and Vision, Angeline Takawira, UN MICT, Behrang Mousavi, Dutch Institute for Architecture – HNI). Zvlášť příspěvek Josefien Schuurman z Holandska mě vyděsil, vypadá to, že Královská knihovna v Haagu jiným institucím moc nepomáhá a úroveň spolupráce mezi knihovnou a dalšími institucemi v Holandsku asi nebude nijak valná…a propos spolupráce
  •  Spolupráce – pořád opakované zaklínadlo, že LTP nelze dělat bez komunity a spolupráce. Tohle asi době funguje v USA, kde sítě jako DPN nebo LOCKSS (které se díky financím z Mellon foundation znovu probouzí k novému vývoji – viz příspěvek Art Pasquinelli, Stanford University Libraries) a možná v UK díky JISCu nebo DPC. 
  • Vědecká data – určitě stojí za to sledovat vývoj v projektu JISC RDSS ("Jisc Research Data Shared Services (RDSS) inititive" John Kaye, "Jisc RDSS use case: Arkivum/Archivematica" Matthew Addis, Arkivum & Justin Simpson, Artefactual) kde se děje něco dramatického v oblasti správy a uchovávání vědeckých dat. V pilotním projektu dodavatelé komerčních LTP (Arkivum, Preservica, Archivematica) a repozitářů (velká řada repozitářů) spolupracují s JISCem na vývoj komponent, která mají zajistit sdílené řešení pro LTP s využitím LTP systémů, které instituce již používají. Také další příspěvek byl o vědeckých datech, resp. velkých vědeckých datech, kde zdá se mají velké plány ("Long term data preservation meets the European Open Science Cloud" Jamie Shiers, CERN) a během příštího roku projdou ISO 16363 certifikací. 
  • Open source - Kde je Roda? U Artefactual jsem přestal věřit, že jde o „open source“ – je to jen business model. V oblasti LTP systémů (ne repozitářů už) neexistuje open source, ale spíš jen softwarová řešení, kde je kód veřejný – jak zaznělo, neexistuje žádná komunita, která by aktivně vyvíjela LOCKSS, u Archivematicy a Rody o tom mám také vážně pochybnosti. Něco jiného jsou asi konkrétní nástroje na identifikaci formátů a jejich validaci (jako jhove, droid, apache tikka apod) nebo různých částí infrastruktury (Fedora, duraspace apod) tam je asi zapojení komunity větší… 
  •  „Data together: Communities & institutions using decentralized technologies to make a better web" Matt Zumwalt, Protocol Labs, DataBindery – 100% pro!
  • "The Eclair Archive cinema heritage use case: Rising to the challenges of complex formats at large scale" Mathieu Giannecchini, Ymagis. LTP pro AV obsah (http://www.eclair.digital/)
  • https://github.com/artefactual/binder/blob/qa/0.8.x/README.md - další produkt Artefaktual využívající Archivematica Storage Service







pondělí 11. září 2017

CoreTrustSeal

Certifikace DSA (Data seal of approval) se definitivně přetransformoval v CoreTrustSeal (https://www.coretrustseal.org/about/). Konsolidace snah několika institucí, která me směřovat mj. také zahájení certfikace podle ISO 16363.

pátek 8. září 2017

Náklady na dlouhodobou ochranu digitálních dokumentů

V českém prostředí ojedinělá diplomová práce na téma Digital preservation cost od Zdenka Hrušky. Velmi pěkný je přehled existujících modelů a aplikace modelu Life3 na repozitář MZK.
https://is.muni.cz/th/217895/ff_m/Diplomka_final_IS.pdf


čtvrtek 31. srpna 2017

Reference rot

Dlouhodobá archivace digitálních dokumentů není jen o formátech. Reference nebo link rot je příkladem problému, který zatím nemá žadné rozumné řešení. Především výzkumné publikace a vysokoškolské kvalifikační práce stojí a padají s odkazy a citacemi, ovšem jak ukazuje tenhle empirickými daty podložený poster, po pěti letech může být polovina linků neplatná a desetina linkovaného obsahu může být ztracena zcela.

Doporučení autorů posteru - make and save mementos - znamená, že vyzývají autory textů a provozovatele repozitářů, aby zajistili možnost archivace obsahů v repozitářích a linkovaných obsahů projekty jako je Webvarchive. Tj. aby technicky umožnili crawlerům sklízení obsahu repozitářů. A sami autoři mohou archivaci iniciovat pomocí služeb jako je ArchiveIT.

http://scholarworks.umass.edu/acrl_nec_conf/2017/posters/6/

sobota 26. srpna 2017

NLA Digital Preservation Knowledge Base

Článek o knowledge base, o níž mluvil Libor na jaře v Praze:

Backing up digital preservation practice with empirical research
The National Library of Australia’s Digital Preservation Knowledge Base
https://doi.org/10.1177/0955749017724630
Gareth Kay, Libor Coufal,Mark Pearson
Digital Preservation Unit, National Library of Australia, Canberra, AustraliaThis article introduces the National Library of Australia’s Digital Preservation Knowledge Base which helps the Library to manage digital objects from its collections over the long term. The Knowledge Base includes information on file formats, rendering software, operating systems, hardware and, most importantly, the relationships between them. Most of the work on the Knowledge Base over the last few years has been focused on the mapping of functional relationships between file formats, their versions and software applications. The information is gathered through unique empirical research and is initially being recorded in a multiple-worksheet Excel file in a semi-structured format, though development of a prototype graph database is underway.

Full text: http://www.nla.gov.au/our-publications/staff-papers/backing-up-digital-preservation-practice-with-empirical-research-the

Informační specialista v NFA

Oddělení metodiky Národního filmového archivu hledá vhodné uchazeče pro pozici Informační specialista

http://nfa.cz/cz/o-nas/volna-mista/


Popis práce:
  • Spolupráce na konsolidaci filmografických a sbírkových databází NFA
  • Koordinace filmografické a katalogizační agendy v Sekci audiovizuálních sbírek NFA
  • Implementace filmografického standardu EN 15907
  • Perspektivně vedení dedikovaného týmu
  • Možnost seberealizace ve výzkumných projektech, studijní cesty, stáže apod.
  • Metodická supervize filmografů a katalogizátorů NFA
  • Systematický odborný rozvoj vlastní kvalifikace
Požadavky:
  • VŠ vzdělání (vhodné i pro čerstvé absolventy), informační vědy nebo knihovnictví výhodou
  • Zkušenost s vedením a koordinací lidí a projektů či komplexních úkolů
  • Zkušenost s pořádáním informací v databázích
  • Zájem o český film a filmografická data
  • Velmi dobrá znalost angličtiny
  • Velmi dobrá počítačová gramotnost
  • Znalost FRBR výhodou, znalost FRBRoo velkou výhodou

Místo výkonu práce: Praha
Předpokládaný nástup: nástup dle dohody
Úvazek: 1,0

Plat: 11. platová třída (Nařízení vlády č. 564/2006 Sb. v platném znění, příloha č. 1), osobní příplatek dle osobního výkonu.

Zaměstnanecké benefity: možnost zvyšování kvalifikace, stravenky, dovolená pět týdnů, zdravotní volno, služební mobil, příspěvek na dětskou letní rekreaci, volný vstup do kina Ponrepo.

Profesní životopis, motivační dopis a kontakty na dvě referenční osoby zasílejte na adresu barbora.ligacova@nfa.cz s označením informační specialista.

Vybraní uchazeči budou pozváni k osobnímu rozhovoru.

pátek 25. srpna 2017

pondělí 21. srpna 2017

Hodnocení úrovně dlouhodobé ochrany dat podle NDSA Levels of Preservation v praxi

NDSA Level of Preservation existují již nějakou dobu a jsou dobrou pomůckou pro posuzování "dospělosti" digitálních repozitářů a jejich procesů. Jenny Mitcham z Univerzity v Yorku publikovala článek, kde popisuje stav jejich univerzitního repozitáře a hodnocení pomocí NDSA metodiky. Zajímavé a inspirující čtení i pro české prostředí.

Jenny Mitcham. Benchmarking with the NDSA Levels of Preservation.
http://digital-archiving.blogspot.co.nz/2017/08/benchmarking-with-ndsa-levels-of.html

čtvrtek 8. června 2017

Oficiální certifikace podle ISO 16363 - první oficiálně akredirovaný poskytovatel?

PTAB získala jako první oficální akreditaci k vykonávání auditu podle normy ISO 16363:

 http://www.iso16363.org/ptab-accredited-for-iso-16363-audit-and-certification/.

Trochu me překvapuje, že odkazují na Register of Certification Bodies of National Accreditation Board for Certification Bodies (NABCB), což je indická instituce a nikoli americká nebo britská, PTAB sídlí ve Velké Británii, takže proč ne UKAS? ..No, kdoví, jak to s tou akreditací je.

středa 24. května 2017

Distributed OAIS-based Digital Preservation System with HDFS Technology

Pro některé probíhající projekty u nás by určitě mohl být inspirativní článek z Ruska o architektuře archivu budovaného v souladu s OAIS s využitím HDFS:

http://fruct.org/publications/fruct20/files/Voi.pdf

Distributed OAIS-based Digital Preservation System with HDFS Technology
Nikita Voinov, Pavel Drobintsev, Vsevolod Kotlyarov Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Igor Nikiforov Dell EMC/Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia 

Abstract—The paper describes architecture of a distributed OAIS-based
digital preservation system which uses HDFS as a file storage system
and supports wide distribution on a number of cluster’s nodes. It is
based on Apache Hadoop framework - a reliable open source solution
with well horizontally scalable distributed architecture. Novelty of
the proposed system is defined by the fact that none of existing OAIS
digital preservation systems use HDFS storage for both structured and
unstructured data archiving. Implementation of the system’s prototype
and results of its testing are also shown.

úterý 25. dubna 2017

Archivace IETF/ISOC RFC - konec papíru....

Možná byste čekali, že zrovna tenhle typ materiálu (RFC) ani nikdy papírovou dobou neprošel, ale ouha. Teprve nedávno vydaná RFC 81533 - Digital Preservation Considerations for the RFC Series s papírem definitivně končí.

RFC editor ma zjevně zkušenosti se ztrátami dat (In the past, nearly 800 RFCs had to be manually transcribed from paper back to electronic format due to a failed server migration and insufficient backups), a teď se chce obejit úplně bez papíru.

Dokument stojí za přečtení celý, ale zde uvedu jen:

For most of the existence of the RFC Series, the digital preservation process has been fairly simple, focusing on bitstream preservation and relying on paper copies of digital files. 
...
Given the need to balance cost and complexity with retention of information for historic, legal, and informational purposes, preservation efforts should focus on the XML canonical format files, the PDF/A-3 format files, the xml2rfc tool and its documentation, and at least two PDF reader applications capable of extracting the embedded XML. Care should be taken that the software being included in this archive has a provision for free copies for backup or archival purposes. All other formats and the overall computing environment should be stored as described in "best effort" data retention (Section 2.4.1), which should in turn be described in the appropriate vendor contract for the RFC Publisher. 

https://www.rfc-editor.org/rfc/pdfrfc/rfc8153.txt.pdf