čtvrtek 27. března 2014

Cloud a archivy, jde to dohromady?

Neil Beagrie publikoval na blogu britského národního archivu (TNA) krátký post o cloudu a jak se k němu archivy staví. Shrnuje nejčastější otázky a informuje o analýze, která se připravuje právě na objednávku britského archivu a měla by být vydána v druhé půli tohoto roku. Zmiňuje se také o systému Archivematika, který welšské konsorcium používá v cloudu.
Určitě stojí za to sledovat.
http://blog.nationalarchives.gov.uk/blog/cloud-storage-archives-match-made-heaven/

úterý 25. března 2014

Zajištění kvality při digitalizaci audiovizuálního obsahu

Zajímavé aktivity BAVC v oblasti dlouhodobé ochrany audiovizuálního obsahu.

BAVC ve společném projektu s několika dalšími institucemi pracuje na vývoji nástrojů na kontrolu kvality digitalizovaného audiovizuálního materiálu. V projektu AVAA vytvářejí databázi audiovizuálních artefaktů a také nástroje na jejich odhalování tzv. quality assurance tools.

Tyto nástroje by měly usnadnit práci především správcům archivů, kteří potřebují jednoduchou informaci o kvalitě materiálu, který se jim do archivu dostává.

Pomocí sady filtrů mohou v audiovizuálním souboru identifikovat podezřelá místa, kde obraz nemá konzistentní jasnost nebo ji mění skokově, kde v obraze dochází k neobvyklým změnám barevnosti, nebo kde jsou barevné fleky, špína,  kde dochází ke ztrátám barevnosti apod.

Jak moc je tohle ojedinělý nástroj nebo nakolik je v praxi použitelný bohužel nedokážu posoudit.


čtvrtek 20. března 2014

Kolik stojí důveryhodnost - zpráva projektu 4C

Zajištění kvality v oblasti dlouhodobé archivace a budování důvěryhodnosti dlouhodobého archivu instituce něco stojí. Tým EU projektu 4C se pokusil získat a sumarizovat informace o nákladech souvisejících s certifikací a self-auditem. Zjistil, že jednak nejsou k dispozici srovnatelná veřejně publikovatelná data, a jednak pro každého stakeholdera je "kvalita" trochu něco jiného.

Formou rozhovorů a analýzy dokumentů rozebírají náklady na projekty pilotních auditů ISO 16363 a také náklady na audity provedené podle TRACu. Protože ISO 16919 není stále ve fázi publikovaného standardu, jsou k certifikaci podle ISO 16363 k dispozici stále jen pilotní audity provedené APARSENem v roce 2011.  Jsou analyzována data z auditů v DANS, SafeArchive, CINES, Chronopolis, Scholars Portal, SEDAC, DNB...

http://www.4cproject.eu/community-resources/outputs-and-deliverables/d4-3-quality-and-trustworthiness-as-economic-determinants-in-digital-curation

středa 19. března 2014

Rozhovor s Pavlem Smržem z VUT o tom proč a jak se VUT zapojilo do projektu SCAPE

Na blogu OPF je rozhovor s Pavlem Smržem z VUT v Brně, který se od září 2013 podílí na projektu SCAPE:

http://openplanetsfoundation.org/blogs/2014-03-07-interview-scaper-pavel-smrz

"I lead a work package dealing with the Data Centre Testbed. Together with other new project partners, we aim at extending the current SCAPE development towards preserving large-scale computing experiments that take place in modern data centres. Our team particularly focuses on preservation scenarios and workflows related to large-scale video processing and interlinking."

"My experience shows that “one-size-fits-all” solutions are often too scary to be used. Although funding agencies believe opposite, research and development project seldom deliver solutions that could be used as a whole. It is often the case that what seemed to be a minor contribution becomes the next big thing for business. I believe that at least some components developed within the project have this great potential."

Jak jsou vaše data a instituce připraveny na dlouhodobou ochranu?

Americký Educopia Institute (http://www.educopia.org/) publikoval dokument, který se zabývá připraveností digitalizovaných novin na dlouhodobou ochranu - Guidelines for Digital Newspaper Preservation Readiness. Z názvu je jasné, že je dokument zaměřen na digitalizované noviny, ovšem zásady, které popisuje, jsou aplikovatelné na jakákoliv data v knihovnách nebo archivech.
Dokument je koncipován tak, že jde vlastně o návod jak postupovat, co zařídit, co kontrolovat v institucích, a to s minimálními náklady. Cílem je, aby data byla dobře spravována a tak "připravena" na dlouhodobou ochranu.
Pokryta jsou následující témata: inventarizace (co, kolik, a kde vlastně máme), organizace dat (názvy souborů, uložení apod.), správa formátů, správa metadat, správa kontrolních součtů, ochranné balíčky a další. Ke každé kapitole náleží seznam nástrojů, které jsou volně dostupné.
Dokument také přináší "kontrolní seznam", který je možné použít na rychlou nebo opakovanou kontrolu připravenosti vaší organizace na dlouhodobou ochranu dat (strana xi).
Autoři rozlišují mezi základní a optimální připraveností. Celý koncept připravenosti je navázán na v roce 2013 představené NDSA Stupně dlouhodobé ochrany - http://www.digitalpreservation.gov/ndsa/activities/levels.html.
Publikace se zdá velmi použitelno pro české knihovny, které spravují digitální data a nemají ustálené procesy okolo jejich správy a v dohledné době nepočítají s žádným sofistikovaným digitálním repozitářem na jejich ochranu.
Pokud máte digitální data a máte snahu je spravovat tak, aby byla použitelná v budoucnu, pak toto je dokument, který vám pomůže začít.


Ke stažení 

http://www.educopia.org/publishing/gdnpr
http://metaarchive.org/public/publishing/Guidelines_for_Digital_Newspaper_Preservation_Readiness.pdf

úterý 18. března 2014

Projekt DURAARK - dlouhodobá archivace architektonických 3D objektů - úvod do digital preservation

Na stránce projektu Duraark (http://duraark.eu/) je mezi projektovými výstupy zajímavý dokument, který se primárně věnuje současnému stavu dlouhodobé ochrany 3D objektů. Úvodní část dokumentu ale velmi dobře shrnuje současný stav chápání dlouhodobé ochrany digitálních dat samotné. Rozhodně stojí za přečtení.
Ilustrativní je obrázek 1 na straně 7 s následujícím popisem, kde je popsán rozdíl mezi ochranou bitstreamu, logickou ochranou a sémantickou ochranou digitálních dat. Toto rozlišení je často nepochopené, dokument jej vysvětluje naprosto přesně.
http://duraark.eu/wp-content/uploads/2014/02/duraark_d6.6.1_final.pdf

PREMIS Fair - prezentace z loňského září nyní online

Prezentace z loňského PREMIS workshopu, který se konal při konferenci iPRES, jsou nyní dostupné online. Pokud používáte metadatové schéma PREMIS, nebo se chystáte, prezentace určitě stojí za prostudování. Dají nahlédnout do změn, které se chystají.
Zajímavé jsou konkrétní příklady použití z různých institucí, mezi jinými prezentovali i polští kolegové.
Z pohledu posledního vývoje v ČR je určitě zajímavá prezentace o využití PREMIS v LTP systému Archivematica.
http://www.loc.gov/standards/premis/premis-implementation-fair-agenda-2013.html

pondělí 17. března 2014

ToMaR - využití Hadoop clusteru pro migraci velkého množství souborů

http://www.openplanetsfoundation.org/blogs/2014-03-14-tomar-how-let-your-preservation-tools-scale

Příspěvek na blogu Open Planets Foundation prakticky ukazuje jak se dají využít nástroje vznikající v projektu SCAPE. Na příkladu formátové migrace ukazuje možnosti využití Hadoop a ToMaR pro hromadné migraci velkého množství souborů. Příspěvek popisuje příklad (asi) fiktivní knihovnice, která potřebuje migrovat několik set tisíc TIFF souborů do formátu JPEG 2000. Tento příklad není zcela teoretický, podobným "cvičením" prošly už naostro např. v Britské knihovně a v mnoha dalších. 


neděle 16. března 2014

Časová osa světových webových archivů

Webarchivists.org publikoval časovou osu zobrazující přehlednou historii vzniku webových archivů ve světě. Je příjemné vidět, že WebArchiv Národní knihovny ČR patří mezi průkopníky archivace webu.

středa 12. března 2014

PREFORMA - PREservation FORMAts for culture information/e-archives

Zajímavý projekt zahájený 1. ledna 2014 financovaný z EU.

http://www.preforma-project.eu/project.html

Podle informaci na internetu (http://www.digitalmeetsculture.net/wp-content/uploads/2014/01/PREFORMA_FactSheet_v1.3.pdf) by měl vypsat tender s částkou 2,8 milionu Euro, ve kterém vyzve 6 dodavatelů, aby vyvinuli moduly pro přípravu dat pro dlouhodobou archivaci -  nástroje na validaci formátů a extrakci technických metadat.

Cílem projektu je zajistit, aby paměťové instituce měli plnou kontrolu nad nástroji, které používají k ověření shody se standardy formátů. Výsledkem by měly být volně dostupné nástroje a jejich pilotní zapojení do jiných open source systémů.

Projekt se zaměří na obrazové soubory, dokumenty, a audiovizuální data a bude vyvíjené nástroje testovat na reálných data zúčastněných institucí.

středa 5. března 2014

3. Liber Workshop on Data Curation se zajimavým programem

Ve Vídni se koná  19. a 20. května 2014 zajímavý workshop Liberu: Keeping Data: The Process of Data Curation. Jako doprovodná akce je oznámeno setkání k projektu Scape.

Program je zde:
http://liber2014.univie.ac.at/programme/

Na hlavní akci vystoupí David Giaretta, Andreas Rauber, Paul Ayris, nebo Jeffrey van der Hoeven, zástupci DANS, CINES i představitelé exotičtějších institucí.

Stránka workshopu také obsahuje seznam doporučené četby k tématu archivace vědeckých dat. Z uvedených novějších titulů jistě stojí za prolistování:

Erway, Ricky. Starting the Conversation: University-wide Research Data Management Policy. Dublin (Ohio):  OCLC Online Computer Library Center, December 2013. http://www.oclc.org/content/dam/research/publications/library/2013/2013-08.pdf

Fearon, David Jr., Betsy Gunia, Sherry Lake, Barbara E. Pralle and Andrew L. Sallans. 2013.SPEC Kit 334: Research Data Management Services. July. Washington, DC: Association of Research Libraries. 
http://publications.arl.org/Research-Data-Management-Services-SPEC-Kit-334/

RDMF special event: Funding Research Data Management . A conversation with the funders. 25 April 2013, Lakeside Conference Centre, Birmingham (Blogposts and presentations). 
http://www.dcc.ac.uk/events/research-data-management-forum-rdmf/rdmf-special-event-funding-research-data-management

úterý 4. března 2014

Kniha: Re-collection: Art, New Media, and Social Memory

Tahle publikace bude určitě stát za pozornost: 

Re-collection: Art, New Media, and Social Memory (Leonardo Book Series) Hardcover – May 23, 2014 by Richard Rinehart (Author) , Jon Ippolito (Author), The MIT Press

Pánové z MIT napsali - soudě podle obsahu na propagačním webu (http://re-collection.net/) a pověsti, která knihu už před publikací provází - asi docela zajímavý text. 

Naše filosofie dlouhodobé ochrany se musí vyvíjet přirozeně s médii. Knihovny, muzea, archivy, wunderkamery, tvořily sociální paměť, a tu je třeba s vývojem digitálních a nových medií znovu definovat a posunout za tyto zdánlivě navždy existující instituce. 

Knihovny, muzea a galerie se zaměřily pouze na ukládání, a nevyužívají potenciál variability, sítí, nových médií a crowdu. Využití práce amatérů je cestou jak efektivně zajistit uchování obsahu nových médií. Migrace, emulace a re-interpretace davem amatérů je spolehlivější cestou jak uchovat kulturní data a obsahy nových médií než ukládání v rigidní instituci a správa "experty". Znamená to ale, že musíme přistoupit na jinou definici kultury, sociální paměti...ale pokud chceme, aby současná digitální kultura přežila, nemáme podle autorů jinou možnost.


pondělí 3. března 2014

Konference Digitálná knižnica v Jasné letos se zajímavým programem

Letos je program tradiční konference Digitálna knižnica 2014 v Jasné pod Chopkom docela zajímavý. Zvlášť druhý den jsou přednášky věnované masové digitalizaci a zpřístupňování digitalizovaných dat od zástupců
- knihovny ve Vatikánu,
- Bavorské státní knihovny
- Britské knihovny (Sean Martin, který se zabývá i dlouhodobou archivací)
- Bodleian Libraries
- Poznan supercomputer center + Polská NL

Bez zajímavosti nebudou určitě ani komerční přednášky Tempestu (Robust OAIS Compliant LTP Solution), IBM, Oracle, nebo Image Access, Treventus atd. 

Je trochu škoda, že na programu není představení digitalizačních projektů České ani Slovenské národní knihovny. Obě tyto instituce masově digitalizují v projektech financovaných EU SF....

Digital Curation of Research Data Experiences of a Baseline Study in Germany

Publikace NETSTORu k dlouhodobé archivaci  vědeckých dat byla zveřejněna také anglicky: http://nbn-resolving.de/urn:nbn:de:0008-2013112701

Německé vydání je na http://nbn-resolving.de/urn:nbn:de:0008-2012031401