úterý 21. února 2017

Přednáška "Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie"

Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie

Registrační formulář na přednášku Libora Coufala.
https://goo.gl/forms/13EBnUjWlf2Q3WUB3

Pořadatel: Česká informační společnost, z. s.
Termín: 22.3.2017, 13:00 - 16:30 hodin
Místo konání: Český svaz vědeckotechnických společností z.s., Novotného lávka 5110 00 Praha 1, učebna 2017

Původně vystudovaný finančník, Libor Coufal je knihovnický "mutant". Knihovnickou dráhu započal ve Fisherově knihovně na University of Sydney. Poté působil v Národní knihovně ČR na oddělení elektronických informačních zdrojů, později přejmenované na oddělení archivace webu, které od roku 2008 vedl. Od roku 2012 pracuje v Národní knihovně Austrálie, kde v současnosti řídí oddělení dlouhodobého digitálního uchovávání.

Program
13:00 - 14:30  Národní knihovna Austrálie v digitálním světě (fondy, služby a projekty), diskuse
14:30 - 15:00  Přestávka s malým občerstvením
15:00 - 16:30  Digitální uchovávání "vzhůru nohama", diskuse

úterý 14. února 2017

PIQL v ČRO - technologie spolehlivejší než digitální nosiče?

Záznam debaty o archivaci v Českem rozhlasu. Každý může posoudit sám, jestli je tohle přístup vhodný pro disaster recovery pro data jeho instituce. PIQL řeší problém s uchováváním digitálních dat odsunutím na trvalé médium, které ukládá na proprietární typ filmového pásu, zapisuje a čte na proprietárním zařízení, v binární podobě.

Vytvoření věčné kopie digitálních dat, trvalého digitálního objektu, bohužel není cesta pro všechny typy archivů. Neměli bychom podlehnout iluzi, že tohle je řešení pro všechny typy dat a institucí - řada institucí potřebuje nástroje pro efektivní správu dat a metadat, pro aktivní ochranu. Musí zajistit trvalou dostupnost dat uživatelům v novém technologickém prostředí; uživatelům, kteří mají nové potřeby a očekávání, kteří potřebují metadata, identifikátory a formáty použitelné v aktuálním technickém a informačním kontextu. Proto existují srandardy jako OAIS a ISO 16363, které popisují obrysy takových řešení. Tzv. longterm preservation systémy (LTP) toho musí obsahovat mnohem více, než jen storage. Nikdo nečeká, že nějaké konkrétní LTP řešení bude existovat navždy - naopak je žadoucí, aby se LTP systémy měnily spolu s technologiemi kolem, archivní balíčky se aktivně kontrolují a migrují do nových formátů, obohacují se jejich metadata a migrují se formáty. PIQL není reprezentantem aktivního přístupu k digital preservation, nezajistí, že budete mít svá data uspořádáná, dobře popsaná, validní, a použitelná v technickém a informačním kontextu uživatelů za 100 let.
úterý 7. února 2017

Archivace videoartu v České republice?

Trvalé uchovávání videoartu, nových medií nebo řekněme audiovizuálního umění asi není nic snadného. Na serveru artalk.cz je zajímavý rozhovor se Slávou Sobotovičovou http://artalk.cz/2016/06/03/videoart-zabava-pro-excentriky/ o archivech videoartu v České republice.
Především se mluví o archivu Vědecko-výzkumného pracoviště AVU (http://vvp.avu.cz/videoarchiv/), jsou zmíněny i další lokální projekty jako Mediabáze FAMU (http://mediabaze.cz/) nebo Media Archive FaVU VUT Brno (http://media-archiv.ffa.vutbr.cz/index.php). 

Bohužel z toho nemám pocit, že by u nás v téhle komunitě byl velký zájem o trvalé uchovávání tohoto obsahu, o logickou ochranu a archivaci ve smyslu ISO 14721 nebo ISO 16363 atp. Snad jen na FAMU se tohle téma trochu řeší. V rozhovoru se mluví o normalizaci souborových formátů a digitalizaci, ale na webech archivů žádné metodiky popsány nejsou, ani nevidím žádné popisy formátových politik, metadatové standardy, žádné pokusy o DSA apod. "Archivy" jsou  zaměřené spíš na zpřístupňování - streamů nebo metadat. 

I v téhle oblasti také vznikají standardy pro metadata jako Media Art Notation System (MANS) nebo se používají standardy vytvořené jinde jako DIDL. 

Archivací "New Media Art" se ve světě zabývá už poměrně hodně institucí (seznam v EU http://www.newmediaart.eu/), například Netherlands Media Art Institute (http://nimk.nl/eng/preservation/media-art-preservation-links), Electronic Arts Intermix (EAI) (https://www.eai.org/), ZKM v Německu (http://zkm.de/en/topic/conservation-of-media-art), ADA (http://www.virtualart.at/nc/home.html). Sbírky videoartu a nových médií mají i některé další knihovny nebo archivy jako Corrnell uni, Getty archives a další. pondělí 6. února 2017

Archivace soukromých digitálních dat se zaměřením na fotografie a videa

Richard Wright sepsal "Case NotePersonal Digital PreservationPhotographs and Video",  kde vysvětluje, jak on osobně čelí rostoucím objemům soukromých digitálních dat jako soukromý archivář.

V posledních letech vyprodukoval jeho život desítky tisíc rodinných a soukromých fotografií a videí. Richard ví o ca 55 000  fotografiích, které jsou všude možně - na některém z jeho 4 počítačů a laptopů, mobilním telefonu, ve foťácích, kamerách, na některém ze tří počítačů partnerky, na domácím NASu nebo některém z cca sedmi USB úložištích, další jsou na Dropboxu, Amazon Photos, Googlu a Microsoft drive, další materiál je v jeho profilech na sociálních sítích, na blozích atd. Všechno pod názvy, které generují fotoaparáty nebo software, ve formátech skrývajících se za MPEG kontejnery, nebo v proprietárních formátech, v RAW, a to bez velké kontroly, bez systematických záloh, bez katalogu.

Tohle všechno zná asi každý. Richard jako archivář svého soukromého archivu doporučuje:

  1. deduplikovat (http://www.joerg-rosenthal.com/en/antitwin/
  2. vytvořit si seznam, katalog všech sbírek (asi ne úroveň každého souboru, ale v rozumné míře) -inspirovat se http://preservationweek.wixsite.com/personalarchiving nebo zvážit použití něčeho jako http://www.resourcespace.com/get tam kde se používají cloudová služby, inspirovat se http://www.cdwinder.de/http://www.cdfinder.de/en/info.html nebo jako Richard investovat do http://www.wincatalog.com/
  3. omezit počet použitých formátů
  4. zálohovat a udržovat zálohy, pokud možno automaticky (třeba s využitím https://www.microsoft.com/en-gb/download/details.aspx?id=15155https://fastglacier.com/ )
  5. kontrolovat, že jsou zálohy a data nepoškozené (fixity check, třeba s použitím https://www.avpreserve.com/tools/fixity/ nebo http://www.md5summer.org/ apod.)
Pokud máte nápady na další užitečné nástroje a služby, můžete je sdílet v komentářích:-)

pátek 27. ledna 2017

PIQL v ČRO

Po úspěchu ve Slovenském rádiu se podařilo PIQLu přesvědčit i Český rozhlas, že tohle je ta správná cesta, jak se zbavit problémů s trvalou archivací digitálního obsahu....

http://www.parabola.cz/zpravicky/27282/cro-pro-archivaci-cennych-zaznamu-vyuzije-technologii-piql/

úterý 24. ledna 2017

Diplomky na UK pouze digitálně

Univerzita Karlova se rozhodla pro archivaci závěrečných kvalifikačních prací (tedy bakalářek, diplomek i rigorózních a disertačních prací) pouze v elektronické podobě. Konkrétním vyjádřením tohoto rozhodnutí je Opatření rektora č. 23/2016, které možnost odevzdání textu omezuje pouze na formát PDF/A (verze 1a nebo 2u). Byla zpřísněna také pravidla pro odevzdávání příloh. Studentům je k dispozici seznam schválených formátů, které budou akceptovány automaticky, a možnost zažádat o přijetí přílohy v neschváleném formátu. Studenti jsou povinni odevzdávat PDF/A od 1. 2. 2016.
Opatření rektora doplňuje metodický pokyn a prozatímní informační stránka pro studenty.
Validace PDF/A bude probíhat pomocí nástroje veraPDF, formáty ostatních souborů budou pouze identifikovány pomocí nástroje Fido.
Otázka zrušení povinnosti odevzdávat i tištěnou verzi práce byla ponechána na rozhodnutí fakult. Je tedy možné, že tištěné verze budou i nadále zpřístupňovány v některých knihovnách.

Jak si vlastně vede "digital preservation" komunita? Komentáře vítány

Andy Jackson a Paul Wheatley tento víkend rozeslali pomocí Google fóra https://groups.google.com/group/digital-curation emails s prosbou o spolupráci. Obracejí se v něm na všechny zapojené v komunitě okolo dlouhodobé archivace s otázkou, zda současný způsob práce, spolupráce a publicity v této komunitě je dostatečný. Oba dlouhodobě stojí za webem www.digipres.org, kde se celkem úspěšně snaží spojovat roztříštěné aktivity různých registrů, diskuzních fór apod. Ideou je mít vše pod jednou střechou a poskytnout zájemcům web jak pro prvotní tak i pro detailní orientaci v problému.
Originální znění emailu je níže, zmíněné otázky znějí
Poslední otázka je asi nejpalčivější. Pokud máte na tyto otázky odpověď nebo názor, napište jej přímo na diskuzní forum https://groups.google.com/forum/#!forum/digipres, nebo do diskuze pod tímto příspěvkem. 

Děkujeme

Calling All Digital Preservers!

The digital preservation community is small and under resourced. This means we have to work together if we want to make a real impact. To this end, a small group of us has been attempting to help the members of the digital preservation community better support each other. The results of this include:
  • The http://www.digipres.org site, which aims to provide a gateway to all of the wonderful community-owned and community-oriented resources out there that are dedicated to digital preservation.
  • The Digital Preservation Q&A site (http://qanda.digipres.org/), which is a Q&A site set up in the wake of the failure of the efforts to set up suitable Stack Exchange sites for our field.
  • The COPTR Tool Registry (http://coptr.digipres.org), which was formed by the merger of many of the previous tool registry efforts, and which seeks to be a primary reference for those working in practical digital preservation.
  • The POWRR Tool Grid v.2 (http://www.digipres.org/tools/), which is generated from COPTR registry.
  • The Formats Overview (http://www.digipres.org/formats/), built by aggregating information from a number of different format registries.
If, like us, you believe we all need to work together, we’d love to hear from you….
The last one is really important. We’ve been in digital preservation long enough to see a lot of portals and projects come and go, and we recognise that making it possible to build on past work sometimes requires changing what we've built so far.

Please get in touch if you have any questions. You could talk to us directly, or use the digipres community forum we set up for this purpose. We’re happy to hear any and all ideas and criticisms!

Best wishes,
Andy Jackson (@anjacks0n) and Paul Wheatley (@prwheatley)
--

čtvrtek 19. ledna 2017

Digital Preservation: Putting It to Work - nová publikace ze Springeru

Ano, je to tak, EU chválení kolegové z Polska vydali publikací ve Springeru. A ze 2/3 v ní prezentují svůj projekt dlouhodobého repozitáře CREDO.

Digital Preservation: Putting It to Work
http://www.springer.com/us/book/9783319518008 
Editors: Tomasz Traczyk, Włodzimierz Ogryczak, Piotr Pałka, Tomasz Śliwiński, 
DOI 10.1007/978-3-319-51801-5

Kniha není sice nijak rozsáhlá (158 stran), uvolněná kapitola o metadatech (odkaz na webu Springeru, 48 stran, přehledový text o všech typech metadat včetně technických pro různé typy obsahu a ochranných, popisných atd.) a obsah ale vypadají docela zajímavě. Obsah je zde:

Part I Problems of Long-Term Digital Preservation
Requirements for Digital Preservation.............................................. 3
Tomasz Traczyk
Metadata in Long-Term Digital Preservation ..................................15
Grzegorz Płoszajski

Part II Solutions Proposed by the CREDO Project
The CREDO Project.................................................... ....................65
Tomasz Traczyk and Włodzimierz Ogryczak
CREDO Repository Architecture.....................................................77
Tomasz Traczyk
Information Processing in CREDO Long-Term Archive ................93
Tomasz Traczyk
Metadata in CREDO Long-Term Archive .................................... 109
Tomasz Traczyk and Grzegorz Płoszajski
Persistence Management in Long-Term Digital Archive ............. 123
Piotr Pałka
Power Efficiency and Scheduling Access to the Archive.............. 133
Tomasz Śliwiński
Information Management in Federated Digital Archives ............. 143
Piotr Pałka and Tomasz Traczyk
Index .............................................................................................. 157

středa 18. ledna 2017

Konference ILIDE 2017 a PASIG

Chtěl bych upozornit na konferenci ILIDE 3-5. dubna 2017 na Slovensku v Jasné. Organizátorům se daří zajistit celou řadu zahraničních speakerů, v programu jsou například David Minor nebo Tom Cramer, ale také disco nebo Aquarium Night:-)

Přísti PASIG se koná opět trochu blíž, v Oxfordu 11. až 13. září 2017https://pasigoxford.org/.

Stále jsou online jsou k dispozici slidy z webinářů PASIGu

Jeden veselý slide z pravidelné prezentace Oracle o vývoji storage technologíí pro archivy je dole:-)


úterý 17. ledna 2017

Ako na certifikáciu repozitára podľa Data Seal of Approval - článek v ITLib

Název: Ako na certifikáciu repozitára podľa Data Seal of Approval
Autor: Andrea Miranda
Číslo: 4/2016
PDF link: http://itlib.cvtisr.sk/buxus/docs/Miranda-ITlib%204_2016.pdf
Abstrakt:
Cieľom príspevku je oboznámiť s kritériami hodnotenia digitálnych repozitárov podľa certifikácie Data Seal of Approval (DSA). Certifikát slúži ako „záruka“ dôvery pre dané kľúčové skupiny, ktoré využívajú či odovzdávajú dáta do cieľového repozitára. DSA predstavuje pomerne jednoduchý spôsob auditu a certifikácie, najmä pre za- čínajúce repozitáre či repozitáre menšieho rozsahu. Popísané sú pôvodné a pripravované Zásady DSA a podrobne spísané sú potrebné podklady a doklady, ktoré bude repozitár potrebovať pre svoju úspešnú certifikáciu.

pondělí 16. ledna 2017

Kdy vydá NDA xml profil pro validaci PDF/A?

V návaznosti na předešlou zprávu o publikaci verze 1.0 validátoru PDF/A veraPDF mě napadá, že by vlastně bylo logické, aby Národní archiv (resp. NDA) vydal xml profil pro validaci PDF/A podle jeho požadavků.

Legislativně deklarovaný požadavek na PDF/A-1a potřebuje doplnění a vysvětlení - je validní reprezentací PDF/A-1a takový soubor PDF/A, které neprojde validací PDF/A-2u nebo 3a? Validace úrovně 2u nebo 3a je podrobnější než validace podle profilu úrovně 1a (kontroluje se více pravidel)....


úterý 10. ledna 2017

veraPDF 1.0 je tu!

Konzorcium veraPDF dnes oznámilo uvolnění verze veraPDF 1.0. 
http://verapdf.org/2017/01/10/verapdf-1-0-released/?utm_source=veraPDF+News

veraPDF je PDF/A validátor, open source, vyvíjený v projektu Open Preservation Foundation a PDF Association, validuje všechny části a úrovně ISO 19005 (PDF/A). Je dostupný pod licencemi MPLv2+/GLPv3+.

Jak důležitý krok je to pro použitelnost PDF/A v archivech asi není třeba vysvětlovat, naše archivní legislativa o tom, jak se prokazuje shoda s ISO 19005, taktně mlčí. veraPDF dává archivům do ruky nástroj, který jim umožní posoudit shodu s touto normou nebo s vlastním profilem -  v případech, kdy je archiv připraven přijmout PDF/A nedovídající některým požadavkům zcela přesně.

Digitální archivace v Rogue One: Star Wars Story - Jedi Archives

Nemůžu neupozornit na příspěvek na blogu Preservicy. "How Not to Build a Digital Archive: Lessons from the Dark Side of the Force" komentuje poslední díl filmové ságy Star Wars z hlediska digitální archivace.

Možná si řeknete, že to je jen chytrý marketingový tah. Pokud to přitáhne  pozornost a povede k popularizaci základních principů digitální archivace, tak proč ne:-)

A je k tomu dokonce i webinář, kde si můžeme poslechnout o chybách Jedi Archive více od Jedi Mastera Jona Tilbura...

A teď koukám, že Zdeněk Hruška už to dokonce i přeložil:
http://ltp-portal.mzk.cz/home/Novinky/jaknebudovatdigitalniarchiv-poucenizestarwarsrogueone

úterý 27. prosince 2016

Digital Preservation Metadata for Practitioners - Implementing PREMIS

12. prosince vyšla soudě podle obsahu hodně zajímává publlikace, sborník příspěvků o implementaci Premis. Obsahuje mj. samostatné kapitoly týkající se návrhu ochanných metadat pro různé typy materiálu, včetně třeba audiovizuálního, webové archivu nebo klasického archivního.

Digital Preservation Metadata for Practitioners
Implementing PREMIS
Editors:
Angela Dappert,
Rebecca Squire Guenther,
Sébastien Peyrard
ISBN: 978-3-319-43761-3 (Print) 978-3-319-43763-7 (Online)
http://link.springer.com/book/10.1007/978-3-319-43763-7#page=22

čtvrtek 15. prosince 2016

DSA survery: co na DSA audit instituce?

Pěkný článek o Data seal of approval repozitářích. Kolegové z NCDD se ptali, jaký význam měl DSA audit pro jednotlivé instituce, co si o procesu mysli, atd..

Survey of DSA-certified digital repositories: Report on the findings in a survey of all DSA-certified digital repositories on investments in and benefits of acquiring the Data Seal of Approval (DSA)
Kees-Jan Waterman
Barbara Sierman

úterý 13. prosince 2016

Dva zajímavé dokumenty z projektu InterPARES 2 - průvodce ochranou digitálních dokumentů a průvodce pro vytváření digitálních dokumentů

Projekt InterPARES jistě není třeba představovat. Je již ve své třetí fázi v podobě InterPARES trust (https://interparestrust.org/) a pokračuje ve vytváření různě zaměřených studií o digitálních archiváliích, dokumentech, společnosti a digital record keeping.
Výzkum a následné zprávy jsou rozčleněny do témat, jako např. infrastruktura, bezpečnost, zpřístupnění, právní otázky aj. - viz https://interparestrust.org/trust/about_research/domains
Všechny publikované zprávy jsou volně dostupné zde https://interparestrust.org/trust/research_dissemination - InterPARES Trust Reseach documents (momentálně 56).

Mj. jsou tam také k nalezení 2 publikace, které poskytují základní informace tvůrcům digitálních dokumentů a také těm, kteří se je snaží dlouhodobě ochránit. Oba dokumenty jsou staršího data, to jim ale nic neubírá na použitelnosti. 


čtvrtek 8. prosince 2016

United States Government Publishing Office (GPO) a ISO 16363

United States Government Publishing Office (GPO) usiluje o externí certifikaci podle ISO 16363 pro své informační systémy. Federal Digital System (FDsys) by měl být certifikován podle této normy jako Trusted Digital Repository (TDR). Dlouhodobou archivací se zabývají již delší dobu, v roce 2014 začali pracovat na přípravě externí certifikace a podle informací na webu (https://www.fdlp.gov/project-list/trustworthy-digital-repository-tdr-audit) letos proběhl interní selfaudit TDR.

Letos v létě také GPO vypsala RFI s cílem zjistit blíže, kdo by mohl pro ně externí certifikaci udělat, a za jakých podmínek. (https://www.govinfo.gov/features/tdr-audit-rfi). Text s požadavky a dotazy z RFI je na https://www.fbo.gov/spg/GPO/PSPSD/WashingtonDC/ISO16363-RFI/listing.html. Bohužel odpovědi nejsou volně dostupné. 

Jak je to v ČR? Česká vláda v této věci spoléhá na projekt Národní digitální archiv (NDA)? Opravdu data všech informačních systémů vlády se  nakonec dostanou do NDA, třeba i kompletni obsah portálu oDok