čtvrtek 3. listopadu 2011

Přehled projektů v oblasti dlouhodobé ochrany digitálních dat financovaných EU

Research on Digital Preservationwithin projects co-funded bythe European Union in the ICT programme, http://cordis.europa.eu/fp7/ict/telearn-digicult/report-research-digital-preservation_en.pdf, Stephan Strodl, Vienna University of Technology, AustriaPetar Petrov, Vienna University of Technology, Austria, Andreas Rauber, Vienna University of Technology, Austria
                

středa 26. října 2011

PRONOM a Linked Data

The National Archives of the UK připravuje zveřejnění dat PRONOMU v publikačním modelu Linked Data, Tak by mělo být snažší data z PRONOMU dále využívat.

Testovací API k Linked Data PRONOM je na:
http://test.linkeddatapronom.nationalarchives.gov.uk/doc/file-formats
A sparql interface je v testovacim provozu na:
http://test.linkeddatapronom.nationalarchives.gov.uk/sparql/endpoint.php

Debata o možném využití sémantických technologií v PRONOMU se vede asi od loňského roku. (http://www.openplanetsfoundation.org/node/562http://labs.nationalarchives.gov.uk/wordpress/index.php/2011/01/linked-data-and-pronom/)

A ještě odkaz na dokument s PRONOM vocabulary:
http://labs.nationalarchives.gov.uk/wordpress/wp-content/uploads/2011/06/draft-pronom-vocabulary-specification.pdf

pátek 21. října 2011

Zajímavý nástroj z NARA: File Analyzer

Aplikace nazvaná File Analyzer (https://github.com/usnationalarchives/File-Analyzer) z NARA může být užitečná v digitalizaci nebo při akvizici elektronických dokumentů. Nástroj poměrně rychle analyzuje obsah disku, je schopen generovat několik typů hashů, umí exportovat různě filtrovaný výsledek analýzy.

Trochu problém je, že neumí analyzovat obsah balíků v taru nebo zipu, alespoň po zběžném vyzkoušení se to tak jeví. V manuálu jsou o archivech nic nenašel.bohužel.

úterý 18. října 2011

čtvrtek 6. října 2011

První výstupy projektu SCAPE

Cílem projektu SCAPE je mimo jiné vytvořit architekturu, která by umožnila efektivně provádět charakterizaci (tj. extrakci siginifikatních vlastností objektů) velkého množství digitálních objektů.

V současnosti používané nástroje DROID, FIDO, JHOVE, FILE, a FITS byly v rámci projektu SCAPE podrobeny testování a analýze výkonu a přesnosti. Výsledky testování mají sloužit k navržení dalších uprav těchto nástrojů pro další použití v rámci projektu SCAPE.


Evaluation of characterisation tools. Part 1: Identification. Johan van der Knijf (KB), Carl Wilson (BL).
http://openplanetsfoundation.org/system/files/SCAPE_PC_WP1_identification21092011_0.pdf

čtvrtek 8. září 2011

KryoFlux

Máte ještě data na disketách? možná vám pomůže KryoFlux, Více íce podrobnmostí na http://www.softpres.org/glossary:KryoFlux

Evropský rámec pro audit a certifikaci

Pánové David Giaretta (za CCSDS/ISO Repository Audit and Certification Working Group (RAC)), Henk Harmsen (Data Seal of Approval (DSA) Board), Christian Keitel (DIN Working Group Trustworthy Archives – Certification) podpsali dohodu, s cílem vytvořit společný Evropský rámec pro audit a certifikaci digitální repozitářů.

http://www.trusteddigitalrepository.eu/Site/Trusted%20Digital%20Repository.html

Evropský certifikační rámec se bude skládat ze tří úrovní:

1) základní certifikace - je přiznána repozitářům, které získají Data Seal of Approval (http://www.datasealofapproval.org/)

2) rozšířená certifikace - je přinána repozitářům, které k základní certifikaci připojí strukturovaný, externě odborně oponovaný a veřejně dostupný self-audit podle norem ISO 16363 nebo DIN 31644

3) formální certifikace - je přiznána repozitářům, které k základní certifikaci projdou procesem plného externího auditu podle norem SO 16363 nebo DIN 31644

pátek 2. září 2011

Vizualizace metadatových standardů

http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf
http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards_glossary_poster.pdf
http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards_glossary_pamphlet.pdf


Zajímavé projekty kolem JPEG2000

Zdá se, věci že kolem jpegu 2000 se začínají hýbat. Několik institucí se zabývá vývojem  nástrojů na kontrolu kvality a validaci tohoto formátu. Určitě to souvisí s postupným přechodem na JP2 v řadě projektů masové digitalizace a chystaným upgradem systémů pro dlouhodobou ochranu v předních institucích.

- v KB.nl pracuje Johan van der Knijff po zkušenostech s Jhovem na aplikaci "Simple JP2 file structure checker" (http://openplanetsfoundation.org/blogs/2011-09-01-simple-jp2-file-structure-checker
- zprávy o podobných snahách jsou také z Welcome library (http://wiki.opf-labs.org/display/AQuA/Validating+TIFF+to+JPEG2000+migration
- brzy snad uvidíme také podporu jpegu 2000 v další generaci  Jhove2. 

A ještě zajímavý članek o jpegu 2000: 
JPEG 2000 standards in digital preservation, Richard Clark

čtvrtek 25. srpna 2011

Náklady na Digital Preservation

Kromě známého projektu LIFE se v poslední době odhady nákladů na dlouhodobou archivaci zabývali v samostatném projektu také v Dánsku:
http://www.costmodelfordigitalpreservation.dk/contact

Pěkný seznam odkazů k tomuto tématu je na: http://www.nationaalarchief.nl/kennisbanken/digitaal-bewaren?auteur=All&onderwerp=28


pátek 15. července 2011

Finská studie o LTP

Finové si nechali odhadnout, kolik ušetří tím, že budou mít centrální Long-term Preservation System pro všechny paměťové instituce.


Článek z Liberu:
Costs and Benefits of a Shared Digital Long-­Term Preservation System, Esa-­‐Pekka Keskitalo
http://www.doria.fi/bitstream/handle/10024/69928/liber%20paper%20keskitalo.pdf?sequence=1

Celá studie k LTP projektu ve Finsku:
http://www.kdk.fi/images/stories/LTP_Final_Report_v_1_1.pdf
Plánují vybudování centrálního systému pro LTP do roku 2016. V rámci projektu, ze kterého je tahle zpráva, vytvořili návrh architektury systému, popis jeho funkcí a požadavky na ně, způsob organizace, návrhy povinných metadat, analýzu přínosu centrálního LTP systému, analýzu nákladů atd. Všechny výstupy tohoto projektu, uvedené v seznamu literatury na konci dokumentu,  jsou ovšem bohužel pouze ve finštině.
Výborná ukázka dobré praxe na celonárodní úrovni. 

pátek 24. června 2011

Dlouhodobá ochrana digitálních dokumentů v paměťových institucích

Zpráva z šetření mezi 27 americkými paměťovými  institucemi. Jak chápou a realizují dlouhodobou ochranu digitálních dokumentů, jak využívají systémy a strategie.


PRESERVATION OF DIGITIZED BOOKS AND OTHER DIGITAL CONTENT HELD BY
CULTURAL HERITAGE ORGANIZATIONS
A report for the NEH and IMLS resulting from a grant from the “Advancing Knowledge:  The
IMLS/NEH Digital Partnership” given to Portico and Cornell University Library
March 2011


http://www.portico.org/digital-preservation/wp-content/uploads/2010/01/NEH-IMLS-D-book-model.pdf

středa 1. června 2011

A memory of webs past

IEEE spectrum uveřejnilo článek o archivaci webu (včetně hezkého komiksu ve stylu Indiana Jones), který představuje několik členských institucí IIPC.
http://spectrum.ieee.org/telecom/internet/a-memory-of-webs-past/0

pátek 6. května 2011

Digital preservation mash-up

http://wiki.opf-labs.org/display/AQuA/Collections%2C+Issues+and+Solutions

Phytonovská obdoba DROIDu

https://github.com/openplanets/fido
Údajně rychlejší nástroj pro identifikaci formátů od Openplanetsfoundation. Na strankách nadace je pěkná debata o tom, jak se FIDO liší od DROIDu
http://www.openplanetsfoundation.org/node/563

Studie vzniklé v projektu PERSID

V rámci projektu PERSID vznikly tři studie zkoumající možnosti integrace běžně využívaných systémů trvalé identifikace (Handle, DOI, URN:NBN).

‘The diversity of persistent identifier solutions inhibits easy access to scholarly and cultural resources; the work of the PersID project, and particularly its focus on policy interoperability across identifiers, will be invaluable in reducing these barriers.’

Studie jsou na stránce Knowledge Exchange: 

Stránka projektu PERSID: www.persid.org

pátek 22. dubna 2011

JHOVE2

https://bitbucket.org/jhove2/main/wiki/Home

Poslední verze JHOVE2 umí například validovat ICC profily, ovšem na podstatné formáty jako JPEG2000, PDF, a na formáty pro webarchiv (ARC, GZIP) si ještě budeme muset počkat do zveřejnění dalších verzí.

čtvrtek 3. března 2011

Nová verze DROIDu - DROID 6

Identifikuje cca 200 formátů, je schopen pracovat s celými složkami, umí identifikovat soubory uvnitř archivů tar. zip, gzip, umi generovat a MD5, pracovat s profily formátů, umí sledovat datum změny souborů atd. umí pomoci i při deduplikaci a vůbec pomůže při managementu dat:
http://www.nationalarchives.gov.uk/information-management/projects-and-work/dc-file-profiling-tool.htm

Link ke stažení:
http://droid.sourceforge.net/

Dokumentace:
http://www.nationalarchives.gov.uk/documents/droid-factsheet.pdf
http://www.nationalarchives.gov.uk/documents/droid-how-to-use-it-and-interpret-results.pdf

úterý 22. února 2011

Archivematica 0.7 release

Byla uvolněna nová verze open-source softwaru pro dlouhodobou ochranu digitálních dokumentů Archivematica.

Archivematica je systém postavený na microservices, poskytuje prostředí pro zpracování digitálních dokumentů v archivu od ingestu po access podle normy OAIS. Hlavními vylepšeními verze 0.7 jsou například implementace dashboardu pro sledovaní workflow zpracování SIP balíků, redisign architektury, nebo rozšíření podpory na kompletní PREMIS


Další verze by měla být zveřejněna ještě během roku 2011.

čtvrtek 13. ledna 2011

PDF/A : A Viable Addition to the Preservation Toolkit

V posledním loňském čísle časopisu D-Lib Magazine vyšel užitečný přehledový článek o formátu PDF/A. Jedná se o verzi formátu PDF, která je určena primárně pro archivní účely. Článek podává stručný přehled vlastností formátu a výsledky testování možností použití PDF/A na Ohio State University.

NOONAN, Daniel W.; MCCRORY, Amy; BLACK, Elizabeth L. PDF/A : A Viable Addition to the Preservation Toolkit. D-Lib Magazine [online]. 2010, 16, 11/12, [cit. 2011-01-13]. Dostupný z WWW: http://www.dlib.org/dlib/november10/noonan/11noonan.html.

čtvrtek 6. ledna 2011

Nová publikace - Digital Curation: A How-To-Do-It Manual

Digital curation : a how-to-do-it manual / Ross Harvey. -- New York : Neal-Schuman, 2010. -- xxii, 225 s

„Digital curation is concerned with actively managing data for as long as it continues to be scholarly, scientific, research, administrative, and/or personal interest, with the aims of supporting reproducibility, reuse of, and adding value to that data, managing it from the point of creation until its determined not to be useful, and ensuring its long-term accessibility, preservation, authenticity, and integrity“(str. 8)