středa 30. dubna 2014

Nanite: https://github.com/openplanets/nanite/

Do seznamu nástrojů jsem přidal Nanite: https://github.com/openplanets/nanite/ , který balí DROID a Apache Tika a má sloužit pro identifikaci a charakterizaci větších objemů dat. Kromě standardní command line aplikace je dostupná také aplikace pro Hadoop pro zpracování dat z Webarchivace.




středa 23. dubna 2014

Nové online registry nástrojů na dlouhodobou ochranu dat

Na webu OPF se objevila malá noticka o možném spojení registru COPTR a DCH RP registru (http://www.openplanetsfoundation.org/blogs/2014-04-22-news-coptr-and-dch-rp-digital-preservation-tool-registries).
Oba registry dělají velmi podobnou věc, vytvářejí seznam nástrojů na všechny možné aktivity, jako např. ingest, extrakci metadat, editaci metadat, validaci formátů aj. V registrech se dá vyhledávat podle různých hledisek.
Pokud tedy hledáte nástroj na konkrétní problém s vašimi daty, pak jej můžete najít zde.
COPTR http://coptr.digipres.org/Category:Tools
DCH RP http://www.digitalmeetsculture.net/heritage-showcases/dch-rp/registry-of-services-and-tools/


úterý 22. dubna 2014

Nová publikace o LTP: Digital Preservation for Libraries, Archives, and Museums

Digital Preservation for Libraries, Archives, and Museums [Paperback]
by Edward M. Corrado, Heather Lea Moulaison

https://rowman.com/ISBN/9780810887121


Porovnání obrazových formátů pro digitalizaci - FADGI

Americká organizace FADGI vydala před Velikonoci poměrně zajímavé porovnání formátů TIFF, JPEG 2000, PNG a JPG z pohledu vhodnosti k dlouhodobé ochraně. Porovnávány byly 4 oblasti:

  • náklady (na tvorbu dat a uložení)
  • možnosti nastavení a flexibilita
  • implementace do systémů a dostupné nástroje
  • dlouhodobá udržitelnost
Celá zpráva ve formě přehledné tabulky je ke stažení zde http://www.digitizationguidelines.gov/guidelines/File_format_compare.html. Dostupná je tabulka, její tisková podoba pro lepší tisk a krátký textový popis se závěry srovnání.
Výsledky jsou celkem očekávatelné, otázku zda vybrat TIFF nebo JPEG 2000 za vás nevyřeší, ale zpráva vám může poskytnou dobrá vodítka a hlediska, které vám s výběrem pomohou.

neděle 13. dubna 2014

Archivematica v ČR

V ČR přibývá projektů, které experimentují s Archivematicou - OS systémem pro zajištění logické dlouhodobé ochrany digitálních dat. Přestože je Archivematica funkčně poměrně omezené řešení, začíná se s ní pracovat v řadě institucí, a několik dalších její používání plánuje nebo zvažuje:

  1. Národní archiv v projektu Národní digitální archiv. Aktuální prezentace ukazuje jasně, že NDA bude stavět svoje řešení na jádru Archivematica. Národní archiv je určitě pod velkým tlakem a rozhodnutí implementovat Archivematicu, o kterém se šuškalo od minulého roku, je velkým projevem důvěry v toto řešení a ve schopnost NA ho implementovat. http://www.isss.cz/archiv/2014/download/prezentace/narodniarchiv_bernas.pdf
  2. S Archivematicou experimentuje MZK, také již od minulého roku. (demo na: archivematica.mzk.cz, resp. http://archivematica.mzk.cz/ica-atom/index.php/;actor/browse) a plánuje ji použít v ostrém provozu pro některá svoje data. 
  3. O Archivematicu se zajímá také NFA a FAMU.
  4. O Archivematice uvažuje také projekt Česká digitální knihovna (projekt NAKI Knihovny Akademie věd). 
  5. Masarykova univerzita podala do FR CESNETu žádost o financování projektu LTP Pilot, kde by chtěla systém testovat a implementovat na infrastruktuře DÚ CESNET, a ve spolupráci s MZK. 


sobota 12. dubna 2014

DMPonline - nástroj na vytváření Data management plánů - DPC a JISC

Již v loňském roce vytvořily britské organizace DPC a JISC jednoduchý online nástroj na tvorbu a správu tzv. Data management plánů. Je to výborný nástroj použitelný v jakékoliv instituci, která vytváří a/nebo spravuje digitální data. Je potřeba se pouze zaregistrovat, nástroj si poté pamatuje plány, které jste vytvořili atd.
Co je to Data management plán? Jde o dokument, který si organizace vytváří pro svá digitální data. Může to být pro sbírku, pro data z konkrétního projektu, data od konkrétního původce. Plán pak obsahuje veškeré údaje, které o datech máme - jak vznikají, jak jsou přebírána, jak a kde jsou ukládána, stupeň ochrany atd atd. Dokument tohoto typu zabrání nejasnostem, poskytne přehled i pro nově příchozí kolegy, může pomoci v plánování a to velmi podstatně - kolik bude potřeba místa na úložišti? Kolik to bude stát? Budeme sbírku X a data od organizace Y ukládat na discích nebo na páskách? Právě z tohoto důvodu musí Data management plán vzniknout již na začátku, tedy před vznikem projektu, před vytvářením nebo přebráním dat. Dokument by to měl být závazný a tedy podepsaný manažerem organizace.
https://dmponline.dcc.ac.uk/ 

pátek 11. dubna 2014

Digitální knihovník: Blog Jaroslava Kvasnici z Národní knihovny

Pomalu se rozrůstá blog pana Kvasnici z NK, který se také dotýká témat dlouhodobé archivace. Píše třeba svoje zkušenosti s Apache Tikka, FITS, nástroji pro extrakci metadat.

Sledujte zde:
http://digitalniknihovnik.wordpress.com/