pátek 31. srpna 2012

Nástroje na identifikaci, validaci a extrakci metadat ze souborových formátů

Užitečný seznam nástrojů včetně stručného popisku a klasifikace podle tří kritérií:
  • funkce (identifikace, validace, extrakce metadat, oprava chyb)
  • způsobu spuštění/typu aplikace (příkazový řádek nebo desktopová aplikace, online aplikace, softwarová knihovna)
  • dostupnosti (open source, freeware, zdarma pro určené typy uživatelů, komerční SW)
http://www.garymcgath.com/formatsoftware.html?goback=.gde_126125_member_153733875

OAIS "verze 2" potřetí

Barbara Sierman z nizozemské Koninklijke bibliotheek napsala stručné a přehledné srovnání rozdílů nové verze OAIS oproti původní verzi. Čtěte na jejím osobním blogu Digital preservation seeds:

http://digitalpreservation.nl/seeds/standards/oais-2012-update/

ISO 14721:2012 - OAIS

OAIS "verze 2", o které jsme informovali v předchozím příspěvku, je od 21. srpna také ISO standard 14721:2012.

http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?csnumber=57284

úterý 28. srpna 2012

Proběhl Mezinárodní archivní kongres - ICA 2012, Brisbane, Austrálie

V týdnu od 20. do 24.8.2012 proběhl v Brisbane v Austrálii mezinárodní archivní kongres, který se koná jednou za 4 roky. Letošní pokrýval celou řadu problémů - "klasickou" archivní teorii, praxi z různých zemí světa. Velký počet příspěvků se věnoval problematice digitálních dokumentů v archivech. Tedy jak dig. data vznikají u původců, jakým způsobem probíhají transfery dig. dokumentů do archivů, jak je archivy zpracovávájí a dlouhodobě ochraňují. Bylo možno vidět a poslechout si převážně australské státní archivy (New South Wales, Queensland, Victoria apod.), což jsou v současné době lídři této v této oblasti. Mají zpracované relevantní politiky, dokumentaci, popsané procesy, mají také zavedené způsoby práce s původci, řeší dlouhodobou ochranu, mají speciální týmy pracovníků apod. Neztratily se ani archivy z EU, prezentace byly z národních archivů Nizozemí, Švédska, Estonska, Velké Británie i Francie aj. Potvrdilo se, že současným problémem je správa digitálních dokumentů a jejich archivace, plus věci navazující.

Web kongresu naleznete na http://www.ica2012.com/.
Plné texty většiny příspěvků pak na této adrese http://www.ica2012.com/program/full-papers.php.

Ze zajímavých a tématicky relevantních tomuto blogu vybírám např.

čtvrtek 23. srpna 2012

OAIS "verze 2" vyšla v červnu 2012

Zdá se, že nám nějakým záhadným způsobem unikla velmi zásadní událost: Consultative Committee for Space Data Systems publikoval (po deseti a půl letech od původního vydání) v červnu tohoto roku revidovanou verzi přelomového dokumentu, který zásadním způsobem ovlivnil vývoj v oblasti digital presevation - Reference model for an Open Archival Information System, v odborných kruzích známého pod důvěrným názvem OAIS.

Revize upřesňuje některé původní koncepty, např. koncept Authenticity je upřesněn pomocí nového konceptu Transformational Information Property, který do modelu zavádí "significant properties". Do Preservation Description Information je nově přidáno Access Rights Information. Došlo také k úpravě některých grafů.

Původní verze OAIS byla v roce 2003 adoptována jako ISO standard 14721:2003 - otázkou je, jak se do ISO standardu promítne tato revize.

Revidovaná verze OAIS je ke stažení na http://public.ccsds.org/publications/archive/650x0m2.pdf.

pondělí 13. srpna 2012

Nástroje na charakterizaci a identifikaci formátů - srovnávací zpráva Australské národní knihovny

Australská národní knihovna zveřejnila závěrečnou zprávu z testování několika nástrojů na extrakci metadat a identifikaci datových formátů. Zpráva je myšlena jako doplněk k podobným projektům a porovnáním, proto obsahuje ne zcela tradiční nástroje, což je z našeho pohledu velký přínos.
Zpráva je dostupná z webu OPF [tady] nebo přímo plný text [.pdf, 1.8MB].

Nástroje na identifikaci datových formátů:

  • File Investigator Engine
  • Outside-In File ID
  • FIDO
  • Unix file / libmagic
Nástroje na extrakci metadat:
  • File Investigator Engine
  • Exiftool
  • MediaInfo
  • pdfinfo from the Xpdf toolkit
  • Apache Tika

pondělí 6. srpna 2012

Disk ze syntetického safíru, který vydrží 2000 let?

Arnano - Safirový disk
Francouzská instituce zabývající se ukládáním jaderného odpadu (L’Andra, Agence nationale pour la gestion des déchets radioactifs) se rozhodla nakoupit archivní média ARNANO (http://www.arnano.fr/), 20cm průhledné disky z umělého safíru potažené vrstvou z nitridu titanu, na které se vejde až 10 000 stran A4 obsahu.
Jsou to analogová média, data je možné přečíst jednoduše přímo mikroskopem. Start-up, který média propaguje, o nich mluví jako o "definitivním archivu".

 Podle výrobců jsou disky nepadělatelné, snadno čitelné a především velmi odolné proti mechanickému, chemickému, magnetickému nebo tepelnému poškození. Jedinou nevýhodou je pořizovací cena jednoho disku: 3000 EUR.

čtvrtek 2. srpna 2012

Nový blog projektu Pandora

Australská národní knihovna spustila nový blog o svém projektu Pandora, jednom z nejstarších projektů archivace webu na světě.
http://blogs.nla.gov.au/australias-web-archives/