pátek 26. července 2013

Rizika formátu PDF pro dlouhodobou ochranu: pokračování pokusů Johana van der Knijffa

Johan na svém blogu na openplanetsfoundation zveřejnil informace o další části svých pokusů s PDF. Tentokrát použil testovací data zveřejněná na Acrobat Engineering Website.

Testoval výkon Apache Preflight 2.0.0, Adobe Acrobat 10.14, Acrobat Preflight 10.1.3 (090)

Testoval dvě skupiny dat, která měla řadu riskantních vlastností (PDF cabinet of horrors:-) jako kryptování, nevložené fonty, multimediální obsah, javascript.

Ze závěrů asi stojí za to zmínit:
- Apache Preflight 2.0.0 neindentifikuje korektně kryptované soubory a soubory chráněné heslem
- při kontrole vložených fontů pomocí Apache Preflight považovat všechny chyby spojené s fonty za potenciální riziko
- multimediální obsah v PDF je pro Apache Preflight přiliš velké sousto - u většiny testovaných souborů nebyl schopen identifikovat specifické vlastnosti související s multimediálním obsahem, javascriptem, vloženými fonty. To by podle Johana nebyl velký problém, pokud bychom chtěli Apache Preflight používat pouze pro testování převoditelnosti PDF do PDF/A. Pokud bychom ale pomocí Apache Preflight chtěli hledat potenciální preservační rizika ve velmi heterogenní sbírce PDF, takt to problém bude.

středa 24. července 2013

Další zpráva DPC: Preserving Computer-Aided Design (CAD)

Přinejmenším stejně zajímavý jako report zmíněný v předešlém příspěvku je další dokument z DPC týkající se dlouhodobé archivace CAD modelů a objektů:
- Popisuje specifické vlastnosti tohoto typu digitálního materiálu
- Shrnuje výzkumné a archivační aktivity jednotlivých výzkumných projektů v této oblasti (LOTAR, STEP atp.) a také průmyslových sdružení a paměťových institucí, které formáty typu CAD používají.

Report je ke stažení zde: http://dx.doi.org/10.7207/twr13-02


středa 17. července 2013

Publikována zpráva DPC o ochranných metadatech (DPC Technology Watch Report "Preservation metadata")

Britská organizace Digital Preservation Coalition (DPC) zpřístupnila text druhé aktualizované verze reportu "Preservation metadata" - http://dx.doi.org/10.7207/twr13-03. První edice vyšla v roce 2005 a text již bylo potřeba podstatně předělat. Od roku 2005 se jedná o jednu z nejstahovanějších zpráv celé série Technology Watch (http://www.dpconline.org/advice/technology-watch-reports).
Nová verze obšírně popisuje různé aspekty ochranných metadat, zvláště ve vztahu ke standardu PREMIS. V textu naleznete definice ochranných metadat, vývoj pohledu na ně, způsoby využívání v různých institucích, způsob použití PREMIS ve schématu METS, přehled užitečných nástrojů k tvorbě ochranných metadat aj.
Text tak je velmi užitečný pro instituce, které s ochrannými metadaty chtějí začít, ale i pro ty, které je již využívají. Popsána je aktuální situace ve využívání ochranných metadat ve světě, což může být inspirací.

čtvrtek 11. července 2013

5D paměť využívající křemíkový krystal

Vědci na Univerzitě v Southamptonu oznámili průlom ve vývoji optických paměťových médií.

Demonstrovaná technologie využívá ultra rychlý laser, který data ukládá do "samouspořádné nanostruktury" v taveném křemeni. Data jsou uložena ve třech vrstvách v nanostrukturovaných bodech, které jsou od sebe vzdáleny pět mikrometrů.

Tato technologie, poprvé navržená již v roce 1996, by mohla zajistit uložení obrovských objemů dat miliony let. Oznámení mluví o 360TB na disk a odolnosti proti teplotám až 1000°C.

Podrobněji v abstraktu a na webu univerzity:
http://www.orc.soton.ac.uk/5dopticalstore.html
http://www.orc.soton.ac.uk/fileadmin/downloads/5D_Data_Storage_by_Ultrafast_Laser_Nanostructuring_in_Glass.pdf

Ještě ohledně tech 5D: jako čtvrtý a pátý rozměr se používají dva "dvojlomové" parametry: "pomalá orientace osy" a "síla retardace":-)

čtvrtek 4. července 2013

FileFormat.Info přidán do sekce Tools/Nástroje

Web FileFormat.Info (http://www.fileformat.info/index.htm) je vynikajícím zdrojem informací o formátech, nástrojích na migraci, extrakci metadat, validaci, identifikaci apod. Web mj. obsahuje databázi fyzických nosičů, formátů, přípon formátů, MIME types, linky na relevantní zdroje atd atd. U formátů jsou někde i ukázkové soubory.
Užitečné mohou být také online nástroje, které web poskytuje (http://www.fileformat.info/tool/index.dir) - je mezi nimi mj. UNIX FILE, nástroje na hashování, UUID generátor aj.
V sekci Convert (http://www.fileformat.info/convert/image/) najdete mj. i online ImageMagick metadata extractor/viewer a jiné online konverzní nástroje.
Celý web FileFormat.Info stojí za podrobné prozkoumání.

ICC profily v JPEG 2000 - změna standardu

JPEG 2000 je obrazový formát využívaný pro svou pokročilou kompresi a zachování kvality obrazu. Ti z vás, kteří jej využívají vědí, že jednou z jeho nevýhod je velmi limitované využití ICC profilů.

Johan van der Knijff nyní na webu OPF zveřejnil update svého staršího textu, který se těmto problémům věnoval. Nově uvádí, že specifikace JPEG 2000 byla na začátku roku 2013 upravena a to následujícím způsobem: Restricted ICC profil nyní nově dovoluje využití "display" profilu (předtím pouze "input" profil). To dává větší možnosti využití standardu JPEG 2000. Dobrou zprávou je také, že nástroje na tvorbu JPEG 2000 obrazů od předních výrobců (Kakadu, Aware aj.) tuto změnu podporují. Některé již dlouhodobě (mimo standard), některé byly upraveny.
Další podrobnosti viz v detailnějším Johanově článku - http://www.openplanetsfoundation.org/blogs/2013-07-01-icc-profiles-and-resolution-jp2-update-2011-d-lib-paper

pondělí 1. července 2013

ANADP II - nové výstupy plánovány na letošní podzim

Od roku 2011 fungující aktivita Aligning National Approaches to Digital Preservation uspořádá 18-20. listopadu 2013 své třetí zasedání/konferenci. Předchozí dvě byly velmi úspěšné. Tentokrát má zasedání v podtitulu slovo "akční" a během těchto tří dnů budou představeny některé výstupy. Budou se konat také "akční sekce", které by měly naznačit řešení pro následující oblasti:

  • vytvoření komunitou spravovaného registru relevantních nástrojů pro DP
  • aplikace OAIS na distribuovanou dlouhodobou ochranu digitálních dat (DP)
  • case studies a kvantitativní data z projektu 4C
  • vytvoření registru pro výuku a školení o DP aj.
Akce to bude určitě zajímavá. Více na http://educopia.org/events/ANADPII/outcomes