středa 29. května 2013

Ztrátový (matematicky) JPEG2000 pro archivní mastery?

Zajímavá studie Roberta Buckleyho pro Kongresovou knihovnu "Using Lossy JPEG2000 Compression For Archival Master Files" doporučuje matematicky ztrátovou kompresi (2-10:1) pro ukládání archivních masterů z digitalizace. Taková komprese neznamená žádnou ztrátu vizuální informace při další redukci velikosti souboru.
http://www.digitizationguidelines.gov/still-image/documents/JP2LossyCompression.pdf

Studie také rozebírá možnosti kódování JPEG2000 "by size" nebo "by quality". Každý způsob řízení kodování do JPEG2000 se hodí pro jiný typ obrázků a jiná workflow.

V tomto kontextu stojí za zmínku také dokument Mezinárodní telekomunikační unie,  http://www.itu.int/rec/T-REC-T.803-200211-I/en, který podrobně a s příklady ukazuje jak testovat konformanci nástrojů na generování a dekodování JPEG2000 s ISO/IEC 15444-1:2004.

neděle 26. května 2013

EPUB jako archivní formát - update 2013

Johan van der Knijff z NK Nizozemí publikoval minulý rok obsáhlou zprávu o vhodnosti formátu EPUB pro dlouhodobou archivaci. Letos se k tématu vrátil a text aktualizoval. Od minulého roku došlo k dalšímu vývoji tohoto formátu, EPUB3 má podporu ve čtečkách a SW aplikacích (iBooks, Sony etc.). Update zároveň upozorňuje na nové nástroje na charakterizaci, které s EPUBem pracují.
Vše na Johanově příspěvku na OPF tady http://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-updatehttp://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-update

pátek 24. května 2013

Akce v Praze: 1st Workshop on Archives in the Digital Age: standards, policies and tools

V rámci konference "3rd International Conference on Integrated Information", která se koná v Praze 5.-9. září 2013 proběhne workshop zaměřený na digitální data v archivech.

Právě byla zveřejněna výzva na podávání příspěvků:

Otevřená témata jsou: 

a) the use and evaluation of standards, metadata schemas and content description rules implemented by the Archives in order to describe, disseminate and preserve their material in the digital world,
b) the implementation of principles, policies, guidelines and best practices as part of the digitally manipulated archival tasks, and
c) the use and evaluation of archival information systems,
d) the implementation of Semantic Web technologies in Archives, and
e) the use of Social Media in Archives.

Příspěvky budou publikovány v Procedia Social and Behavioral Sciences. 

Nová verze nástroje JHOVE publikována k testování


Gary McGath vydal novou verzi JHOVE, 1.10b1 k testování. Hlavní změnou je vyřešení problému s PDF a JPEG formáty, který v určitých případech u poškozených souborů vedl ke spotřebování veškeré dostupné paměti systému, který JHOVE používal.

Kdo chcete testujte, pro ostatní je poslední verze stabilní 1.9.https://sourceforge.net/projects/jhove/files/jhove/JHOVE%201.10b1/

úterý 14. května 2013

DigCCurr - Curate Thyself: Druhé místo pro DIFFER

B. Vychodil z NK ČR a dokktorand na FF UK získal ocenění na sympoziu DigCCurr - Curate Thyself.

Komise, složená z renomovaných profesorů amerických, kanadských a britských univerzit z oblasti knihovnictví a správy digitálních dat, digital curation, ocenila jeho poster o projektu DIFFER (http://differ.nkp.cz/) druhým místem.

Více informací zde: http://m.sils.unc.edu/news/2013/curate-thyself-digccurr-ending

Best practices for a digital storage infrastructure for the long-term preservation of digital files

V projektu "Digitizing Contemporary Art" vznikla moc pěkná přehledová studie o technologiích ukládání dat a médiích.
http://www.digitisingcontemporaryart.eu/images/uploads/banners/DCA_D62_Best_practices_for_a_digital_storage_infrastructure_20130506_Version1.pdf
Vysvětluje vždy stručně principy fungování jednotlivých technologií a shrnuje doporučení při používání každé z nich, rozebírá výhody a nevýhody každé technologie. V závěru je i cenové srovnání a doporučený, jak storage technologii vybírat...

úterý 7. května 2013

Dánský národní archiv zveřejnil novou verzi své strategie dlouhodobé ochrany

Dánský národní archiv zveřejnil anglickou verzi nové strategie dlouhodobé ochrany digitálních archiválií "Strategy for archiving digital records 
at the Danish National Archives". Jde o velmi zajímavé čtení. Národní archiv Dánska má velmi omezený počet formátů, které od původců akceptuje. Původci musí provést migraci dat do těchto formátů a do metadat podle standardu. Transfer digitálních dat probíhá každých 5 let a to i v případě, že se jedná o neuzavřené (tedy živé) fondy. Digitální archiválie jsou pak na obou místech, u původce i v archivu. Archiv tak vlastně dělá snapshoty - více ve vlastním dokumentu. Zároveň každý digitální archiv původce musí projít auditem, zda odpovídá standardům stanoveným národním archivem.
Situace tedy do jisté míry podobná té české, alespoň pokud se jedná o předepsanou množinu formátů, které archiv přijímá.

středa 1. května 2013

Nástroj FITS v nové a podstatně vylepšené verzi

Gary McGath strávil celý duben úpravami nástroje FITS, který obsahuje balík jiných nástrojů jako jsou JHOVE, DROID, NZME a dokáže poskytnout jeden výstup v XML s výsledky, které tyto nástroje dávají pro konkrétní soubor.
V nové verzi, která je dostupná na GitHub (https://github.com/gmcgath/fits-mcgath) byly aktualizovány nástroje DROID, JHOVE, a hlavně byla přidána Tika. FITS je teď také schopný dát výsledky (tj. extrahovat vlastnosti) z video souborů, k čemuž využívá elementy např. z MediaInfo, PBcore a popis z Archivematiky.
Rozhodně stojí za vyzkoušení!
Podrobnosti viz zde http://www.openplanetsfoundation.org/blogs/2013-04-30-getting-fits-shape

Zajímavý post o ISO 16363 a ISO 16919 - Audit důvěryhodných digitálních repozitářů


Na blogu texaského státního archivu a knihovny se objevil zajímavý příspěvek (https://www.tsl.state.tx.us/slrm/blog/?p=4812) o stavu norem ISO 16363 a především ISO 16919, která je normou upravující organizace, které mohou provádět audit podle ISO 16363. Norma je zdá se před dokončením.
Zajímavé jsou také informace o testovacích auditech, které proběhly v USA a v Evropě, kde ani jeden repozitář neprošel, většinou kvůli neexistenci tzv. preservation policies nebo psané kodifikaci procesů.
Vytvořit takovouto dokumentaci může trvat velmi velmi dlouho, instituce která by se ráda ucházela o ISO 16363 by proto měla být připravena daleko před auditem.
V textu se také skrývá malé varování: "ISO 16919 is getting closer and closer to finalizing. However, until this standard is completed, you cannot conduct any official ISO 16363 audits, which means that there is no such thing as ISO 16363 compliance. If a vendor tells you that they can do an ISO 16363 audit for you, they are either misinformed or outright lying, so hold on to your wallet!"