čtvrtek 5. července 2012
K čemu se (také) mohou hodit registry formátů - výborné zamyšlení Paula Wheatleyho na OPF
Paul Wheatley se ve svém příspěvku na blogu OPF zamýšlí nad tím, co všechno by nám měl registr formátů poskytnout. Zamyšlení je postaveno na praktické ukázce postupu práce při uložení PDF souboru do digitálního repozitáře. Čtěte na http://www.openplanetsfoundation.org/blogs/2012-07-05-dont-panic-what-we-might-need-format-registries
středa 4. července 2012
UDFR spuštěno
University of California Curation Center dnes oznámilo spuštění dlouho očekávaného registru digitálních formátů UDFR (Unified Digital Format Registry), sponzorovaného Kongresovou knihovnou jako část programu NDIIPP (National Digital Information Infrastructure Preservation Program). Cílem UDFR je sjednotit a propojit funkce a data ze dvou předchozích registrů - PRONOM a GDFR. UDFR běží na platformě OntoWiki s otevřeným kódem (open source). Registry digitálních formátů hrají důležitou roli v procesech plánování a provádění akcí dlouhodobého uchování (např. migrace formátů).
UDFR byl naplněn daty z PRONOM a registru MIME typů IANA a v současnosti obsahuje informace o:
UDFR byl naplněn daty z PRONOM a registru MIME typů IANA a v současnosti obsahuje informace o:
- 846 souborových formátech
- 28 kódování znaků
- 17 kompresních algoritmech
- 1,198 MIME typech
- 548 externích signaturách (souborových příponách)
- 494 interních signaturách ("magických číslech")
- 268 softwarových balících
- 156 agentech
úterý 3. července 2012
Náklady na digital preservation - prezentace z workshopu v Dánsku
11. června proběhl v Kodani workshop "Costs and Benefits of Keeping Knowledge", prezentace jsou nyní k dispozici na webové stránce workshopu [zde]. Zajímavá je prezentace o modelu DP4Lib, jehož výsledky ukazují, že nejvíce nákladný z trojice Ingest, Curation and Access je Ingest. Velmi praktický a návodný je též příspěvek Cost model for DP (Ulla Bøgvad Kejser).
pátek 29. června 2012
Digital Preservation na Stack Exchange - vyjádřete svou podporu
Na Stack Exchange se formuje nová stránka otázek a odpovědí na téma Digital Preservation. Momentálně se nachází ve fázi rekrutování dostatečně velké komunity potenciálních aktivních uživatelů, kteří mají zájem aktivně přispívat k vytváření obsahu formou kladení a zodpovídání dotazů. To je podmínkou pro spuštění stránky. Pokud se takovou komunitu podaří vybudovat, může jít o potenicálně velmi zajímavou znalostní bázi pro oblast dlouhodobého digitálního uchování. Pokud máte zájem podpořit tento projekt, klikněte na obrázek.
pondělí 25. června 2012
EPUB jako formát pro dlouhodobou ochranu
Jedna novinka z Openplanetsfoundation: Studie z KB o formátu EPUB z pohledu dlouhodobé ochrany digitálních dat.
http://www. openplanetsfoundation.org/ system/files/ epubForArchivalPreservation180 62012ExternalDistribution_0. pdf
resp.:
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation20072012ExternalDistribution.pdf
Text se zabývá současnými možnostmi identifikace a validace tohoto formátu, rozdíli mezi verzí 2 a 3, a nakonec obsahuje i nějaké základní doporučení pro dlouhodobou ochranu. Autorem studie je opět Johan van der Knijff, text není součástí výstupů projektu SCAPE, ale je skutečně jen paperem vydaným KB.
Zatím jsou Johanova doporučení jasná:
1) Nepřijímat EPUB jako archivní formát, dokud se formát více nerozšíří a dokud nebude lepší podpora v prohlížečích.
2) Nepřijímat k archivaci dokumenty v EPUBu, které jsou opatřeny DRM.
3) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují zdroje, jež nejsou na seznamu Core media types (tzv. foreign resources) .
4) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují remote resources.
5) Dávat pozor na EPUB dokumenty, které obsahují javascript resources.
6) Vyhnout se DTBook obsahu.
7) K verifikaci shody EPUBu se specifikací používat Epubcheck.
8) Prozatím nepřijímat k archivaci publikace v EPUBu, které obsahují pokročilejší typografické prvky a layout (např. vědecké a technické dokumenty, které obsahují specialni znaky, matematické rovnice apod.).
Johan slibuje další testování nástrojů pro validaci a extrakci technických metadat, a další analýzy. Vzhledem k probíhajícím projektům v ČR, které se týkají e-knih, je tohle velmi aktuální téma, kterému bude třeba se věnovat i u nás.
http://www.
resp.:
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation20072012ExternalDistribution.pdf
Text se zabývá současnými možnostmi identifikace a validace tohoto formátu, rozdíli mezi verzí 2 a 3, a nakonec obsahuje i nějaké základní doporučení pro dlouhodobou ochranu. Autorem studie je opět Johan van der Knijff, text není součástí výstupů projektu SCAPE, ale je skutečně jen paperem vydaným KB.
Zatím jsou Johanova doporučení jasná:
1) Nepřijímat EPUB jako archivní formát, dokud se formát více nerozšíří a dokud nebude lepší podpora v prohlížečích.
2) Nepřijímat k archivaci dokumenty v EPUBu, které jsou opatřeny DRM.
3) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují zdroje, jež nejsou na seznamu Core media types (tzv. foreign resources) .
4) Nepřijímat k archivaci dokumenty v EPUBu, které obsahují remote resources.
5) Dávat pozor na EPUB dokumenty, které obsahují javascript resources.
6) Vyhnout se DTBook obsahu.
7) K verifikaci shody EPUBu se specifikací používat Epubcheck.
8) Prozatím nepřijímat k archivaci publikace v EPUBu, které obsahují pokročilejší typografické prvky a layout (např. vědecké a technické dokumenty, které obsahují specialni znaky, matematické rovnice apod.).
Johan slibuje další testování nástrojů pro validaci a extrakci technických metadat, a další analýzy. Vzhledem k probíhajícím projektům v ČR, které se týkají e-knih, je tohle velmi aktuální téma, kterému bude třeba se věnovat i u nás.
pondělí 18. června 2012
Zajímavé články: ontologie pro digital preservation
McHugh, A. (2012) A model for digital preservation repository risk relationships. In: World Library and Information Congress: 78th IFLA General Conference and Assembly, 11-17 Aug 2012, Helsinki, Finland.
http://eprints.gla.ac.uk/65420/
A analýza limitů v oblasti dlouhodobé ochrany: hlavním limitem není podle autora už technologie, ale jsou jím finance. Objem digitálních informací, který bychom mohli chtít dlouhodobě ochraňovat stále dramaticky roste, ovšem finance dostupné na tuto činnosti nerostou podle autora zdaleka dostatečně.
https://escholarship.bc.edu/ojs/index.php/ital/article/view/2167/pdf
pondělí 11. června 2012
Potřebné znalosti a zkušenosti pro "digital preservation"
Jedním z prvních výstupů evropského projektu DigCurV (Digital Curator Vocational Education) je analýza potřeb školení v této oblasti a také analýza znalostí a zkušeností, které pracovníci mají mít. Dotazníky vyplnilo více než 400 knihoven a archivů ze 44 zemí světa.
Na stránkách 33-59 studie [zde] naleznete, jaké znalosti tyto instituce u svých pracovníků preferují.
Na stránkách 33-59 studie [zde] naleznete, jaké znalosti tyto instituce u svých pracovníků preferují.
Náklady na "digital preservation" a projekt dánského národního archivu a královské knihovny
Královská knihovna a národní archiv v Dánsku publikovaly výsledky několikaletého výzkumu v oblasti nákladů na uložení, ochranu digitálních dat. Jejich projekt Cost Model for Digital Preservation (CMDP) začal v roce 2009 na základě předchozích aktivit a pokračuje dodnes. Nástroj ve formě excelové tabulky [zde] je neustále doplňován a vyvíjen. Pokrývá OAIS moduly "Preservation planning", "Archival Storage", "Ingest" a částečně "Administration". Ke všemu je dostupná dokumentace.
čtvrtek 7. června 2012
Pravěk, aneb kde jsou ta data dnes?
Někdy je dobré se ohlédnout. Doufejme, že za 40 let bude na naši dobu pohled lepší a data z našich dnešních systémů a archivů budou dostupná a použitelná.
K tomu pohledu zpět nám můžou pomoci nejen zahraniční weby a instituce (http://www.vintage-computer.com, http://www.computerhistory.org nebo http://www.oldcomputers.net/) ale také řada zajímavých česky psaných a na lokální informace bohatších zdrojů. Přece jen o SAPO, Uralu, Minsku a TNS se v anglických zdrojích moc nepíše.
Moc hezky udělaný web z jedné diplomky je tady:
http://www.historiepocitacu.cz
Ledacos zajímavého je k viděni tady:
http://www.kormus.cz/mvt/
Dokonce máme u nás i HW muzeum:
http://technodrom.cz/index.html
A další zajímavé odkazy k tomuto tématu:
http://sen.felk.cvut.cz/sen/index_cz.html?historie/gen2.html
http://extrahardware.cnews.cz/historie-pocitacu-i-pocitacovy-pravek a dalších 9 pokračování
http://www.vesmir.cz/clanek/pocatky-pocitacove-techniky-nebyly-jednoduche
Poslední odkaz není na HW, ale přece jen si ho v tomto kontextu nedopustím. Je to bestseller loňského roku, kniha Jamese Gleicka "The Information: A History, A Theory, A Flood."
A trocha atmosféry 80tých let:
K tomu pohledu zpět nám můžou pomoci nejen zahraniční weby a instituce (http://www.vintage-computer.com, http://www.computerhistory.org nebo http://www.oldcomputers.net/) ale také řada zajímavých česky psaných a na lokální informace bohatších zdrojů. Přece jen o SAPO, Uralu, Minsku a TNS se v anglických zdrojích moc nepíše.
Moc hezky udělaný web z jedné diplomky je tady:
http://www.historiepocitacu.cz
Ledacos zajímavého je k viděni tady:
http://www.kormus.cz/mvt/
Dokonce máme u nás i HW muzeum:
http://technodrom.cz/index.html
A další zajímavé odkazy k tomuto tématu:
http://sen.felk.cvut.cz/sen/index_cz.html?historie/gen2.html
http://extrahardware.cnews.cz/historie-pocitacu-i-pocitacovy-pravek a dalších 9 pokračování
http://www.vesmir.cz/clanek/pocatky-pocitacove-techniky-nebyly-jednoduche
Poslední odkaz není na HW, ale přece jen si ho v tomto kontextu nedopustím. Je to bestseller loňského roku, kniha Jamese Gleicka "The Information: A History, A Theory, A Flood."
A trocha atmosféry 80tých let:
úterý 5. června 2012
DOTS - optická páska
Zajímavá technologie pro archival storage:
http://group47.com/Group_47-DOTS_Technology_Overview-WEBSITE.pdf
http://group47.com/Group_47-DOTS_Technology_Overview-WEBSITE.pdf
čtvrtek 31. května 2012
PrestoPrime Storage Planning Tool
Na Oracle Storage Day v Praze 18. dubna zmínil pan Hruška ve své prezentaci o dlouhodobé archivaci nástroj pro plánování HW archivu, který vznikl v rámci projektu Presto Prime. (http://prestoprime.it-innovation.soton.ac.uk/)
Stojí za to, se tímhle webem proklikat, a zkusit si nějaký HW navrhnout.
Stojí za to, se tímhle webem proklikat, a zkusit si nějaký HW navrhnout.
neděle 27. května 2012
How to research and develop signatures for file format identification
pátek 18. května 2012
Nejzajímavější konference v roce 2012
Ačkoli už za sebou máme několik velmi zajímavých akcí v oblasti digtial preservation (například Future Perfect 2012) čeká nás v této letos ještě ledacos. Tady je summary nejdůležitějších akcí v oboru:
Screening the Future Conference 2012
May 21–23 2012
http://www.prestocentre.org/events/screeningfuture/2012
APA 2012 Conference
European Space Agency in Frascati,
Rome, Italy
November 6.-7. 2012
http://www.alliancepermanentaccess.org/index.php/event/apa-2012-conference-6-7-nov-esaesrin-frascati/
Archiving Conference
June 12 -15 2012
Copenhagen, Denmark
http://www.imaging.org/ist/conferences/archiving/Archiving2012%20Preliminary%20Program.pdf
Ipres 2012
University of Toronto
October 1 -5 2012
http://ipres.ischool.utoronto.ca/
Screening the Future Conference 2012
May 21–23 2012
http://www.prestocentre.org/events/screeningfuture/2012
APA 2012 Conference
European Space Agency in Frascati,
Rome, Italy
November 6.-7. 2012
http://www.alliancepermanentaccess.org/index.php/event/apa-2012-conference-6-7-nov-esaesrin-frascati/
Archiving Conference
June 12 -15 2012
Copenhagen, Denmark
http://www.imaging.org/ist/conferences/archiving/Archiving2012%20Preliminary%20Program.pdf
Ipres 2012
University of Toronto
October 1 -5 2012
http://ipres.ischool.utoronto.ca/
středa 16. května 2012
Zveřejněna nová verze metadatového schématu PREMIS (v. 2.2)
PREMIS Editorial Committee oznámil vydání nové verze PREMIS 2.2.
Nové schéma je dostupné na http://www.loc.gov/standards/premis/premis.xsd
Změny v datovém slovníku jsou popsány v http://www.loc.gov/premis/Rights-PREMIS-review-20120404.doc. Tyto změny budou během několika dní promítnuty i do Datového slovníku PREMIS.
Změny se týkají převážně údajů o právech (entita Rights).
Nové schéma je dostupné na http://www.loc.gov/standards/premis/premis.xsd
Změny v datovém slovníku jsou popsány v http://www.loc.gov/premis/Rights-PREMIS-review-20120404.doc. Tyto změny budou během několika dní promítnuty i do Datového slovníku PREMIS.
Změny se týkají převážně údajů o právech (entita Rights).
pátek 4. května 2012
Seznam "seznamů" nástrojů na digital preservation/curation
Paul Wheatly dal dohromady neuvěřitelně užitečný seznam různých seznamů a portálů shromažďujících informace o nástrojích na různé procesy digital preservation/curation. Viz http://wiki.opf-labs.org/display/SPR/Digital+Preservation+Tools.
čtvrtek 3. května 2012
Vzdělávací web o Digital Preservation pro zaměstnance státu Severní Karolina, USA
Web obsahuje úvod do problematiky na několika úrovních, seznam relevantních zdrojů, odkazy na videa, školení apod. Velmi užitečný úvodní zdroj informací. Viz http://digitalpreservation.ncdcr.gov/index.html
Zajímavá analýza z projektu APARSEN
David Giaretta a spol. připravili moc pěkný přehled projektů a oblasti dlouhodobé ochrany digitálních dat. Hlavní částí dokumentu je návrh řízení autenticity a provenance během životního cyklu digitálních záznamů, dokument se tedy zabývá nikoli knihovními nebo vědeckými daty, kde se již dlouhodobá ochrana digitálních dat řeší v mnoha institucích, ale daty e-governmentu, records managementem.
Report on Authenticity and Plan for Interoperable Authenticity Evaluation System
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/04/APARSEN-REP-D24_1-01-2_3.pdf
Report on Authenticity and Plan for Interoperable Authenticity Evaluation System
http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2012/04/APARSEN-REP-D24_1-01-2_3.pdf
středa 2. května 2012
Preserving Moving Pictures and Sound
Preserving Moving Pictures and Sound
DPC Technology Watch Report 12-01 March 2012
DPC Technology Watch Series
Richard Wright
http://dx.doi.org/10.7207/twr12-01 (PDF 915KB)
Helen R. Tibbo. Placing the Horse before the Cart - Conceptual and Technical Dimensions of Digital Curation
Helen Tibbo ve svém článku velmi pěkně popisuje rozdíl mezi chápáním "digital preservation" a "digital curation", jejich začátky, vývoj a současné směřování na pozadí různých projektů. Zajímavé odpočinkové čtení se spoustou odkazů na další relevantní zdroje.
Viz http://www.cceh.uni-koeln.de/files/Tibbo.pdf
Přihlásit se k odběru:
Příspěvky (Atom)