čtvrtek 21. prosince 2017
čtvrtek 14. prosince 2017
Preferred formats National Archives of the Netherlands In view of sustainable accessibility
Anglická verze formátové strategie NA NL, určitě stojí za vidění:
http://www.nationaalarchief.nl/sites/default/files/docs/national_archives_of_the_netherlands_preferred_and_acceptable_formats.pdf
Další jejich dokumenty anglicky:
http://openpreservation.org/blog/2017/12/12/translated-documents-of-the-national-archives-of-the-netherlands/
http://www.nationaalarchief.nl/sites/default/files/docs/national_archives_of_the_netherlands_preferred_and_acceptable_formats.pdf
Další jejich dokumenty anglicky:
http://openpreservation.org/blog/2017/12/12/translated-documents-of-the-national-archives-of-the-netherlands/
pátek 1. prosince 2017
Nové verze (a hned dvě)
Od včerejška je dostupný JHOVE ve verzi 1.18. Za zmínku stojí asi hlavně přidání validace ICC profilů do JPEG modulu.
Release notes: https://github.com/openpreserve/jhove/releases/latest.
Download JHOVE 1.18: http://software.openpreservation.org/rel/jhove-latest.jar.
K oslavě mezinárodního dne digital preservation se přidala i VeraPDF, která přišla s verzí 1.10. Bude to chtít trochu testování, ale zdá se mi, že se pustili do řešení několika velice nepříjemných potíží v oblasti validace unicode.
Release notes: https://github.com/veraPDF/veraPDF-library/releases/latest.
Download veraPDF: http://downloads.verapdf.org/rel/verapdf-installer.zip.
Release notes: https://github.com/openpreserve/jhove/releases/latest.
Download JHOVE 1.18: http://software.openpreservation.org/rel/jhove-latest.jar.
K oslavě mezinárodního dne digital preservation se přidala i VeraPDF, která přišla s verzí 1.10. Bude to chtít trochu testování, ale zdá se mi, že se pustili do řešení několika velice nepříjemných potíží v oblasti validace unicode.
Release notes: https://github.com/veraPDF/veraPDF-library/releases/latest.
Download veraPDF: http://downloads.verapdf.org/rel/verapdf-installer.zip.
čtvrtek 30. listopadu 2017
Dnes je Mezinárodní den digital preservation
Můžete sledovat twitter účet nebo i přispět informací o tom, co děláte vy....
https://twitter.com/hashtag/IDPD17?src=hash
https://twitter.com/hashtag/IDPD17?src=hash
středa 22. listopadu 2017
Validace Digital Cinema Package (DCP)
Na githubu byl zveřejněn nástroj avizovaný na Pasigu pro validaci DCP formátů. Slouží jak k extrakci technických metadat tak k validaci.
https://github.com/Ymagis/ClairMeta
https://pypi.python.org/pypi/clairmeta
https://github.com/Ymagis/ClairMeta
https://pypi.python.org/pypi/clairmeta
středa 1. listopadu 2017
zajímavý nástroj: isolyzer
https://github.com/KBNLresearch/isolyzer/
Isolyzer verifies if the file size of a CD / DVD image ("ISO image") is consistent with the information in its filesystem-level headers. The following file systems are supported:
ISO 9660
Universal Disk Format (UDF)
Apple Hierarchical File System (HFS)
Apple HFS+
Hybrids of the above file systems, e.g. ISO 9660 + HFS; UDF Bridge (UDF + ISO 9660)
Isolyzer uses the information in the filesystem-level headers to calculate the expected file size (typically based on a block size field and a number of blocks field). This is then compared against the actual file size, which can be useful for detecting incomplete (e.g. truncated) ISO images. Isolyzer also extracts and reports some technical metadata from the filesystem-level headers.
Isolyzer verifies if the file size of a CD / DVD image ("ISO image") is consistent with the information in its filesystem-level headers. The following file systems are supported:
ISO 9660
Universal Disk Format (UDF)
Apple Hierarchical File System (HFS)
Apple HFS+
Hybrids of the above file systems, e.g. ISO 9660 + HFS; UDF Bridge (UDF + ISO 9660)
Isolyzer uses the information in the filesystem-level headers to calculate the expected file size (typically based on a block size field and a number of blocks field). This is then compared against the actual file size, which can be useful for detecting incomplete (e.g. truncated) ISO images. Isolyzer also extracts and reports some technical metadata from the filesystem-level headers.
středa 4. října 2017
Příspěvky z iPres2017
Příspěvky z iPresu 2017 v Japonsku jsou online (https://ipres2017.jp/programme/). Je tam docela hodně zajímavých textů. Na rozdíl od Pasigu tady jsou k dispozici full texty a některé články jsou i delší a techničtější.
Chtěl bych upozornit na dva zabývající se PDF, ale ja tam řada dalších zajímavých:
Michelle Lindlar, Yvonne Tunnat and Carl Wilson. A Test-Set for Well-Formedness Validation in JHOVE – The Good, the Bad and the Ugly
Marco Klindt. A considered harmful for digital preservation
Chtěl bych upozornit na dva zabývající se PDF, ale ja tam řada dalších zajímavých:
Michelle Lindlar, Yvonne Tunnat and Carl Wilson. A Test-Set for Well-Formedness Validation in JHOVE – The Good, the Bad and the Ugly
Marco Klindt. A considered harmful for digital preservation
International Digital Preservation Day - 30th November 2017
http://www.dpconline.org/events/international-digital-preservation-day
Třeba se v ČR také někdo zapojí:-)
čtvrtek 21. září 2017
CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov
Na programu (http://cda.kultury.sk/sk/program) jsou tři příspěvky z projektu NDK, což je určitě jeden z důvodů proč konferenci navštívit. Zajímavý by mohl být také příspěvěk o projektu Elektronický archív Slovenska, o kterém se toho tak moc neví.
Konefernce je zaměřená na velké národní projekty, akdemické instituce s výjimkou KNAV tady nepřednášejí. Škoda, že se nedozvíme nic o českém projektu NDA a aktivitách českých archivů...
9.11.2017, Univerzitná knižnica v Bratislave, Centrálny dátový archív
Miesto konania: Prednášková sála UKB, Ventúrska 11, Bratislava
úterý 19. září 2017
sobota 16. září 2017
Digital Dunhuang: A Standard for Digital Preservation
Tenhle projekt je v digitální podobě skoro stejně impresivní, jako fyzický originál. Nejrozsáhlejší jeskynní komplex na Hedvábné stezce, který proslul pozoruhodnými freskami a také obrovskou knihovnou rukopisů (kde se mimo jiné našly nejstarší verze řady čínských textů, asi 50 tis. rukopisů, 15.tisk knih atd. ) je postupně převáděn do digitální podoby.
Digitalizace 3D objektů v nebývalém rozsahu a kvalitě, včetně HD video snímání jednotlivých jeskyní, jejich modelace v CADu atd. A samozřejmě se také řeší, jak data z takového projektu dlouhodobě uchovat (a zpřístupnit, protože "dunhuangologie" je už samostatný obor, o data mají zájem badatelé po celém světě). Zajímavé je, že projekt také uchovávání informace o měřeních klimatických podmínek v jeskynních.
Komplex, který je pod ochranou UNESCO, je dokumentován do digitální podoby mj. s pomocí Getty Institute a Mellon Foundation.
Škoda, že je článek tak stručný, bylo by pěkné vědět jaké technologie se používají.
Digital Dunhuang: A Standard for Digital Preservation, Peter Zhou University of California, Berkeley
https://ipres2017.jp/wp-content/uploads/Keynote-peter-edited-by-Nakayama.pdf
Digitalizace 3D objektů v nebývalém rozsahu a kvalitě, včetně HD video snímání jednotlivých jeskyní, jejich modelace v CADu atd. A samozřejmě se také řeší, jak data z takového projektu dlouhodobě uchovat (a zpřístupnit, protože "dunhuangologie" je už samostatný obor, o data mají zájem badatelé po celém světě). Zajímavé je, že projekt také uchovávání informace o měřeních klimatických podmínek v jeskynních.
Komplex, který je pod ochranou UNESCO, je dokumentován do digitální podoby mj. s pomocí Getty Institute a Mellon Foundation.
Škoda, že je článek tak stručný, bylo by pěkné vědět jaké technologie se používají.
Digital Dunhuang: A Standard for Digital Preservation, Peter Zhou University of California, Berkeley
https://ipres2017.jp/wp-content/uploads/Keynote-peter-edited-by-Nakayama.pdf
čtvrtek 14. září 2017
Za Pasigem 2017, Oxford 11-13.9.
(slidy z prezentací budou dostupné na https://pasigoxford.figshare.com/)
Tohle jsou nesystematické poznámky a dojmy z Pasigu v Oxfordu. Trochu přitom přemýšlím nahlas a snažím se zaznamenat zajímavé příspěvky.
Tohle jsou nesystematické poznámky a dojmy z Pasigu v Oxfordu. Trochu přitom přemýšlím nahlas a snažím se zaznamenat zajímavé příspěvky.
- Lokalita – místo konání konference byla doslova koloniální (Oxford University Museum of Natural History, a hned za ním bylo Pitt Rivers Museum). Koloniální nádech pak měly i samotné příspěvky, kde dominovaly velmi výrazně příspěvky z USA a UK. Jako by dřívější tahouni digital preservation v EU usnuli….bohužel. Koloniální byla i forma podání příspěvků – žádné velké technikálie, trochu show…
- Vendors – rozhodně pozoruhodná byla rozsáhlá účast sponzorů, poskytovatelů komerčních řešení pro digital preservation. Celkem 11 sponzorů velmi silně ovlivnilo program konference…(lightnig talks, vender demos, a uživatelské prezentace). Několik příspěvků, které se tvářily jako odborné, končilo dobrou zprávou, že si po problémech instituce pořídila profesionální SW a teď už je všechno v pořádku (příspěvky Eduardo del Valle, University of the Balearic Islands, Catherine Taylor, Waddesdon Manor a další…).
- Audiance – více než polovina účastníků byla na Pasigu poprvé. Takže jim asi nevadilo poslouchat příspěvky během prvního dne (Introduction to DP, Standard and Models, Certification and validation). Zazněla také řada příspěvků institucí, které se začaly zabývat LTP teprve nedávno, a člověk si trochu připadal jako před deseti lety….(Josefien Schuurman, Netherlands Institute for Sound and Vision, Angeline Takawira, UN MICT, Behrang Mousavi, Dutch Institute for Architecture – HNI). Zvlášť příspěvek Josefien Schuurman z Holandska mě vyděsil, vypadá to, že Královská knihovna v Haagu jiným institucím moc nepomáhá a úroveň spolupráce mezi knihovnou a dalšími institucemi v Holandsku asi nebude nijak valná…a propos spolupráce
- Spolupráce – pořád opakované zaklínadlo, že LTP nelze dělat bez komunity a spolupráce. Tohle asi době funguje v USA, kde sítě jako DPN nebo LOCKSS (které se díky financím z Mellon foundation znovu probouzí k novému vývoji – viz příspěvek Art Pasquinelli, Stanford University Libraries) a možná v UK díky JISCu nebo DPC.
- Vědecká data – určitě stojí za to sledovat vývoj v projektu JISC RDSS ("Jisc Research Data Shared Services (RDSS) inititive" John Kaye, "Jisc RDSS use case: Arkivum/Archivematica" Matthew Addis, Arkivum & Justin Simpson, Artefactual) kde se děje něco dramatického v oblasti správy a uchovávání vědeckých dat. V pilotním projektu dodavatelé komerčních LTP (Arkivum, Preservica, Archivematica) a repozitářů (velká řada repozitářů) spolupracují s JISCem na vývoj komponent, která mají zajistit sdílené řešení pro LTP s využitím LTP systémů, které instituce již používají. Také další příspěvek byl o vědeckých datech, resp. velkých vědeckých datech, kde zdá se mají velké plány ("Long term data preservation meets the European Open Science Cloud" Jamie Shiers, CERN) a během příštího roku projdou ISO 16363 certifikací.
- Open source - Kde je Roda? U Artefactual jsem přestal věřit, že jde o „open source“ – je to jen business model. V oblasti LTP systémů (ne repozitářů už) neexistuje open source, ale spíš jen softwarová řešení, kde je kód veřejný – jak zaznělo, neexistuje žádná komunita, která by aktivně vyvíjela LOCKSS, u Archivematicy a Rody o tom mám také vážně pochybnosti. Něco jiného jsou asi konkrétní nástroje na identifikaci formátů a jejich validaci (jako jhove, droid, apache tikka apod) nebo různých částí infrastruktury (Fedora, duraspace apod) tam je asi zapojení komunity větší…
- „Data together: Communities & institutions using decentralized technologies to make a better web" Matt Zumwalt, Protocol Labs, DataBindery – 100% pro!
- "The Eclair Archive cinema heritage use case: Rising to the challenges of complex formats at large scale" Mathieu Giannecchini, Ymagis. LTP pro AV obsah (http://www.eclair.digital/)
- https://github.com/artefactual/binder/blob/qa/0.8.x/README.md - další produkt Artefaktual využívající Archivematica Storage Service
úterý 12. září 2017
Preservation with PDF/A (2nd Edition) DPC Technology Watch Report
Preservation
with PDF/A
(2nd Edition)
DPC Technology Watch Report
17-01 July 2017
Betsy A Fanning AIIM
http://www.dpconline.org/docs/technology-watch-reports/1703-preservation-with-pdf-a-twr-17-01/file
17-01 July 2017
Betsy A Fanning AIIM
http://www.dpconline.org/docs/technology-watch-reports/1703-preservation-with-pdf-a-twr-17-01/file
pondělí 11. září 2017
CoreTrustSeal
Certifikace DSA (Data seal of approval) se definitivně přetransformoval v CoreTrustSeal (https://www.coretrustseal.org/about/). Konsolidace snah několika institucí, která me směřovat mj. také zahájení certfikace podle ISO 16363.
pátek 8. září 2017
Náklady na dlouhodobou ochranu digitálních dokumentů
V českém prostředí ojedinělá diplomová práce na téma Digital preservation cost od Zdenka Hrušky. Velmi pěkný je přehled existujících modelů a aplikace modelu Life3 na repozitář MZK.
https://is.muni.cz/th/217895/ff_m/Diplomka_final_IS.pdf
https://is.muni.cz/th/217895/ff_m/Diplomka_final_IS.pdf
čtvrtek 31. srpna 2017
Reference rot
Dlouhodobá archivace digitálních dokumentů není jen o formátech. Reference nebo link rot je příkladem problému, který zatím nemá žadné rozumné řešení. Především výzkumné publikace a vysokoškolské kvalifikační práce stojí a padají s odkazy a citacemi, ovšem jak ukazuje tenhle empirickými daty podložený poster, po pěti letech může být polovina linků neplatná a desetina linkovaného obsahu může být ztracena zcela.
Doporučení autorů posteru - make and save mementos - znamená, že vyzývají autory textů a provozovatele repozitářů, aby zajistili možnost archivace obsahů v repozitářích a linkovaných obsahů projekty jako je Webvarchive. Tj. aby technicky umožnili crawlerům sklízení obsahu repozitářů. A sami autoři mohou archivaci iniciovat pomocí služeb jako je ArchiveIT.
http://scholarworks.umass.edu/acrl_nec_conf/2017/posters/6/
Doporučení autorů posteru - make and save mementos - znamená, že vyzývají autory textů a provozovatele repozitářů, aby zajistili možnost archivace obsahů v repozitářích a linkovaných obsahů projekty jako je Webvarchive. Tj. aby technicky umožnili crawlerům sklízení obsahu repozitářů. A sami autoři mohou archivaci iniciovat pomocí služeb jako je ArchiveIT.
http://scholarworks.umass.edu/acrl_nec_conf/2017/posters/6/
úterý 29. srpna 2017
Reportáž ČT o Národním digitálním archivu
Vláda ho schválila před 13 lety. Digitální archiv by měl být od roku 2019
LOC - formáty doporučené pro LTP - Recommended Formats Statement
Nová verze Recommended Formats Statement
sobota 26. srpna 2017
NLA Digital Preservation Knowledge Base
Článek o knowledge base, o níž mluvil Libor na jaře v Praze:
Backing up digital preservation practice with empirical research
The National Library of Australia’s Digital Preservation Knowledge Base
Backing up digital preservation practice with empirical research
The National Library of Australia’s Digital Preservation Knowledge Base
https://doi.org/10.1177/0955749017724630
Gareth Kay, Libor Coufal,Mark Pearson
Digital Preservation Unit, National Library of Australia, Canberra, AustraliaThis article introduces the National Library of Australia’s Digital Preservation Knowledge Base which helps the Library to manage digital objects from its collections over the long term. The Knowledge Base includes information on file formats, rendering software, operating systems, hardware and, most importantly, the relationships between them. Most of the work on the Knowledge Base over the last few years has been focused on the mapping of functional relationships between file formats, their versions and software applications. The information is gathered through unique empirical research and is initially being recorded in a multiple-worksheet Excel file in a semi-structured format, though development of a prototype graph database is underway.
Full text: http://www.nla.gov.au/our-publications/staff-papers/backing-up-digital-preservation-practice-with-empirical-research-the
Gareth Kay, Libor Coufal,Mark Pearson
Digital Preservation Unit, National Library of Australia, Canberra, AustraliaThis article introduces the National Library of Australia’s Digital Preservation Knowledge Base which helps the Library to manage digital objects from its collections over the long term. The Knowledge Base includes information on file formats, rendering software, operating systems, hardware and, most importantly, the relationships between them. Most of the work on the Knowledge Base over the last few years has been focused on the mapping of functional relationships between file formats, their versions and software applications. The information is gathered through unique empirical research and is initially being recorded in a multiple-worksheet Excel file in a semi-structured format, though development of a prototype graph database is underway.
Full text: http://www.nla.gov.au/our-publications/staff-papers/backing-up-digital-preservation-practice-with-empirical-research-the
Informační specialista v NFA
Oddělení metodiky Národního filmového archivu hledá vhodné uchazeče pro pozici Informační specialista
http://nfa.cz/cz/o-nas/volna-mista/
Popis práce:
Místo výkonu práce: Praha
Předpokládaný nástup: nástup dle dohody
Úvazek: 1,0
Plat: 11. platová třída (Nařízení vlády č. 564/2006 Sb. v platném znění, příloha č. 1), osobní příplatek dle osobního výkonu.
Zaměstnanecké benefity: možnost zvyšování kvalifikace, stravenky, dovolená pět týdnů, zdravotní volno, služební mobil, příspěvek na dětskou letní rekreaci, volný vstup do kina Ponrepo.
Profesní životopis, motivační dopis a kontakty na dvě referenční osoby zasílejte na adresu barbora.ligacova@nfa.cz s označením informační specialista.
Vybraní uchazeči budou pozváni k osobnímu rozhovoru.
http://nfa.cz/cz/o-nas/volna-mista/
Popis práce:
- Spolupráce na konsolidaci filmografických a sbírkových databází NFA
- Koordinace filmografické a katalogizační agendy v Sekci audiovizuálních sbírek NFA
- Implementace filmografického standardu EN 15907
- Perspektivně vedení dedikovaného týmu
- Možnost seberealizace ve výzkumných projektech, studijní cesty, stáže apod.
- Metodická supervize filmografů a katalogizátorů NFA
- Systematický odborný rozvoj vlastní kvalifikace
- VŠ vzdělání (vhodné i pro čerstvé absolventy), informační vědy nebo knihovnictví výhodou
- Zkušenost s vedením a koordinací lidí a projektů či komplexních úkolů
- Zkušenost s pořádáním informací v databázích
- Zájem o český film a filmografická data
- Velmi dobrá znalost angličtiny
- Velmi dobrá počítačová gramotnost
- Znalost FRBR výhodou, znalost FRBRoo velkou výhodou
Místo výkonu práce: Praha
Předpokládaný nástup: nástup dle dohody
Úvazek: 1,0
Plat: 11. platová třída (Nařízení vlády č. 564/2006 Sb. v platném znění, příloha č. 1), osobní příplatek dle osobního výkonu.
Zaměstnanecké benefity: možnost zvyšování kvalifikace, stravenky, dovolená pět týdnů, zdravotní volno, služební mobil, příspěvek na dětskou letní rekreaci, volný vstup do kina Ponrepo.
Profesní životopis, motivační dopis a kontakty na dvě referenční osoby zasílejte na adresu barbora.ligacova@nfa.cz s označením informační specialista.
Vybraní uchazeči budou pozváni k osobnímu rozhovoru.
pátek 25. srpna 2017
Seznam collection management systémů
Ashley Blewer dala dohromady seznam systémů na správu digitálního obsahu. Seznam míchá různé typy systémů (DAM, LTP apod.), i tak ovšem může být pěkným přehledem pro zájemce o implementaci podobného systému.
https://ablwr.github.io/blog/2017/08/09/collection-management-system-collection/
seznam je tady https://docs.google.com/spreadsheets/d/1cXOug3qM0pNNeD_wssiVEv9c0W1Y5I1VDTnSPTk7fb4/edit#gid=0
https://ablwr.github.io/blog/2017/08/09/collection-management-system-collection/
seznam je tady https://docs.google.com/spreadsheets/d/1cXOug3qM0pNNeD_wssiVEv9c0W1Y5I1VDTnSPTk7fb4/edit#gid=0
pondělí 21. srpna 2017
Hodnocení úrovně dlouhodobé ochrany dat podle NDSA Levels of Preservation v praxi
NDSA Level of Preservation existují již nějakou dobu a jsou dobrou pomůckou pro posuzování "dospělosti" digitálních repozitářů a jejich procesů. Jenny Mitcham z Univerzity v Yorku publikovala článek, kde popisuje stav jejich univerzitního repozitáře a hodnocení pomocí NDSA metodiky. Zajímavé a inspirující čtení i pro české prostředí.
Jenny Mitcham. Benchmarking with the NDSA Levels of Preservation.
http://digital-archiving.blogspot.co.nz/2017/08/benchmarking-with-ndsa-levels-of.html
Jenny Mitcham. Benchmarking with the NDSA Levels of Preservation.
http://digital-archiving.blogspot.co.nz/2017/08/benchmarking-with-ndsa-levels-of.html
pátek 4. srpna 2017
PSM in Digital Curation
https://sils.unc.edu/programs/psm-digital-curation
100% online professional master kurz "digitálního kurátorství" na University of North Carolina v Chapel Hill
Přehled obsahu:
https://sils.unc.edu/programs/psm-digital-curation/curriculum
Introducing the PSM in Digital Curation from UNC SILS on Vimeo.
100% online professional master kurz "digitálního kurátorství" na University of North Carolina v Chapel Hill
Přehled obsahu:
https://sils.unc.edu/programs/psm-digital-curation/curriculum
Introducing the PSM in Digital Curation from UNC SILS on Vimeo.
čtvrtek 8. června 2017
Oficiální certifikace podle ISO 16363 - první oficiálně akredirovaný poskytovatel?
PTAB získala jako první oficální akreditaci k vykonávání auditu podle normy ISO 16363:
http://www.iso1636 3.org/ptab-accredited-for-iso- 16363-audit-and-certification/ .
Trochu me překvapuje, že odkazují na Register of Certification Bodies of National Accreditation Board for Certification Bodies (NABCB), což je indická instituce a nikoli americká nebo britská, PTAB sídlí ve Velké Británii, takže proč ne UKAS? ..No, kdoví, jak to s tou akreditací je.
http://www.iso1636
Trochu me překvapuje, že odkazují na Register of Certification Bodies of National Accreditation Board for Certification Bodies (NABCB), což je indická instituce a nikoli americká nebo britská, PTAB sídlí ve Velké Británii, takže proč ne UKAS? ..No, kdoví, jak to s tou akreditací je.
středa 24. května 2017
Distributed OAIS-based Digital Preservation System with HDFS Technology
Pro některé probíhající projekty u nás by určitě mohl být inspirativní článek z Ruska o architektuře archivu budovaného v souladu s OAIS s využitím HDFS:
http://fruct.org/publications/fruct20/files/Voi.pdf
Distributed OAIS-based Digital Preservation System with HDFS Technology
Nikita Voinov, Pavel Drobintsev, Vsevolod Kotlyarov Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Igor Nikiforov Dell EMC/Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Abstract—The paper describes architecture of a distributed OAIS-based
digital preservation system which uses HDFS as a file storage system
and supports wide distribution on a number of cluster’s nodes. It is
based on Apache Hadoop framework - a reliable open source solution
with well horizontally scalable distributed architecture. Novelty of
the proposed system is defined by the fact that none of existing OAIS
digital preservation systems use HDFS storage for both structured and
unstructured data archiving. Implementation of the system’s prototype
and results of its testing are also shown.
http://fruct.org/publications/fruct20/files/Voi.pdf
Distributed OAIS-based Digital Preservation System with HDFS Technology
Nikita Voinov, Pavel Drobintsev, Vsevolod Kotlyarov Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Igor Nikiforov Dell EMC/Peter the Great Saint-Petersburg Polytechnic University Saint-Petersburg, Russia
Abstract—The paper describes architecture of a distributed OAIS-based
digital preservation system which uses HDFS as a file storage system
and supports wide distribution on a number of cluster’s nodes. It is
based on Apache Hadoop framework - a reliable open source solution
with well horizontally scalable distributed architecture. Novelty of
the proposed system is defined by the fact that none of existing OAIS
digital preservation systems use HDFS storage for both structured and
unstructured data archiving. Implementation of the system’s prototype
and results of its testing are also shown.
úterý 25. dubna 2017
Archivace IETF/ISOC RFC - konec papíru....
Možná byste čekali, že zrovna tenhle typ materiálu (RFC) ani nikdy papírovou dobou neprošel, ale ouha. Teprve nedávno vydaná RFC 81533 - Digital Preservation Considerations for the RFC Series s papírem definitivně končí.
RFC editor ma zjevně zkušenosti se ztrátami dat (In the past, nearly 800 RFCs had to be manually transcribed from paper back to electronic format due to a failed server migration and insufficient backups), a teď se chce obejit úplně bez papíru.
Dokument stojí za přečtení celý, ale zde uvedu jen:
For most of the existence of the RFC Series, the digital preservation process has been fairly simple, focusing on bitstream preservation and relying on paper copies of digital files.
...
Given the need to balance cost and complexity with retention of information for historic, legal, and informational purposes, preservation efforts should focus on the XML canonical format files, the PDF/A-3 format files, the xml2rfc tool and its documentation, and at least two PDF reader applications capable of extracting the embedded XML. Care should be taken that the software being included in this archive has a provision for free copies for backup or archival purposes. All other formats and the overall computing environment should be stored as described in "best effort" data retention (Section 2.4.1), which should in turn be described in the appropriate vendor contract for the RFC Publisher.
https://www.rfc-editor.org/rfc/pdfrfc/rfc8153.txt.pdf
RFC editor ma zjevně zkušenosti se ztrátami dat (In the past, nearly 800 RFCs had to be manually transcribed from paper back to electronic format due to a failed server migration and insufficient backups), a teď se chce obejit úplně bez papíru.
Dokument stojí za přečtení celý, ale zde uvedu jen:
For most of the existence of the RFC Series, the digital preservation process has been fairly simple, focusing on bitstream preservation and relying on paper copies of digital files.
...
Given the need to balance cost and complexity with retention of information for historic, legal, and informational purposes, preservation efforts should focus on the XML canonical format files, the PDF/A-3 format files, the xml2rfc tool and its documentation, and at least two PDF reader applications capable of extracting the embedded XML. Care should be taken that the software being included in this archive has a provision for free copies for backup or archival purposes. All other formats and the overall computing environment should be stored as described in "best effort" data retention (Section 2.4.1), which should in turn be described in the appropriate vendor contract for the RFC Publisher.
https://www.rfc-editor.org/rfc/pdfrfc/rfc8153.txt.pdf
úterý 4. dubna 2017
Veřejná e-mailová konference k dlouhodobé digitální archivaci
Založena veřejná e-mailová konference k dlouhodobé digitální archivaci, LTP:
Chcete-li do této skupiny přidat příspěvek, zašlete e-mail na adresu
digital-preservation-cz@googlegroups.com.
Navštivte tuto skupinu na
https://groups.google.com/group/digital-preservation-cz.
Chcete-li tuto diskusi zobrazit na webu, navštivte
https://groups.google.com/d/msgid/digital-preservation-cz/8123a4a63e094414b7cfcfa1b9533657%40UVTWS03.uvtuk.cuni.cz.
Další možnosti najdete na https://groups.google.com/d/optout.
Chcete-li do této skupiny přidat příspěvek, zašlete e-mail na adresu
digital-preservation-cz@googlegroups.com.
Navštivte tuto skupinu na
https://groups.google.com/group/digital-preservation-cz.
Chcete-li tuto diskusi zobrazit na webu, navštivte
https://groups.google.com/d/msgid/digital-preservation-cz/8123a4a63e094414b7cfcfa1b9533657%40UVTWS03.uvtuk.cuni.cz.
Další možnosti najdete na https://groups.google.com/d/optout.
pátek 31. března 2017
středa 29. března 2017
Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?
Ve středu 29. března 2017 od 10 do 12:30 hod se v kinosále NA konala akce nazvaná docela vtipně "Národní digitální archiv – příležitost nebo hrozba pro specializované archivy?"
Po prezentacích pánů z Národního digitálního archivu představily svoje projekty v oblasti elektronických dokumentů čtyři specializované archivy (UK, ČRO, ČTV, NFA)
Zdaleka nejzajímavější pro mě byly úvodní prezentace o stavu projektu NDA a Národním archivním portálu. Prezentace, které by měly zaznít v podobném rozsahu i na konferenci ISSS 2017 přístí týden přednesli pan Bernas (Současný stav a střednědobá perspektiva Národního digitálního archivu) a Stodůlka (Výběr archiválií prostřednictvím Národního archivního portálu) a doplnila je informace o nové verzi standardu NSESSS od pana Kunta (Informace o novele národního standardu elektronických systémů spisové služby)
Z prezentace pana Bernase jsme se mimo jiné dozvěděli, že v ostrém prostředí Národního digitálního archivu jsou dnes uložena data z 9 skartačních řízení (5 přejímek). Řešení NDA je složeno ze systému Archivematica a modulů vyvinutých kolem. Prezentace obsahovala i praktické reflexe z provozu NDA od roku 2015:
Po prezentacích pánů z Národního digitálního archivu představily svoje projekty v oblasti elektronických dokumentů čtyři specializované archivy (UK, ČRO, ČTV, NFA)
Zdaleka nejzajímavější pro mě byly úvodní prezentace o stavu projektu NDA a Národním archivním portálu. Prezentace, které by měly zaznít v podobném rozsahu i na konferenci ISSS 2017 přístí týden přednesli pan Bernas (Současný stav a střednědobá perspektiva Národního digitálního archivu) a Stodůlka (Výběr archiválií prostřednictvím Národního archivního portálu) a doplnila je informace o nové verzi standardu NSESSS od pana Kunta (Informace o novele národního standardu elektronických systémů spisové služby)
Z prezentace pana Bernase jsme se mimo jiné dozvěděli, že v ostrém prostředí Národního digitálního archivu jsou dnes uložena data z 9 skartačních řízení (5 přejímek). Řešení NDA je složeno ze systému Archivematica a modulů vyvinutých kolem. Prezentace obsahovala i praktické reflexe z provozu NDA od roku 2015:
- Největším kamenem úrazu jsou SIP balíčky, jejich kvalita.
- Proto NDA poskytuje validátory SIP a PDF/A.
- V současnosti systémy NDA nejsou moc robustní a bude se na nich pracovat dále v projektu NDA II. Moduly vyvinuté vlastními silami NA budou dále upraveny dodavatelem.
- Byla zmíněna potřeba sladit aplikační rozhraní jednotlivých modulů, webové služby. Systém je záměrně budován z menších částí, aby se lépe udržoval, ale to předpokládá koordinaci rozhraní.
- Strojové rozhraní bude mít i modul přístup.
- V rámci NDA II budou vylepšeny možnosti autentizace.
- Skartační řízení - dlouhodobým cílem je zjednodušení procesů.
- Bezpečnost je pro NDA velmi důležitá, produkční systém je fyzicky oddělený, NDA je významný informační systémy ve smyslu zákona o kybernetické bezpečnosti, bude auditován z hlediska informační bezpečnosti (vedle ISO 16363 a dalších) .
- kolísavá kvalita SIPů, chyby
- chyby v zachycení struktury spisu a ve spisovém plánu, při tvorbě SIPu
- dokumenty předstírající něco, co nejsou (doc tváři se jako pdf/a)
- formální plnění - jen proto, aby tam něco bylo - například mimetype
- chybějící údaje od původce - které jistě původce zná (název, ičo)
- deklarace nepotřebných názvových prostorů
- NDA neposkytuje template pro SIP – vstupy jsou variabilní – možnosti plnění jsou velké, ale původci stejně dělají chyby
Archiv na národní úrovni, který chce působit jako důvěryhodný, by měl zcela transparentně komunikovat o svých postupech zajištění dlouhodobého uchovávání (a ne jen říct, že se něco někam migruje) a o tom, jak vypadá jeho AIP.
Přitom NDA tak trochu odrazuje zájemce z dalších archivů od budování vlastního digitálního archivu (tj. archivu s oprávněním ukládat digitální data ve smyslu zákona), říkají:
- nemá smysl budovat digitální archiv za každou cenu, z prestižních důvodu, jen proto, abychom ho měli!
- soustředit se raději na spisovou službu a uložit data v NDA
- postupy LTP vyzkoušet nejprve na digitalizátech
- teprve až když jsou zkušenosti přejit k digitální archivaci - menší riziko
úterý 28. března 2017
Dokument "Understanding PREMIS" v nové updatované verzi
Známý úvod do metadatového formátu PREMIS od Priscilly Caplan byl vydán v nové aktualizované verzi. Nová verze reflektuje poslední změny a úpravy PREMISu. Originální verze dokumentu vznikla v roce 2009, aktualizace tedy již byla nutná.
Dostupné na
Dostupné na
čtvrtek 23. března 2017
středa 22. března 2017
Uvolněná nová verze JHOVE - 1.16
OPF (Open Preservation Foundation) vydalo novou verzi open source identifikátoru formátů JHOVE 1.16, podrobnější informace v tiskové zprávě.
Nová verze kromě oprav nabízí i lepší zpracování souborů v PDF a WAV modulech. V British Library byl JHOVE pro validaci PDF otestován, zde jsou výsledky.
Nová verze kromě oprav nabízí i lepší zpracování souborů v PDF a WAV modulech. V British Library byl JHOVE pro validaci PDF otestován, zde jsou výsledky.
pátek 17. března 2017
Archivematica 1.6
https://groups.google.com/forum/#!msg/archivematica/AVP4ARbomA4/SbaGxXaGBgAJ
Novinky: Appraisal/Arrangement tab, ArchivesSpace integration, Improvements to transfer backlog management,Full AIP re-ingest and AIP re-ingest improvements, DIP upload to AtoM improvements, Support multiple checksum algorithms, a další...
Novinky: Appraisal/Arrangement tab, ArchivesSpace integration, Improvements to transfer backlog management,Full AIP re-ingest and AIP re-ingest improvements, DIP upload to AtoM improvements, Support multiple checksum algorithms, a další...
Guetzli: Perceptually Guided JPEG Encoder
https://arxiv.org/pdf/1703.04421.pdf
Guetzli: Perceptually Guided JPEG Encoder
J. Alakuijala, R. Obryk∗ , O. Stoliarchuk, Z. Szabadka, L. Vandevenne, and J. Wassenberg
Google Research Europe
March 14, 2017
Guetzli is a new JPEG encoder that aims to produce visually indistinguishable images at a lower bit-rate than other common JPEG encoders. It optimizes both the JPEG global quantization tables and the DCT coefficient values in each JPEG block using a closed-loop optimizer. Guetzli uses Butteraugli [1], our perceptual distance metric, as the source of feedback in its optimization process. We reach a 29-45% reduction in data size for a given perceptual distance, according to Butteraugli, in comparison to other compressors we tried. Guetzli’s computation is currently extremely slow, which limits its applicability to compressing static content and serving as a proof- of-concept that we can achieve significant reductions in size by combining advanced psychovisual models with lossy compression techniques
Guetzli: Perceptually Guided JPEG Encoder
J. Alakuijala, R. Obryk∗ , O. Stoliarchuk, Z. Szabadka, L. Vandevenne, and J. Wassenberg
Google Research Europe
March 14, 2017
Guetzli is a new JPEG encoder that aims to produce visually indistinguishable images at a lower bit-rate than other common JPEG encoders. It optimizes both the JPEG global quantization tables and the DCT coefficient values in each JPEG block using a closed-loop optimizer. Guetzli uses Butteraugli [1], our perceptual distance metric, as the source of feedback in its optimization process. We reach a 29-45% reduction in data size for a given perceptual distance, according to Butteraugli, in comparison to other compressors we tried. Guetzli’s computation is currently extremely slow, which limits its applicability to compressing static content and serving as a proof- of-concept that we can achieve significant reductions in size by combining advanced psychovisual models with lossy compression techniques
Storage pro dlouhodobou archivaci
Tohle je opravdu moc pěkný článek na blogu Davida Rosenthala.
http://blog.dshr.org/2016/12/the-medium-term-prospects-for-long-term.html
http://blog.dshr.org/2016/12/the-medium-term-prospects-for-long-term.html
čtvrtek 16. března 2017
1bit do jednoho atomu holmia
"K praktickému použití je zatím daleko, pro ukládání dat je totiž potřeba řádkovací tunelový mikroskop chlazený tekutým dusíkem a pracující ve vakuu"
http://diit.cz/clanek/prelomova-technologie-ulozi-1-bit-do-1-atomu#utm_source=atom&utm_medium=feed&utm_content=article
http://diit.cz/clanek/prelomova-technologie-ulozi-1-bit-do-1-atomu#utm_source=atom&utm_medium=feed&utm_content=article
pondělí 13. března 2017
Desítky PB v České televizi
Pěkná fotogalerie, jen by to chtělo asi trochu podrobnější komentář.
http://www.lupa.cz/galerie/ceska-televize-jeji-datacentra-a-zalohovani/
http://www.lupa.cz/galerie/ceska-televize-jeji-datacentra-a-zalohovani/
úterý 21. února 2017
Přednáška "Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie"
Digitální sbírky a jejich dlouhodobé uchovávání v Národní knihovně Austrálie
Registrační formulář na přednášku Libora Coufala.
https://goo.gl/forms/ 13EBnUjWlf2Q3WUB3
Pořadatel: Česká informační společnost, z. s.
Termín: 22.3.2017, 13:00 - 16:30 hodin
Místo konání: Český svaz vědeckotechnických společností z.s., Novotného lávka 5110 00 Praha 1, učebna 2017
Původně vystudovaný finančník, Libor Coufal je knihovnický "mutant". Knihovnickou dráhu započal ve Fisherově knihovně na University of Sydney. Poté působil v Národní knihovně ČR na oddělení elektronických informačních zdrojů, později přejmenované na oddělení archivace webu, které od roku 2008 vedl. Od roku 2012 pracuje v Národní knihovně Austrálie, kde v současnosti řídí oddělení dlouhodobého digitálního uchovávání.
Program
13:00 - 14:30 Národní knihovna Austrálie v digitálním světě (fondy, služby a projekty), diskuse
14:30 - 15:00 Přestávka s malým občerstvením
15:00 - 16:30 Digitální uchovávání "vzhůru nohama", diskuse
Registrační formulář na přednášku Libora Coufala.
https://goo.gl/forms/
Pořadatel: Česká informační společnost, z. s.
Termín: 22.3.2017, 13:00 - 16:30 hodin
Místo konání: Český svaz vědeckotechnických společností z.s., Novotného lávka 5110 00 Praha 1, učebna 2017
Původně vystudovaný finančník, Libor Coufal je knihovnický "mutant". Knihovnickou dráhu započal ve Fisherově knihovně na University of Sydney. Poté působil v Národní knihovně ČR na oddělení elektronických informačních zdrojů, později přejmenované na oddělení archivace webu, které od roku 2008 vedl. Od roku 2012 pracuje v Národní knihovně Austrálie, kde v současnosti řídí oddělení dlouhodobého digitálního uchovávání.
Program
13:00 - 14:30 Národní knihovna Austrálie v digitálním světě (fondy, služby a projekty), diskuse
14:30 - 15:00 Přestávka s malým občerstvením
15:00 - 16:30 Digitální uchovávání "vzhůru nohama", diskuse
pátek 17. února 2017
úterý 14. února 2017
PIQL v ČRO - technologie spolehlivejší než digitální nosiče?
Záznam debaty o archivaci v Českem rozhlasu. Každý může posoudit sám, jestli je tohle přístup vhodný pro disaster recovery pro data jeho instituce. PIQL řeší problém s uchováváním digitálních dat odsunutím na trvalé médium, které ukládá na proprietární typ filmového pásu, zapisuje a čte na proprietárním zařízení, v binární podobě.
Vytvoření věčné kopie digitálních dat, trvalého digitálního objektu, bohužel není cesta pro všechny typy archivů. Neměli bychom podlehnout iluzi, že tohle je řešení pro všechny typy dat a institucí - řada institucí potřebuje nástroje pro efektivní správu dat a metadat, pro aktivní ochranu. Musí zajistit trvalou dostupnost dat uživatelům v novém technologickém prostředí; uživatelům, kteří mají nové potřeby a očekávání, kteří potřebují metadata, identifikátory a formáty použitelné v aktuálním technickém a informačním kontextu. Proto existují srandardy jako OAIS a ISO 16363, které popisují obrysy takových řešení. Tzv. longterm preservation systémy (LTP) toho musí obsahovat mnohem více, než jen storage. Nikdo nečeká, že nějaké konkrétní LTP řešení bude existovat navždy - naopak je žadoucí, aby se LTP systémy měnily spolu s technologiemi kolem, archivní balíčky se aktivně kontrolují a migrují do nových formátů, obohacují se jejich metadata a migrují se formáty. PIQL není reprezentantem aktivního přístupu k digital preservation, nezajistí, že budete mít svá data uspořádáná, dobře popsaná, validní, a použitelná v technickém a informačním kontextu uživatelů za 100 let.
Vytvoření věčné kopie digitálních dat, trvalého digitálního objektu, bohužel není cesta pro všechny typy archivů. Neměli bychom podlehnout iluzi, že tohle je řešení pro všechny typy dat a institucí - řada institucí potřebuje nástroje pro efektivní správu dat a metadat, pro aktivní ochranu. Musí zajistit trvalou dostupnost dat uživatelům v novém technologickém prostředí; uživatelům, kteří mají nové potřeby a očekávání, kteří potřebují metadata, identifikátory a formáty použitelné v aktuálním technickém a informačním kontextu. Proto existují srandardy jako OAIS a ISO 16363, které popisují obrysy takových řešení. Tzv. longterm preservation systémy (LTP) toho musí obsahovat mnohem více, než jen storage. Nikdo nečeká, že nějaké konkrétní LTP řešení bude existovat navždy - naopak je žadoucí, aby se LTP systémy měnily spolu s technologiemi kolem, archivní balíčky se aktivně kontrolují a migrují do nových formátů, obohacují se jejich metadata a migrují se formáty. PIQL není reprezentantem aktivního přístupu k digital preservation, nezajistí, že budete mít svá data uspořádáná, dobře popsaná, validní, a použitelná v technickém a informačním kontextu uživatelů za 100 let.
úterý 7. února 2017
Archivace videoartu v České republice?
Trvalé uchovávání videoartu, nových medií nebo řekněme audiovizuálního umění asi není nic snadného. Na serveru artalk.cz je zajímavý rozhovor se Slávou Sobotovičovou http://artalk.cz/2016/06/03/videoart-zabava-pro-excentriky/ o archivech videoartu v České republice.
I v téhle oblasti také vznikají standardy pro metadata jako Media Art Notation System (MANS) nebo se používají standardy vytvořené jinde jako DIDL.
Archivací "New Media Art" se ve světě zabývá už poměrně hodně institucí (seznam v EU http://www.newmediaart.eu/), například Netherlands Media Art Institute (http://nimk.nl/eng/preservation/media-art-preservation-links), Electronic Arts Intermix (EAI) (https://www.eai.org/), ZKM v Německu (http://zkm.de/en/topic/conservation-of-media-art), ADA (http://www.virtualart.at/nc/home.html). Sbírky videoartu a nových médií mají i některé další knihovny nebo archivy jako Corrnell uni, Getty archives a další.
Především se mluví o archivu Vědecko-výzkumného pracoviště AVU (http://vvp.avu.cz/videoarchiv/), jsou zmíněny i další lokální projekty jako Mediabáze FAMU (http://mediabaze.cz/) nebo Media Archive FaVU VUT Brno (http://media-archiv.ffa.vutbr.cz/index.php).
Bohužel z toho nemám pocit, že by u nás v téhle komunitě byl velký zájem o trvalé uchovávání tohoto obsahu, o logickou ochranu a archivaci ve smyslu ISO 14721 nebo ISO 16363 atp. Snad jen na FAMU se tohle téma trochu řeší. V rozhovoru se mluví o normalizaci souborových formátů a digitalizaci, ale na webech archivů žádné metodiky popsány nejsou, ani nevidím žádné popisy formátových politik, metadatové standardy, žádné pokusy o DSA apod. "Archivy" jsou zaměřené spíš na zpřístupňování - streamů nebo metadat.
I v téhle oblasti také vznikají standardy pro metadata jako Media Art Notation System (MANS) nebo se používají standardy vytvořené jinde jako DIDL.
Archivací "New Media Art" se ve světě zabývá už poměrně hodně institucí (seznam v EU http://www.newmediaart.eu/), například Netherlands Media Art Institute (http://nimk.nl/eng/preservation/media-art-preservation-links), Electronic Arts Intermix (EAI) (https://www.eai.org/), ZKM v Německu (http://zkm.de/en/topic/conservation-of-media-art), ADA (http://www.virtualart.at/nc/home.html). Sbírky videoartu a nových médií mají i některé další knihovny nebo archivy jako Corrnell uni, Getty archives a další.
pondělí 6. února 2017
Archivace soukromých digitálních dat se zaměřením na fotografie a videa
Richard Wright sepsal "Case NotePersonal Digital PreservationPhotographs and Video", kde vysvětluje, jak on osobně čelí rostoucím objemům soukromých digitálních dat jako soukromý archivář.
V posledních letech vyprodukoval jeho život desítky tisíc rodinných a soukromých fotografií a videí. Richard ví o ca 55 000 fotografiích, které jsou všude možně - na některém z jeho 4 počítačů a laptopů, mobilním telefonu, ve foťácích, kamerách, na některém ze tří počítačů partnerky, na domácím NASu nebo některém z cca sedmi USB úložištích, další jsou na Dropboxu, Amazon Photos, Googlu a Microsoft drive, další materiál je v jeho profilech na sociálních sítích, na blozích atd. Všechno pod názvy, které generují fotoaparáty nebo software, ve formátech skrývajících se za MPEG kontejnery, nebo v proprietárních formátech, v RAW, a to bez velké kontroly, bez systematických záloh, bez katalogu.
Tohle všechno zná asi každý. Richard jako archivář svého soukromého archivu doporučuje:
V posledních letech vyprodukoval jeho život desítky tisíc rodinných a soukromých fotografií a videí. Richard ví o ca 55 000 fotografiích, které jsou všude možně - na některém z jeho 4 počítačů a laptopů, mobilním telefonu, ve foťácích, kamerách, na některém ze tří počítačů partnerky, na domácím NASu nebo některém z cca sedmi USB úložištích, další jsou na Dropboxu, Amazon Photos, Googlu a Microsoft drive, další materiál je v jeho profilech na sociálních sítích, na blozích atd. Všechno pod názvy, které generují fotoaparáty nebo software, ve formátech skrývajících se za MPEG kontejnery, nebo v proprietárních formátech, v RAW, a to bez velké kontroly, bez systematických záloh, bez katalogu.
Tohle všechno zná asi každý. Richard jako archivář svého soukromého archivu doporučuje:
- deduplikovat (http://www.joerg-rosenthal.com/en/antitwin/)
- vytvořit si seznam, katalog všech sbírek (asi ne úroveň každého souboru, ale v rozumné míře) -inspirovat se http://preservationweek.wixsite.com/personalarchiving nebo zvážit použití něčeho jako http://www.resourcespace.com/get tam kde se používají cloudová služby, inspirovat se http://www.cdwinder.de/, http://www.cdfinder.de/en/info.html nebo jako Richard investovat do http://www.wincatalog.com/
- omezit počet použitých formátů
- zálohovat a udržovat zálohy, pokud možno automaticky (třeba s využitím https://www.microsoft.com/en-gb/download/details.aspx?id=15155, https://fastglacier.com/ )
- kontrolovat, že jsou zálohy a data nepoškozené (fixity check, třeba s použitím https://www.avpreserve.com/tools/fixity/ nebo http://www.md5summer.org/ apod.)
pátek 27. ledna 2017
PIQL v ČRO
Po úspěchu ve Slovenském rádiu se podařilo PIQLu přesvědčit i Český rozhlas, že tohle je ta správná cesta, jak se zbavit problémů s trvalou archivací digitálního obsahu....
http://www.parabola.cz/zpravicky/27282/cro-pro-archivaci-cennych-zaznamu-vyuzije-technologii-piql/
http://www.parabola.cz/zpravicky/27282/cro-pro-archivaci-cennych-zaznamu-vyuzije-technologii-piql/
úterý 24. ledna 2017
Diplomky na UK pouze digitálně
Univerzita Karlova se rozhodla pro archivaci závěrečných kvalifikačních prací (tedy bakalářek, diplomek i rigorózních a disertačních prací) pouze v elektronické podobě. Konkrétním vyjádřením tohoto rozhodnutí je Opatření rektora č. 23/2016, které možnost odevzdání textu omezuje pouze na formát PDF/A (verze 1a nebo 2u). Byla zpřísněna také pravidla pro odevzdávání příloh. Studentům je k dispozici seznam schválených formátů, které budou akceptovány automaticky, a možnost zažádat o přijetí přílohy v neschváleném formátu. Studenti jsou povinni odevzdávat PDF/A od 1. 2. 2016.
Opatření rektora doplňuje metodický pokyn a prozatímní informační stránka pro studenty.
Validace PDF/A bude probíhat pomocí nástroje veraPDF, formáty ostatních souborů budou pouze identifikovány pomocí nástroje Fido.
Otázka zrušení povinnosti odevzdávat i tištěnou verzi práce byla ponechána na rozhodnutí fakult. Je tedy možné, že tištěné verze budou i nadále zpřístupňovány v některých knihovnách.
Opatření rektora doplňuje metodický pokyn a prozatímní informační stránka pro studenty.
Validace PDF/A bude probíhat pomocí nástroje veraPDF, formáty ostatních souborů budou pouze identifikovány pomocí nástroje Fido.
Otázka zrušení povinnosti odevzdávat i tištěnou verzi práce byla ponechána na rozhodnutí fakult. Je tedy možné, že tištěné verze budou i nadále zpřístupňovány v některých knihovnách.
Jak si vlastně vede "digital preservation" komunita? Komentáře vítány
Andy Jackson a Paul Wheatley tento víkend rozeslali pomocí Google fóra https://groups.google.com/group/digital-curation emails s prosbou o spolupráci. Obracejí se v něm na všechny zapojené v komunitě okolo dlouhodobé archivace s otázkou, zda současný způsob práce, spolupráce a publicity v této komunitě je dostatečný. Oba dlouhodobě stojí za webem www.digipres.org, kde se celkem úspěšně snaží spojovat roztříštěné aktivity různých registrů, diskuzních fór apod. Ideou je mít vše pod jednou střechou a poskytnout zájemcům web jak pro prvotní tak i pro detailní orientaci v problému.
Originální znění emailu je níže, zmíněné otázky znějí
Děkujeme
Calling All Digital Preservers!
Originální znění emailu je níže, zmíněné otázky znějí
- co vám chybí na výchozí stránce webu www.digipres.org?
- myslíte, že by jste mohli zodpovědět některé z nezodpovězených otázek na http://qanda.digipres.org/? (pokud ano tak to samozřejmě udělejte)
- můžete jakkoliv přispět na COPTR wiki (http://coptr.digipres.org/Main_Page)?
- jsou tyto zdroje užitečné? Myslíte, že by bylo dobře změnit celkový přístup?
Děkujeme
Calling All Digital Preservers!
The digital preservation community is small and under
resourced. This means we have to work together if we want to make a real
impact. To this end, a small group of us has been attempting to help the
members of the digital preservation community better support each other. The
results of this include:
- The http://www.digipres.org site, which aims to provide a gateway to all of the wonderful community-owned and community-oriented resources out there that are dedicated to digital preservation.
- The Digital Preservation Q&A site (http://qanda.digipres.org/), which is a Q&A site set up in the wake of the failure of the efforts to set up suitable Stack Exchange sites for our field.
- The COPTR Tool Registry (http://coptr.digipres.org), which was formed by the merger of many of the previous tool registry efforts, and which seeks to be a primary reference for those working in practical digital preservation.
- The POWRR Tool Grid v.2 (http://www.digipres.org/tools/), which is generated from COPTR registry.
- The Formats Overview (http://www.digipres.org/formats/), built by aggregating information from a number of different format registries.
If, like us, you believe we all need to work together,
we’d love to hear from you….
- What have we missed from the front-page list?
- Can you answer any of these seven unanswered DigiPres questions?
- Can you contribute to the COPTR wiki?
- Are these resources useful? Should we change our approach?
The last one is really important. We’ve been in digital
preservation long enough to see a lot of portals and projects come and go, and
we recognise that making it possible to build on past work sometimes requires
changing what we've built so far.
Please get in touch if you have any questions. You could
talk to us directly, or use the digipres community forum we set up for
this purpose. We’re happy to hear any and all ideas and criticisms!
Best wishes,
Andy Jackson (@anjacks0n)
and Paul Wheatley (@prwheatley)
--
čtvrtek 19. ledna 2017
Digital Preservation: Putting It to Work - nová publikace ze Springeru
Ano, je to tak, EU chválení kolegové z Polska vydali publikací ve Springeru. A ze 2/3 v ní prezentují svůj projekt dlouhodobého repozitáře CREDO.
Digital Preservation: Putting It to Work
http://www.springer.com/us/book/9783319518008
Digital Preservation: Putting It to Work
http://www.springer.com/us/book/9783319518008
Editors: Tomasz Traczyk, Włodzimierz Ogryczak, Piotr Pałka, Tomasz Śliwiński,
DOI 10.1007/978-3-319-51801-5
Kniha není sice nijak rozsáhlá (158 stran), uvolněná kapitola o metadatech (odkaz na webu Springeru, 48 stran, přehledový text o všech typech metadat včetně technických pro různé typy obsahu a ochranných, popisných atd.) a obsah ale vypadají docela zajímavě. Obsah je zde:
Part I Problems of Long-Term Digital Preservation
Requirements for Digital Preservation.............................................. 3
Tomasz Traczyk
Metadata in Long-Term Digital Preservation ..................................15
Grzegorz Płoszajski
Part II Solutions Proposed by the CREDO Project
The CREDO Project.................................................... ....................65
Tomasz Traczyk and Włodzimierz Ogryczak
CREDO Repository Architecture.....................................................77
Tomasz Traczyk
Information Processing in CREDO Long-Term Archive ................93
Tomasz Traczyk
Metadata in CREDO Long-Term Archive .................................... 109
Tomasz Traczyk and Grzegorz Płoszajski
Persistence Management in Long-Term Digital Archive ............. 123
Piotr Pałka
Power Efficiency and Scheduling Access to the Archive.............. 133
Tomasz Śliwiński
Information Management in Federated Digital Archives ............. 143
Piotr Pałka and Tomasz Traczyk
Index .............................................................................................. 157
středa 18. ledna 2017
Konference ILIDE 2017 a PASIG
Chtěl bych upozornit na konferenci ILIDE 3-5. dubna 2017 na Slovensku v Jasné. Organizátorům se daří zajistit celou řadu zahraničních speakerů, v programu jsou například David Minor nebo Tom Cramer, ale také disco nebo Aquarium Night:-)
Přísti PASIG se koná opět trochu blíž, v Oxfordu 11. až 13. září 2017, https://pasigoxford.org/.
Stále jsou online jsou k dispozici slidy z webinářů PASIGu
Stále jsou online jsou k dispozici slidy z webinářů PASIGu
úterý 17. ledna 2017
Ako na certifikáciu repozitára podľa Data Seal of Approval - článek v ITLib
Název: Ako na certifikáciu repozitára podľa Data Seal of Approval
Autor: Andrea Miranda
Číslo: 4/2016
PDF link: http://itlib.cvtisr.sk/buxus/docs/Miranda-ITlib%204_2016.pdf
Abstrakt:
Cieľom príspevku je oboznámiť s kritériami hodnotenia digitálnych repozitárov podľa certifikácie Data Seal of Approval (DSA). Certifikát slúži ako „záruka“ dôvery pre dané kľúčové skupiny, ktoré využívajú či odovzdávajú dáta do cieľového repozitára. DSA predstavuje pomerne jednoduchý spôsob auditu a certifikácie, najmä pre za- čínajúce repozitáre či repozitáre menšieho rozsahu. Popísané sú pôvodné a pripravované Zásady DSA a podrobne spísané sú potrebné podklady a doklady, ktoré bude repozitár potrebovať pre svoju úspešnú certifikáciu.
Autor: Andrea Miranda
Číslo: 4/2016
PDF link: http://itlib.cvtisr.sk/buxus/docs/Miranda-ITlib%204_2016.pdf
Abstrakt:
Cieľom príspevku je oboznámiť s kritériami hodnotenia digitálnych repozitárov podľa certifikácie Data Seal of Approval (DSA). Certifikát slúži ako „záruka“ dôvery pre dané kľúčové skupiny, ktoré využívajú či odovzdávajú dáta do cieľového repozitára. DSA predstavuje pomerne jednoduchý spôsob auditu a certifikácie, najmä pre za- čínajúce repozitáre či repozitáre menšieho rozsahu. Popísané sú pôvodné a pripravované Zásady DSA a podrobne spísané sú potrebné podklady a doklady, ktoré bude repozitár potrebovať pre svoju úspešnú certifikáciu.
pondělí 16. ledna 2017
Kdy vydá NDA xml profil pro validaci PDF/A?
V návaznosti na předešlou zprávu o publikaci verze 1.0 validátoru PDF/A veraPDF mě napadá, že by vlastně bylo logické, aby Národní archiv (resp. NDA) vydal xml profil pro validaci PDF/A podle jeho požadavků.
Legislativně deklarovaný požadavek na PDF/A-1a potřebuje doplnění a vysvětlení - je validní reprezentací PDF/A-1a takový soubor PDF/A, které neprojde validací PDF/A-2u nebo 3a? Validace úrovně 2u nebo 3a je podrobnější než validace podle profilu úrovně 1a (kontroluje se více pravidel)....
Legislativně deklarovaný požadavek na PDF/A-1a potřebuje doplnění a vysvětlení - je validní reprezentací PDF/A-1a takový soubor PDF/A, které neprojde validací PDF/A-2u nebo 3a? Validace úrovně 2u nebo 3a je podrobnější než validace podle profilu úrovně 1a (kontroluje se více pravidel)....
úterý 10. ledna 2017
veraPDF 1.0 je tu!
Konzorcium veraPDF dnes oznámilo uvolnění verze veraPDF 1.0.
http://verapdf.org/2017/01/10/verapdf-1-0-released/?utm_source=veraPDF+News
veraPDF je PDF/A validátor, open source, vyvíjený v projektu Open Preservation Foundation a PDF Association, validuje všechny části a úrovně ISO 19005 (PDF/A). Je dostupný pod licencemi MPLv2+/GLPv3+.
Jak důležitý krok je to pro použitelnost PDF/A v archivech asi není třeba vysvětlovat, naše archivní legislativa o tom, jak se prokazuje shoda s ISO 19005, taktně mlčí. veraPDF dává archivům do ruky nástroj, který jim umožní posoudit shodu s touto normou nebo s vlastním profilem - v případech, kdy je archiv připraven přijmout PDF/A nedovídající některým požadavkům zcela přesně.
veraPDF je PDF/A validátor, open source, vyvíjený v projektu Open Preservation Foundation a PDF Association, validuje všechny části a úrovně ISO 19005 (PDF/A). Je dostupný pod licencemi MPLv2+/GLPv3+.
Jak důležitý krok je to pro použitelnost PDF/A v archivech asi není třeba vysvětlovat, naše archivní legislativa o tom, jak se prokazuje shoda s ISO 19005, taktně mlčí. veraPDF dává archivům do ruky nástroj, který jim umožní posoudit shodu s touto normou nebo s vlastním profilem - v případech, kdy je archiv připraven přijmout PDF/A nedovídající některým požadavkům zcela přesně.
Digitální archivace v Rogue One: Star Wars Story - Jedi Archives
Nemůžu neupozornit na příspěvek na blogu Preservicy. "How Not to Build a Digital Archive: Lessons from the Dark Side of the Force" komentuje poslední díl filmové ságy Star Wars z hlediska digitální archivace.
Možná si řeknete, že to je jen chytrý marketingový tah. Pokud to přitáhne pozornost a povede k popularizaci základních principů digitální archivace, tak proč ne:-)
A je k tomu dokonce i webinář, kde si můžeme poslechnout o chybách Jedi Archive více od Jedi Mastera Jona Tilbura...
A teď koukám, že Zdeněk Hruška už to dokonce i přeložil:
http://ltp-portal.mzk.cz/home/Novinky/jaknebudovatdigitalniarchiv-poucenizestarwarsrogueone
Možná si řeknete, že to je jen chytrý marketingový tah. Pokud to přitáhne pozornost a povede k popularizaci základních principů digitální archivace, tak proč ne:-)
A je k tomu dokonce i webinář, kde si můžeme poslechnout o chybách Jedi Archive více od Jedi Mastera Jona Tilbura...
A teď koukám, že Zdeněk Hruška už to dokonce i přeložil:
http://ltp-portal.mzk.cz/home/Novinky/jaknebudovatdigitalniarchiv-poucenizestarwarsrogueone
Přihlásit se k odběru:
Příspěvky (Atom)