pátek 31. října 2014

ISO 16919:2014 - Publikovaný standard

Norma ISO 169191 se posunula do stavu "International Standard published" (http://www.iso.org/iso/catalogue_detail.htm?csnumber=57950), teoreticky tedy mohou oficiálně začít certifikace podle normy ISO 16363:2012.

ISO 16919:2014 specifkuje požadavky na organizace, které provádějí audit a certifikaci digitálních repozitářů podle metrik obsažených v ISO 17021 a  ISO 16363. Cílem normy je podpořit akreditaci organizací poskytujících certifikace. 

Cely text normy je k dispozici na stránce CCSDS v pdf:

http://public.ccsds.org/publications/archive/652x1m2.pdf

čtvrtek 30. října 2014

NDSA - jak a kdo archivuje web v USA?

NDSA zveřejnila zprávu ze sruvey o archivaci webu ve Spojených státech.

Na rozdíl od České Republiky, kde se archivací webu kromě Webarchivu Národní knihovny zabývá jen několik málo institucí a jednotlivců, je v USA praxe mnohem pestřejší.

Odpovědi na dotazník poskytlo téměř 90 institucí, a z výsledků je vidět, že archivace webu je v posledních letech stále populárnější. Nejčastěji se dotazované instituce (odpověděly především veřejné instituce, vládní a státní úřady, z poloviny univerzity) zabývají jak archivací svého vlastního webového sídla tak cizích webů, většina institucí používá externí služby archivace webu, a také data externě archivují. Mezi nejčastěji používané nástroje patří Heritrix, HTTrack.

Podrobnější výsledky jsou na: http://www.digitalpreservation.gov/ndsa/working_groups/documents/NDSA_USWebArchivingSurvey_2013.pdf

Sborníky z konferencí iPRES dostupné na jednom místě

Díky kolegům z Technické univerzity ve Vídni jsou sborníky z konferencí iPRES dostupné na jednom místě, totiž v repozitáři vídeňské univerzity. Link je tady
https://phaidra.univie.ac.at/detail_object/o:340041.
Zatím chybějí sborníky z roku 2013 a 2014, ale doufejme, že budou brzy doplněny.

středa 29. října 2014

OAIS systems AIP modeling – do we need Common AIP exchange format?

In my career in long-term preservation I had the chance to look under the skin of several systems developed with the aim to fulfill the OAIS reference model. During couple of years, I became familiar with Rosetta, SDB, RODA, one home grown system in Slovakia, more briefly with some other one customer or home tailored solutions. Joining the LTP-Pilot project at Masaryk University in Brno I started to look more closely at Archivematica as this is the focus of the project (and of other projects in Czech Republic as well – Archivematica is supposedly used in the National Archives of the Czech Republic; National Film Archives and Library of the Academy of Sciences are looking at this system too).

The OAIS - ISO 14721 - describes functional entities and information model. For some reason I tend to feel that to understand an OAIS system is always very useful to start with the information model.  I.e. to understand how are the information types described in OAIS mapped to AIP, how can the SIP be structured and how is it converted to AIP, what is possible to do with the AIP later on inside the repository. The AIP modeling expresses the long-term preservation philosophy of the OAIS system creator, and constraints also possible functionality of the system.

Seeing x-th system with the same ambitions (be the “OAIS system”) I realized that there are quite some differences between them on the level of AIP data model. If we see during 10 years of existence of the OAIS such different approaches as RODA FOXML based model,  Archivematica Bagit based model, or systems using METS or non-METS simple and single metadata containers like Rosetta or SDB and other, not mentioning other appraoches like SPAR in BNF, how can we expect some level of interoperability in 50 years time? How do we expect to migrate the AIPs from system to system? Does that mean that we will throw the old repository metadata in a provenance bag, and take only some information to build new AIPs? Or should we have bigger ambitions and want to map maximum of the audit and provenance information into the new systems?

I was always rather skeptical to practical usability of the abstract models like the Trustworthy digital object. But should we not really strive to model some “Common AIP Exchange Format” or have and AIP exchange method standard that would enable fast system to system exchange of the AIPs preserving maximum of the information? I don’t know if the TIPR (http://wiki.fcla.edu/TIPR/1) project resulted in practical implementations, but Repository Exchange Package could be a way to look at the problem. But this project seems to be territorially focused and ended by 2011 without any further steps to enlarging the user community.

If we look at the LTP repositories environment in 50 years time, we can expect each AIP being migrated twice between different systems. Shouldn’t we have clear and common idea about what is to be preserved in these migrations? Shouldn’t this be also explicitly described in widely accepted standard?


úterý 14. října 2014

ČSN ISO 16363 a 14721 - klíčové normy česky

Tak jsme se dočkali překladu dvou klíčových norem z oblast dlouhodobé archivace.
V srpnu byla vydána ČSN ISO 14721, aka OAIS a teď v říjnu ČSN ISO 16363.

Ke koupi třeba tady:
http://shop.normy.biz/detail/96148
http://shop.normy.biz/detail/95767

Andrea Fojtů vypsala z OAIS překlady klíčových termínů, takže, zapomeňme na migrace a transformace, replikace, a autenticitu. Aspoň že nám zůstala "informace" a "data":

access functional entity ­ funkční celek zpřístupnění
access rights information ­ informace o přístupových právech
access aid ­ pomůcka pro zpřístupnění
access collection ­ sbírka pro zpřístupnění
access software ­ software pro zpřístupnění
adhoc order ­ jednorázová objednávka
administration functional entity ­ funkční celek správy
AIP edition ­ vydání balíčku AIP
AIP version ­ verze balíčku AIP
archival information collection AIC­ archivní informační zbírka
archival information package AIP ­ archivní informační balíček
archival information unit AIU ­ archivní informační jednotka
archival storage functional entity ­ funkční celek archivního uložení
archive ­ archiv
associated description ­ pridružený popis
authenticity ­ hodnověrnost
collection description ­ popis sbírky
common services ­ základní služby
consumer ­ koncový uživatel
content data object ­ datový objekt s obsahem
content information ­ informační obsah
context information ­ informace o souvislostech
co­operating archives ­ spolupracující archivy
data  data
data dictionary ­ datový slovník
data dissemination session ­ spojení pro šíření dat
data management functional entity ­ funkční celek správy dat
data management data ­ data o správě dat
data object ­ datový objekt
data submissions sessions ­ spojení pro dodávání dat
derived AIP ­ odvozený AIP
descriptive information ­ popisná informace
designated community ­ určená komunita
digital migration ­ přesun digitálního obsahu
digital object ­ digitální objekt
dissemination information package ­ výstupní informační balíček
event based order ­ rámcová objednávka
federated archives ­ sdružené archivy
finding aid ­ pomůcka pro vyhledávání
fixity information ­ informace o neporušenosti
global community ­ společná komunita
independently understandable ­ srozumitelný sám o sobě
information ­ informace
information object ­ informační objekt
information package ­ informační balíček
information property ­ vlastnost informace
information property description ­ popis vlastnosti informace
ingest functionality entity ­ funkční celek příjmu
knowledge base ­ znalostní základna
local community ­ lokální komunita
long term ­ dlouhá doba
long term preservation ­ dlouhodobé uchovávání
management ­ vedení
member description ­ popis člena
metadata ­ metadata
non-reversible transformation ­ nevratný převod
open archival information system ­ otevřený archivační informační systém
order agreement ­ dohoda o objednávce
ordering aid ­ pomůcka pro objednávání
other representation information ­ ostatní vysvětlující informace
overview description ­ celkový popis
package description  popis balíčku ­ 
packaging information ­ informace o zabalení
physical object ­ fyzický objekt
preservation description information ­ informace o uchovávání
preservation planning functional entity ­ funkční celek plánování uchovávání
producer ­tvůrce
provenance information ­ informace o původu
reference information ­ informace o identifikátorech
reference model ­ referenční model
refreshment ­ obnova
repackaging ­ přebalení
replication ­ kopírování
representation information ­ vysvětlující informace
representation network ­ síť vysvětlujících informací
representation rendering software ­ software pro zobrazení vysvětlujících informací
retrieval aid ­ pomůcka pro získávání
reveresible transformation ­ vratný převod
search session ­ spojení pro vyhledávání
semantic information ­ informace o významu
structure information ­ informace o uspořádání
submission agreement ­ dohoda o dodávání dat
submission information package ­ vstupní informační balíček
succession plan ­ plán nastupnictví
transformation ­ převod
transformational information property ­ převáděná vlastnost informace
unit description ­ popis jednotky