čtvrtek 2. ledna 2014

Digitální archivace kinematografických děl - stručná zpráva z NFA

Filmové archivy jsou v oblasti dlouhodobé ochrany digitálních objektů ve specifické situaci. V porovnání s knihovnami a ostatními archivy se potýkáme jednak s mnohonásobně větším objemem dat a také se značnou komplexností formátů. A zatímco pro digitální text, statickou grafiku, zvuk a videa dokumentačního charakteru existuje řada komerčních i open-source řešení digitálních repozitářů, u kinematografických děl (kde kromě obsahu značně záleží i na formě) je situace složitější a ani inspirace v zahraničí nepřináší odpovědi na většinu otázek nebo dokonce hotová řešení.

V Národním filmovém archivu jsme jako formát pro prezervaci (a případně i šířeni) nativně digitálních kinematografických děl zvolili Digital Cinema Package (DCP), používaný k současné digitální kinodistribuci. Je to tedy formát značně rozšířený s odhadovanou dlouhou životností (10 let?), vyznačuje se dobrým kompresním poměrem, technologie, na nichž je postaven (JPEG 2000, WAVE, MFX, XML), jsou obecně známé. (Další pomocné formáty jsou XDCAM HD422 pro distribuci obsahu do klasických televizí, a různé podoby MP4/H.264/AAC pro šíření přes web, IPTV, OTT apod. - zde do budoucna uvažujeme o nasazení nějaké podoby H.265/HEVC - nadějně se jeví x265.)

U skenu filmů (skenování pro prezervační i prezentační účely plánujeme ve větší míře rozjet v následujících letech) uvažujeme rovněž o nějaké formě komprese JPEG 2000 (zřejmě však v neztrátové podobě) v konteineru MXF. Rešením by mohl být Master Archive Package (MAP) propagovaný evropským projektem EDCINE. Zatím však není příliš rozšířený a jde tak de facto o proprietární technologii, možná proto nakonec přistoupíme k nějaké vlastní implementaci podobných formátů, která bude ovšem otevřenější pro další zpracování a případné sdílení.

Archivaci videa se věnuje např. Archivematica či DVA-Profession (projekt Österreichische Mediathek). Tyto digitální repozitáře však nepracují s formáty jako je DCP nebo MAP (ve smyslu, že by jim „rozuměly“, získávaly z nich metadata, uměly je přehrávat a převádět do jiných formátů). Pokud je nám známo, žádný takový systém nyní neexistuje. Nadějně se jeví projekt P4 (Presto Prime Preservation Platform), který je zaměřen přímo na prezervaci audiovizuálních dat, a také počítá s implementací iRODS, technologie pro zabezpečení dat na bitové úrovni, pro nás rovněž potenciálně zajímavou. S iRODS má díky účasti na projektu Cinegrid zkušenosti sdružení CESNET, s nímž bychom rádi navázali spolupráci.

Další poměrně složitý komplex problematiky představují metadata audiovizuálního obsahu. Z hlediska výběru standardu se zatím předběžně přikláníme k nějaké formě MPEG-7. Co se týká oblastí našeho zájmu, kromě technických metadat popisujících aktuální stav formátů a proces migrací (např. převod videokazet do souborů, skenování filmového obrazu a zvuku, budoucí migrace DCP do nových formátů) existují přinejmenším další dva zásadní úkoly k řešení: Time-based metadata popisná (jména herců, lokace, ...) i technická (střihy, změny parametrů obrazu a zvuku, ...) a technická metadata popisující průběh digitálního restaurování filmového obrazu a zvuku. Klíčová je samozřejmě co největší automatizace při sběru a zpracování všech těchto metadat.

2 komentáře:

  1. dobry den,
    digitalni repozitare "rozumi" formatum potud, pokud maji plugin nebo nastroj na extrakci technickych metadat. Napr. Archivematica udela zakladni extrakci metadat z jakehokoliv formatu. U formatu "beznych" jako je tiff, pdf, doc, jpg, atd pouzivaji repozitare nastroje jako je JHOVE na extrakci metadat a DROID na identifikaci formatu. Casto je mozne zapojit jine nastroje, pro AV material napr. MediaInfo aj. Prehravani a prevod do jinych formatu je otazkou. Prehravani muze byt mimo repozitar, tedy streamovat napr. obsah repozitare do prehravace, ktery chcete pouzivat pro uzivatele. Samotny repozitar pak nic prehravat nemusi. Takto napr. u hudby v mp3 postupuje NK Noveho Zelandu, ktera pouziva LTP system Rosetta. Migrace do jineho formatu - podobne. Repozitar by vam mel pomoci s identifikaci problemu, tedy varovani typu "pozor format xy je zastaraly". Pak je otazka jake v dane chvili existuji jine formaty pouzitelne pro migraci a zda repozitar ma nastroje na tuto migraci. Pokud ne, je nutne aby bylo mozne je do repozitare doplnit, napr. jako plugin. Podstatne ale je, aby repozitar mel a aktivne pracoval s technickymi metadaty, aby byl schopen vam rict jake formaty repozitar obsahuje, tedy je nutna alespon zakladni extrakce metadat a identifikace formatu.

    OdpovědětSmazat
    Odpovědi
    1. Dobrý den a moc děkuju za reakci.

      Ten můj nástin problematiky je velmi obecný a snad i v některých ohledech pomýlený. Jsem technolog filmového a digitálního obrazu, avšak z nouze nyní řeším i digitální repozitáře a metadata (nicméně doufám, že do NFA brzy přijmeme i profesionála z oboru Informační vědy, který by se tématu začal věnovat na patřičné úrovni...). Děkuju tedy za upřesnění funkce digitálního repozitáře. Je pravda, že přehrávání i formátové konverze dokážeme řešit bez problému vně digitálního repozitáře.

      MediaInfo znám a používam, dokonce jsem teď ke svému překvapení zjistil, že dokáže extrahovat většinu důležitých informací i z formátu DCP (nekryptovaného). Další formáty (MAP, XDCAM, MP4) by neměly být problém. Otázka je, jak by si program poradil s kryptovanými DCPky, které zřejmě v repozitáři budeme muset rovněž držet (kvůli distribuci do kin)...

      Smazat