středa 26. února 2014

ARCOMEN: Prototypy nástrojů pro analýzu webových dat ze sociální sítí

EU Projekt ARCOMEN, který se zabývá využitím informací vytěžených ze sociálních webů pro paměťové instituce, zveřejnil první nástroje na Sourceforge.

Projekt se snaží vytvořit nástroje pro využití obsahů sociální medií při selekci a hodnocení dat především při webarchivaci. Pokud vám, jako mě, není moc jasné, o co by asi mohlo jít, nezoufejte a pobavte se s některými demo nástroji, které jsou dostupné online - seznam je zde http://www.arcomem.eu/technology-demos/

Za pokus stojí určitě nástroj na analýzu názorů v textu:
http://demos.gate.ac.uk/arcomem/opinions/

Vyhledávač FOKAS - Formerly Known AS:
http://www.l3s.de/fokas/

Trendy topics modul:
http://fbmya02.barcelonamedia.org/engv2/

Pěkná je ukázka využití nástrojů Gate pro extrakci "named entities" z dat webarchivu:


Entity, event and opinion detection in GATE from Diana Maynard on Vimeo.

Webinář: Jak formulovat požadavky na LTP systém pro audiovizuální data

PrestoCenter pořádá volně dostupný webinář na téma Jak formulovat požadavky na LTP systém pro audiovizuální data.

Především se bude mluvit o tom,  jak při formulaci požadavků použít standardy ISO 14721:2012 tj. OAIS, Ontology for Media Resources, a standard ISO/IEC 25010 System and Software Quality Requirments and Evaluation SQuaRE – System and Software Quality.

Webinář vede Carlo Meghini z Univerzity v Pise, kterého si možná někteří pamatují - v roce 2008 vystoupil v Praze v rámci školení DPE.
Registrace zde: http://bit.ly/1k8QMNZ

SCAPE SCOUT - Preservation watch system

O tzv. Preservation Watch systému, který vzniká v projektu SCAPE jsme už před časem psali (http://digital-preservation-cz.blogspot.cz/2012/02/automatizovane-sledovani-promen.html)

Systém pro automatické sledování rizik a možností pro dlouhodobou ochranu mezitím dostal název Scout a jasnější obrysy funkcí. Měl by uživatele automaticky upozornit na nové nástroje nebo verze, nově odhalená rizika, mohl by archivu pomoci zjistit, které další instituce mají podobná data ve stejných formátech . Automaticky by měl sklízet řadu informačních zdrojů a měl by je zpřístupňovat formou ontologické znalostní báze(Více na  http://openplanets.github.io/scout/)

Nyní je možnost vyjádřit se k tomu, co by měl tento systém sledovat v dotazníku:
http://survey.scape-project.eu/index.php/862812/lang/en

neděle 23. února 2014

UNESCO srovnání SW na správu digitálního repozitáře

UNESCO vydalo přehledové srovnání systémů na správu digitálních dat/repozitářů. Porovnány jsou systémy Digital Commons, Fedora, Islandora, DSpace, a EPrints. Porovnáno je 12 hledisek:

  • technická infrastruktura (instalace, hosting, podpora atd.)
  • front-end design
  • správa struktury a obsahu 
  • vyhledávání
  • nástroje k publikování obsahu
  • reportování
  • multimédia
  • interoperabilita
  • sociální sítě
  • zpřístupnění
  • autentikace
  • ochrana dat

Jaká rizika přináší PDF/A-3? Report NDSA

Americká organizace vydala před týdnem report, ve kterém se zabývá riziky, která může pro dlouhodobou ochranu dat představovat formát PDF/A-3  (ISO 19005-3:2012). Na blog postu http://blogs.loc.gov/digitalpreservation/2014/02/new-ndsa-report-the-benefits-and-risks-of-the-pdfa-3-file-format-for-archival-institutions/ se dočtete více o krátké historii a problémech, které komunita v PDF/A-3 vidí. Vlastní report, který je volně ke stažení zde http://www.digitalpreservation.gov/ndsa/working_groups/documents/NDSA_PDF_A3_report_final022014.pdf.
V čem je tedy problém? Poslední verze PDF/A, tedy PDF/A-3 má oproti PDF/A-2 (ISO 19005-2:2011) novou vlastnost, která může způsobit z pohledu dlouhodobé ochrany spoustu problémů. Zatímco PDF/A-2 umožňovalo zapouzdření souborů pouze pokud i tyto odpovídaly specifikaci PDF/A, tak nová verze PDF/A-3 umožňuje zapouzdření jakýchkoliv souborů do PDF/A-3 souboru. Mohou to tak být např. XML, CSV, CAD, obrazové, exe a jiné soubory, zapouzdřené do PDF/A.
Autoři vidí možnost využití a archivace PDF/A-3 vytvářených v kontrolovaném prostředí, ale rozhodně ne jako formátu pro příjem PDF/A souborů z různých zdrojů, nad kterými nemáte kontrolu. Více viz zpráva samotná.


pátek 21. února 2014

Norma ISO 16363:2012 vydána ve slovenském znění!

Zásluhou projektu Centrálny dátový archív byla přeložena norma ISO 16363:2012
Audit and certification of trustworthy digital repositories do slovenského jazyka. 

Ke koupi je zde: 

Připravuje se také slovenský překlad ISO 14721:2012 - OAIS

Na českých překladech uvedených norem pracuje Národní knihovna ČR. 

pondělí 3. února 2014

Národní archiv zve na přednášku KARLA PONEŠE "Komplexní pohled na problematiku digitální obrazové reprodukce"

"Komplexní pohled na problematiku digitální obrazové reprodukce"
Přednáška se koná 25. února 2014 od 9.30 hodin v sídle Národního archivu, Archivní 4, Praha 4 – Chodovec

Přednáška navazuje na seminář z 21. května 2013, který se zabýval digitalizací fotografických archiválií.
Tentokrát bude problematika digitalizačního procesu řešena komplexněji:

Workflow digitalizačního procesu
a. Digitální obrazová repro
b. 8 vs 16 bit – ukázka rozdílu
c. RAW vs JPG – ostrost, barevnost
d. Správa barev – proč a jak
e. Tvorba ICC profilů
f. Tvorba profilu objektivu
g. Používání tabulky X-rite v praxi

Přihlášky zasílejte e-mailem: emilie.benesova@nacr.cz
Kapacita sálu je omezená.

EU projekt 4C je v půlce - podívejte se na publikované dokumenty

Projekt 4C (Collaboration to Clarify the Cost of Curation), který má za cíl zmapovat a lépe pochopit náklady na dlouhodobou ochranu digitálních dat, je v půlce svého trvání. O tom, co bylo dosaženo, si můžete přečíst tady http://www.4cproject.eu/news-and-comment/4c-blog/79-lessons-from-the-half-way-point. Z článku vede link na deliverables, tedy dosud publikované dokumenty - http://4cproject.eu/community-resources/outputs-and-deliverables. Některé z dokumentů stojí za přečtení, viz níže:

  • D4.1 Hodnocení nepřímých nákladů na dlouhodobou ochranu http://tinyurl.com/oupe95y. Tento se zabývá zajímavým tématem nepřímých nákladů. Nejen platy, elektřina, HW a podobně ovlivňují náklady na digitální archiv, ale i skutečnosti, které se pomocí archivu snaží vaše instituce dosáhnout. V projektu spolupracující instituce daly dohromady seznam takovýchto faktorů. Jsou mezi nimi např. riziko, důvěryhodnost, dobrá pověst, autenticita aj. Každý z faktorů je vysvětlen s příklady nákladů, které může přinést.
  • D2.1 Výchozí studie stakeholderů a jejich iniciativ http://tinyurl.com/ksjqors přináší seznam institucí, projektů, publikací a konferencí, které se zabývaly nebo zabývají náklady na dlouhodobou ochranu. 
  • D3.1 Ohodnocení modelů na odhad nákladů a analýza potřeb http://tinyurl.com/m4hm7v5 hodnotí existující nástroje a modely
Dokumenty budou přibývat, tak stránku sledujte i nadále.