pondělí 16. února 2015

Rozhovor s ředitelem Narodního archivu UK na BBC 4Ten rozhovor reaguje na názory Vinta Cerfa, prezentované třeba také zde: http://www.theguardian.com/technology/2015/feb/13/google-boss-warns-forgotten-century-email-photos-vint-cerf

Zbavme se PDF, je tady RG?

Na několika fórech probíhá debata o článku, který vysvětluje, proč je PDF nevhodný formát pro publikaci výsledků vědecké práce:
http://www.theguardian.com/higher-education-network/2015/feb/11/researchers-its-time-to-ditch-the-pdf

Shrnu-li, článek říká, že PDF je formát nevhodný pro publikování proto, že neodpovídá tomu, jak dnes lidé na webu komunikují:
  • je to statický typ formátu, neumožňuje snadné komentování a sdílení. PDF vzniklo v pravěku internetu, kdy nebylo z bezpečnostních důvodů žádoucí, nechat čtenáře, aby s pisateli textů komunikovali přímo tak, aby se tato komunikace stala součástí dokumentu samotného. PDF umožňuje jen jednosměrnou komunikaci....
  • dokumenty v PDF jsou nepřehledné, poznámky nebo ilustrace jsou někdo jinde, než je zrovna oko čtenáře, a tohle zdržuje a rozptyluje...
  • protože PDF umožňuje jen jednosměrnou komunikaci a vylučuje kontextualizaci obsahu, přispívá PDF tomu, že většinu vědeckých článků čtou jen jejich autoři samotní, recenzenti a editoři.....
Organizace spoluzaložená autorem článku Ijadem Madischem (http://www.researchgate.net/) proto navrhla formát RG: https://explore.researchgate.net/display/news/2015/02/12/Introducing+the+RG+Format

středa 11. února 2015

MD5 hashclash - je MD5 v repozitářích už k ničemu?

Honza narazil na zajímavý příspěvek na blogu Nata McHugha.

Popisuje jak vytvořil dva vizuálně zcela odlišné obrázky, které mají stejný MD5 hash. Použil k tomu prefix collision attack.

Z popisu to chápu tak, že do těla jpeg souborů přidával za end of image marker bloky bitů, které nemají na renderovanou podobu obrázku vliv. Tyhle přidané bloky bitů jsou generované tak, aby postupně zvyšovaly rozsah kolize, a nakonec zcela odstraní rozdíly v MD5 jednotlivých souborů.

Pochopitelně celá tahle legrace trvá asi docela dlouho. Pokus prokazuje, že MD5 nedostojí definici kryptografické hashovací funkce, kde je jedním z požadavků odolnost proti kolizi.

Je otázka, jaký dopad to může mít na praxi v repozitářích kulturních dat, kde možná riziko záměrného útoku touto cestou nehrozí a kde se obvykle používá více hashovacích funkcí zároveň.

Článek a obrázky jsou tady:
http://natmchugh.blogspot.co.nz/2014/10/how-i-created-two-images-with-same-md5.html
A je k dispozici i nástroj: https://code.google.com/p/hashclash/, který vytvořil Mark Stevens.

úterý 3. února 2015

JHOVE nadále pod správou OPF

Velmi rozumný krok pro celou komunitu kolem dlouhodobé archivace udělala OPF.

V dotazování mezi svými členy OPF zjistila, že JHOVE (JSTOR/Harvard Object Validation Environment) patří k nejdůležitějším nástrojům v oblasti. Žádný velký objev:-)

A protože je už snad od roku 2010 zcela bez podpory a vývoje, rozhodla se OPF ve spolupráci s PORTICO převzít za jeho další správu odpovědnost. 
Třeba se tedy dočkáme nejen kosmetických úprav, ale například lepší podpory PDF, apod.