pátek 26. července 2013

Rizika formátu PDF pro dlouhodobou ochranu: pokračování pokusů Johana van der Knijffa

Johan na svém blogu na openplanetsfoundation zveřejnil informace o další části svých pokusů s PDF. Tentokrát použil testovací data zveřejněná na Acrobat Engineering Website.

Testoval výkon Apache Preflight 2.0.0, Adobe Acrobat 10.14, Acrobat Preflight 10.1.3 (090)

Testoval dvě skupiny dat, která měla řadu riskantních vlastností (PDF cabinet of horrors:-) jako kryptování, nevložené fonty, multimediální obsah, javascript.

Ze závěrů asi stojí za to zmínit:
- Apache Preflight 2.0.0 neindentifikuje korektně kryptované soubory a soubory chráněné heslem
- při kontrole vložených fontů pomocí Apache Preflight považovat všechny chyby spojené s fonty za potenciální riziko
- multimediální obsah v PDF je pro Apache Preflight přiliš velké sousto - u většiny testovaných souborů nebyl schopen identifikovat specifické vlastnosti související s multimediálním obsahem, javascriptem, vloženými fonty. To by podle Johana nebyl velký problém, pokud bychom chtěli Apache Preflight používat pouze pro testování převoditelnosti PDF do PDF/A. Pokud bychom ale pomocí Apache Preflight chtěli hledat potenciální preservační rizika ve velmi heterogenní sbírce PDF, takt to problém bude.