pondělí 13. srpna 2012

Nástroje na charakterizaci a identifikaci formátů - srovnávací zpráva Australské národní knihovny

Australská národní knihovna zveřejnila závěrečnou zprávu z testování několika nástrojů na extrakci metadat a identifikaci datových formátů. Zpráva je myšlena jako doplněk k podobným projektům a porovnáním, proto obsahuje ne zcela tradiční nástroje, což je z našeho pohledu velký přínos.
Zpráva je dostupná z webu OPF [tady] nebo přímo plný text [.pdf, 1.8MB].

Nástroje na identifikaci datových formátů:

  • File Investigator Engine
  • Outside-In File ID
  • FIDO
  • Unix file / libmagic
Nástroje na extrakci metadat:
  • File Investigator Engine
  • Exiftool
  • MediaInfo
  • pdfinfo from the Xpdf toolkit
  • Apache Tika