私は時々、クライアントから間違った拡張子を持つファイルを受け取ることがあります。例えば、名前はimage.jpg
だが、ファイルは実際にはTIFF画像だとします。多くの場合、テキストエディタでファイルを開き、最初の数バイトを見て、それがどのファイルタイプであるかを推測することで、それを明らかにすることができます
これは、JPEG、TIFF、GIF、PDFファイルで動作します。しかし、他にもたくさんの種類のファイルがあります
含有データを解析することで、正しいファイルタイプの識別を自動化することは可能でしょうか?
159 Martin 2011-04-24
TrID ツールを使用すると、ファイルを識別するためのファイルタイプ定義のライブラリが増えています
ワイルドカードがサポートされているので、この例では、検査対象の画像をすべてフォルダに入れて、例えば C:\verifyimages のようにして、コマンドを使用することができます
trid C:\verifyimages\*
これは、verifyimages
フォルダ内のすべてのファイルを調べます
GUI版も用意されています。TrIDNet
Windows Explorer と Total Commander に TrID または TrIDNet を簡単に統合する方法についてのドキュメントがあります
Windows Explorer
Total Commander
151 Gaff 2011-04-24
ファイルは、それを分類するために各引数をテストします。ファイルシステムテスト、マジックナンバーテスト、言語テストの順に実行される3つのテストがあります。最初のテストが成功すると、ファイルの種類が表示されます
印刷されるタイプは通常、テキスト (このファイルには印刷文字といくつかの一般的な制御文字だけが含まれており、おそらく ASCII 端末で読んでも安全でしょう)、実行ファイル (このファイルには、UNIX カーネルや他の UNIX カーネルで理解できる形でプログラムをコンパイルした結果が含まれています)、または他の何かを意味するデータ (データは通常「バイナリ」または印刷不可能です) のいずれかが含まれています。例外として、バイナリデータを含むことが知られているよく知られたファイル形式 (コアファイル、tar アーカイブ) があります
54 Ignacio Vazquez-Abrams 2011-04-24
私は以前、フランス国立図書館で、デジタル化された書籍だけでなく、あらゆる種類の奇妙なファイル形式を持つ何百万ものデジタルアーティファクトを含むデジタルアーカイブシステムを構築するために働いていました。ファイル形式を認識するために、JHOVEを使用していました
JHOVEはオープンソースで、JSTORとハーバード大学図書館によって管理されています。利用するのは簡単です
14 Nicolas Raoul 2011-04-24
ファイルの種類は、Windowsを含むどのパソコンからでも確認することができます
3 John Williams 2018-06-04
魅力的な現代的なアプローチは、Git for Windowsを使用することです。git-bash.exe
を実行し、file path\to\file
のコマンドを実行します。出力例は次のようになるかもしれません
TestFile.ico: MS Windows icon resource - 1 icon, 128x128, 32 bits/pixel
別の方法としては、file -i path\to\file
コマンドを使用すると、このようになるかもしれません
TestFile.ico: image/vnd.microsoft.icon; charset=binary
2 AlainD 2020-07-19
私はOracleのOutsideInライブラリをプログラムに使用しています。無料ではありませんが、特に画像の場合はうまく機能します。市場では500以上のファイルタイプをサポートしていると言われています
2 Richard Brightwell 2011-04-24