編集

Magika 1.0をリリース

GoogleがAI駆動ファイルタイプ検出システムMagika 1.0をリリースした。初回の安定版で、200種類以上のファイルタイプに対応(以前の約100種類から倍増)。

主な改善点として、Rustで一から書き直した高性能エンジン、ネイティブRustコマンドラインツール、コードや設定ファイルなどのテキストベースフォーマットの精度向上、PythonとTypeScriptモジュールの刷新が含まれる。

新たにサポートするファイルタイプとして、データサイエンス・ML関連(Jupyter Notebooks、Numpy arrays、PyTorch models、ONNX、Apache Parquet、HDF5)、モダンプログラミング・Web関連(Swift、Kotlin、TypeScript、Dart、Solidity、Web Assembly、Zig)、DevOps・設定関連(Dockerfiles、TOML、HashiCorp HCL、Bazel、YARA)、データベース・グラフィックス関連(SQLite、AutoCAD、Adobe Photoshop、Webフォント)を追加。

類似フォーマットの識別精度も向上。JSONLとJSON、TSVとCSV、Apple binary plistsとXML plists、C++とC、JavaScriptとTypeScriptを区別可能。

Rustベースのエンジンにより、シングルコアで1秒あたり数百ファイルを識別可能。マルチコアCPUでは1秒あたり数千ファイルまでスケール。MacBook Pro(M4)では約1,000ファイル/秒を処理。

#参考文献

編集