MedGemma、医療 AI 開発向けマルチモーダルモデル
Google が MedGemma コレクションに 2 つの新しいモデルを追加した。MedGemma 27B Multimodal は複雑なマルチモーダルと縦断的電子健康記録の解釈をサポート。MedSigLIP は分類、検索、関連タスク用の軽量画像・テキストエンコーダー(400M パラメーター)。
MedGemma 4B Multimodal は MedQA で 64.4%のスコアを記録し、8B 未満のオープンモデル中で最高クラス。胸部 X 線レポートの 81%が米国認定放射線科医により十分な精度と判定。MedGemma 27B は MedQA で 87.7%のスコアを記録し、DeepSeek R1 との差は 3 ポイント以内で推論コストは約 10 分の 1。
オープンモデルの利点として、専用ハードウェアでの実行、ファインチューニングによる最適化、スナップショット配布による安定性を提供。DeepHealth が胸部 X 線トリアージ、Chang Gung Memorial Hospital が繁体字中国語医学文献、Tap Health が進捗ノート要約で活用。
Hugging Face と GitHub で利用可能。Vertex AI で専用エンドポイントとして展開可能。