FFmpeg 8.0がWhisperフィルターで自動音声認識に対応

FFmpeg 8.0で、Whisperフィルターが新しく追加された。これにより、FFmpeg単体でOpenAIのWhisperモデルを使用した自動音声認識が可能になった

plaintext

ffmpeg -i input.mp4 -vf "whisper=language=ja" -f srt output.srt

音声認識と同時に動画処理を行う例：

plaintext

ffmpeg -i input.mp4 -vf "whisper=language=en" -c:v libx264 -c:a aac output.mp4

これまで音声認識には別途Whisperの実行環境が必要だったが、FFmpeg単体で処理できるようになったことで、動画編集ワークフローでの自動字幕生成が容易になった。