R2 Data Catalog、期限切れスナップショットでデータファイルも削除
R2 Data Catalog に組み込まれた Apache Iceberg カタログでは、スナップショットの自動期限切れが従来どおりメタデータ(マニフェストやマニフェストリストなど)を整理するだけでなく、保持対象のスナップショットから参照されなくなったデータファイルも R2 上から削除するようになった。これまでデータファイルは Spark などから remove_orphan_files や expire_snapshots を実行して回収する必要があり、ストレージコストと運用負荷が残りやすかった。
期限切れのスナップショットに紐づかなくなったデータファイルは、スナップショット失効と同じタイミングで除去される。カタログ単位で有効化する場合は npx wrangler r2 bucket catalog snapshot-expiration enable に --older-than-days と --retain-last を指定し、古さと最低保持本数の両方を満たしたスナップショットだけが対象になる。