コラム
【ちょこっと豆知識】
1フレームの音声サンプル数

コラム

映像コンテンツ制作の技術にかかわる皆様に、ちょっと業務に役立つ知識などをお伝えする【ちょこっと豆知識】。今回は、1フレームの音声サンプル数について解説します。
29.97fpsでは1フレームあたりの音声サンプル数が毎フレーム異なることをご存知ですか?
日本の放送で使用されるフレームレートは、29.97fps。元々白黒放送では30.00fpsだったフレームレートを、カラー化するために0.1%周波数をずらす必要があり(なぜ0.1%かは論文を書けるレベルになってしまうので割愛します)、1秒間に29.97フレーム(整数で表現すると1001秒に30000フレーム)というフレームレートになりました。
音声のサンプリングレートは48000Hz。1フレームあたりの音声サンプル数は、48000サンプルをフレームレートで割るので、48000/(30000/1001) = 1601.6 となり、整数になりません。
そのため、SDIやMXF(OP1a)などでは、ちょうどサンプル数が整数になる5フレーム分をひとつのパターンとして、1602、1601、1602、1601、1602サンプル(計8008サンプル)を1つのパターンとして繰り返す、という特殊なことをしています。
これを5フレームシーケンスといいます。

音声は1サンプルでも抜けるとノイズやエラーになりますから、この5フレームシーケンスを意識しながら処理を作るのは地味に面倒で、開発者泣かせです。
編集機でも、ぴったりフレームに合わせて音を貼り付けたつもりでも、貼る場所によって最後の1サンプルだけ次のフレームに突き抜けたり、1サンプル足りない、ということが発生する場合があるので微妙に注意が必要ですね。
ところで、日本の放送だと「1秒」の定義って難しいですよね。ノンモン0.5秒は、24000サンプルなのか、15フレーム(24024サンプル)なのか悩みます。
AS MXF Checkerでは、15フレームで運用している局で弾かれないよう、15フレームで検知しています。
編集マンの皆様はどちらで運用されていますか❓
※本コラムは、2026年2月16日の公式Xの投稿
をもとに再構成したものです。
Loading...
ユーザーメモ