BLOG ブログ

技術情報

知っておきたいデジタル音声の基本とフォーマット

yuji takeichi

yuji takeichi

デジタル音声データの基礎知識:アナログからデジタルへ

アナログ音声データのデジタル変換

アナログの音声データをデジタルに変換する際には、アナログデジタルコンバーター(ADC)を使用します。
アナログ信号は連続的な波形で表され、これを離散的な数値データに変換する必要があります。

サンプリングレートと量子化ビット

デジタルデータではアナログデータのような滑らかな波形をそのまま再現することはできません。
そのため、デジタル化の過程ではサンプリングレートと量子化ビットが重要な役割を果たします。

サンプリングレート

サンプリングレートとは、1秒間に音声信号を測定する回数を示します。
例えば、CD音源では44100Hz(1秒間に44100回測定)です。

量子化ビット

量子化ビットは、各サンプリングポイントで音の大きさを表現するビット数を示します。
CD音源では16ビットが使用され、これは2の16乗(65536)段階の音の大きさを表現できます。

波形で見るデジタル音声データ

音の波形に対して、横軸に対して分割するのがサンプリングレート、縦軸に対して分割するのが量子化ビットです。
サンプリングレートと量子化ビット数で分割した線が交差するポイントをデジタルデータでは制御します。
サンプリングレート、量子化ビット数が多ければ多いほどアナログに近いデータが再現できるということになります。
逆に低ければカクカクとした音になるということですね。

デジタル音声データの計算

CD音源のデータサイズはサンプリングレートと量子化ビットに基づいて計算できます。

  • サンプリングレート:44100Hz
  • 量子化ビット数:16ビット

この場合の1秒間のデータサイズは以下のようになります。 44100 × 16 = 705600ビット

8ビットで1バイトなので88200バイト(約86.1KB)

例えば、5分の音声データのサイズは次のように計算されます。 44100(Hz) × 16(bit) × 300(sec) = 約25.2MB

さらに、ステレオ音声の場合はデータサイズが2倍になります。

デジタル音声フォーマットの圧縮と品質

デジタル音声データは、圧縮することでデータサイズを削減できます。圧縮方法には、可逆圧縮と不可逆圧縮の2種類があります。

可逆圧縮

可逆圧縮では、圧縮してもデータが失われず、元のデータを完全に復元できます。音質を重視する場合に適しています。

不可逆圧縮

不可逆圧縮では、データの一部が失われるため、元のデータを完全には復元できません。
しかし、人間の耳には聞こえないような不要なデータを削除することで、データサイズを大幅に削減します。

例えば、未圧縮のPCM音源は1秒間に705600ビット(約705.6kbps)のデータ量を持ちますが、
これを128kbpsのMP3に圧縮する場合、人間には聞こえない部分のデータを削除し、128kbpsに収まるサイズまでデータ量が減少します。

主なデジタル音声フォーマット

PCM(Pulse Code Modulation)

PCMは、音声データをデジタル化する基本的な方法で、CD音源などに使用されます。
PCMは圧縮されていないため、高品質な音声を提供しますがデータサイズが大きくなります。

MP3(MPEG-1 Audio Layer 3)

MP3は、PCM音源を不可逆圧縮した音声フォーマットです。
ビットレートは通常96~320kbpsで、一般的に128kbpsや192kbpsが使用されます。

WMA(Windows Media Audio)

WMAは、Microsoftが開発した音声フォーマットで、MP3と同様に不可逆圧縮を使用します。
ビットレートは通常48~192kbpsで、音質とファイルサイズのバランスが良いです。

AAC(Advanced Audio Coding)

AACは、MP3の後継として開発された音声フォーマットで、より効率的な圧縮が可能です。
ビットレートは通常96~320kbpsで、MP3よりも高音質を提供します。iTunesやYouTubeで広く使用されています。

OGG Vorbis

OGG Vorbisは、オープンソースの音声圧縮フォーマットで、MP3やAACと同等の音質を提供します。
ビットレートは通常64~320kbpsです。特にゲームやストリーミングメディアで使用されます。

FLAC(Free Lossless Audio Codec)

FLACは可逆圧縮を使用する音声フォーマットで、圧縮しても音質が劣化しません。
音質を重視するオーディオファイルやアーカイブに適しています。

音質とデータサイズのトレードオフ

高ビットレートの音声ファイルは音質が良い反面、データサイズが大きくなります。
一方、低ビットレートの音声ファイルはデータサイズが小さくなりますが、音質が低下します。
使用目的に応じて最適なビットレートを選択することが重要です。

使用例と応用

  • MP3: 一般的な音楽配信やストリーミングサービスで広く使用されています。
  • WMA: MicrosoftのWindows Media Playerで広く使用されていました。
  • AAC: iTunes、YouTube、Apple Musicで広く使用されています。
  • OGG Vorbis: ゲームやストリーミングメディアで使用されています。
  • FLAC: 音質を重視するオーディオファイルやアーカイブ用途で使用されます。

yuji takeichi

yuji takeichi