wav? mp3? 音声ファイルについて
私が学生の頃、カセットテープやMDに録音して
音楽を持ち歩いていたことを考えれば、
今、音声ファイルをスマホに入れて
好きなだけ音楽が聴ける状況は、まさに夢の様です。
そんな便利な音声ファイル。
実は、WAVをはじめMP3やAACなど様々なファイル形式があり、
それぞれの特徴が異なります。
今回は、そんな音声ファイルについて書いてみようと思います。
音のデータができるまで
普段あたりまえのように使っている音声ファイル。
そもそも「音」がデータになるとは、どういうことでしょうか。
まずは、
小さい頃に誰もが一度は遊んだであろう「糸電話」を思い出してみてください。
自分の声が、紙コップの底に張った糸を伝い、相手の紙コップから聞こえる。
そんな遊びでしたね。
どうして音が伝わるのかというと、
自分の紙コップの中で、口から発せられた空気の振動が、コップの底を振るわせ、
糸を振動として伝っていき、反対側のコップの底を振るわせる。
相手の紙コップの中でそれが空気の振動を作り、音が聞こえる。ということです。
つまり音とは、「振動・振るえ」だと言えます。
「空気の振動」です。(難しい言い方だと「空気の疎密」などと言われます)
さて、話を戻して
「音」がデータになる、とはどういうことか。
この声や楽器、音楽などの「空気の振動」を
電気信号に変えて記録したもの、これが音声データです。
例えば、マイクを使って声を編集ソフトに取り込むと
この様に表示されます。
左から右へ時間軸が進む。中央の線が無音状態(振動無し)。
マイクを使って電気信号となった声の空気振動が、
上下に凄まじく波打つ線で表示されているのが分かると思います。
音声データはこの電気信号で出来たこの波の「形」を記録します。
これはPCM (Pulse Code Modulation) という方法で、音声のデジタル記録として一般的なものです。
画像ファイルに例えると、
低画質なものがボヤけたりカクカクしていたり
一方、高画質なものがくっきりはっきりしているのと同じ様に、
PCMで記録された音声も、波の形を高画質(とは言いませんが)で記録するほど
音の再現度が高くなり、高音質ということになります。
もちろん高音質で記録したものの方が、その分データ容量が上がります。
非圧縮音声・非可逆圧縮音声
いよいよ、音声ファイルの話です。
まずは「WAV:ワブ・ウェブ」と「AIFF:エーアイエフエフ」です。
前項のPCMは音声を記録するための手段であって、例えばvoice.pcmなどという独自のファイルになったりする訳ではありません。
PCMの音声を扱うファイル、その代表的な形式がWAVとAIFFです。
この2種類のファイル形式、内容はほとんど違いが無いと言ってもよく、
WAVが、Microsoft Windowsの形式
AIFFが、Apple Macintoshの形式として作られました。
波形をそのままファイルにしている様なものなので、
録音や編集のための形式として適切ですが、
その分データ容量が大きくなってしまうのが難点です。
一方その難点を克服するため、
放送やインターネットでの配信、ポータブルプレイヤーで持ち運ぶためなど様々な用途で、
オーディオCDやWAV、AIFFなどの音声データの容量を小さくするために一般的になった
MP3、AAC、WMA などの形式があります。
これらは元となる音声データから、人の聴覚では聞こえにくい音の要素を
省くことなどで、データ容量を10分の1程度まで小さくできます。
データが小さくなることで扱いやすくなりますが、
これらは加工された音声なので、録音や編集などの作業には向きません。
また、一度WAVからMP3などに変換したファイルは、そのMP3からWAVに変換し直したとしても、
元の音質に戻すことは出来ません。
そのことから、MP3などのファイル形式は「非可逆圧縮音声」と呼ばれ、
それに対して、WAVやAIFFは「非圧縮音声」と呼ばれます。
それぞれの形式を簡単に見ていくと、
MP3:一番ポピュラーな圧縮音声の形式。再生できる機材も多い。
AAC:デジタル映像の音声にも使われている形式。iTunesで使われる様になり広く普及。
WMA:Microsoft独自の形式。そのため対応機器が少ない。
と、いった特徴があります。
まとめ
今回はとても簡単にではありますが、
音声ファイルの仕組みとファイル形式を説明しました。
音や映像の制作とは切っても切れない音声ファイル、それぞれの特徴をうまく捉えて適材適所で使っていきましょう。