声のはなし

【宅録研究!】高音質ってなに? ~Hzとbit~

宅録に関してネットで調べているときに見かけた『高音質録音可』みたいな文言。

その時ふと思いました。

高音質って・・・どんな定義を満たせば高音質なんだろう?

マイクを用意して、パソコンで録音、DAWを使って簡単な編集はできますが、

まだまだ音に関しての知識は乏しい私・・・。

もっと宅録技術を向上するために音の勉強もしたい!

ということで、宅録研究を始めます!(「`・ω・)「

とはいえ難しいことはわからないので、頑張ってかみ砕いて落とし込んでいきます!

私と同じように録音する側の知識に自信がない方、宅録初心者の方にも役に立ったら嬉しいです。

今回は『高音質とは?』をテーマにまとめていきます!

高音質の定義とは?

まず結論。

高音質とは人によって定義が異なります。

どういうこと!?

高音質とは字の通り『音の質が高いこと』ですよね。

この『音の質が高い』というのが、

  1. 原音に近いもの
  2. メインの音を聞き取りやすく調整したもの

どちらのことを言っているのか、言いたいのかによって違ってくるんです。

例えばナレーションや歌。

読み手の声の大小や息遣いが入った原音があるとします。

①の『原音に近いもの』のことを高音質というならば、

編集時に音の大小があっても、息遣いの音があっても、あまり調整しないことが高音質になります。

変わって②の『メインの音を聞き取りやすく調整したもの』のことを高音質だと言うなら、

音量の大小を整えたり、ノイズの除去をしたりしてメインとなる音を聞き取りやすく編集しなければなりません。

たぶんナレーションなら②がほとんどだと思うので、

私が目指す高音質は『メインの音を聞き取りやすく調整したもの』ですね。

(息遣いに関しては不要な部分はノイズですが、場合によっては“味”になるので全部カットする必要はないと個人的に思っています。)

正直①の考えが私にはなかった笑

音のデータには『デジタルデータ』と『アナログデータ』がある。

スマホやパソコンで録音したものを『デジタルデータ』と言うそうです。

デジタルデータの利点は、

  1. 再現時に劣化せずに原音に近い音で再生可能
  2. コピーを繰り返しても劣化しない

そしてデジタルデータの音質は『Hz』と『bit』で表すことができるんだそう。

この『Hz』と『bit』の値が大きければ大きいほど良い音が録音できるらしいですよ。

ちなみにレコードやビデオテープのようなものをアナログデータと言うらしいです。

サンプリング周波数(Hz)

サンプリング周波数とは、人の声などのアナログの音声信号をデジタル信号へ変換する際に、1秒間に変換させる回数のことを言います。

簡単に言うと、録音した時に見る波のことです。

1秒間に1回波を計測すれば1Hzとなります。

この数値が高ければ高いほど細かくデータを取れるので原音に近い音で録音できます。

ちなみにCDのサンプリング周波数は、『44.1 kHz』。

これは『1秒間に4万4100回なみなみしている』ことになります。

(1,000Hz=1kHz)

CDすごい!

しかし録音した周波数をそのまま再現できるのではなく、

再現できるサンプリング周波数の本来の半分の周波数までなんだそう。

つまり、44.1kHzで録音したものの再現は『22.05kHz』となります。

そしてサンプリング周波数を上げるのと比例してデータ量が増えていきます。

「なんで半分なの?」とは聞かないで笑

しかし細かくデータを取得するということは、PCなどの記憶媒体にそれだけ負荷がかかります。

単純に「高くすればいい!」というのではなく、使用用途によって決めるのがベストのようです。

加えて人間の耳が拾える範囲にも限界があります。

だいたい20Hz~20kHz程度と言われているようです。

CDのサンプリング周波数は『44.1kHz』

そして再現できる周波数は『22.05kHz』

人間の聞こえる範囲は『~20kHz』

基本的には44.1kHzで十分なんだね!

ちなみに

映像系の標準は48kHz

音楽系の標準は44.1kHz

ハイレゾは96kHzや192kHz

らしいです。

ハイレゾすごっ!

bit

bitとは、音量に対する音の解像度のことです。

単位はbit。

写真のbitと同じ感覚でよいかと思います。

16bitだと65,536段階で音量をデータ化し、

24bit=16,777,216段階で、

32bit=4,294,967,296段階で音量をデータ化するそうです。

こちらもHz同様、数値が大きければ大きいほど良い音が録れると言われています。

写真や絵の解像度も低いとファミコンのような荒いドットに、解像度が高いと鮮明な写真になるイメージです。

しかしこちらもサンプリング周波数同様、パソコンなどへの負荷も考えて、使用用途によって決めた方がいいそうです。

主流は16bitと24bitのよう。

他に32bit浮動小数点というものもあるそうですが・・・

ちょっとまだ理解が足りていないので、また別の機会にまとめようと思います!

ちなみにCDのbit数は16bit。

16bitでも問題ないかと思いますが、余裕があるなら24bitにしておいた方が無難なのかな?

というのが今の印象です。

今後もリサーチ続けます!

まとめ

いかがでしたでしょうか?

まず大前提として高音質とは、『何を求めるのかで定義が変わる』ということ。

  1. 原音に近い音を高音質と捉えるのか?
  2. メインの音を聞き取りやすく調整したものなのか?

そして音声データとしては『Hzとbitの数値が高いほど原音に近い音で録音ができる』こと。

ただし、数値が高いほどパソコンなどへの負荷が高くなるため適切な数値で扱うことがベストであるということ。

目安として、音楽系はCDと同じ『44.1kHz/16bit』、映像系は『48kHz/16bitあるいは24bit』が標準となる。

私の現在の調査だとこんな感じでした!

私は今まで宅録をしてきましたが、Hzやbitなどを特に気にすることなくやってきていました(;´∀`)

(納品して音声チェックしてもらって特に問題がなかった)

録音編集に使っているAudacityの初期設定が44.1kHz/32bit浮動小数点となっていたので問題なかったのかと思います。

これを読んで少しでも音に対して

「ああ、そういうことだったのか!」

「そんなものもあるのね!」

と思ってもらえたら嬉しいです。

宅録をするなら読みのスキルだけでなく、こういった音への知識も備えていた方が何かといいはず!

これからも音への勉強を続けていきます!(「`・ω・)「

今回も最後までご覧くださりありがとうございました!╰(*´︶`*)╯Thank you.♥