top of page
ナビ用背景.png

​音声の表現
​について

音声の表現についてまとめる前に、「波」について確認します。
振動が伝わることが波の現象です。波が伝わるためには特殊な場合を除き、媒質(=波を伝える物質)が必要になります。媒質は一般的に、水または空気などがあります。
音の波の媒質は空気です。
さまざまな波の動きがありますが、例えば正弦波の場合・・・

正弦波グラフ2.png

となります。円運動している空気(媒質)がある場合、一回転している時間を周期といいます。この綺麗な波の形は無機質な音で純音(音叉)と呼ばれる正弦波です。

例えば振幅・周波数(周期)が同じでも音色が違うと、波の形は異なります。

ここで3つの音色の波の形を確認してみましょう。

正弦波の場合、0から0までの間を、山が1、谷を−1で表しています。1個の波が伝わる時間(例:正弦波の一往復)を周期といい、単位を秒[s]で表します。
そして、1秒間に含まれる波の数(例:1秒あたりの正弦波の往復回数)を周波数といい、単位をヘルツ[Hz]で表します。

例えば、周期が 0.5 s の場合、周波数は 2 Hz となります。

また、周波数が 200 Hz の場合、周期は 0.005 s となります。

周波数と周期は、音の高さに影響します。音が高いということは、波の数が多いということです。また、音が大きいということは、振幅(上下)が大きいということです。

では、音のデジタル化とは?

音を数値にすることですね!

時間に対して一定の間隔で区切り、量(=サンプル)として取り出した点を標本点といいます。そして、この操作を標本化といいます。

Voice_Expression_02.png
Voice_Expression_03.png
Voice_Expression_04.png

標本化周期とは、標本化するときに一定の時間で区切った間隔のことです。

標本化周波数とは、サンプリング周波数といい、1秒間に標本化する回数のことです。

量子化とは、音の波の高さ(つまり振幅)に対して一定の間隔で区切り、標本点を整数で表すことです。

Voice_Expression_05.png
Voice_Expression_06.png
Voice_Expression_08.png

振幅は何段階に分かれているでしょう?

段階に分けるということは、何通りと言い換えることができます。

この「何通り」​、何bit(ビット)で表すことができるでしょうか?

​例えば振幅が8段階だった場合、振幅は8通りと言い換えることができます。

8通りということは、2の3乗(2×2×2)です。この桁の部分、指数の部分が「量子化ビット数」になります。量子化ビット数は「3 bit」ですね。

例えば振幅が16段階だった場合、振幅は16通りと言い換えることができます。

16通りということは、2の4乗(2×2×2×2)です。この桁の部分、指数の部分が「量子化ビット数」になります。量子化ビット数は「4 bit」ですね。

 

また電圧の最も近い段階値を整数で表現するため、切り上げたり切り下げたりします。この時に生じる誤差のことを量子化誤差といいます。

この誤差をなくすにはどうしたらいいのでしょうか。

Voice_Expression_07.png
Voice_Expression_12.png
Voice_Expression_13.png

そして、コンピュータは「0」と「1」しか理解できないため、量子化した値を2進数に変換する必要があります。量子化した数値を2進数の「0」と「1」に置き換えることを符号化といいます。

Voice_Expression_09.png
Voice_Expression_10.png
Voice_Expression_11.png

符号化された値を受け取ったコンピュータは、この符号によって音の波を表現します。

このように、標本化→量子化→符号化の手順で音をデジタル化することを、PCM方式(パルス符号変調方式)といいます。

音をデジタル化するにはどうしたらいい?
音質を良くするためにはどうしたらいい?
​また、そのデメリットについて考えてみよう。

© 2023 The Book Lover Wix.comを使って作成されました

bottom of page