이 과정을 이해하기 위해서는 먼저 파동이 무엇인지에 대해 알아야 한다. 파동은 우리가 바다에서 보는 파도, 호수에 돌을 던지면 일어나는 물결 등이 바로 파동에 해당한다. 음성 역시 눈에는 보이지 않지만 파동이다. 음성 역시 파도처럼 높낮이가 있고 이 높낮이가 바로 소리의 크기(시끄러운가 조용한가)를 결정하며 얼마나 파도가 자주치는지(즉 한 파도가 지나가고 다음 파도가 얼마만큼 빨리 오는지)를 수치로 나타낸 것이 진동수로 음성 역시 진동수가 존재하고 진동수가 높으면 고음, 진동수가 낮으면 저음에 해당한다.

마이크로 전달된 목소리를 mp3와 같은 디지털 파일로 만들기 위한 모든 과정을 간략히 설명하면 2번의 변환 과정이 필요하다.


1번 과정. 목소리는 마이크를 통해 전기신호로 변환되고 

2번 과정. 이 전기신호는 ad컨버터(아날로그 to 디지털 컨버터)를 통해 디지털 신호로 변환되는 과정을 거친다. 


음성신호가 마이크를 통해 전기신호로 변환되는 1번 과정은 전자기 유도로 설명이 가능하다. 전자기 유도란 자석의 흔들림이 코일에 전기흐름을 발생시키는 것이다. 마이크를 분해해보면 마이크는 진동막과 진동막에 자석이 연결되어 있고 이 자석은 코일로 둘러쌓여 있다. 우리는 얇은 종이에 대고 말을 하면 종이가 떨리는 것을 쉽게 알 수 있다. 이처럼 우리의 목소리는 마이크의 진동막에 떨림을 발생시키고 진동막에 연결된 자석과 자석을 둘러싼 코일을 통해 음성신호가 전기신호로 변환된다. 이처럼 전자기 유도를 통해 목소리의 파동의 형태가 그대로 전기파동의 형태로 바뀌게 된다.


By ChrisEngelsma (Own work) via Wikimedia Commons


이제 변환된 전기신호를 디지털 신호로 변환할(2번 과정) 차례이다. 전기신호가 디지털 신호로 변환되기 위해서는 ad컨버터가 사용된다. 이 ad컨버터는 연속적인 파동인 전기신호를 디지털신호로 변환한다. 디지털로 변환한다는 것은 연속적인 아날로그적 형상의 특정 시간의 파동의 형태를 측정해 수치로 나타낸다는 것이다.(디지털이란 세상의 모든 것을 수치로 나타내는 것을 말한다) 특정 시간의 수치를 기록하는 디지털의 특성상 연속적인 파동을 최대한 원래의 소리와 비슷하게 디지털화하려면 최대한 자주 파동의 형태를 측정해야 한다. 이를 샘플링레이트(sampling rate)라고 하는데 일반적으로 cd의 음원은 44khz의 샘플링레이트를 갖는데 이는 파동의 형태를 1초에 44000번을 측정한다는 것이다. 이 샘플링레이트가 높을 수록 실제 연속적인 파동의 형태와 비슷한 모습으로 디지털화하는 것이 가능할 것이다. 다만 샘플링레이트의 수치가 올라갈 수록 용량이 급격히 상승하게 된다. 


By Mike Toews (Own work) via Wikimedia Commons


위의 그림을 보고 설명하자면 마치 산을 그려놓은 듯한 보라색 선이 바로 음성신호를 그대로 변환한 전기신호라면 빨간색 지점들이 바로 전기신호의 상태를 측정하는 지점들이다. 이 지점들이 촘촘할 수록 더 실제와 동일하게 디지털화가 가능하다. 이 그림을 보면 적분이 떠오르는 사람도 있을 것이다. 아날로그를 디지털화한다는 것은 바로 적분의 과정과 동일한데 적분도 간격을 줄일수록 그 값이 정확해 지듯 여기서는 샘플링 레이트를 높일 수록 실제의 아날로그 신호를 정확히 재연할 수 있다. 디지털신호보다 아날로그 신호를 좋아하는 사람들은 디지털은 이처럼 아날로그적 소리를 100% 재연 하는 것이 불가능하기 때문에 선호하지 않는다. 이처럼 지점마다 측정된 전기신호를 ad컨버터가 수치로 저장하여 이를 디지털화하고 이 연속적인 디지털 신호를 파일로 저장한 것이 mp3와 같은 음악파일이 되는 것이다. mp3와 같은 음악파일의 재생은 위의 과정의 역으로 돌린다고 생각하면 된다. 다만 ad컨버터가 아닌 digital to analog이므로 da컨버터가 사용된다.    








,