본문 바로가기
오디오 이야기

[오디오]MP3와 CD 음질의 차이가 있는지, 그건 모르겠고...

by 만술[ME] 2015. 11. 19.

우선 아래의 소리 반 공기 반은 아니고 농담 반 진담 반인 오디오와 관련된 이야기를 읽기 전에 오디오 세계에 대한 제 입장(따위는 관심 없다면 할 수 없지만)을 먼저 알아두시면 앞으로 읽으실 글을 읽을 가치가 있는지, 여기에 댓글 달며 싸울 가치가 있는지 알 수 있으실 겁니다. (라고 하지만 그러자면 요딴 글 읽으려고 선행 학습할 글이 너무 많다는 건 함정입니다.)




아무튼,


요즘은 나이를 먹어서인지 이곳저곳에 분산 수용되고, 이 박스 저 박스에 들어있는 CD를 찾아서 듣는 게 귀찮아져서 시험 삼아 꺼내기 힘든 곳에 있는 CD들을 FLAC으로 리핑 해서 듣고 있습니다. 저야 당연히 기왕이면 무손실이겠거니 하고 FLAC으로 리핑을 하는데 (저야 아이폰을 쓰니 ALAC이 좋지만, Oppo-105가 ALAC에 대해서는 갭리스 플레이를 지원하지 않아서 할 수 없이 FLAC을 씁니다.) 인터넷에서는 손실 압축인 MP3와 FLAC사이에 차이가 없다는 의견들과 또 그렇지 않다는 의견들이 많더군요. 재미있는 건 차이 없다는 의견은 이런저런 데이터와 원리로 무장했는데, 차이 있다는 쪽은 들어보면 안다 류의 대응이 많다는 건 여전합니다.


차이가 없다는 쪽도 <인지>의 문제를 거론하지 둘이 완전히 일치한다고 말하지는 습니다. 둘이 똑같다면 <손실>압축 = <무손실>원본이니 그야말로 창조경제가 될 테지요. 그러다 보니 그 어려운 <인지>에 대한 테스트가 증거로 나와야 하는데, 다들 인용하는 게 그냥 이 자료 하나더군요. 독일어 원문은 돈을 내야 하니 못 보고, 영문은 위 국역본에 나온 링크는 깨져있으니 <여기>에서 볼 수 있습니다. 


이 테스트(독일의 오디오 쪽은 아니고 PC 관련 정간물에서 한 것이지만)을 읽다 보면 몇 가지 의문을 가지지 않을 수 없습니다. 뭐 크게 딴지를 거는 것은 아니고 그냥 신나서 이 테스트 결과를 MP3(주로 320K)와 CD가 음질이 같다는 근거로 마구 가져다 쓰기에는 문제가 있어 보인다는 겁니다.


1. 압박은 고래도 춤추게 할까요? 위 테스트를 보면서 가장 먼저 주목하게 되는 부분은 (제가 변태여서인지) 참가자들의 입장에서 이런 테스트가 엄청난 압박이라는 것입니다. 그들의 일부는 30분 만에 포기하고 싶어 했으며, 최고점을 받은 사람도 (내부자임에도) 한 시간 만에 지쳐버렸다는 점을 주목하고 싶습니다. 부모님들이 시험 보러 가는 자녀에게 부담 갖지 말고 평소처럼만 하라고 격려하는 것을 보면 재미있는 일이죠? 


2. 테스트의 방식을 요약하면 (1)CD 음원을 1분간 들려줌 (2)비교 대상인 세 음원을 각각 1분간 무순위로 들려줌(128 kbps, 256 kbps, CD 음원), (3)그리고 들은 세 음원을 각각 구분해 내는 것인데, 이 경우 세 번째 음원은 비교 음원인 CD 음원을 들은 지 무려 2분이 경과한 뒤에 듣게 된다는 것입니다. 아울러 이 방식은 처음에 CD 음원을 들려주었음에도 CD 음원과 다른 음원과의 음질 차이가 있는지를 확인하는 테스트보다는 근본적으로는 세 음원을 변별해내는(차이를 구분하는 것이 아니라 그 음원이 무엇인지를 맞히는) 테스트입니다. 묘한 게 <인지>에 대한 테스트를 하면서 전제를 낮은 음질(또는 공정한 용어로 손실이 많은 압축방식)이 <인지적으로> 선호되지 않을 것을 전제로 하는 것으로 보입니다. 아니라면 문제 음원을 그것이 CD건, 128 kbps, 256 kbps건 무작위로 하나를 들려주고 다음에 보기 음원을 각각 무작위로 순차적으로 들려준 뒤, 처음 들었던 문제의 음원이 무엇인지 알아맞히는 테스트로 설계했어야 옳습니다. 


다시 말해서 (1)CD를 들려준다 (2)무작위로 세 음원을 들려준다 (3)어떤 것이 CD 음원인지 알아맞히라고 한다로 진행해야 할 테스트를 테스트에 임하는 사람들이 들어보진 못한 음원(128 kbps, 256 kbps)까지 변별해야 하는 문제로 출제하고 그것을 평가 결과에 반영하는 이상한 짓을 한 것입니다. 문제 되는 곡의 128 kbps, 256 kbps의 샘플을 들어보지 못한 사람에게 어느 것이 128 kbps이고 어느 것이 256 kbps인지를 맞추게 한 것이죠. 말하자면 CD 음질은 모두 찾아내지만, 128 kbps, 256 kbps를 구분 못 하면 17점을 받는 겁니다. 물론 원문을 보면 이런 결과를 보인 참가자가 있지는 않았지만, 저는 테스트의 설계에 대해 말하는 겁니다. (후속 과정에서 마음껏 들을 기회가 주어졌다고 하는데 정확한 방식이 기술되어 있지는 않아 모르지만, 여전히 음원의 이름을 맞히는 게임이죠.)


3. 아울러 이 테스트는 묘하게 <선호>에 대한 테스트와 <변별력>에 대한 테스트가 융합되어 있다는 겁니다. 말은 MP3와 CD의 구분(변별)에 대한 테스트인 것처럼 보이지만, 결국은 사람들의 “내 귀에 좋게 들리는 것이 CD이고 안 좋게 들리는 것이 128 kbps일 것”이라는 고정관념을 이용하고 있습니다. 처음에 CD를 들려줬다고는 해도, 들어보지 못한 128 kbps, 256 kbps를 구분해야 하는 테스트 참가자의 입장에서는 보기 중 가장 듣기 좋은 것에서 별로인 것 순서를 정하는 <선호도 테스트>가 되어 버릴 위험이 있습니다. <라우드니스 워>의 예로도 알 수 있듯, 인지적인 <음질 좋음>의 기준은 <음질>과 관련이 없을 수도 있습니다.   


4. 만약 선호도를 떠나서 음질의 차이를 구분하는지 못하는지를 검증하기 위한 테스트였다면, 일반적인 ABX 테스트여야 했을 것입니다. (왜 이런 간단한 방법을 안 쓴 것인지 뭔가 의도가 있는 건 아닌가 하는 생각도 들 정도입니다.) 즉, (1)CD음원을 들려주고 (2)CD 음원이나 256kbps 음원을 들려준 뒤 (3)처음 음원과의 동일한지 다른지를 구분하는 방식이어야 했다는 것입니다. (이래야 기억력의 한계도 어느 정도는 극복할 수 있을 것이며, 사실 처음 들려준 음원이 꼭 CD일 필요도 없습니다) 즉, 인용된 테스트는 CD음원과 256kbps 또는 128kbps의 음질을 구분할 수 있는가의 테스트라 하기에는 문제가 있습니다.


5. 이글 이외의 많은 블로그, 동호회의 글에서 이 문제를 다루면서 측정 결과에 대해서는 다르다는 것에 이견은 없습니다. 실험에서 여실히 보이는 차이를 사람이 <인지>를 하느냐 못하느냐의 문제라는 것이죠. 저는 이런 종류의 테스트가 설계가 잘되고 못되고를 떠나서 차이를 인지 못 한다는 결론으로 이어질 수 있을까에 대해서도 의문입니다. 


청각적 테스트는 두 개의 샘플을 병행하여 들려줄 수 없는 반면, 시각적 테스트는 병행하여 예를 제시할 수 있는데, 예를 들어 RGB 240-28-28을 RGB 245-28-28과 이웃하게 놓는 경우 대부분의 사람은 둘의 차이를 인지할 수 있지만(구분 못하면 모니터를 바꾸세요^^), 이 두 가지 색상을 청각적 테스트를 하듯 순차적으로 보여주며 ABX 실험을 한다면 얼마나 많은 사람들이 차이를 인지할 수 있을까요? 이 경우 시각적 정보를 병행하여 처리할 수 없는 가상의 세계에 사는 사람들이 누군가 RGB 240-28-28을 RGB 245-28-28에 비해 선호한다고 말하는 것에 대해 넌 차이도 못 맞추면서 RGB 240-28-28을 선호하는 것은 넌센스라고 말하는 것이 과연 정당할까요? 또는 RGB 245-28-28을 보여주고는 RGB 245-28-28, RGB 240-28-28, RGB 235-28-28을 무작위로 보여주면서 정확하게 맞춰보라 한다면 결과는 위 실험과 비슷할 겁니다.



RGB 245-28-28, RGB 240-28-28, RGB 235-28-28 (아니, 반대인가?^^)




청각은 병행 검증이 불가능하니 시각과는 달리 인지 가능성의 정의 자체가 달라진다고 생각해야 할까요? 그래서 순차적 샘플제공에 의한 ABX 테스트에서 통과하지 못하면 인지적 차이가 없다고 주장해야 옳은 것일까요? 



겹쳐 놓으니 차이가 보이죠?




6. 이 때문에 묘한 호기심이 생겼는데, 사람은 (다른 동물은 제가 안 물어봐서 모르겠지만) 자신이 인지하고 안 하고를 늘 제대로 표현하지 못합니다. 이건 의도적인 속임 말고 본인이 인지하고 있음을 인지 못 하는 웃기는 상황이 가능하다는 것인데, 본인이 긴장하고 있다고 인지하지는 못하지만, 심장박동, 땀, 체온 등 몸의 변화를 측정하면 긴장을 측정할 수 있다는 겁니다. 이 경우 “나는 내가 긴장하고 있다는 것을 <몰랐다>”는 묘한 언명이 가능한 상황이 되죠. 의사는 “너는 긴장하고 있다”고 알려주고요. 그러면 대상자는 “그러고 보니 그런 것 같네요”라고 답하죠. 문제는 <인지>의 정의에 대한 문제까지 이어집니다. “제 몸이 먼저 <알아요>”하는 상황에서 그걸 <인지>로 볼 수 있느냐 아니냐는 것이죠. 


7. 그렇다면 음질 차이의 인지 여부는 시험에 참가하는 사람의 능동적인 반응만으로 충분하지 않은 것은 아니라는 주장도 가능하지 않을까요? 즉, CD 음원을 틀어주었을 때와 MP3를 틀어주었을 때의 각종 신체반응을 측정해보면 어떨까요? 만약 CD와 MP3를 들을 때, 또는 처음에 제시된 샘플과 답안을 들었을 때의 신체적 반응의 차이를 측정하면 뜻밖에 <무의식적 인지 반응>을 측정하고 이를 통해 사람이 각각의 음원의 차이를 인지하는지 못하는지를 <측정>할 수도 있는 것 아닐까? 이제부터 “음질 좋은 오디오는 몸이 먼저 안다”는 광고도 가능하겠습니다.^^ (교과서 잘못된 것은 그냥 느낌으로 알 수 있으니 뭐 음질 따위야)



*     *     *



길게 늘어놓았지만 결론입니다.


(1)CD와 MP3(320kbps)의 음질 차이가 없다는 말을 하는 사람은 없습니다. 측정 결과가 달라요. 만약 같으면 그야말로 창조경제입니다.


(2)둘의 차이를 인지할 수 없다는 입장은 위에 인용한 글을 주장의 근거로 내세우고 있습니다. 국산도 아닌 독일 전문가들이 이미 테스트 끝낸 문제라는 거죠. 더구나 그 테스트에는 256kbps 음원을 사용했는데, 하물며 320kbps라면 말할 것도 없죠.


(3)반대편 사람들은 여전히 들어보면 안다, 좋은 기계로 들어보면 안다는 말을 반복하고 있습니다. 

 

(4)(제가 잘못 생각하는 것인지) 왜 사람들이 인용하기 좋아하는 테스트의 문제점을 지적하지 않는지 모르지만, 제가 보기에 테스트는 문제가 있습니다. ①선호도 테스트와 변별력 테스트가 묘하게 뭉뚱그려져 있으며 ②쉽고 간편하며 이쪽 주장하는 분들이 무척 좋아하는 ABX 테스트를 사용하지 않았습니다.


(5)따라서 이 테스트 결과로 전문가인 사람조차 MP3와 CD 음질을 구분하지 못했다는 이야기를 하는 것은 무리가 있습니다. 참고로 <MP3와 CD 음질이 다르다>, <MP3보다 CD 음질이 좋게 들린다>, <MP3보다 CD 음질이 좋다>는 각각 다른 말이며 테스트 방법도 달라집니다.


(6)<인지>의 정의 자체도 문제가 됨에도 비판 없이 받아들여지고 있습니다. 병행하여 제시하면 쉽게 변별할 수 있는 시각적 테스트의 경우도 순차적으로 제시한다면 맞추기 힘들어지고, 청각은 순차적인 제시 이외에 테스트 방법이 없는데, 이 결과만으로 인지의 가능성을 논하는 것이 정당한 것인지에 대한 <합의>가 필요합니다.  



추가적 꼭 언급하고 싶은 것이 있습니다. 이번 이야기도 그렇고 음질 구분 테스트 따위의 말들을 하는데, 사진 또는 영상에서 말하는 <화질>이라는 용어와 같이 오디오에서 <음질>이라는 용어도 정말 문제가 많습니다. 멋진 사진을 놓고 사진 좀 찍는 사람들에게 두 사진 중 어느 것이 화질이 좋으냐고 물으면 이런저런 답이 나올 겁니다. 그렇다고 사진 좀 찍는 사람들도 화질 구분 못한다는 따위의 말을 하면 웃긴 거죠. <화질>이라는 것은 해상도, 다이내믹 레인지, 계조 표현 등 정말 다양한 요소들의 결합에서 나오는 이야기이니까요. 


만약 제가 설계한다면 해상력, 다이내믹, 고음재생, 저음재생 등 분야를 나누어서 각각을 대상으로 차이를 구분 가능한지를 테스트 할 것입니다. 이렇게 하면 아마 재미있는 결과가 나오지 않을까요? 물론 그 뒤에도 분석적으로 인지는 가능하지만, 종합적으로는 인지적 의미가 없다는 이야기를 할 수는 있겠죠^^.


MF[ME]





댓글