지난 4월 말부터 필자는 RVC라는 AI 음성 기술을 테스트하고 있다. 그러나 말만 테스트일 뿐, 사실상 커버곡을 만드는 것이나 다름이 없다. 다만 커버곡이라고 호칭을 붙이기에는 다른 스트리머나 가수에 비해 영상미도 음질도 보잘 것이 없었다. 원곡 반주가 아닌 노래방 반주에 맞춰 부르는 게 대다수고, 영상에 꾸미는 것도 없이 그저 3D 아바타와 노래방 반주 화면 밖에 없으니까 말이다. 그래서 나는 대외적으로는 'RVC 노래 테스트' 라는 호칭을 사용하기로 하였다.
AI 기술이 일반인에게 나름 보급화가 되기 시작한 것은 작년부터일 것이다. 작년 후반기 때 그림을 그려주는 AI가 두각을 나타내기 시작했고, 올해 초에는 ChatGPT 같은 AI 채팅이 널리 알려지고, 그 후에 RVC 같은 AI 보이스가 알려졌다. 물론 그 전에도 MMVC, DDSP 등 AI 보이스 기술이 존재했지만 일반인들이 접근하는 데에는 난이도가 있었다. 일반인들이 설명문을 보고 손쉽게 접근할 수 있는 수준이 되어야 비로소 해당 기술의 인지도가 상승하는 것이라고 필자는 생각한다.
하지만 이러한 AI 기술들도 결국 기존의 정보를 가지고 그것을 응용하는 것일 뿐이다. 무에서 유를 창조할 수는 없는 것이다. 그러다보니 항상 이러한 기술들은 저작권 문제에 휩싸이게 된다. 당장 AI 그림부터, 그림체를 학습한 뒤 특정 단어를 제시하면 그려주는 기술이다. 그러면 본인의 그림체를 AI에게 학습당한 일러스트레이터들이 이를 곱게 볼 수는 없을 것 아닌가. AI 보이스도, 일단 인간의 목소리가 학습이 되어야 말을 하든 노래를 하든 할 수 있는 것이니, 이때 학습된 목소리가 저작권을 침해하느냐 않느냐의 시비에 휘말릴 수 있고, 커버곡을 제작할 경우 이미 존재하는 보컬을 추출해서 AI에게 변환을 지시해야 하니 변환시킬 보컬을 부른 실연자(實演者)의 저작권을 침해하는 지 아닌 지의 논란에도 직면할 수 있다. 이처럼, 현재 보급되고 있는 AI 기술들은 각각의 직종에 위협이 되기 때문에, 앞으로도 여러가지로 견제가 들어올 가능성이 높다. 현재 국회에 제출된 'AI 표기 의무법' 이라든가 말이다.
필자는 위와 같은 논란을 최대한 회피하기 위해, AI 목소리 모델은 실제 가수의 육성이 아닌 TTS 출신이나 공개 배포되고 있는 모델만을 사용하고 있으며, 보컬 또한 실제 가수의 육성을 추출하는 것이 아닌 직접 부른 뒤에 이를 변환하는 식으로 대체하고 있다. 솔직히 나도 내가 부른 것보다는 가수가 직접 부른 게 듣는 입장에선 더 좋다고 생각한다. 하지만 나는 '버추얼 개망초' 의 이름으로 RVC 테스트를 진행하고 있는데, 가수의 보컬을 따서 변환을 하면 그건 해당 가수를 모창하는 것이지, '버추얼 개망초' 의 영혼을 담아서 부르는 것이 아니지 않은가. 그래서 조금 못 부르더라도 그런 식으로 프로젝트를 진행하였고, 다음 달인 10월 11일. 데뷔 1주년이 되는 날까지 유튜브에 테스트 영상 공개를 이어가려고 한다.
정보 수집을 위해 커뮤니티나 SNS를 들락날락 거리면, 유독 특정 SNS는 AI 기술들에 대해 부정적인 입장을 피력하는 걸 넘어 원색적으로 비난을 하기도 한다. AI 기술로 무언가를 제작하는 사람들이 모두 도둑이라도 된 것마냥 말이다. 아마 AI 기술로 인해 피해를 입는 직종을 가진 자들이 많아서 그런 것 같은데, 이래나 저래나 중간에 끼어있으면 괴롭기만 하다. 정치도 극우나 극좌처럼 극단으로 치달으면 진영논리에 빠져 아무 생각없이 상대방을 무지성으로 헐뜯기만 하면 되니까 역설적으로는 그게 더 편한 것처럼 말이다. 저작권 시비에 최대한 휘말리지 않도록 나름대로 방침을 세워서 프로젝트를 진행해왔는데, 세상에는 이러한 시도를 알아봐주는 사람도 거의 없고, 심지어 알고리즘에게도 무시받고 있다. 긍정적인 의미로든 부정적인 의미로든 뻔뻔하지 못하면 손해만 보는 세상이다.