“가우디오랩의 ‘무한한 자유’에 끌렸죠” with 아시아경제

2022.07.04ㆍ by Gaudio Lab

“가우디오랩의 ‘무한한 자유’에 끌렸죠” with 아시아경제

(2022. 07. 04)

지난 3월 가우디오랩에 합류한 근우가 아시아경제와 인터뷰를 진행했습니다. 인터뷰를 통해 “인공지능에 귀 달러 온” 근우의 포부를 한 눈에 알아볼 수 있었는데요. 인터뷰 전문을 본 포스팅을 통해 공개합니다!

올해 AI 전문가로 가우디오랩에 합류했다. 가우디오랩에서 어떤 역할을 맡게 됐나?

현재 가우디오랩 R&D 조직의 절반은 AI가 차지하고 있습니다. 가우디오랩의 AI 조직은 연구와 개발로 나뉘는데, 저는 그 중에서도 연구조직을 이끌고 있습니다. 통상 대기업에서 연구조직은 주로 상위 조직에서 정한 방향에 맞추어 연구를 실행하게 됩니다. 하지만 가우디오랩의 연구조직은 능동적이고 주도적으로 연구방향을 수립하고 실행합니다. 덕분에 사업과 얼라인된 빠르고 유연한 연구개발이 가능합니다. 제 역할은 학계 및 산업계에 대한 이해를 바탕으로 AI 연구 방향을 수립하고 훌륭한 팀원들과 함께 이를 실행하는 것입니다.

오디오 AI 기술 전문가로 오랫동안 경력을 쌓아왔다. 스포티파이, 틱톡 등 글로벌 빅테크 기업에서 일하다 한국의 스타트업을 선택한 이유가 궁금하다.

스포티파이, 틱톡 등 제가 근무했던 글로벌 빅테크 기업들은 각 분야에서 명실상부 세계 최고의 기업일 뿐만 아니라, 기업 문화나 생산성 면에서도 세계를 선도하고 있습니다. 구조적으로 잘 짜여진 조직인 만큼, 업무 또한 굉장히 분업화가 잘 되어 있죠. 그런 빅테크 기업에서 약 4년을 보내면서 연구와 조직 문화에 대해 많이 배웠습니다.

하지만 같은 일을 비슷한 방식으로 하는 것에 더 이상 재미를 느끼지 못하게 되었습니다. 스포티파이와 틱톡에서 해온 업무를 인스타그램에 가서 또 반복하고 싶지 않았습니다. 오히려 가우디오랩이라는 스타트업이 연구자에게 제공하는 자유로운 환경과 주도적인 업무가 가능한 환경 등이 훨씬 더 매력적으로 느껴졌습니다.

사실 가우디오랩은 여러모로 저와 연이 깊은 회사입니다. 과거 한국에서 5년 가량 음향 연구를 하던 시절부터 오현오 CEO, 전상배 CSO와 인연이 있었고, 소위 ‘알파고 쇼크’ 직후에 제가 가우디오랩에서 AI 초청 세미나를 하기도 했었죠. 당시 오현오 CEO가 제게 “이제 음향도 AI가 대세가 되겠느냐”는 질문을 했었고, 저는 “시간 문제일 뿐”이라고 대답을 했던 것이 기억이 납니다.

어느덧 시간이 흘러 저와 CEO 모두 ‘그 때’ 가 바로 눈 앞에 있다는 직감을 갖고 함께 일하기로 뜻을 모았습니다.

한국에서 5년, 그리고 영국과 미국으로 건너가 8년간 일했던 분야를 다시 한국에 돌아와 집대성하겠다는 임무를 받았습니다. 어쩌면 운명일 수 있겠다는 생각으로 합류했습니다.

전문가의 입장에서 본 가우디오랩의 장점 혹은 차별화된 경쟁력은 무엇인가?

가우디오랩의 가장 큰 자산은 바로 ‘사람’입니다. 우선, 이렇게 오디오 전문가가 많이 있는 회사는 세계적으로도 찾아보기 어렵습니다. 가우디오랩에는 전 세계적으로 희귀한 음향공학박사가 총 8명이나 되는데요, 이는 국내 최상위 수준의 규모입니다.

그리고 R&D가 아닌 조직 마저도 ‘소리에 진심인 사람들’로 가득 차있습니다. 그 결과가 바로 조직의 순발력이자 힘입니다. 존경할 수 있는 동료들이 있기에, 가우디오랩은 계속해서 강해질 수 밖에 없다고 생각합니다.

또한, 2022년 현재 한국은 전 세계에 문화를 수출하는 콘텐츠 강국이 되어있는데요.콘텐츠 관련 기술을 개발하는 회사 입장에서는 놓칠 수 없는 좋은 기회입니다. 저희도 다각적인 측면에서 다양한 파트너사와 협력을 진행하며 새로운 기회를 계속 만들어내고 있습니다.

기존 오디오 AI 기술의 현황과 문제점은 뭐라고 봤나, 그리고 이를 해결하기 위한 노력은 무엇인가?

기존에 있던 회사들은 빠르게 변하는 AI 기술의 속도를 따라가는 데 어려움을 겪습니다. 이런 현상은 오디오 뿐만 아니라 어디에나 마찬가지이기 때문에 스타트업에게도 항상 기회가 열려있는 셈입니다.

학계에서 좋은 평가를 받는 결과물이라도 실제 제품에 적용하기엔 어려운 경우가 많이 있습니다. 예를 들어 가우디오랩이 개발한 기술 중에 음악과 가사를 동기화해주는 GTS(Gaudio Text Sync)라는 기술이 있습니다. 음악 스트리밍 서비스에서 사람들이 음악을 들을 때 각 순간에 해당하는 가사를 아주 정밀하게 보여주는 기술입니다. 보통 ‘실시간 가사보기’ 라고 하죠.

학계에서 나온 방법들도 어느 정도는 작동하지만, 너무 작은 데이터로서 평가하기 때문에 실제로 만들어서 써보면 사업적으로는 만족하기가 어려운 경우가 많습니다. 때문에 가우디오랩에서는 학계에서 사용하는 것보다 훨씬 크고 까다로운 데이터로 AI 솔루션을 평가하였고, 또 이 기준을 통과하는 세계 최고의 성능을 만들어냈습니다. 덕분에 해당 기술은 현재 상용화에 성공하여 다수의 스트리밍 서비스에 제공되고 있습니다.

많은 스타트업들이 AI 개발 인력 확보에 어려움을 겪고 있다. 좋은 인력을 영입하기 위해서는 어떤 노력이 필요하다고 보나?

AI 개발인력이 가장 중요시하는 가치는 본인의 성장이라고 봅니다. 회사와 본인이 함께 성장할 수 있는 기업 문화가 매우 중요하다고 생각합니다. 저 또한 팀원들이 회사의 성장 방향성에 맞는 결과물을 내는데 기여할뿐만 아니라, 그 과정의 전반을 통해 많은 것을 배울 수 있도록 팀을 이끌고자 노력중입니다. 물론 회사의 발전에 따른 성과를 직원들과 나누는 것은 당연하고요.

실제로 가우디오랩은 강한 동기부여를 통해 성장에 집중할 수 있는 기업문화를 가지고 있습니다. 실제로 가우디오랩 구성원들의 총 동기지수(Total Motivation Factor, 일의 즐거움/의미가 높을수록 높아짐)는 일반 회사들과는 비교할 수 없을 정도로 매우 높은 편입니다.

올해 주력하고 있는 핵심 분야와 목표에 대해 설명을 부탁한다.

“소리는 경험의 절반이다(Sound is half the experience)”, 조지 루카스 감독의 말입니다.

오디오 없이는 뛰어난 콘텐츠가 완성될 수 없는 것이죠. 영화, 방송, 음악 등 우리 주변 다양한 미디어의 소리를 만들고 처리하는데는 수많은 오디오 기술이 들어갑니다. 여기에 AI를 도입한다면 불가능을 가능케 할 수 있는 분야가 무궁무진해집니다.

최근 가우디오랩에서는 여러 가지 악기와 목소리를 분리해내는 음원분리 기술 GSEP을 개발하였습니다. 음악이 요리라면 여기에서 재료들을 하나하나 분리해내는 기술입니다. 현재는 저희 홈페이지를 통해 이를 무료로 제공하고 있는데요, 이를 고도화하는데 매진하고 있습니다.

또, 현재 메타버스 환경에는 오디오 기술이 전무한데요. 이 부분도 저희의 주력 분야 중 하나입니다. 영화관에서 영화를 보면 일반 디바이스에서 보는 것 보다 훨씬 몰입감이 높아지는 것처럼, 오디오는 컨텐츠의 화룡점정을 담당합니다. 이는 메타버스 환경에서도 마찬가지, 혹은 더 강한 역할을 하게 될 것이라고 생각합니다. 사람들의 ‘몰입’을 이끌어내야 하니까요.

메타버스 환경에서는 실시간으로 오디오를 생성하고 이를 실감나게 재생하는 기술이 필요할텐데요, 이미 AI는 이러한 기술 개발에 중요한 역할을 하고 있습니다. 가우디오랩에서도 최고의 기술을 제공하기 위해 끊임없이 연구 중에 있습니다.

미디어 속 가우디오랩

韓 스타트업 '무한한 자유'에 끌렸죠

Back

Sound technologies for the metaverse with Arirang TV

Sound technologies for the metaverse with Arirang TV (2022. 04. 20) 아리랑TV 비즈테크 코너에 소개된 가우디오랩 AI그룹 가우디오랩의 AI Audio 기술이 아리랑TV의 비즈테크 코너를 통해 소개되었습니다. 메타버스 환경에서의 소리를 전하기 위해 공간음향, AI 음원분리 등 다양한 요소로 최선을 다하는 가우디오랩의 기술 일부가 소개되었습니다. (오피스도 살짝 엿볼 수 있어요?) 세계 최고의 수준을 자랑하는 가우디오랩의 AI 음원분리 기술과 그 활용에 대한 이야기를 나누었는데요. 특히 링크나 파일만으로 즉시 음원분리가 가능한 Studio Gaudio 사이트가 현장에서 아주 뜨거운 반응을 얻기도 했습니다 ? 가우디오랩의 소리 기술을 통해 여러분께 전하게 될 놀랍고 근사한 소리경험을 기대해주세요!

2022.04.22

가우디오랩x오디언, 넘치는 몰입감 ‘오디오 시어터’ 론칭… 극장처럼 생생한 몰입감 구현

가우디오랩x오디언, 넘치는 몰입감 ‘오디오 시어터’ 론칭… 극장처럼 생생한 몰입감 구현 (2022. 08. 11) 가우디오랩의 공간음향 기술, 오디언의 콘텐츠 기획력, 강수진 성우 군단의 환상 콜라보 유명 성우의 연기, 오리지널 IP, 강렬한 사운드 효과 더해져 차별화된 몰입감 전달 AI・메타버스 오디오 전문 기업 가우디오랩 주식회사는 오디오 콘텐츠 전문 제작・유통사 (주)오디언소리와 함께 몰입감 넘치는 새로운 형태의 오디오 콘텐츠 ‘오디오 시어터‘를 선보입니다. 이번 ‘오디오 시어터‘는 오디언의 콘텐츠 기획력에 가우디오랩의 공간음향 기술력을 더한 차별화된 방식의 오디오 콘텐츠입니다. 기존의 오디오 콘텐츠가 단편적인 하나의 목소리로 전달된 것과 달리, ‘오디오 시어터‘는 유명 성우들이 각 배역을 직접 연기해 예술성을 갖춘 동시에 이용자들에게 ‘귀로 보는 듯한’ 경험을 제공합니다. 특히 가우디오랩의 공간음향 기술로 극의 흐름과 인물의 움직임에 맞게 각 성우의 목소리를 상하좌우 360도 공간에 배치함으로써, 이용자들은 소리 만으로 각 장면을 상상할 수 있는 경험을 마주할 수 있습니다. 또한 청자를 감싸는 듯한 공간음향과 정교한 효과음이 더해져, 마치 주인공들 사이에 본인이 자리하는 것 같은 새로운 차원의 오디오 경험과 탁월한 몰입감을 느낄 수 있습니다. 가우디오랩과 오디언의 ‘오디오 시어터’ 콘텐츠는 오는 16일 오디언 <사건 보고서> 시리즈를 통해 최초 공개되며 네이버 오디오 클립과 예스24 등을 통해 만나볼 수 있습니다. <사건 보고서>는 국내 최정상 성우 강수진을 포함한 약 20여 명의 성우가 참여하는 오디오북으로 많은 화제를 모은 바 있습니다. 유명 원작 기반이 아닌 자체 창작 IP라는 점에서 오디오 콘텐츠 시장에 활기를 불어넣는다는 평을 받기도 했습니다. 가우디오랩 오현오 대표는 “가우디오랩과 오디언, 그리고 강수진 성우 군단의 이번 협력은 오디오 기술, 오디오 콘텐츠 제작・유통, 그리고 성우 분야에서 각 대한민국을 대표하는 드림팀이 만나 세계 최고 품질의 오디오 콘텐츠를 우리말로 처음 선보이는 의미있는 시도“라며, “앞으로도 기존 오디오북 형식에 가우디오랩의 공간음향 및 AI 기술을 지속적으로 접목해 더 많은 사용자에게 훌륭한 소리 경험을 제공하여 전 세계 오디오 콘텐츠 시장에 새 바람을 일으킬 것“이라는 소감과 각오를 전했습니다. 콘텐츠 제작에 참여한 성우 강수진은 “공동기획으로 이번 콘텐츠 제작에 참여해 영화를 보는 듯한 입체적 소리 경험을 전달할 수 있어 기쁘다“라며, “공간 음향 기술을 더해 기존 오디오 콘텐츠와는 차별된 풍부한 사운드를 전달할 수 있으리라 기대한다“라고 소감을 전했습니다.

2022.08.11