가우디오랩, 오디오 AI 기술 API 플랫폼 ‘가우디오 개발자 센터’ 출시
가우디오랩, 오디오 AI 기술 API 플랫폼 ‘가우디오 개발자 센터’ 출시
- “말로만 듣던 소문난 그 기술” B2B부터 B2C까지 다양한 사용자가 직접 사용해 볼 수 있어

AI 오디오 전문 기업 가우디오랩이 자사 기술을 담은 API 플랫폼 ‘가우디오 개발자 센터(Gaudio Developers)’를 출시했습니다. 개발자, 크리에이터, 기업 등 다양한 고객 군이 자사 제품에 강력한 AI 오디오 기능을 도입할 수 있도록 지원합니다. 초기 기능으로는 AI 기반의 음원 분리, D/M/E(Dialogue, Music, Effect; 대사/음악/효과음) 분리, 텍스트 싱크가 포함됐습니다.
가우디오랩은 세계 최고 수준의 AI 음원 분리 모델을 자체 개발 및 보유하고 있습니다. 음원 분리 기능에서는 독자 모델을 활용해 보컬, 악기, 노이즈 등을 분리하도록 돕습니다. 여러 악기가 섞인 음악에서 보컬이나 드럼 등 특정 소리 만을 분리하거나, 시끄러운 환경에서 녹음된 파일의 소음 제거 등 다양한 목적으로 활용될 수 있습니다.
D/M/E(Dialogue, Music, Effect; 대사/음악/효과음) 분리 기능에서도 뛰어난 성능을 제공합니다. 많은 유사 서비스가 어려움을 겪는 ‘가사(보컬)가 있는 음악이 흐르는 대화 장면’에서의 대사 및 음악 분리 성능이 경쟁사 대비 약 2배 뛰어난 수치를 보이며 최상급 성능을 자랑합니다. 이미 방송 콘텐츠의 글로벌 수출을 위한 재제작, 배경 음악의 교체를 통한 저작권 문제 해소, 클래식 영화의 복원 및 재개봉, 리믹싱 및 마스터링 등 다양한 목적으로 사용되고 있습니다.
AI 텍스트 싱크 기능도 탑재했습니다. 오디오와 줄 단위의 가사를 정밀하게 동기화할 수 있어 음원 스트리밍 서비스의 실시간 가사 보기 기능 등의 기반 기술로 쓰입니다. 이미 멜론, 벅스, 네이버 바이브 등에서 사용하고 있는 기술입니다. 또한 다양한 언어의 싱크를 지원해 어학 학습 시 특정 구간을 반복 재생해 교육 효과를 높이는 등 다양한 목적으로 사용됩니다.
가우디오랩은 독자 AI 엔진을 사용해 속도와 품질을 높이면서도, 일부 고객 니즈에 따라서는 자회사인 사운드 포스트 프로덕션 스튜디오 웨이브랩을 통해 세밀한 품질 컨트롤까지 담긴 프리미엄 서비스도 제공합니다. 개인 크리에이터부터 대형 방송사까지 다양한 니즈에 적용 가능한 작업 프로세스를 갖춰, 이미 국내 여러 대형 방송사 및 일본의 방송사와도 협업이 진행 중입니다.
가우디오랩은 그간 B2B 위주로 공급되던 기술을 다양한 목적으로 사용하고자 하는 수요가 많아 이번 API 출시를 결정했습니다. 개인에서 시작해 팀이나 기업 규모로도 확대가 쉬운 서비스인 만큼 다양한 면에서 콘텐츠 확장의 가능성에 기여할 수 있는 플랫폼으로 도약하고자 노력하겠습니다.


