가우디오랩 백엔드팀, 보이지 않는 곳에서 소리를 전하는 사람들

2025.08.04ㆍ by Heidi

 

가우디오랩 백엔드 팀

 

 

AI 오디오 기술을 서비스로 제공하는 팀

 

기술을 서비스로, 사용자에게 닿게 만드는 팀. 오늘은 가우디오랩의 AI/음향 기술을 서비스로 제공하는 SNA (Service and Apps) 스쿼드의 두 개발자, Paul과 Johnny의 이야기를 전합니다. 오랫동안 함께 호흡을 맞춰온 두 분은, 지금도 가우디오랩에서 새로운 챕터를 함께 써내려가고 있습니다. 사용자에게 직접 보이진 않지만, 두 분의 손에서 서비스가 만들어지고, 좋은 소리 경험이 시작됩니다. 무대 뒤에서 묵묵히 개발을 이어가는 두 사람의 이야기를 담았습니다.

 

Q: 안녕하세요! 간단한 자기 소개와 현재 SNA 스쿼드에서 맡고 계신 역할에 대해 소개해주세요.

 

Paul: 안녕하세요, SNA에서 백엔드 엔지니어로 일하고 있는 Paul입니다. 저는 AI 오디오 기술을 웹 기반으로 사용자에게 전달하는 서비스를 만들고 있고, 현재는 ‘Gaudio Developers’라는 이름의 제품을 개발하고 있습니다. 이 서비스는 고객이 OpenAPI를 통해 가우디오랩의 최신 오디오 기술을 직접 적용해볼 수 있도록 만든 Gaudio Studio의 또 다른 버전입니다.

 

가우디오랩 백엔드 개발자 폴과 폴의 자녀들

Paul과 자녀들_엄빠 어디가 이벤트에서 찰칵

 

 

 

Johnny: 저는 DevOps(데브옵스) 엔지니어 겸 플랫폼 엔지니어로 일하고 있습니다. 쉽게 말하면, 개발자가 만든 프로그램이 사용자에게 문제 없이 잘 전달되도록, 중간 과정을 자동으로 처리하고 효율적으로 만드는 일을 합니다. 또한, 다른 개발자들이 일하기 편한 환경을 만들고, 개발 방식이나 문화도 더 좋게 가꾸는 역할을 하고 있어요. 지금은 Paul과 같이 Gaudio Developers를 개발하고 있고, Gaudio Sing 서비스의 운영도 일부 맡고 있습니다.

 

가우디오랩 백엔드 개발자 Johnny

 

 

 

최고의 복지는 좋은 동료

 

Q: 실제로 와보니 가우디오랩은 어떠셨나요? 이전 조직과 비교해, 팀 문화나 일하는 방식은 어떤 점이 다른가요?

 

Paul: 가장 큰 차이는 주도적으로 일할 수 있는 환경인 것 같습니다. 주어진 리소스 안에서 유연하게 일정을 조율하고, 설계부터 의사결정까지 직접 참여할 수 있어요. 이러한 문화 덕분에 맡은 일에 더 애착을 갖고 끝까지 책임 있게 완수하게 되는 것 같아요.

 

Johnny: 이전 회사들은 실패를 용납하지 않는 분위기였어요. 결과 중심의 평가 구조가 강하다 보니, 기술 선택이나 기능 개발이 자연스럽게 보수적으로 흘러갈 수밖에 없었죠. “그때 잘 했던 방식인데, 굳이 바꿀 필요 있어? 그냥 원래 방식대로 하자.”와 같은 식이죠. 그런데 가우디오랩은 다릅니다. 설득 가능한 충분한 이유가 있으면 팀원들도 다 거부감 없이 받아들이고, 실패 하더라도 “그럴 수도 있는 거지. 그건 리더인 나의 판단이니까 너의 잘못이 아니야”라며 오히려 이런 과정을 함께 고민하고 격려해주고 있어요. 덕분에 실패에서 배우고, 더 나은 결과물을 만들 수 있는 기회가 열려있답니다.

 

 

Q: SNA는 그 어느 팀보다도 커뮤니케이션이 활발한 팀인 것 같아요. 어떻게 문제를 해결하고 소통하나요?

 

Johnny: 네, 커뮤니케이션이 정말 중요합니다. 지시나 방향을 제대로 이해하지 못하면 개발이 잘못된 방향으로 흘러갈 수 있고, 서비스가 사용자에게 제공된 이후에는 이를 수정하는 데 더 많은 시간과 비용이 들 수 있습니다. 이러한 리스크를 줄이기 위해, 저희는 초기 단계에서부터 모두가 같은 방향을 바라보고 있다는 확신이 들 때까지 적극적으로 질문하고 논의합니다. “그 방향이 맞는지 잘 모르겠습니다”, “왜 그렇게 생각하셨는지 여쭤봐도 될까요?”, “혹시 다른 접근 방식도 고려해볼 수 있지 않을까요?” 와 같은 대화를 통해 다양한 관점을 공유하며, 한 시각에 머무르지 않기 위해 늘 고민합니다.

 

Paul: 문제가 발생했을 때는 일차적으로 해당 이슈의 담당자가 책임지고 해결을 시도합니다. 하지만 어려움이 있거나 잘 풀리지 않을 땐 팀원들이 함께 도와줘요. 특히 팀 리더 Min은 늘 곁에서 함께 고민해주시고, 필요할 땐 방향도 잡아주셔서 든든합니다.

 

또한 저희 팀은 Slack을 중심으로 비동기 커뮤니케이션을 하고 있고, 매일 짧은 스크럼을 통해 진행 상황을 공유하고 있어요. 의견을 자유롭게 나눌 수 있는 분위기라 필요한 순간에 바로 도움을 요청하거나 협업할 수 있는 유연함이 있지요! 이런 환경이 서로를 신뢰하고 자율적으로 일할 수 있게 만드는 것 같아요.

 

 

Q: 협업이 잘 되는 팀이라면 팀원들에 대한 애정도 클 것 같은데요. 함께 일하는 동료들은 어떤 분들인가요?

 

Johnny: 먼저, Min은 팀 리더의 역할을 정말 잘하세요. 업무의 방향을 명확히 제시하고, 실무자가 일에 집중할 수 있도록 장애물을 잘 제거해주는 분이에요. Paul은 항상 열려 있는 분이에요. 아무 고민 없이 제 뒤를 맡길 수 있을 만큼, 든든하고 신뢰할 수 있는 동료랍니다. 그리고 우리 팀의 주니어들 Handy와 Hazel은 성장 속도가 정말 빠릅니다. 미래가 기대되는 팀원들이죠.


Paul: 저도 Johnny의 소개에 다 공감해요. 저희 팀원은 모두 ‘내가 아니면 안 된다’는 책임감을 갖고 각자의 역할을 끝까지 해내는 분들이에요. ‘최고의 복지는 좋은 동료’라는 말이 딱 맞는 팀이라고 생각합니다!

 

 

 

경계 없는 엔지니어, 한계 없는 성장

 

Q: 가우디오랩에 합류하신지 어느덧 4~5년차가 되셨어요. 그동안 가장 기억에 남는 서비스 하나를 뽑자면요?

 

Paul: 입사 직후 맡았던 GTS (AI Text Sync) 프로젝트가 가장 기억에 남아요. 당시에는 웹 기반 제품도 없었고, 관련 개발자도 저 혼자라 모든 걸 처음부터 만들어야 했어요. OpenAPI, 라이선스 서비스, 관리자 웹 등 전체 구조를 도커 기반으로 직접 설계하고 구현했죠. 이전 회사에선 비슷한 역할을 수행하는 사람이 많아서 부분적으로만 기여했지만, 여기서는 기획부터 개발, 운영, 고객 대응까지 A to Z를 직접 경험할 수 있었어요. 잘 모르는 부분에 대해서는 강의나 책을 보면서 공부할만큼 치열하게 몰입했던 프로젝트였습니다. 저에겐 매우 뜻깊은 경험이었죠.

 

Johnny: 애정이 가는 건 Gaudio Studio입니다. 이전까지는 기업을 고객으로 하는 B2B 제품을 주로 다뤘는데, 이번에는 소비자가 직접 사용하는 서비스를 처음 맡게 되었어요. 일반 소비자 고객은 그 수나 성향이 훨씬 다양하고, 요구사항이나 피드백 방식도 크게 다르더라고요. 그만큼 고객의 니즈도 각기 달랐어요. 그래서 ‘이렇게 하면 고객이 더 좋아하지 않을까?'하면서 더 능동적으로 고민하며 방향을 설계하는 과정이 많았던 것 같습니다. 그런 과정들이 무척 흥미로웠습니다. 😊

 

 

Q: 그런 몰입의 시간들이 지금의 성장을 만들어낸게 아닌가 싶은데요. 앞으로 어떤 개발자로 성장하고 싶으신가요?

 

Paul: 최근에는 다양한 AI 도구를 적극 활용해 개발 생산성을 높이고 있어요. 반복 작업은 자동화하고, 이슈가 발생했을 때는 더 빠르고 효과적인 해결 방향을 찾을 수 있게 되었죠. 그 과정에서 기술적인 역량 뿐만 아니라, 일하는 방식에서도 스스로 많은 성장을 느끼고 있습니다. 앞으로는 AI 도구와 백엔드 기술을 유기적으로 결합해, 최소한의 리소스로 최대의 결과를 낼 수 있는 구조를 고민하고 있어요. 더 효율적인 시스템을 만들고, 사용자에게 한층 더 만족스러운 경험을 전하는 개발자가 되고 싶습니다.


Johnny: 저는 ‘경계 없는 엔지니어’가 되고 싶어요. ‘개발자니까 개발만 해야 한다’는 고정관념보다는, 더 나은 제품과 경험을 만들기 위해서라면 제 역할의 경계를 넘나드는 일도 마다하지 않는 태도를 지향합니다. 운영이든 기획이든, 개발과 맞닿아 있는 지점에서 문제를 함께 이해하고 풀어가며 기여하는 개발자로 성장하고 싶어요.

 

가우디오랩 개발팀

 

 

 

진심을 함께할 사람을 기다립니다

 

Q: 마지막으로 이 인터뷰를 보고 있는 예비 동료에게 한마디 부탁드려요.

 

Paul: 평소 관심 있던 기술을 실제 서비스로 구현해보고 싶으셨다면, 가우디오랩에서는 전체 흐름을 경험해볼 수 있습니다. 작지만 단단한 팀에서 함께 성장하고 싶은 분이라면 분명 많은 걸 얻어가실 수 있을 거예요. 기회가 된다면 좋은 소리를 더 많은 사람들에게 전달하며, 기술을 통해 함께 의미 있는 가치를 만들어갈 수 있으면 좋겠습니다. 무엇보다, 스스로 생각하고 움직이면서 성장하는 분이라면 언제든 환영합니다! 실패해도 좋습니다! 🙌🏻

 

Johnny: 그리고 저희는 진심을 중요하게 생각합니다. 이력서에 적힌 블로그 글도 하나하나 읽어보고, 소스 코드도 실제로 리뷰하고 있어요. 많은 경험을 해본 것도 물론 중요하지만, 그보다 그 경험에 얼마나 진심을 다했는지가 더 중요하다고 생각해요. 함께 고민하고 성장할 준비가 되어 있고, 진심으로 가우디오랩의 여정을 함께하고 싶은 분이라면 누구든지 환영입니다.

 

 

 

가우디오랩의 Backend Software Engineer 동료가 되어주세요:)

모든 open position 확인하기

 

pre-image
LKFS부터 True-peak까지, 2025 라우드니스 완벽 가이드

      라우드니스(Loudness)란 정확히 무엇인가요?   Loudness란 인간 청각의 지각 정도에 의해 느끼는 소리의 크기를 뜻합니다. 내가 지금 듣고 있는 노래의 크기를 주변 사람에게 알려준다고 가정해 봅시다! 일단 소리가 크다면 Loudness가 크다고 할 수 있고, 소리가 작다면 Loudness가 작다고 할 수 있습니다. 하지만 주변 사람에게 소리의 크기를 알려준다고 했을 때, Loudness에 대한 인지 정도가 나와 같으리라는 보장은 없습니다. 주변 사람의 수가 많아질수록 그 보장성은 줄어들기까지 합니다. 이럴 때 가장 효율적인 방법은 숫자가 도입된 객관적인 지표(단위)를 통해 전달하는 것입니다. Loudness 단위에 관한 연구는 활발하게 이루어져 왔습니다. 그중에서도 방송, 스트리밍과 같은 시장에서 통용되고 실용성 높은 단위를 소개하고자 합니다.   소개하고자 하는 단위는 LKFS(Loudness K-Weighted relative to Full Scale)이며, LUFS(Loudness Unit relative to Full Scale)로도 불립니다. 이 단위와 관련된 파라미터들은 ITU-R(International Telecommunication Union – Radiocommunication), EBU-R(European Broadcasting Union)에 의해 고안되었습니다.       라우드니스를 측정할 때 주로 어떤 요소들을 보나요?   Loudness를 측정할 때는 몇 가지 핵심 파라미터가 공통으로 사용됩니다. 다양한 측정 도구나 DAW(디지털 오디오 워크스테이션)에서 제공하는 라우드니스 미터를 살펴보면, 대체로 Integrated, Short-Term, Momentary loudness, true peak 그리고 Loudness Range 등의 항목이 기본적으로 포함되어 있음을 알 수 있습니다. 이번 챕터에서는 각 파라미터가 의미하는 바에 대해서 살펴보도록 하겠습니다.   2-1. 핵심 키워드: LKFS, LU, Momentary, Loudness, Short-term Loudnessm, Integrated Loudness, LRA, True-peak   LKFS(Loudness K-Weighted relative to Full Scale) a.k.a. LUFS(Loudness Unit relative to Full Scale) Loudness의 단위 중 하나이며, 인간의 청각 특성에 부합하게 설계된 K-weighting filter를 거친 입력 신호에 대한 크기입니다. K-weighting filter는 인간이 비교적 잘 듣는 주파수 영역의 신호를 증가시키고, 비교적 잘 들리지 않는 주파수 영역의 신호를 감소시키는 필터로 이해하시면 됩니다. Loudness의 종류에는 측정하는 길이에 따라 Momentary, Short-term, Integrated Loudness로 나뉩니다. Momentary Loudness는 0.4초, Short-term Loudness는 3초, Integrated Loudness는 전체 구간에 대한 소리 크기입니다.   *LKFS와 LUFS는 무엇이며, 어떤 차이가 있을까요? Loudness의 단위를 최초 고안한 것은 ITU에서 하고 단위를 LKFS로 정의하였습니다. 이후 디스플레이 방식이나 Momentary, Short-term, Integrated Loudness, LRA 등의 용어와 디스플레이 방식 등을 정의한 것은 EBU에서 고안하면서 LUFS로 명칭을 변경하였지요. 따라서 북미권에서는 LKFS를 쓰고, 유럽권에서는 LUFS를 쓰는 경향을 보이네요.     LU(Loudness Unit) LKFS가 측정되는 자체의 값이라면 LU는 상대적인 측정량입니다. 즉, 기준 레벨 대비하여 얼마나 차이가 나는지, 혹은 Loudness의 범위를 의미할 때 쓰입니다. 예를 들어, 콘텐츠 A가 -12LKFS이고 콘텐츠 B가 -20LKFS이면 "A 콘텐츠는 B 콘텐츠보다 8 LU만큼 더 크게 들린다"로 표현할 수 있습니다.     Momentary Loudness K-weighting filter를 거친 신호의 0.4초 분량에 해당하는 소리크기이며, 75% 오버랩(0.1초)을 하여 측정합니다. 순간순간의 소리크기로 이해하면 됩니다.         위 그림과 같이 측정한 결과를 히스토그램화 하여 누적하면 아래 그림과 같습니다.         Momentary Loudness의 히스토그램은 추후 Integrated Loudness를 계산할 때 활용됩니다.       Short-term Loudness K-weighting filter를 거친 신호의 3초 분량에 해당하는 소리크기이며, EBU에서는 최소 0.1s 간격으로 갱신할 것을 권장하고 있습니다.           Short-term Loudness의 히스토그램은 추후 Loudness Range를 계산할 때 활용됩니다.       Integrated Loudness 전체 구간에서 들리는 소리 크기의 평균입니다. 콘텐츠 전반적인 소리 크기를 의미하고 구하는 방식은 다음과 같습니다. Step1) -70LKFS 이하의 momentary loudness 분포 값들을 제거한 후, 나머지 분포 값들의 평균을 구합니다.     Step2) step1에서 구한 평균보다 10LU만큼 작은 게 relative threshold입니다.     step3) relative threshold보다 높은 분포 값들의 평균이 integrated loudness입니다.       LRA(Loudness Range) 한 콘텐츠 내에서 시간에 따른 라우드니스의 변화량을 나타내는 척도입니다. 소리크기가 어느 정도로 분포하고 있는지 알 수 있는 지표이며, 구하는 방식은 다음과 같습니다. Step1)  -70LKFS 이하의 short-term loudness 분포 값들을 제거한 후, 나머지 분포 값들의 평균보다 20LU 작은 값(relative threshold)을 구합니다.     Step2) relative threshold 이상의 분포 값 중 상위 5% 값과 하위 10%의 차이값이 Loudness Range입니다.        *IL 계산과정과 LRA 계산과정에서 모두 Relative Threshold 라는 개념을 사용하는데, 이 둘은 정의가 다릅니다. IL 계산 과정에서는 momentary loudness를 이용하고 absolute threshold 이상에 대한 평균값 - 10 LU 로 relative threshold가 정의되고, LRA 계산 과정에서는 short-term loudness를 이용하고 absolute threshold 이상에 대한 평균값 - 20 LU로 relative threshold가 정의됩니다.     True-peak 192kHz 샘플링 주파수로 변환하였을 때의 피크 값이며 단위는 dBTP입니다. 재생환경 중에서 충분히 높은 샘플링 주파수(192kHz)일 때 열화를 방지하기 위한 값으로 이해하면 됩니다. 일반적으로 소비되는 음원의 샘플링 주파수는 44.1, 48kHz이기 때문에 업샘플링을 하는 게 일반적인데, 이때 기존의 sample peak 값보다 커질 수 있습니다. 업샘플링에 대한 예시입니다.     중축이 되는 업샘플링 기법 외에도 표현 범위를 넘어가는 걸 방지하기 위한 attenuation, upsampling 이후에 유효한 신호들만 남기기 위한 필터링, 데시벨 단위로 환산하기 위한 로그화 등이 진행됩니다. 아래 block diagram은 샘플링 주파수가 48kHz일 때 true-peak을 구하는 일련의 과정입니다.         2-2. 라우드니스 감 익히기         기존의 RMS 대신 LKFS(LUFS)를 사용하는 이유가 무엇인가요?   기존에는 RMS(Root-mean-square)를 활용하여 Loudness를 측정했지만 실제 인간의 청각 능력과는 매칭이 잘 안됐습니다. 이후 ITU, EBU에서 K-weighting 필터를 활용하여 인간의 청각 능력을 반영하고, 크기를 구하는 과정에서 보았듯이 소리크기를 느끼는 데 있어 영향력이 없는 부분에 대한 열외 처리를 하는 등 보다 정교한 방법으로 Loudness를 계산합니다. 다른 단위보다 정교하기 때문에 대세로 자리 잡지 않았나 싶네요!         '음량 전쟁(Loudness War)'은 무엇이며, 왜 문제가 되나요?   Loudness와 관련된 이슈를 하나 말씀드리려 합니다. 다들 아실 수도 있는 ‘Loudness War’입니다. 제 마음대로 요약하면 콘텐츠 제작자가 “다른 창작물보다 내 창작물의 소리를 더 크게 함으로써 청취자들로부터 하여금 더 주목받을 것이다. 보너스로 음질이 더 좋아진 것처럼 청취자의 착각을 불러일으킬 것이다.“와 같은 마음으로 콘텐츠를 생산하는 것입니다. 혹은 “다른 창작물보다 나의 창작물의 소리를 더 키우진 않겠지만 차이가 크게 나지 않도록 만들 것이다.“와 같은 마음도 될 수 있겠네요. 소리가 커지면 음질이 개선된다고 생각이 될지 모르겠지만, 실제로는 Dynamic이 좁아 표현력도 떨어지고, 클리핑 발생의 빈도가 높아져 음질 열화 확률은 더 높아집니다. 소리를 과하게 키우면 음원의 질 자체는 오히려 떨어진다는 것을 많은 소비자가 인지하여 소비의 패턴이 바뀌기를 희망합니다.       스트리밍 플랫폼들의 라우드니스 규제 및 권장 현황 (masteringthemix 발췌)       라우드니스에 대한 궁금증이 해소되셨기를 바랍니다!   이 포스트는 2019년 공개되었던 '라우드니스 101'을 보완하여 새롭게 정리한 글입니다.   혹시 더 깊이 있는 정보나 전문적인 내용을 원하신다면, 라우드니스 측정 및 규제에 대한 상세한 기술적 내용을 담고 있는 아래 국제 표준 문서를 참고하시는 것을 적극 추천해 드립니다:) ITU-R BS.1770-4: 라우드니스 측정 알고리즘의 기준 제시 EBU-R Tech 3341, 3342: 방송 환경에서의 라우드니스 규제 및 측정 방법에 대한 상세한 지침 제공   이 외에 추가로 라우드니스와 가우디오랩의 음량 관련 기술에 대해 궁금한 점이 있다면 언제든 편하게 문의해 주세요!         Loudness에 대해 더 자세히 알고 싶으신가요? 스트리밍 시대의 음량 문제 미디어 스트리밍을 위한 라우드니스 정규화 시스템 구축방법    

2025.07.18
after-image
80년 만에 처음 듣는 광복의 소리, 비하인드 스토리를 만나보세요.

      “80년 만에 처음 들은 광복의 소리"… 빙그레 '처음 듣는 광복 캠페인' 국내 AI 기술로 '대한독립만세' 되살리다.    공개 6일 만에 400만 뷰를 돌파한 빙그레의 캠페인 ‘처음 듣는 광복’이 화제입니다. 광복 80주년을 맞이해 AI 기술로 세상에 없던 ‘광복의 소리’를 구현한 것인데요. 이 소리를 구현하는 과정 뒤에 바로 한국의 AI 기술, 가우디오랩의 기술이 있었습니다. 소리 없이 기록된 그날을 치밀한 조사와 AI 오디오 기술을 활용해 재현했는데요. 80년 만에 들려온 광복의 소리, 궁금하지만 들어본 적 없던 그 소리를 어떻게 만들 수 있었을까요?   1945년 8월 15일 일왕의 항복 선언, 다음 날 이어진 가슴 벅찬 ‘대한 독립 만세’의 행렬. 관련한 많은 문헌들이 남아있지만, 당시 상황을 담은 '소리' 기록은 남아있지 않다는 점에 착안했습니다. 빙그레와 이노션이 가우디오랩의 기술을 접목해 80년 동안 전해질 수 없었던 광복의 소리를 재현했습니다. 광복 당시 울려 퍼졌던 만세 함성을 후손에게 전하며, 소리 없이 잊혀가던 의미를 소리로서 일깨우고 독립유공자의 희생을 기릴 수 있었습니다. 참고로 이 광고 캠페인은 빙그레에서 매년 진행해오던 것으로 잊혀져가는 광복의 의미를 청각이라는 감각을 통해 되살렸다는 점에서 특별한 의미를 갖고 있습니다.     AI 음원 분리 기술 GSEP (Gaudio source SEParation)   소리를 구현하는데 있어 필수적인 기술은 AI 음원 분리였습니다. 음원 분리란 여러 음원이 섞여있는 오디오 신호에서 개별 음원을 따로따로 추출하는 것인데요. 가우디오랩의 AI 음원 분리 기술은 녹음된 음원에서 소음만을 제거해 핵심 소리를 깨끗하게 전달하는 과정 등에 사용되었습니다.   독립운동가 후손의 증언, 역사학자의 자문, 사료와 문헌 기록 등 철저한 역사 고증 단계를 거치며 많은 소리 재료를 확보했고, 요리 재료를 깨끗이 손질하듯, AI 음원 분리 기술을 활용해 80년 전의 소리 재료들을 깔끔한 고품질 음원으로 만들었습니다.       치밀한 고증에 생성 AI 기술을 더해 만들어진 소리   세상에 없던 소리는 가우디오랩의 생성 AI 기술을 적용해 새롭게 만들었습니다. 빙그레와 이노션은 소리의 단서가 되는 사실들을 철저히 선별하고, 당시의 온도와 습도까지 고려하여 소리 요소들을 배치하는 과정을 진행했습니다. 이 소리 요소들을 바탕으로 의복이 스치는 소리, 신발의 종류별로 달라지는 발자국 소리, 도로 위의 노면 전차, 바닥재의 재료에 닿는 소리 등은 역사학자의 자문과 검증을 거친 후 가우디오랩의 생성 AI 기술을 활용해 만들어 냈습니다. 나이, 성별, 감정 등의 요소를 적용해 ‘만세’를 외치는 군중의 소리를 만들고, 서울역 광장이라는 배경과 군중 규모에 따른 몰입감을 더했습니다. 원하는 소리를 생성한 후에는 업스케일링(낮은 해상도와 저품질의 소리를 높이는 일) 기술을 적용해 더 좋은 품질의 소리 경험으로 감동을 느낄 수 있도록 했고요.       고품질 공간 음향 기술을 입히다    공간 음향은 입체감과 현장감 있는 소리를 전달하는 기술입니다. 특히, 국제 표준으로 채택된 가우디오랩의 공간 음향 기술은 바이노럴(Binaural, 양이, ‘두 귀’를 의미) 렌더링이 적용되어 사방을 둘러싸는 듯한 몰입감 넘치는 소리를 구현하는데 제격이죠.   철문이 열리며 군중이 뛰쳐나오는 소리, 광복 당시 운행한 전차의 소리, 양철 두드리는 소리, 태극기 펄럭이는 소리 등 다양한 장면에 바로 이 기술을 적용했습니다. 서대문 형무소 앞, 저벅저벅 신발 소리를 내며 이동하는 사람들, 인파가 운집한 서울역 광장 공간 등 변화하는 배경에 맞는 소리도 공간 음향 기술로 재현되었습니다.     광복의 순간을 소리로 구현하는 작업은 단순한 음향 재현이 아닌, 그날의 감정과 울림을 전하는 일입니다. 당시의 뜨거운 공기, 눈물과 함께 터져 나오는 함성, 북받쳐 올라 뛰쳐나오는 발걸음 등.., 말로 다 담을 수 없는 감정까지도 소리에 담을 수 있도록 소리 하나하나를 깨끗하게 다듬고 기술을 입혔습니다.   ‘광복의 소리’를 최초로 구현하고, 후손들에게 전할 역사적 자료가 된다는 책임감을 안고 이 뜻깊은 프로젝트에 참여했는데요. ‘한국의’ AI 회사로서 더없이 영광스럽고 기쁜 시간이었습니다. 앞으로도 가우디오랩은 기술을 통한 새로운 경험을 전할 수 있도록 최선을 다하겠습니다.

2025.08.22