모국어처럼 자연스러운 AI 번역: SyncWords와 DeepL이 라이브 스트리밍을 통해 언어의 장벽을 허무는 방법

실시간 비디오 자막 분야의 선도 기업인 SyncWords가 세계에서 가장 자연스러운 AI 번역 엔진 DeepL과 만나면 어떤 변화가 일어날까요? 이 전략적 협업을 통해 글로벌 커뮤니케이션은 어떻게 혁신되고 있는지, 자막 지연 시간은 어떻게 8초에서 거의 실시간 수준으로 단축되었는지, 또한 고객들이 이 강력한 파트너십을 요청하는 이유는 무엇인지 알아보세요.

두 사람이 노트북 화면을 바라보며 협업하고 있습니다.

핵심 사항

  • SyncWords는 DeepL과의 파트너십을 통해 고품질 실시간 번역을 제공하고, 라이브 글로벌 방송의 자막 지연 시간을 8초에서 거의 실시간 수준으로 단축했습니다.

  • 고객은 유럽어 번역 품질 향상을 위해 DeepL 도입을 특별히 요청했습니다.

  • 클라우드 기반 솔루션은 대규모 이벤트에도 즉시 확장 가능하며 수백만 시간 분량의 영상에 100개 이상의 언어를 지원합니다.

  • 통합 솔루션을 사용하는 기업은 콘텐츠에 대한 시청자 참여도가 4배 향상되고 글로벌 도달 범위가 확대되었습니다.

산업
인터넷 소프트웨어 및 서비스, 미디어 및 엔터테인먼트
DeepL 제품
DeepL API
주요 시장
유럽, 북아메리카, 남아메리카, 아시아, 전 세계 시장
주요 언어
유럽어, 북유럽어

DeepL과 SyncWords의 만남

호주 오픈과 같은 글로벌 이벤트나 실시간 자막이 제공되는 속보를 시청할 때, 그 뒤에서 작동하는 기술에 대해 생각해 본 적이 있으신가요? 전 세계 수백만 명의 시청자에게 원활한 자막과 번역을 제공하는 일은 커다란 차이를 만들어냅니다. 이 중요한 역할을 맡고 있는 기업이 바로 SyncWords입니다.

미국에 본사를 둔 SyncWords는 라이브 및 VOD 자막, AI 기반 음성 번역 분야의 선도 기업입니다. 수백만 시간 분량의 동영상 콘텐츠를 제공하며 세계 최대 규모의 이벤트, 웨비나, 기업 방송에서 100개 이상의 언어를 지원합니다.

최근 유럽 고객들의 고품질 다국어 자막에 대한 수요가 증가하며 SyncWords는 속도, 정확성, 확장성 측면에서 자사의 기술력을 강화할 번역 솔루션이 필요했습니다. 고객들은 해답을 이미 알고 있었고, SyncWords에 DeepL과의 협업을 요청했습니다.

“우리 고객들은 특히 유럽어의 품질을 중요하게 생각했고, 우리는 그 기대에 부응해야 했습니다. DeepL을 실시간 동영상 워크플로에 도입한 것도 바로 이 이유입니다. 고객들이 직접 요청한 사항이기 때문이죠.”

지오반니 갈베즈(Giovanni Galvez), 비즈니스 개발 및 전략 부사장, SyncWords

품질을 유지하며 다국어 동영상 콘텐츠 확장하기

SyncWords의 목표는 단순한 번역 자동화를 넘어, 전 세계 시청자에게 원어민처럼 자연스럽고 몰입감 있는 시청 경험을 제공하는 것이었습니다.

그러나 속보, 글로벌 스포츠 토너먼트, 기업 웨비나 등 실시간으로 진행되는 라이브 이벤트에서 고품질 번역과 자막을 확장하는 일은 절대 쉽지 않은 도전이었습니다.

속도 요인

기존의 실시간 자막 시스템은 4~8초의 지연이 발생해 시청자의 실시간 몰입을 방해하고 연결이 끊기는 문제가 발생했습니다. SyncWords는 실시간 동영상의 속도에 맞춰 동작하는 AI 번역이 필요했습니다.

정확성과 맥락

AI 번역 도구는 종종 산업별 전문 용어, 화자의 어조 또는 누락된 맥락을 정확히 반영하지 못하는 경우가 많았습니다.

이벤트와 산업 전반에 걸친 확장성

SyncWords는 뉴스, 스포츠, 미디어, 엔터테인먼트, 기업 이벤트 등 다양한 분야에서 매일 수백만 단어 분량의 번역과 자막을 제공합니다. 이 방대한 콘텐츠를 처리하기 위해서는 정확성을 유지하면서도 원활하게 자동화된 워크플로가 필수적입니다.

DeepL/Interpreter
즉각적인 언어 확장성

SyncWords 플랫폼은 몇 개에서 수십 개의 새로운 언어를 단 몇 초 만에 빠르게 추가할 수 있어, 라이브 스트리밍이나 방송 콘텐츠가 다양한 글로벌 시청자에게 즉시 전달될 수 있도록 지원합니다.

어조와 의도를 살린 개인화된 번역

실시간 자막과 음성 번역은 어색하거나 기계적으로 들려서는 안 됩니다. SyncWords는 화자의 어조, 말투, 의도 등 음성 패턴의 섬세한 뉘앙스를 유지할 수 있는 솔루션을 개발했습니다.

스트리밍 플랫폼 및 프로토콜과의 호환성

RTMP, SRT, HLS, CMAF Ingest와 같은 다양한 라이브 스트리밍 동영상 포맷을 AI 엔진이 자동으로 처리하는 것은 간단한 일이 아닙니다. SyncWords는 최신 스트리밍 기술을 활용해 AI 번역 기능을 플러그 앤 플레이 방식으로 전환할 수 있는 스트리밍 워크플로를 구축했습니다.

DeepL의 차별점

  • 고객이 선택한 AI 번역 솔루션

SyncWords는 DeepL을 워크플로에 도입하기에 앞서, 다양한 AI 번역 도구를 테스트해 언어의 미묘한 뉘앙스, 산업별 전문 용어, 문맥 처리 능력을 자세히 평가했습니다. 특히 유럽어에 대한 고품질 번역 수요가 증가함에 따라 여러 산업 분야에서는 더욱 유창하고 자연스러운 어휘 선택, 문장 구성, 문맥 이해가 가능한 솔루션이 필요했습니다.

SyncWords의 고객들은 DeepL이 라이브 스트리밍 워크플로에 매끄럽게 통합되어, DeepL의 최신 기술을 기반으로 실시간 영상 콘텐츠에서 즉각적인 언어 품질 개선 효과를 경험할 수 있다는 점에 매우 만족했습니다.

  • 실시간 동기화 자막 및 번역

라이브 방송에서는 자막이 조금만 지연되어도 시청자의 몰입이 쉽게 깨질 수 있습니다. AI 기반 워크플로를 도입하기 전, SyncWords는 자막 지연 문제로 인해 사용자 경험에 지속적인 어려움을 겪고 있었습니다.

“라이브 방송 중 자막은 일반적으로 영상이나 음성보다 4~8초 정도 지연됩니다. 이로 인해 단어나 문장 일부가 잘못 표기되거나 완전히 누락될 수 있어, 최종 사용자 경험이 크게 저하될 수 있습니다.”

AWS 블로그(SyncWords 및 AWS Elemental Media Services 관련)

SyncWords는 이 문제를 정면으로 맞서 해결했습니다. AI 기반 라이브 스트리밍 플랫폼을 최적화하여 자막 지연 시간을 최소화함으로써 시청자에게 원활한 경험을 제공했습니다. 또한, DeepL의 고속 API는 몇 분의 1초 속도로 작동하여 빠르게 진행되는 대화에서도 실시간 번역을 제공할 수 있었습니다.

  • 공감을 이끄는 맞춤형 번역

SyncWords는 영상 현지화가 단순한 단어 번역 그 이상이라는 사실을 잘 알고 있습니다. 문맥을 고려하고 화자의 의도와 정확성을 유지해야 하기 때문입니다. 이러한 이유로 SyncWords는 DeepL의 용어집 기능을 활용해 기업, 법률, 기술 방송 등 다양한 산업 콘텐츠에서 용어의 일관성을 효과적으로 관리하고 있습니다.

“용어집을 통해 복잡한 기술 번역과 고도로 전문화된 콘텐츠의 일관성을 유지하는 데 큰 차이를 만들 수 있었습니다.”

지오반니 갈베즈(Giovanni Galvez), 비즈니스 개발 및 전략 부사장, SyncWords

또한, SyncWords는 음성 번역에 AI 기반 어조 매칭 기능을 최초로 도입해 더빙된 영상 콘텐츠에서도 원본 화자의 음정, 감정, 스타일을 자연스럽게 전달합니다. 이 솔루션은 다수 화자가 동시에 대화하는 그룹 대화 환경에서도 탁월한 성능을 보여주며, SyncWords는 이를 라이브 뉴스 및 스포츠 방송을 위한 AI 번역 기술의 다음 진화 단계로 평가하고 있습니다.

  • 간단하고 원활한 API 통합

SyncWords는 컨테이너 오케스트레이션 도구인 Kubernetes을 활용해 각 콘텐츠에 대한 실시간 자막 및 번역 인스턴스를 수요에 따라 자동으로 확장할 수 있도록 구성했습니다. 이를 통해 시스템은 다음 기능을 구현합니다.

  1. 그랜드 슬램 테니스 토너먼트, 올림픽 및 패럴림픽, 정치 토론, 뉴스 속보, 글로벌 정상회담 등 트래픽이 몰리는 실시간 이벤트에서 폭발적인 수요 증가에 맞춰 리소스를 탄력적으로 자동 확장합니다.
  2. DeepL API를 분산된 Kubernetes 포드에서 실행하여 번역 작업 부하를 효율적으로 분산하고 지연 없는 실시간 번역을 제공합니다.
  3. 비용 효율성을 최적화하고 필요시에만 리소스를 동원함으로써 고비용의 온프레미스 인프라를 유지하지 않아도 됩니다.
  4. 전 세계 다양한 지역에 라이브 자막 및 번역을 배포하여 라이브 스트리밍 워크플로를 소스에 가깝게 유지합니다.
  5. 이중 영상 파이프라인 구성과 글로벌 지역 간 복원력이 요구되는 기존의 라이브 스트리밍 워크플로에 통합할 수 있습니다.

“급변하는 수요에 유연하게 대응하는 확장성은 라이브 스트리밍 방송에 필수적입니다. Kubernetes를 활용하면 모든 라이브 스트리밍에 필요한 정확한 리소스를 확보할 수 있어 과부하나 지연 없이 AI 기반의 정확한 실시간 번역을 보장할 수 있습니다. 이제 수백, 수천 개의 라이브 스트리밍 방송에 자막을 추가하고 즉시 번역하는 일은 현실이 되었습니다.”

지오반니 갈베즈(Giovanni Galvez), 비즈니스 개발 및 전략 부사장, SyncWords

SyncWords는 이미 마이크로서비스 기반 아키텍처를 구축하여 대규모 실시간 스트리밍 자막 및 번역을 지원할 수 있는 기반을 마련해 두었습니다. 하지만 과제가 남아 있었습니다. 원활하게 통합되고 수요에 따라 확장 가능하며 높은 작업량의 환경에서도 정확성을 유지할 수 있는 번역 API를 찾는 것이었습니다. DeepL API는 별도의 전문 하드웨어나 수동 설정 없이도 사용할 수 있는 플러그 앤 플레이 방식의 유연한 확장성을 제공하며, SyncWords가 매일 수백만 시간 분량의 동영상을 원활하게 번역할 수 있도록 지원했습니다. 

DeepL API는 Kubernetes 기반 환경에 완벽히 통합되어 다음과 같은 기능을 실현할 수 있었습니다.

  • 병목 현상 없이 수천 개의 동시 라이브 스트리밍 방송에 실시간 AI 번역을 배포
  • 모든 컨테이너화된 라이브 스트리밍 인스턴스가 DeepL의 최신 문맥 기반 번역 모델에 즉시 액세스하여 자연스럽고 정확한 실시간 번역 제공
  • 고가의 전용 번역 서버 없이 완전한 클라우드 기반 자동 확장 배포 모델을 통해 안정적이고 비용 효율적인 운영
“SyncWords 개발팀은 DeepL API가 손쉽게 구현 가능하다는 점을 확인했고, 이는 우리 서비스의 빠른 확장을 위한 핵심 요소였습니다.”

지오반니 갈베즈(Giovanni Galvez), 비즈니스 개발 및 전략 부사장, SyncWords

고객의 글로벌 진출 지원

SyncWords는 단순한 번역 제공업체를 넘어, 글로벌 성장을 목표로 하는 기업들의 신뢰할 수 있는 전략적 파트너입니다.

DeepL과의 협업을 통해 SyncWords는 다음과 같은 가치를 제공합니다.

  • 주요 유럽어에 즉시 액세스. 이는 유럽 시장 진출을 위한 핵심 요소입니다.
  • 4배 높은 시청자 참여. 자막이 포함된 영상은 자막이 없는 영상보다 끝까지 시청되는 비율이 4배 더 높습니다.
  • 원활한 규정 준수. 전 세계 법적 요건을 충족해 비즈니스의 운영을 지원합니다.
  • 수익화 및 배포. 방송사는 전 세계에 실시간 콘텐츠를 제공하고 라이선스를 부여함으로써 수익을 창출할 수 있습니다.
그 결과는 어떨까요?

고객들이 경쟁사가 아닌 SyncWords를 선택한 이유는 다음과 같습니다.

탁월한 AI 번역 정확성과 섬세한 뉘앙스 처리

• 주요 스트리밍 플랫폼과의 간편한 API 통합

더욱 빠른 라이브 및 VOD 번역 처리 시간

즉각적인 확장성

AI 기반 영상 현지화의 미래

동영상 콘텐츠의 중요성이 날로 커지고, 다국어 영상에 대한 수요가 급증함에 따라 SyncWords는 더욱 접근성 높고 개인화된 글로벌 커뮤니케이션의 길을 열어가고 있습니다.

  • AI 기반의 어조 매칭 번역 기술을 통한 자연스러운 더빙 번역 제공
  • 매일 수백만 단어 분량을 처리하는 더 빠르고 확장성이 뛰어난 워크플로
  • DeepL을 통한 글로벌 진출 가속화
  • 최신 스트리밍 기술 지원: 실시간 방송에 적합한 서라운드 사운드 번역이 포함된 4K 해상도 영상, 특히 자막 지연 없는 스포츠 이벤트 전달

“DeepL 덕분에 SyncWords는 높은 부하가 발생하는 실시간 이벤트 환경에서도 실시간으로 정확하고 자연스러운 번역을 제공할 수 있습니다.”

지오반니 갈베즈(Giovanni Galvez), 비즈니스 개발 및 전략 부사장, SyncWords

실시간 영상은 미래입니다. 그리고 그 미래는 시청자의 언어로 전달되어야 합니다. SyncWords와 DeepL은 이를 가능하게 만드는 손쉬운, 실시간, 대규모 번역 솔루션을 제공합니다.

  • 자막지연 4~8초 감소
  • 자막이포함된 영상에 4배 높은 시청자 참여도
  • 수백만시간 분량의 영상 콘텐츠 처리

DeepL의 잠재력 살펴보기

커뮤니케이션과 워크플로를 강화하기 위한 정확한 AI 번역을 찾고 계신가요?