본문 바로가기
경제뉴스 스크랩

세계적으로 유튜브 언어 장벽을 허물어 버리는 '오토 더빙'을 아시나요?

by 비월 2401 2024. 10. 9.
반응형

최근 유튜브가 인공지능(AI)을 활용하여 자동 더빙 서비스를 제공하면서 전 세계적으로 언어 장벽이 허물어지고 있습니다.

이로 인해 유튜브 콘텐츠의 국가 간 장벽이 낮아지고, 유튜브의 생태계가 격변을 예고하고 있는데요.

오늘은 자동 더빙 즉, '오토 더빙'에 대해 알아보겠습니다.


1. 오토 더빙의 정의와 영향력

오토 더빙의 정의와 영향력

오토더빙은 말 그대로 인공지능(AI)을 활용하여 동영상에 자동으로 음성을 입히는 기술입니다. 

최근 유튜브에서 이 기능을 도입하여, 크리에이터가 동영상을 업로드하면 시청자가 클릭 한 번으로 원하는 언어로 더빙된 음성을 들을 수 있게 되었습니다.

현재 프랑스어, 스페인어, 포르투갈어, 이탈리아어 등 다양한 언어로 지원되고 있으며, 점차 더 많은 언어로 확대될 예정입니다.

이 기능은 특히 언어 장벽을 허물어, 전 세계의 다양한 시청자들이 더 쉽게 콘텐츠를 즐길 수 있도록 돕습니다. 

특히, 크리에이터의 목소리와 억양을 그대로 유지하면서도 실시간으로 더빙이 가능하다는 점이 큰 장점이라고 하니,

이제 언어의 장벽이 무너지면 한국어를 쓰는 국내 유튜버가 해외시장에 손쉽게 진출할 수 있고, 반대의 경우가 생길 수도 있겠죠.


수천만명의 구독자를 지닌 글로벌 유튜버에 의해 한국 유투버 생태계가 무너질 수 있고, 역으로 다른 나라의 생태계를 정복할 수도 있으니 점점 치열해질 것 같습니다. 


2. 오토더빙 기술의 세부단계

오토더빙 기술의 세부단계

1) 음성 인식

먼저, 원본 동영상의 음성을 텍스트로 변환합니다.

이를 위해 음성 인식 기술을 사용합니다.

 

2) 번역

변환된 텍스트를 원하는 언어로 번역합니다.

이 과정에서는 기계 번역 기술이 사용됩니다.

 

3) 음성 합성

번역된 텍스트를 기반으로 새로운 음성을 생성합니다.

이때 음성 합성 기술을 사용하여 사용자의 자연스러운 발음과 억양을 구현합니다.

 

4) 동기화

생성된 음성을 원본 동영상의 입 모양과 타이밍에 맞춰 동기화합니다.

이를 통해 시청자가 더 자연스럽게 느낄 수 있도록 해주는 것이죠

이 과정에서 딥러닝과 같은 인공지능 기술이 많이 활용될 수밖에 없습니다.

특히 '음성 합성' 부분에서는 텍스트를 자연스러운 음성으로 변환하기 위해 다양한 음성 데이터와 학습 알고리즘이 사용되기에 훈련이 필요할 것으로 판단됩니다.


3. 오토더빙 활용범위

오토더빙 활용범위

세계적으로 유튜브 언어 장벽을 허물어 버리는 '오토 더빙'은 여러 분야에서 활용될 것이 예상됩니다.

이러한 음성 관련 기술은 매우 다양하며, 몇 가지 주요 기술과 활용범위를 안내하겠습니다.

 

1) 음성 인식 (Speech Recognition)

사람의 음성을 텍스트로 변환하는 기술입니다.

이 기술은 스마트폰의 음성 비서, 자동 자막 생성, 콜센터의 음성 분석 등에 사용됩니다.

 

2) 음성 합성 (Speech Synthesis)

텍스트를 자연스러운 음성으로 변환하는 기술로 대중화가 많이 되었습니다.

많은 이들이 알다시피, 내비게이션에 들어가는 안내 음성이나, 시각 장애인을 위한 읽기 도구에 사용됩니다.

오토더빙 활용범위

3) 음성 복제 (Voice Cloning)

특정 화자의 목소리와 억양을 학습하여 유사한 음성을 생성하는 기술입니다.

오픈 AI의 보이스 엔진이 대표적인 예로, 교육이 선두주자이고, 그 외 의료, 공공 분야에서 활용되고 있습니다.


4) 자연어 처리 (Natural Language Processing, NLP)

음성 인식과 음성 합성의 기반이 되는 기술로, 컴퓨터가 인간의 언어를 이해하고 처리할 수 있도록 돕습니다.

챗봇, 번역기, 음성 비서 등에 널리 사용됩니다.


5) 음성 감정 인식 (Emotion Recognition)

음성에서 감정을 분석하여 화자의 감정 상태를 파악하는 기술입니다.

아무래도 의학 관련 서비스에 이용될 가능성이 높은데

고객 서비스, 심리 치료, 감정 분석 등 다양한 분야에서 활용될 수 있습니다.


4. 오토더빙 활용 주요 회사

이처럼 오토더빙 분야는 치열하게 기술을 개발과 동시에 다양한 서비스를 제공하고 있는데

오토더빙 기술을 개발하는 주요 회사들을 소개하려 합니다.

 

1) 유튜브 (YouTube)

앞서 설명했다시피 유튜브는 최근 오토더빙 기능을 도입하여, 크리에이터가 동영상을 업로드하면 시청자가 클릭 한 번으로 원하는 언어로 더빙된 음성을 들을 수 있게 했습니다.

이 기능은 현재 시험 단계에 있으며, 프랑스어, 스페인어, 포르투갈어, 이탈리아어 등 다양한 언어로 지원되며, 전 세계의 언어 장벽을 허물 것으로 예상됩니다.

2) 구글 (Google)

구글은 딥마인드의 AI 모델을 활용하여 다양한 음성 관련 기술을 개발하고 있습니다.

특히, 동영상 생성형 AI 모델인 '비오'를 통해 자동 더빙뿐만 아니라 다양한 AI 기반 동영상 제작 기능을 제공하고 있습니다

 

3) 아마존 (Amazon)

아마존의 AWS(Amazon Web Services)는 음성 인식 및 합성 기술을 제공하는 다양한 서비스를 통해 오토더빙 기술을 지원하고 있습니다.

아마존 폴리(Amazon Polly)는 텍스트를 자연스러운 음성으로 변환하는 서비스로, 여러 언어와 음성을 지원합니다.


4) 마이크로소프트 (Microsoft)

마이크로소프트의 Azure Cognitive Services는 음성 인식 및 합성 기술을 포함한 다양한 AI 서비스를 제공합니다.

이를 통해 개발자들이 오토더빙 기능을 쉽게 구현할 수 있습니다.

이 외에도 많은 스타트업과 기술 기업들이 오토더빙 기술을 개발하고 있으며, 이 기술을 활용해 우리 삶 곳곳에서 계속적으로 발전이 예상됩니다. 



이처럼 세계적으로 유튜브 언어 장벽을 허물어 버리는 '오토 더빙'은 금년 말까지 구글 딥마인드의 '비오'를 쇼츠에 통합한다고 합니다.

오토더빙

'비오'는 구글이 금년 5월 공개한 동영상 생성 AI모델로써, 

크리에이터는 비오를 통해 AI가 생성한 배경을 추가하거나 명령어만으로 6초 분량의 쇼츠영상을 만든다고 하네요.  
그렇게 AI를 통해 쇼츠 영상제작(동영상 제목, 섬네일, 개요등)은 더 효율적이고 더 빨라지기 때문에 유튜브뿐 아니라 모든 영역에서 언어 장벽이 허물어지는 건 시간문제인 것 같습니다.

 

이상으로 '오토더빙'에 대한 소개를 마치도록 하겠습니다.

감사합니다.


모두 포기하지 않으면 가장 나쁜 상황이 초래되는 '치킨게임'을 아시려면 아래 링크를 클릭해 주세요.

 

모두 포기하지 않으면 가장 나쁜 상황이 초래되는 '치킨게임'을 아시나요?

모두가 포기 또는 양보를 하지 않으면 가장 나쁜 상황이 초래되는 '치킨게임'이 경제신문 용어로 등장했습니다.최근 생성형 인공지능(AI) 시장에서 빅테크 기업들의 '치킨 게임'이 시작됐습니다.

bewall2401.com

반응형

#tt-body-page blockquote[data-ke-style='style1']::after { content: ''; display: block; background: url(https://t1.daumcdn.net/keditor/dist/0.4.9/image/blockquote-style1.svg) no-repeat 50% 0; padding-top: 34px; transform: rotate(180deg); }