본문 바로가기
카테고리 없음

AI 음성 생성기 - 일레븐랩스 Eleven Labs

by Rany! 2024. 3. 22.
반응형

일레븐랩스 Eleven Labs

 
일레븐랩스는 딥러닝 기술을 기반으로 한 AI 음성 생성 플랫폼으로 인공지능 기술을 사용하여 텍스트를 실제 사람의 목소리로 변환시킨다. 텍스트를 입력하면 실제 사람의 목소리와 유사한 음성을 만들어낼 수 있으며, 다양한 언어와 목소리 스타일을 지원한다.  사실적인 음성을 생성하는 능력으로 인해 다양한 목적으로 사용할 수 있어 인기를 얻고 있다.
 

주요 특징

  • 텍스트 음성 변환: 텍스트를 입력하면 자연스러운 음성으로 변환한다.
  • 목소리 복제: 실제 사람의 목소리를 복제하여 원하는 음성으로 변환할 수 있다.
  • 다양한 언어 지원: 한국어, 영어, 일본어 등 29개 언어로 다양한 언어를 지원한다.
  • 다양한 목소리 스타일: 남성, 여성, 어린이, 노인 등 다양한 연령의 목소리와  방언을 포함한 다양한 목소리를 제공한다. 
  • 다양한 기능: 음성 속도, 음량, 억양 등을 조절하는 기능을 제공한다.
  • 간편한 사용: 누구나 쉽게 사용할 수 있는 간편한 인터페이스를 제공한다.
  • 요금제: 무료 버전과 유료 버전이 있다. 어디나 그렇듯 무료 버전은 제한된 기능을 제공하지만, 유료 버전은 더 많은 기능과 더 높은 품질의 음성을 제공한다.
  • 음성 다운로드: 완성된 음성을 MP3 또는 WAV 형식으로 다운로드하여 사용할 수 있다.

 

주요 기능

  1. 텍스트 음성 변환
  2. 음성 읽어주기
  3. 오디오북 생성을 위한 프로젝트
  4. 무료 AI 더빙 및 비디오 번역기
  5. AI 음성 및 텍스트 음성 API
  6. 음성 복제
  7. 보이스 라이브러리

 

사용 방법

 
- 무료로 사용해 보자!
 
▶ 검색창에서 일레븐랩스 입력 - 검색 결과 클릭 

 
오른쪽 상단의 'Sign Up' 클릭 - 구글 계정으로 로그인

 

레이아웃

- 보기 편하게 영어 화면을 한글로 바꿔 보자!
 
영어로 나타난 화면을 오른쪽 마우스 클릭 - '한국어'로 번역 클릭 
 

 
1 음성생성 - '텍스트를 음성으로'와 '음성 대 음성' 중 선택하여 생성한다.
2 언어 설정 - 29개의 언어에서 선택할 수 있다.
3  AI 음성

  • 각각의 목소리는 억양, 목소리의 느낌, 사용되기에 적당한 분야 등이 제시되어 적합한 목소리를 선택할 수 있다.
  • 다양한 악센트와 톤으로 다양한 AI 음성을 제공한다.  예) 내가 선택한 Alice는 '새로운, 영국의, 자신감, 소식'으로 제시되어 있다.
  • '음성 추가'를 선택하여 나만의 AI 음성을 생성할 수도 있다.
  • 색상으로 구분된 태그를 사용하면 적합한 음성을 쉽게 찾을 수 있다.

4 음성 설정

  • 음성 튜너를 사용하여 음성의 안정성, 선명도 및 스타일을 조정할 수 있다.
  • 안정성 - 목소리가 안정적 이도록 정도를 설정한다.
  • 명확성 + 유사성 - 내 목소리로 할 경우 비슷하게 나오도록 하려면 정도를 크게 한다.
  • 스타일 - 원래 성우의 목소리를 변화시키 것으로 숫자가 클수록 과장되게 생성된다.

5 텍스트 - 음성 변환할 텍스트를 입력하는 창

 

1. 텍스트 음성 변환

 
- Text-to-Speech를 사용하여 사실적인 AI 음성을 생성한다.
- ElevenLabs는 인공 지능을 사용하여 29개 언어로 된 70개 이상의 다양한 음성으로 작성된 텍스트를 인간과 유사한 음성으로 변환한다!
- 생성된 음성은 MP3 파일로 다운로드하여 어디서나 사용할 수 있다.
 
= 텍스트를 입력하여 그 텍스트를 읽는 음성을 생성해 보자.
 
▶ 3  AI 음성 선택 - 4 음성 설정에서 튜너 조절 - 2 언어 모델 선택 ( 기본 Eleven Multilingual v2)으로 유지 ) -  텍스트 입력 - 하단의 '생성하기' 클릭 - 
→ 간단한 영어 문장을 복사하여 붙여 넣기 했다.

 
→ 몇 초 만에 아래의 17초 분량의 나레이션이 생성되었다.

 
왼쪽 상단의 일레븐랩스 아이콘 클릭 첫 화면으로 돌아간다.

 
음성 설정에서 안정성, 명확성 + 유사성에 대해 변화를 주고 스타일도 더욱 과장시켜 다시 생성해 보았다.

 
AI 음성 설정에 몇 가지 변경으로 같은 텍스트에 다른 느낌으로 만들 수 있다.
내 콘텐츠의 내용에 알맞은 목소리를 찾아 음성 설정의 정도를 적절히 설정하여 생성하기에 유용하겠다.
 
 
 

2. 음성 대 음성

 
- 목소리를 다른 캐릭터로 변환하고 감정과 전달을 맞춤 설정할 수 있다.
- 오디오를 플랫폼에서 직접 녹음하거나 MP3 파일을 업로드하여 생성할 수 있다. 
 
= 짧은 동요를 불러  만들어 보자.
 
음성 대 음성 선택 -  AI 음성 선택 - 음성 설정한 후 - 하단 오디오 창에서 '오디오 녹음' 클릭 
 오디오 파일을 업로드하거나 음성 녹음을 할 수 있다.

 
 마이크 버튼 클릭 - 간단하게 녹음 - 마이크 끄기 - 하단의 '생성하기' 클릭
→ 생성된 결과는 화면 오른쪽 상단에 생긴다.
→ 플레이 버튼을 눌러 확인할 수 있고 다운로드하여 내 컴퓨터에 저장할 수 있다.

 
 
이제부터 유료 기능이다. 무료 AI 더빙 및 번역기는 무료로 생성되지 않았다. 
→ 일레븐랩스 화면에서 왼쪽 상단의 일레븐랩스 아이콘을 클릭하여 기능을 선택하여 사용한다.

 

3 .오디오북 제작 프로젝트

 
- ElevenLabs를 사용하면 간소화된 워크플로에서 긴 형식의 음성 오디오를 정확하게 생성, 편집 및 사용자 정의할 수 있다.
- 스튜디오에서 책을 녹음하는 데 몇 시간을 소비하는 대신 몇 분 만에 오디오북을 만들 수 있다.
 

 

4. 무료 AI 더빙 및 비디오 번역기

- 일레븐랩스와 함께 무료 AI 더빙 및 비디오 번역기를 사용하면 콘텐츠를 몇 초 만에 29개 언어로 번역할 수 있다. 이를 통해 원본 음성의 특성을 유지하면서 원본 오디오를 새로운 언어로 번역할 수 있다.
- 소스언어에서 오디오 또는 비디오의 언어를 선택하고 대상 언어에서 번역하고 싶은 언어를 선택한다.
- MP3, MP4 파일을 플랫폼에 업로드하거나 YouTube, TikTok, X(Twitter) 또는 Vimeo의 URL을 삽입할 수도 있다.
→ 무료로 사용 가능하다더니 생성이 안된다.
 
 

5. AI 음성 및 텍스트 음성 API

- 챗봇, 웹사이트, 앱 등에 29개 언어로 AI 음성을 구현하려는 개발자를 위해 안정적이고 사용하기 쉬운 API를 제공한다.
- 상황과 감정에 따라 음조를 조정하는 프로젝트에 수천 개의 음성 중에서 AI 음성을 선택할 수 있고, 자신만의 음성을 복제하여 사용자 정의 음성을 만들 수도 있습니다.

 

6. 음성 복제

- ElevenLabs 음성 복제 도구를 사용하면 자신의 음성에 대한 짧은 녹음이나 권한이 있는 음성을 업로드하여 자신만의 AI
음성을 만들 수 있다.
- 음성 녹음 샘플에는 배경 소음이 없는 화자 29명이 포함되어야 하며 길이는 50분 이상이어야 한다. 
- 음성 복제는 놀라울 정도로 정확하며 원래 음성과 구별할 수 없을 정도의 품질이라고 한다.

 

 

 

7. 음성 라이브러리

 
- ElevenLabs 음성 라이브러리에는 다양한 고품질 AI 음성 컬렉션이 있어 VoiceLab에 추가하여 사용할 수 있다.
- 필터를 사용하여 비디오, 오디오북, 비디오 게임 또는 블로그의 성별, 연령 및 억양을 기준으로 음성을 정리할 수 있어 원하는 목소리를 쉽게 찾을 수 있다. 
 
 
 

요금제

 
 
무료 기능으로는 너무 제한적이긴 하다. 하지만 말투, 억양 등을 고려해서 목소리를 선택할 수 있고 빠르고 쉽게 고품질의 음성이 생성되어 편리한 점, 그리고 유료로 사용했을 때 기능들은 다양한 분야에서 활용 할 수 있는 도구이다.
실제 일레븐랩스의 플랫폼은 게임과 영화 및 TV 내레이션, 오디오북 제작과 마케팅 활동에 활용되고 있다.
 
하지만 우려되는 부분도 있다.
유명인의 목소리를 복제하여 더빙하는 등의 생성 AI 음성의 잘못된 사용은 딥페이크와 함께 굉장히 우려스러운 부분이다.
사용자가 책임감있게 사용함과 더불어 제도적으로 제한이 필요한 부분이다. 
 
 

반응형