보이스오버와 오디오 기초
PonPon 오디오 스튜디오: 텍스트 음성 변환, 보이스 체인저, 31개 언어 더빙, 음향 효과, 음악, 다중 음성 대화 — ElevenLabs와 MiniMax 기반.
오디오 스튜디오는 영상에 그림을 입힌 뒤 추가하게 되는 모든 요소를 다룹니다. 하단 바에서 전환할 수 있는 여섯 가지 모드가 있으며, 음성과 음악은 ElevenLabs 기반이고 두 번째 음성 옵션으로 MiniMax를 제공합니다.

컴포저 바는 모든 모드에서 동일하게 작동합니다. 왼쪽 드롭다운에서 모드를 전환하고(텍스트 음성 변환, 보이스 체인저, 더빙 등), 가운데 컨트롤에서 제공자와 음성을 선택하며, Generate 버튼에 크레딧 비용이 표시됩니다.
보이스오버(텍스트 음성 변환)
스크립트를 입력하고 음성을 선택한 뒤 생성하면, 내레이션, 설명 영상, 광고, 얼굴이 나오지 않는 영상에 사용할 음성 오디오를 만들 수 있습니다. audio › text to speech에서 열어 보세요.
- ElevenLabs와 MiniMax 음성 중에서 선택할 수 있습니다. MiniMax는 감정(중립, 기쁨, 슬픔, 분노 등)과 속도 컨트롤을 추가로 제공합니다.
- 글로 쓰는 방식이 아니라 말하는 방식으로 작성하세요 — 짧은 문장과 자연스러운 어구가 좋습니다. 구두점이 멈춤을 조절합니다.
보이스 체인저
이미 녹음한 음성이 있나요? 보이스 체인저는 타이밍과 전달 방식은 그대로 유지하면서 다른 음성으로 다시 입혀 줍니다 — 익명화하거나 내레이션의 스타일을 바꿀 때 유용합니다. 원본을 깔끔하게 다듬는 노이즈 제거 옵션도 있습니다.
더빙
더빙으로 기존 오디오 또는 영상을 다른 언어로 번역하고 다시 음성을 입힐 수 있습니다. PonPon은 31개 대상 언어를 지원하므로, 다시 녹음하지 않고도 하나의 영상으로 여러 시장에 도달할 수 있습니다.
음향 효과
"양철 지붕을 두드리는 폭우", "SF 문이 열리는 휘익 소리" 같은 소리를 묘사하면 음향 효과 모드에서 생성할 수 있습니다. 클립 길이와 프롬프트를 얼마나 엄격하게 따를지 설정할 수 있습니다. 클립 아래에 효과를 겹겹이 쌓으면 무음 렌더링도 생동감 있게 만들 수 있습니다.
음악
음악 모드에서 분위기를 잡아 줄 배경 음악을 생성하세요. 특정 곡이 아니라 스타일과 에너지를 프롬프트로 입력하고("따뜻한 lo-fi, 편안한 느낌" / "몰아치는 일렉트로닉, 경쾌한 느낌"), 길이를 설정한 뒤, 보컬을 원하지 않으면 instrumental을 켜세요.
대화
대화 모드는 다중 음성 대화를 생성합니다. 스크립트를 한 줄씩 작성하고 각 화자에게 서로 다른 음성을 지정하세요.
한데 모으기
전형적인 얼굴 없는 영상 제작 흐름은 다음과 같습니다. 영상 생성기에서 비주얼을 생성하고, 보이스오버를 추가한 뒤, 음향 효과와 음악을 넣고, Flow나 Studio에서 조립합니다.
관련 아티클
- 텍스트로 영상 만들기PonPon에서 영상 생성이 작동하는 방식: 텍스트로 영상 생성과 이미지로 영상 생성의 차이, Veo 3.1, Sora 2, Kling 3.0 같은 모델 선택, 그리고 Edit 및 Motion Control 탭.
- 첫 AI 영상단계별 안내: 로그인하고, 프롬프트를 작성하고, 모델을 고르고, 화면 비율과 길이, 해상도를 설정한 뒤 생성하고, PonPon에서 첫 AI 영상을 다운로드하세요.
- PonPon이란?PonPon은 AI 미디어 스튜디오입니다. 영상, 이미지, 오디오를 생성하고 편집하며, 원클릭 효과를 실행할 수 있고, 30개 이상의 모델을 브라우저 탭 하나에서 사용할 수 있습니다.