Voiceover und Audio-Grundlagen
Das PonPon-Audiostudio: Text-to-Speech, Voice Changer, Synchronisation in 31 Sprachen, Soundeffekte, Musik und mehrstimmige Dialoge – powered by ElevenLabs und MiniMax.
Das Audiostudio deckt alles ab, was du nach dem Schnitt zu einem Video hinzufügst. Es hat sechs Modi, die über die Leiste am unteren Rand gewechselt werden – Stimme und Musik werden von ElevenLabs bereitgestellt, mit MiniMax als zweiter Stimmoption.

Die Composer-Leiste funktioniert in jedem Modus gleich: Das linke Dropdown wechselt den Modus (Text-to-Speech, Voice Changer, Synchronisation usw.), die mittleren Steuerelemente wählen Provider und Stimme, und Generieren zeigt die Credit-Kosten an.
Voiceover (Text-to-Speech)
Schreibe dein Skript, wähle eine Stimme und erzeuge gesprochenes Audio für Erzählungen, Erklärvideos, Werbung und Faceless-Videos. Öffne es unter Audio › Text-to-Speech.
- Wähle zwischen ElevenLabs- und MiniMax-Stimmen. MiniMax bietet zusätzlich Emotion (neutral, fröhlich, traurig, wütend und mehr) und Geschwindigkeits-Regler.
- Schreibe so, wie es gesprochen werden soll, nicht wie es geschrieben wird – kurze Sätze, natürliche Formulierungen. Satzzeichen steuern die Pausen.
Voice Changer
Hast du bereits eine Aufnahme? Der Voice Changer liest sie mit einer anderen Stimme ein und behält dabei dein Timing und deine Betonung bei – praktisch zum Anonymisieren oder Umgestalten von Erzählungen. Eine Rauschunterdrückungsoption hilft dabei, die Aufnahme zu bereinigen.
Synchronisation (Dubbing)
Übersetze und vertone vorhandenes Audio oder Video in eine andere Sprache mit Dubbing. PonPon unterstützt 31 Zielsprachen, sodass ein einziges Video viele Märkte erreichen kann – ganz ohne Neuaufnahme.
Soundeffekte
Beschreibe einen Klang – „starker Regen auf einem Blechdach“, „Sci-Fi-Türsummen“ – und erzeuge ihn im Modus Soundeffekte. Du kannst die Cliplänge und die Genauigkeit der Prompt-Umsetzung einstellen. Lege Effekte unter einen Clip, damit ein stiller Render lebendig wird.
Musik
Erzeuge Hintergrundmusik für die gewünschte Stimmung im Modus Musik. Beschreibe einen Stil und eine Energie („warmes Lo-Fi, entspannt“ / „treibende Elektronik, schwungvoll“) statt eines bestimmten Songs, lege die Länge fest und aktiviere Instrumental, wenn du keine Gesangsstimme möchtest.
Dialog
Der Modus Dialog erzeugt eine mehrstimmige Unterhaltung: Schreibe das Skript Zeile für Zeile und weise jedem Sprecher eine andere Stimme zu.
Alles zusammenfügen
Ein typisches Faceless-Video entsteht so: Erzeuge die Bilder im Video-Generator, füge ein Voiceover hinzu, lege Soundeffekte und Musik darunter, und montiere alles in Flow oder Studio.
Verwandte Artikel
- Text-zu-Video GrundlagenWie die Videogenerierung auf PonPon funktioniert: Text-zu-Video vs. Bild-zu-Video, die Auswahl von Modellen wie Veo 3.1, Sora 2 und Kling 3.0 sowie die Tabs Bearbeiten und Bewegungssteuerung.
- Dein erstes KI-VideoSchritt für Schritt: Anmelden, Prompt schreiben, Modell auswählen, Seitenverhältnis, Dauer und Auflösung festlegen, generieren und dein erstes KI-Video auf PonPon herunterladen.
- Was ist PonPon?PonPon ist ein KI-Medienstudio – generiere Videos, Bilder und Audio, bearbeite sie und starte Effekte mit einem Klick, mit 30+ Modellen in einem einzigen Browser-Tab.