1つのプロンプトで画像と動画を同時生成
Agent がプロンプトの意図を分析し、画像・動画・またはその両方を生成するかを自動判断します。「ポスターを作ってアニメーション化して」と言えば、静止画と動画クリップが一度に生成されます。大量出力が必要なら「5パターン」と言うだけで、Agent が並列タスクに分割します — 最大20件まで同時実行可能です。
Agent がプロンプトの意図を分析し、画像・動画・またはその両方を生成するかを自動判断します。「ポスターを作ってアニメーション化して」と言えば、静止画と動画クリップが一度に生成されます。大量出力が必要なら「5パターン」と言うだけで、Agent が並列タスクに分割します — 最大20件まで同時実行可能です。
Agent は画像用に Nano Banana Pro、GPT Image 2、Nano Banana 2、Nano Banana を、動画用に Seedance 2.0、Seedance 2.0 Fast、Kling O3、Kling O1 から自動選択します。各モデルのアスペクト比制限、解像度上限、参照画像数は自動処理されるため、手動設定は不要です。
マークチップを使って Canvas アイテムの領域にタグ付けできます — 「車」や「背景」とラベルを付ければ、Agent が画像・動画・音声を正しいパイプラインスロットにルーティングします。開始フレーム/終了フレーム、参照画像(Seedance は最大9枚、Kling は最大4枚)、参照動画、音声参照に対応しています。
Agent が最適な生成パイプラインを自動選択します — テキスト→動画、画像→動画、参照→動画、動画→動画、動画編集。Kling に「車を緑にして」と指示すれば、インプレース動画編集にルーティングされます。同じプロンプトを Seedance で実行すると動画参照にルーティングされます。モデルが対応していない場合、Agent は適切にフォールバックします。
「このシーンの20バリエーション」と言えば、Agent がプロンプトを最大20の並行生成タスクに分割します。各タスクは最適なモデルとパイプラインに個別にルーティングされ、すべての結果がリアルタイムで Canvas にストリーミングされます。以前は午後いっぱいかかっていたバッチワークフローが、数分で完了します。
Agent はプロンプトが音声・音楽・環境音を示唆していることを検出します — 「ストリートミュージシャンがギターを演奏」「ナレーターが商品を紹介」など — Seedance 2.0 のような対応モデルで自動的に音声生成を有効にします。音声トグルを手動で切り替える必要はありません。Agent が意図を読み取り、パイプラインをエンドツーエンドで設定します。
1つのプロンプトから商品ポスターとそれに合ったショーケース動画を同時に生成。Agent が各出力を最適なモデルに自動振り分けます。
「5つの異なるバージョン」や「スタイル違いで3パターン」と言うだけ。Agent が並列タスクに分割して同時実行します — 1プロンプトで最大20出力。
参照画像や動画を Canvas にアップロード。Agent が適切なパイプラインを自動検出します — 静止画には画像→動画、スタイル転送には参照→動画、編集には動画→動画 — 手動でのパイプライン選択は一切不要です。
同じプロンプトを異なるモデルで実行し、Canvas 上で並べて比較。Seedance は高速イテレーション向き、Kling はインプレース動画編集向き、GPT Image 2 はテキストレンダリングとブランド精度が最高です。
毎日PonPonを使っている何千ものクリエイター、エージェンシー、ブランドの仲間入りをしましょう。
The era of typing one prompt and hoping for the best is ending. AI agents now manage the entire video creation process, from script to final cut, across multiple specialized models.
With the recent launch of official agent execution environments, automating complex AI video tasks just became vastly more reliable for creators.
Build a repeatable AI video production workflow from scratch — covering planning, prompt writing, model selection, generation, editing, and delivery.