HappyHorse マルチリファレンス動画

参照画像を1〜9枚アップロードし、プロンプト内のキャラクタートークンにそれぞれ割り当てます。HappyHorseはクリップ全体にわたって参照したすべての人物の同一性の一貫性を維持します。

マルチリファレンス生成では、複数のソース画像——キャラクターごとに1枚——を提供し、AIモデルが動画全体を通じて各人物の独自の外観を維持できるようにします。モデルは各参照をプロンプト内の名前付きトークン（例：[person1]、[person2]）にマッピングし、顔の特徴・体型・衣服をそのトークンに紐付けます。これは、1人の同一性しか保てないシングルリファレンスモデルとは根本的に異なります。シングルリファレンスモデルでは、複数人のシーンで副次的なキャラクターをAIが生成してしまいます。

できること

1回の生成に最大9枚の参照画像

HappyHorseは1〜9枚の参照画像を受け付けます——現在のAI動画モデルの中で最多です。各参照は別のキャラクタートークンに紐付けられるため、9人の異なる人物が登場するグループシーンも1回の生成で可能です。

プロンプト内のキャラクタートークンバインディング

参照画像は[person1]〜[person9]のようなトークンに割り当てられます。これらのトークンをプロンプト内で使用して、各キャラクターを独立して配置・演出します：「[person1]がコーヒーカップを[person3]に手渡し、[person2]が背景で手を振っている。」

キャラクター間のインタラクション

すべての参照が同一の生成パスで読み込まれるため、キャラクターが自然に相互作用できます——握手、会話、物の受け渡し。シングルリファレンスモデルでは、これを実現するために個別クリップの合成が必要です。

尺を通じた一貫した同一性

顔の特徴・肌のトーン・ヘアスタイル・衣服が、フレーム1からクリップ終端まで安定して維持されます。カメラアングルの変化や部分的なオクルージョンがあっても、クリップ途中での同一性のドリフトは発生しません。

複数の参照タイプに対応

参照はヘッドショット・全身写真・スタイライズドイラストレーションのいずれでも使用できます。HappyHorseはソース画像のフォーマットに関わらず同一性の特徴を抽出しますが、正面向きで自然な表情の写真が最も正確な結果をもたらします。

はじめに

使い方

PonPon VideoでHappyHorseを選択

PonPon Videoにアクセスし、モデルドロップダウンからHappyHorseを選択します。

参照画像をアップロード

参照画像のアップロードエリアをクリックして、1〜9枚の画像を追加します。各画像には1人の顔が明確に写っている必要があります——正面向き・適切な照明・オクルージョン最小限が理想です。順番（person1、person2など）を記録しておいてください。

キャラクタートークンを使ったプロンプトを書く

アップロードした各画像をトークンで参照します：[person1]、[person2]など。各キャラクターの具体的なアクションとともにシーンを描写します：*「[person1]はデスクに座ってタイピングしており、[person2]が後ろに立ってスクリーンを指差している。[person3]がフォルダを持ってドアから入ってくる。」*

尺とアスペクト比を設定

クリップの長さとアスペクト比を選択します。マルチキャラクターシーンには、16:9のワイドスクリーンがキャラクターの配置に余裕を与えます。長めの尺（8〜10秒）でより複雑なインタラクションが可能です。

生成して同一性の一貫性を確認

生成をクリックし、クリップ全体を通じて各キャラクターが参照と一致しているか確認します。1人のキャラクターがドリフトする場合は、より鮮明な照明や正面に近いアングルの参照写真を試してください。

クリエイターのために

個人クリエイター、エージェンシー、ブランドを問わず、すべてのモデルがあなたのワークフローに適応します。

F1 pit stop sequence

[person1] in a red racing suit leaps over the pit wall and changes the front-right tire while [person2] in a blue suit handles the rear-left tire. [person3] holds the lollipop sign and drops it as the car launches forward. Overhead camera, 16:9, 8 seconds.

Rollercoaster reality warp

[person1] and [person2] sit side by side in the front row of a rollercoaster. [person1] screams with arms raised while [person2] grips the bar and laughs. The track twists through a surreal neon portal. POV from the seat behind, 16:9, 6 seconds.

Bedroom explosion chaos

[person1] jumps on the bed launching pillows into the air while [person2] ducks behind the door and [person3] catches a flying blanket. Feathers drift everywhere, warm lamplight, handheld camera feel. 16:9, 10 seconds.

コピーして使う

プロンプトテンプレート

会話シーン（2名）

[person1] and [person2] sit across from each other at a coffee shop table. [person1] gestures while speaking, [person2] nods and smiles. Warm afternoon light through the window. Shallow depth of field. 16:9, 8 seconds.

モデル: HappyHorse · リファレンス: 2枚 · 尺: 8秒 · アスペクト: 16:9

チーム紹介

[person1], [person2], [person3], and [person4] stand in a row in a modern office lobby. Each waves at the camera in sequence from left to right. Clean white background, professional attire. 16:9, 10 seconds.

モデル: HappyHorse · リファレンス: 4枚 · 尺: 10秒 · アスペクト: 16:9

家族の食事シーン

[person1] sits at the head of a dining table, [person2] and [person3] on either side, [person4] at the far end. [person1] raises a glass for a toast, others follow. Warm candlelight, rustic wooden table. 16:9, 10 seconds.

モデル: HappyHorse · リファレンス: 4枚 · 尺: 10秒 · アスペクト: 16:9

商品の受け渡しデモ

[person1] in a lab coat hands a product box to [person2] in business casual. [person2] inspects the box and nods approvingly. Clean studio background, soft key light. 16:9, 6 seconds.

モデル: HappyHorse · リファレンス: 2枚 · 尺: 6秒 · アスペクト: 16:9

こんな方に

ユースケース

マルチキャラクターのナラティブ動画

定番のキャストが登場する短編映画・ウェブシリーズ・解説動画。一度キャラクターの参照をアップロードすれば、エピソードをまたいで一貫したシーンを生成できます——ショット間の連続性エラーも発生しません。

チームおよびグループ写真のアニメーション

企業チームの写真をアニメーションの紹介動画に変換します。各チームメンバーのヘッドショットをアップロードし、彼らが相互作用するシーンを作成します——手を振る、握手する、一緒にプレゼンするなど。

家族・イベント動画

祝日や記念日のための個人化された家族動画を生成します。家族の写真をアップロードし、家族ディナー・誕生日パーティー・公園での散歩など、各人物が認識できるシーンを作成します。

Eコマースのモデル一貫性

ファッション・ライフスタイルブランドは、複数の商品動画にわたって同じモデルの同一性を維持できます。モデルの参照をアップロードし、異なるシチュエーションで異なる衣装を着せた動画を生成します——再撮影を手配せずに。

比較

HappyHorse マルチリファレンス vs 他のモデル

	HappyHorse（リファレンス1〜9枚）	他のモデル
最大リファレンス画像数	1回の生成に9枚——それぞれ別のキャラクタートークンに紐付け	Kling 3.0：リファレンス1枚。Veo 3.1：最大3アセット。Seedance 2.0：リファレンス1〜2枚
複数キャラクターのインタラクション	全キャラクターを1回のパスでレンダリング——参照した人物同士の自然なインタラクション	シングルリファレンスモデルはキャラクターを個別に生成してコンポジットする必要がある
同一性のバインド方法	プロンプト内の名前付きトークン（[person1]〜[person9]）——キャラクターごとの明示的なコントロール	ほとんどのモデルはシングルの暗黙的なリファレンスを使用——複数の同一性を指定する方法がない
グループシーンのクオリティ	各人物がリファレンスの同一性を維持——キャラクター間で顔が混合しない	リファレンス1枚のモデルでは、サブキャラクターの顔の特徴がメインキャラクターと混合しやすい
ユースケースの適合性	複数人物のナラティブ、チーム動画、家族コンテンツに最適	シングル被写体のコンテンツに向いている：ポートレート、ソロ商品デモ、モノローグ

最高の結果を得る

コツとベストプラクティス

明確な正面向きの参照写真を使用

同一性の抽出は、適切な照明の正面向きヘッドショットまたは腰までの写真で最も効果的です。横顔・サングラス・強い影はマッチング精度を低下させます。参照画像には1人だけ写るようにしてください。

スケールアップの前に2〜3枚の参照から始める

参照が多いほど生成の複雑さが増します。まず2〜3キャラクターでプロンプト構成を検証してから、さらに追加してください。1シーンに5キャラクターを超えると、位置の制御が精確にしにくくなります。

キャラクターの位置を明示的に記述

複数のキャラクターがいる場合、曖昧な空間描写は混雑した・不明確な構図につながります。位置を明示してください：「[person1]は左、[person2]は中央、[person3]は右。」

6枚を超える参照では収益逓減を想定

HappyHorseは最大9枚の参照をサポートしますが、7〜9キャラクターのシーンでは1人あたりの視覚的スペースが少なくなります。同一性の精度は維持されますが、フレームが混雑するにつれて個々のキャラクターのディテールは減少します。

コミュニティ

世界中のクリエイターに愛されています

毎日PonPonを使っている何千ものクリエイター、エージェンシー、ブランドの仲間入りをしましょう。

The quality jumped overnight

We switched our product video pipeline to PonPon last month. Kling 3.0 with native audio is genuinely usable for social ads now. Our team ships 30+ variations a week without touching After Effects.

Marcus Johansson

Head of Content, DTC Brand

Finally a tool my whole team can use

I'm technical, my co-founder isn't. She hops into PonPon, types a prompt, and gets a polished video in minutes. Canvas is the killer feature — we brainstorm visually and export straight to pitch decks.

Priya Kapoor

Startup Founder

Cut our pre-production costs in half

We prototype every scene in PonPon before we shoot. Directors see framing, pacing, and mood before a single camera rolls. It's become essential to our pre-vis workflow.

James Whitfield

Production Supervisor

Built our TikTok presence from zero

Brand new account, three videos a day, all on PonPon. Hit 50k followers in four months. The variety lets us test hooks constantly without burning out on production.

Sofia Castellanos

TikTok Creator

Audio quality matches the visuals

Kling 3.0 audio finally feels coherent with the footage. No more awkward mismatched foley. I haven't opened my DAW for social cuts in a month.

Theo Nakamura

Sound Designer

Documentary pre-vis breakthrough

Pre-visualizing reenactments and archival sequences used to cost us 15% of every doc budget. PonPon lets me block scenes for free, then shoot only what matters.

Priya Venkatesan

Documentary Producer

よくある質問

質問と回答

HappyHorseは何枚の参照画像を使用できますか？

HappyHorseは1回の生成に1〜9枚の参照画像をサポートします。各画像はキャラクタートークン（[person1]〜[person9]）に紐付けられ、プロンプト内で各キャラクターを独立してコントロールするために使用します。

HappyHorseのプロンプトでキャラクタートークンはどのように機能しますか？

参照画像をアップロードすると、それぞれに[person1]、[person2]などのトークンが割り当てられます。プロンプト内でこれらのトークンを使用して特定のキャラクターを参照します：「[person1]が[person2]と握手する。」モデルは各トークンを対応する参照の顔と外観にマッピングします。

マルチキャラクターシーンでHappyHorseはKling 3.0とどう違いますか？

Kling 3.0は参照画像を1枚しかサポートしないため、単一被写体の動画に最適です。HappyHorseは最大9枚の参照をサポートするため、複数の識別可能なキャラクターが登場するシーンにより適しています。

どのような参照写真が最もよく機能しますか？

顔が明確に見える、正面向きで適切な照明の写真です。ヘッドショットまたは腰までの写真が最適です。サングラス・強い影・複数人が写る写真は避けてください。詳細なガイダンスはベストプラクティスをご覧ください。

すべてのキャラクターはクリップ全体で一貫性が維持されますか？

はい。各参照キャラクターは始めから終わりまで顔の特徴・肌のトーン・ヘアスタイルを維持します。参照の衣服もプロンプトで異なる服装を明示的に記述しない限り維持されます。

マルチリファレンスをビデオtoビデオ編集と組み合わせることはできますか？

はい。HappyHorseは最大5枚の参照画像を使ったビデオtoビデオ編集もサポートしています。既存のクリップのキャラクターを差し替えながら、元のモーションとタイミングを維持できます。

HappyHorseのマルチリファレンスは無料で使えますか？

PonPonの毎日の無料クレジットで、マルチリファレンスを含むHappyHorseの生成がカバーされます。マルチリファレンスに別途追加料金はかかりません。サブスクリプションのクレジット量は料金プランをご覧ください。

2枚の参照画像が非常に似ている場合はどうなりますか？

2枚の参照が似た特徴（例：兄弟姉妹）を持っている場合、モデルが間違えることがあります。モデルが区別できるよう、異なるヘアスタイル・顔の形・衣服の参照を使用してください。プロンプトで区別できる特徴を明示的に記述することも効果的です。

探索

もっと探索

モデル

AI Video Generator

作り始める準備はできましたか？

毎日の無料クレジットですぐに始められます。クレジットカード不要。

HappyHorse マルチリファレンスを試す

HappyHorse マルチリファレンス動画

[person1] and [person2] sit across from each other at a coffee shop table. [person1] gestures while speaking, [person2] nods and smiles. Warm afternoon light through the window. Shallow depth of field. 16:9, 8 seconds.

[person1], [person2], [person3], and [person4] stand in a row in a modern office lobby. Each waves at the camera in sequence from left to right. Clean white background, professional attire. 16:9, 10 seconds.

[person1] sits at the head of a dining table, [person2] and [person3] on either side, [person4] at the far end. [person1] raises a glass for a toast, others follow. Warm candlelight, rustic wooden table. 16:9, 10 seconds.

HappyHorse（リファレンス1〜9枚）

他のモデル

最大リファレンス画像数

1回の生成に9枚——それぞれ別のキャラクタートークンに紐付け

Kling 3.0：リファレンス1枚。Veo 3.1：最大3アセット。Seedance 2.0：リファレンス1〜2枚

複数キャラクターのインタラクション

全キャラクターを1回のパスでレンダリング——参照した人物同士の自然なインタラクション

シングルリファレンスモデルはキャラクターを個別に生成してコンポジットする必要がある

同一性のバインド方法

プロンプト内の名前付きトークン（[person1]〜[person9]）——キャラクターごとの明示的なコントロール

ほとんどのモデルはシングルの暗黙的なリファレンスを使用——複数の同一性を指定する方法がない

グループシーンのクオリティ

各人物がリファレンスの同一性を維持——キャラクター間で顔が混合しない

リファレンス1枚のモデルでは、サブキャラクターの顔の特徴がメインキャラクターと混合しやすい

ユースケースの適合性

複数人物のナラティブ、チーム動画、家族コンテンツに最適

シングル被写体のコンテンツに向いている：ポートレート、ソロ商品デモ、モノローグ

HappyHorse マルチリファレンス動画

できること

1回の生成に最大9枚の参照画像

プロンプト内のキャラクタートークンバインディング

キャラクター間のインタラクション

尺を通じた一貫した同一性

複数の参照タイプに対応

使い方

PonPon VideoでHappyHorseを選択

参照画像をアップロード

キャラクタートークンを使ったプロンプトを書く

尺とアスペクト比を設定

生成して同一性の一貫性を確認

クリエイターのために

プロンプトテンプレート

会話シーン（2名）

チーム紹介

家族の食事シーン

商品の受け渡しデモ

ユースケース

マルチキャラクターのナラティブ動画

チームおよびグループ写真のアニメーション

家族・イベント動画

Eコマースのモデル一貫性

HappyHorse マルチリファレンス vs 他のモデル

コツとベストプラクティス

明確な正面向きの参照写真を使用

スケールアップの前に2〜3枚の参照から始める

キャラクターの位置を明示的に記述

6枚を超える参照では収益逓減を想定

世界中のクリエイターに愛されています

The quality jumped overnight

Finally a tool my whole team can use

Cut our pre-production costs in half

Built our TikTok presence from zero

Audio quality matches the visuals

Documentary pre-vis breakthrough

質問と回答

もっと探索

HappyHorse Alibaba's Versatile AI Video Model

HappyHorse Video-to-Video Editing

Kling 3.0 The Cinematic AI Video Model

Kling 3.0 Multi-Shot Storytelling

Seedance 2.0 Fast, Expressive AI Video

AI Video Generator

作り始める準備はできましたか？

HappyHorse マルチリファレンス動画

できること

1回の生成に最大9枚の参照画像

プロンプト内のキャラクタートークンバインディング

キャラクター間のインタラクション

尺を通じた一貫した同一性

複数の参照タイプに対応

使い方

PonPon VideoでHappyHorseを選択

参照画像をアップロード

キャラクタートークンを使ったプロンプトを書く

尺とアスペクト比を設定

生成して同一性の一貫性を確認

クリエイターのために

プロンプトテンプレート

会話シーン（2名）

チーム紹介

家族の食事シーン

商品の受け渡しデモ

ユースケース

マルチキャラクターのナラティブ動画

チームおよびグループ写真のアニメーション

家族・イベント動画

Eコマースのモデル一貫性

HappyHorse マルチリファレンス vs 他のモデル

コツとベストプラクティス

明確な正面向きの参照写真を使用

スケールアップの前に2〜3枚の参照から始める

キャラクターの位置を明示的に記述

6枚を超える参照では収益逓減を想定

世界中のクリエイターに愛されています

The quality jumped overnight

Finally a tool my whole team can use

Cut our pre-production costs in half