세대당 최대 9장의 레퍼런스 이미지
HappyHorse는 레퍼런스 이미지를 1~9장까지 수용합니다. 이는 현재 AI 영상 모델 중 가장 높은 수치입니다. 각 레퍼런스는 별도의 캐릭터 토큰에 바인딩되므로, 9명의 서로 다른 인물이 등장하는 단체 장면을 한 번의 생성으로 구현할 수 있습니다.
멀티 레퍼런스 생성은 캐릭터당 하나의 소스 이미지를 여러 장 제공하여, AI 모델이 영상 전체에서 각 인물의 고유한 외모를 유지할 수 있도록 합니다. 모델은 각 레퍼런스를 프롬프트 내 명명된 토큰(예: [person1], [person2])에 매핑하여, 해당 토큰에 얼굴 특징, 체형 비율, 의상을 바인딩합니다. 이는 하나의 정체성만 보존할 수 있는 단일 레퍼런스 모델과 근본적으로 다릅니다. 단일 레퍼런스 모델은 다인 장면에서 보조 캐릭터를 AI가 임의로 생성할 수밖에 없습니다.
HappyHorse는 레퍼런스 이미지를 1~9장까지 수용합니다. 이는 현재 AI 영상 모델 중 가장 높은 수치입니다. 각 레퍼런스는 별도의 캐릭터 토큰에 바인딩되므로, 9명의 서로 다른 인물이 등장하는 단체 장면을 한 번의 생성으로 구현할 수 있습니다.
레퍼런스 이미지는 [person1]부터 [person9]까지의 토큰에 할당됩니다. 프롬프트에서 이 토큰을 사용해 각 캐릭터를 독립적으로 배치하고 지시할 수 있습니다: "[person1]이 [person3]에게 커피잔을 건네는 동안 [person2]는 배경에서 손을 흔든다."
모든 레퍼런스가 동일한 생성 패스에서 로드되기 때문에, 캐릭터들이 자연스럽게 상호작용할 수 있습니다. 악수, 대화, 물건 전달 등이 가능합니다. 단일 레퍼런스 모델은 이를 구현하려면 별도의 클립을 합성해야 합니다.
얼굴 특징, 피부 톤, 헤어스타일, 의상이 첫 프레임부터 클립 끝까지 안정적으로 유지됩니다. 카메라 앵글 변경이나 부분 가림이 있어도 중간에 정체성이 흐트러지지 않습니다.
레퍼런스는 증명사진, 전신 사진, 또는 스타일화된 일러스트 등 다양한 형태를 사용할 수 있습니다. HappyHorse는 소스 이미지 형식에 관계없이 정체성 특징을 추출하지만, 중립적인 표정의 정면 사진이 가장 정확한 결과를 제공합니다.
PonPon 영상으로 이동한 후, 모델 드롭다운에서 HappyHorse를 선택하세요.
레퍼런스 이미지 업로드 영역을 클릭하고 1~9장의 이미지를 추가하세요. 각 이미지는 한 사람의 얼굴이 명확하게 보이는 사진이어야 합니다. 정면을 바라보고, 조명이 밝으며, 가려지는 부분이 최소화된 사진이 좋습니다. 순서(person1, person2 등)를 기록해 두세요.
업로드한 각 이미지를 해당 토큰([person1], [person2] 등)으로 참조하세요. 각 인물의 구체적인 동작을 설명합니다: *"[person1]은 책상에 앉아 타이핑하고, [person2]는 뒤에 서서 화면을 가리키고 있다. [person3]은 폴더를 들고 문으로 들어온다."*
클립 길이와 화면 비율을 선택하세요. 다인 장면에서는 16:9 와이드스크린이 캐릭터 배치에 더 넓은 공간을 제공합니다. 더 긴 재생 시간(8~10초)은 복잡한 상호작용을 표현하는 데 유리합니다.
생성 버튼을 클릭한 후, 각 캐릭터가 클립 전체에서 해당 레퍼런스와 일치하는지 확인하세요. 특정 캐릭터가 흐트러진다면, 더 나은 조명이나 정면 각도의 명확한 레퍼런스 사진을 사용해 보세요.
솔로 크리에이터든, 에이전시든, 브랜드든 — 모든 모델이 당신의 작업 방식에 맞춥니다.
[person1]과 [person2]가 카페 테이블을 사이에 두고 마주 앉아 있다. [person1]은 말하면서 손짓을 하고, [person2]는 고개를 끄덕이며 미소 짓는다. 창문으로 들어오는 따뜻한 오후 햇살. 얕은 피사계 심도. 16:9, 8초.
모델: HappyHorse · 레퍼런스: 이미지 2장 · 재생 시간: 8s · 화면 비율: 16:9
[person1], [person2], [person3], [person4]가 현대적인 사무실 로비에 일렬로 서 있다. 왼쪽부터 순서대로 각자 카메라를 향해 손을 흔든다. 깔끔한 흰색 배경, 전문적인 복장. 16:9, 10초.
모델: HappyHorse · 레퍼런스: 이미지 4장 · 재생 시간: 10s · 화면 비율: 16:9
[person1]은 식탁 상석에 앉아 있고, [person2]와 [person3]은 양쪽에, [person4]는 맞은편 끝에 앉아 있다. [person1]이 건배를 위해 잔을 들어 올리자, 나머지도 따라 한다. 따뜻한 촛불 조명, 소박한 나무 테이블. 16:9, 10초.
모델: HappyHorse · 레퍼런스: 이미지 4장 · 재생 시간: 10s · 화면 비율: 16:9
실험복을 입은 [person1]이 캐주얼 비즈니스 복장의 [person2]에게 제품 박스를 건넨다. [person2]는 박스를 살펴보며 만족스럽게 고개를 끄덕인다. 깔끔한 스튜디오 배경, 부드러운 주 조명. 16:9, 6초.
모델: HappyHorse · 레퍼런스: 이미지 2장 · 재생 시간: 6s · 화면 비율: 16:9
반복 등장하는 출연진이 있는 단편 영화, 웹 시리즈, 설명 영상. 캐릭터 레퍼런스를 한 번 업로드하면 여러 에피소드에 걸쳐 일관된 장면을 생성할 수 있습니다. 촬영 컷 사이의 연속성 오류가 없습니다.
기업 팀 사진을 애니메이션 소개 영상으로 변환하세요. 각 팀원의 증명사진을 업로드하고, 손 흔들기, 악수, 함께 발표하는 등의 장면을 프롬프트로 연출할 수 있습니다.
명절이나 기념일을 위한 맞춤형 가족 영상을 만드세요. 가족 사진을 업로드하면 가족 식사, 생일 파티, 공원 산책 등 각 인물을 알아볼 수 있는 장면을 생성할 수 있습니다.
패션 및 라이프스타일 브랜드는 여러 제품 영상에서 동일한 모델 정체성을 유지할 수 있습니다. 모델의 레퍼런스를 업로드하면, 별도의 촬영 없이도 다양한 의상과 배경에서 모델이 등장하는 영상을 생성할 수 있습니다.
| HappyHorse (레퍼런스 1~9장) | 다른 모델 | |
|---|---|---|
| 최대 레퍼런스 이미지 수 | 세대당 9장 — 각각 별도의 캐릭터 토큰에 바인딩 | Kling 3.0: 레퍼런스 1장. Veo 3.1: 최대 3개 에셋. Seedance 2.0: 레퍼런스 1~2장 |
| 멀티 캐릭터 상호작용 | 모든 캐릭터가 한 번의 패스에서 렌더링 — 참조된 인물들 간의 자연스러운 상호작용 | 단일 레퍼런스 모델은 캐릭터를 각각 생성한 후 합성해야 함 |
| 정체성 바인딩 방식 | 프롬프트 내 명명된 토큰([person1]~[person9]) — 캐릭터별 명시적 제어 | 대부분의 모델은 단일 암묵적 레퍼런스를 사용 — 여러 정체성을 지시하는 방법 없음 |
| 단체 장면 품질 | 각 인물이 레퍼런스 정체성 유지 — 캐릭터 간 얼굴 혼합 없음 | 레퍼런스가 1장인 모델은 보조 캐릭터의 특징이 주인공과 혼합되는 경우가 많음 |
| 적합한 사용 사례 | 다인 서사 영상, 팀 영상, 가족 콘텐츠에 최적 | 단일 피사체 콘텐츠에 더 적합: 인물 사진, 솔로 제품 시연, 독백 |
정체성 추출은 조명이 밝고 정면을 바라보는 증명사진 또는 허리 위 사진에서 가장 잘 작동합니다. 측면 프로필, 선글라스, 강한 그림자는 매칭 정확도를 낮춥니다. 레퍼런스 이미지 한 장에 한 명만 담으세요.
레퍼런스가 많을수록 생성 복잡도가 높아집니다. 프롬프트 구조를 검증하려면 2~3명의 캐릭터로 먼저 시작한 후 늘려가세요. 단일 장면에 5명 이상이 되면 위치 제어가 더 어려워집니다.
여러 캐릭터가 있을 때 모호한 공간 묘사는 혼잡하거나 불명확한 구도를 만들 수 있습니다. 위치를 구체적으로 지정하세요: "[person1]은 왼쪽, [person2]는 중앙, [person3]은 오른쪽."
HappyHorse는 최대 9장의 레퍼런스를 지원하지만, 7~9명이 등장하는 장면은 인물당 시각적 공간이 줄어듭니다. 정체성 정확도는 높게 유지되지만, 프레임이 더 붐비면서 개별 캐릭터의 디테일이 감소합니다.
매일 PonPon을 쓰는 수천 명의 크리에이터, 에이전시, 브랜드와 함께하세요.