ภาพอ้างอิงสูงสุด 9 ภาพต่อการสร้างหนึ่งครั้ง
HappyHorse รับภาพอ้างอิงได้ 1 ถึง 9 ภาพ — จำนวนสูงสุดในบรรดาโมเดลวิดีโอ AI ปัจจุบัน ภาพอ้างอิงแต่ละภาพจะผูกกับ character token แยกกัน ทำให้ฉากกลุ่มที่มี 9 คนที่แตกต่างกันเป็นไปได้ในการสร้างครั้งเดียว
การสร้างวิดีโอแบบ multi-reference ช่วยให้คุณระบุภาพต้นฉบับหลายภาพ — หนึ่งภาพต่อหนึ่งตัวละคร — เพื่อให้โมเดล AI รักษาลักษณะเฉพาะของแต่ละบุคคลตลอดทั้งวิดีโอ โมเดลจะจับคู่ภาพอ้างอิงแต่ละภาพกับ token ที่ตั้งชื่อไว้ (เช่น [person1], [person2]) ใน prompt โดยผูกลักษณะใบหน้า สัดส่วนร่างกาย และเสื้อผ้าเข้ากับ token นั้น ซึ่งแตกต่างจากโมเดล single-reference ที่รักษาเอกลักษณ์ได้เพียงคนเดียว ทำให้ฉากที่มีหลายคนต้องสร้างตัวละครรองขึ้นมาเองโดยไม่มีต้นแบบ
HappyHorse รับภาพอ้างอิงได้ 1 ถึง 9 ภาพ — จำนวนสูงสุดในบรรดาโมเดลวิดีโอ AI ปัจจุบัน ภาพอ้างอิงแต่ละภาพจะผูกกับ character token แยกกัน ทำให้ฉากกลุ่มที่มี 9 คนที่แตกต่างกันเป็นไปได้ในการสร้างครั้งเดียว
ภาพอ้างอิงถูกกำหนดให้กับ token เช่น [person1] ถึง [person9] ใช้ token เหล่านี้ใน prompt เพื่อจัดวางและกำกับแต่ละตัวละครอย่างเป็นอิสระ: "[person1] ส่งแก้วกาแฟให้ [person3] ขณะที่ [person2] โบกมือจากด้านหลัง"
เนื่องจากภาพอ้างอิงทั้งหมดถูกโหลดในการสร้างครั้งเดียวกัน ตัวละครจึงโต้ตอบกันได้อย่างเป็นธรรมชาติ — จับมือ สนทนา ส่งต่อสิ่งของ โมเดล single-reference ต้องนำคลิปแยกมาตัดต่อเพื่อให้ได้ผลลัพธ์เดียวกัน
ลักษณะใบหน้า โทนผิว ทรงผม และเสื้อผ้า คงที่ตั้งแต่เฟรมแรกจนจบคลิป ไม่มีการเปลี่ยนแปลงเอกลักษณ์กลางคลิป แม้มีการเปลี่ยนมุมกล้องหรือมีการบดบังบางส่วน
ภาพอ้างอิงสามารถเป็นภาพใบหน้า ภาพเต็มตัว หรือภาพประกอบแนวศิลป์ก็ได้ HappyHorse ดึงคุณลักษณะเอกลักษณ์โดยไม่คำนึงถึงรูปแบบภาพต้นฉบับ แต่ภาพหน้าตรงที่มีสีหน้าเป็นกลางให้ผลที่แม่นยำที่สุด
ไปที่ PonPon Video แล้วเลือก HappyHorse จากเมนูเลือกโมเดล
คลิกพื้นที่อัปโหลดภาพอ้างอิงแล้วเพิ่มภาพ 1 ถึง 9 ภาพ แต่ละภาพควรแสดงใบหน้าของบุคคลหนึ่งคนอย่างชัดเจน — หน้าตรง แสงดี บดบังน้อย บันทึกลำดับไว้ (person1, person2 เป็นต้น)
อ้างอิงภาพที่อัปโหลดแต่ละภาพด้วย token ของมัน: [person1], [person2] เป็นต้น อธิบายฉากพร้อมการกระทำเฉพาะของแต่ละคน: *"[person1] นั่งที่โต๊ะพิมพ์งาน ขณะที่ [person2] ยืนอยู่ด้านหลังชี้ที่หน้าจอ [person3] เดินเข้ามาทางประตูถือแฟ้มเอกสาร"*
เลือกความยาวคลิปและอัตราส่วนภาพ สำหรับฉากหลายตัวละคร 16:9 widescreen ให้พื้นที่สำหรับจัดวางตัวละครได้มากกว่า ความยาวนานขึ้น (8–10 วินาที) ช่วยให้มีการโต้ตอบที่ซับซ้อนมากขึ้น
คลิก Generate แล้วตรวจสอบว่าแต่ละตัวละครตรงกับภาพอ้างอิงตลอดคลิป หากตัวละครคนใดเปลี่ยนแปลง ลองใช้ภาพอ้างอิงที่ชัดเจนกว่าโดยมีแสงดีกว่าหรือมุมหน้าตรงมากขึ้น
ไม่ว่าคุณจะเป็นครีเอเตอร์คนเดียว เอเจนซี หรือแบรนด์ — ทุกโมเดลปรับตัวให้เข้ากับวิธีทำงานของคุณ
[person1] และ [person2] นั่งตรงข้ามกันที่โต๊ะร้านกาแฟ [person1] ใช้มือประกอบการพูด [person2] พยักหน้าและยิ้ม แสงบ่ายอบอุ่นผ่านหน้าต่าง ระยะชัดตื้น 16:9, 8 วินาที
Model: HappyHorse · References: 2 images · Duration: 8s · Aspect: 16:9
[person1], [person2], [person3] และ [person4] ยืนเรียงแถวในล็อบบี้สำนักงานทันสมัย แต่ละคนโบกมือหาเลนส์ตามลำดับจากซ้ายไปขวา พื้นหลังสีขาวสะอาด ชุดแต่งกายมืออาชีพ 16:9, 10 วินาที
Model: HappyHorse · References: 4 images · Duration: 10s · Aspect: 16:9
[person1] นั่งที่หัวโต๊ะอาหาร [person2] และ [person3] อยู่สองข้าง [person4] อยู่ปลายโต๊ะ [person1] ยกแก้วดื่มฉลอง คนอื่นๆ ทำตาม เทียนไขอบอุ่น โต๊ะไม้สไตล์รัสติก 16:9, 10 วินาที
Model: HappyHorse · References: 4 images · Duration: 10s · Aspect: 16:9
[person1] สวมเสื้อกาวน์ห้องแล็บส่งกล่องสินค้าให้ [person2] ที่แต่งชุด business casual [person2] ตรวจสอบกล่องและพยักหน้าแสดงความพอใจ พื้นหลัง studio สะอาด แสง key light นุ่มนวล 16:9, 6 วินาที
Model: HappyHorse · References: 2 images · Duration: 6s · Aspect: 16:9
ภาพยนตร์สั้น ซีรีส์เว็บ และวิดีโออธิบายที่มีนักแสดงประจำ อัปโหลดภาพอ้างอิงตัวละครครั้งเดียวแล้วสร้างฉากที่สม่ำเสมอตลอดทุกตอน — ไม่มีข้อผิดพลาดด้านความต่อเนื่องระหว่างช็อต
เปลี่ยนภาพถ่ายทีมองค์กรให้กลายเป็นวิดีโอแนะนำแบบแอนิเมชัน อัปโหลดภาพใบหน้าแยกกันของสมาชิกทีมแต่ละคน แล้วกำหนดฉากที่พวกเขาโต้ตอบกัน — โบกมือ จับมือ หรือนำเสนอร่วมกัน
สร้างวิดีโอครอบครัวส่วนตัวสำหรับวันหยุดหรืองานเฉลิมฉลอง อัปโหลดภาพสมาชิกในครอบครัวแล้วสร้างฉากต่างๆ เช่น ครอบครัวรับประทานอาหารค่ำ งานวันเกิด หรือเดินเล่นในสวน — แต่ละคนจดจำได้
แบรนด์แฟชั่นและไลฟ์สไตล์สามารถรักษาเอกลักษณ์ของนางแบบคนเดิมในวิดีโอสินค้าหลายรายการ อัปโหลดภาพอ้างอิงของนางแบบแล้วสร้างภาพสวมชุดต่างกันในสภาพแวดล้อมต่างกันโดยไม่ต้องนัดถ่ายซ้ำ
| HappyHorse (1-9 references) | โมเดลอื่น | |
|---|---|---|
| ภาพอ้างอิงสูงสุด | 9 ภาพต่อการสร้างหนึ่งครั้ง — แต่ละภาพผูกกับ character token แยกกัน | Kling 3.0: 1 ภาพอ้างอิง Veo 3.1: สูงสุด 3 assets Seedance 2.0: 1–2 ภาพอ้างอิง |
| การโต้ตอบระหว่างหลายตัวละคร | ตัวละครทั้งหมดถูกเรนเดอร์ในการผ่านเดียว — การโต้ตอบตามธรรมชาติระหว่างบุคคลที่มีภาพอ้างอิง | โมเดล single-reference ต้องสร้างตัวละครแยกกันแล้วนำมาตัดต่อรวมกัน |
| วิธีผูกเอกลักษณ์ | Named token ([person1]–[person9]) ใน prompt — ควบคุมแต่ละตัวละครอย่างชัดเจน | โมเดลส่วนใหญ่ใช้ภาพอ้างอิงเดียวแบบ implicit — ไม่มีวิธีกำกับหลายเอกลักษณ์ |
| คุณภาพฉากกลุ่ม | แต่ละคนรักษาเอกลักษณ์จากภาพอ้างอิง — ไม่มีการผสมใบหน้าระหว่างตัวละคร | โมเดลที่มีภาพอ้างอิงเดียวมักผสมลักษณะตัวละครรองเข้ากับตัวละครหลัก |
| ความเหมาะสมกับกรณีใช้งาน | เหมาะที่สุดสำหรับเรื่องราวหลายบุคคล วิดีโอทีม เนื้อหาครอบครัว | เหมาะกว่าสำหรับเนื้อหาตัวละครเดียว: ภาพบุคคล demo สินค้าเดี่ยว การพูดคนเดียว |
การดึงเอกลักษณ์ทำงานได้ดีที่สุดกับภาพใบหน้าหรือภาพท่อนบนที่มีแสงดีและหน้าตรง ภาพด้านข้าง แว่นกันแดด หรือเงามืดมากลดความแม่นยำของการจับคู่ ใช้หนึ่งคนต่อภาพอ้างอิงหนึ่งภาพ
ภาพอ้างอิงยิ่งมากยิ่งเพิ่มความซับซ้อนในการสร้าง เริ่มด้วยตัวละคร 2–3 ตัวเพื่อตรวจสอบโครงสร้าง prompt แล้วค่อยเพิ่ม เกิน 5 ตัวละครในฉากเดียว การควบคุมการจัดวางจะยากขึ้น
เมื่อมีหลายตัวละคร การอธิบายตำแหน่งที่คลุมเครือทำให้องค์ประกอบอัดแน่นหรือไม่ชัดเจน ระบุตำแหน่ง: "[person1] ทางซ้าย [person2] ตรงกลาง [person3] ทางขวา"
แม้ HappyHorse รองรับสูงสุด 9 ภาพอ้างอิง ฉากที่มี 7–9 ตัวละครจะเหลือพื้นที่ภาพต่อคนน้อยลง ความแม่นยำของเอกลักษณ์ยังคงสูง แต่รายละเอียดของแต่ละตัวละครลดลงเมื่อเฟรมแน่นขึ้น
เข้าร่วมกับครีเอเตอร์ เอเจนซี และแบรนด์นับพันที่ใช้ PonPon ทุกวัน
เริ่มต้นด้วยเครดิตฟรีรายวัน ไม่ต้องใช้บัตรเครดิต