Bảng thuật ngữ AI media

Giải thích đơn giản các thuật ngữ về hình ảnh, video và âm thanh AI mà bạn sẽ gặp trên PonPon — từ tỷ lệ khung hình, inpainting đến lip-sync, native audio, allowance và text-to-video.

Từ vựng về AI media, giải thích theo ngôn ngữ thông thường. Mỗi mục đều có liên kết đến hướng dẫn chi tiết hơn.

A–C

Allowance — số credits đi kèm với gói của bạn, tự động làm mới mỗi chu kỳ; được dùng trước tất cả các loại credits khác. Xem Credits và các gói.

Aspect ratio — hình dạng của khung hình (16:9, 9:16, 1:1). Chọn theo từng đầu ra; xem Định dạng đầu ra và giới hạn.

Batch — tạo nhiều hình ảnh cùng lúc để chọn ra cái tốt nhất. Xem Định dạng đầu ra và giới hạn.

Credits — đơn vị bạn chi tiêu cho mỗi lần tạo nội dung; chi phí phụ thuộc vào model, độ dài và độ phân giải. Xem Credits và các gói.

D–L

Denoise — loại bỏ tiếng ồn nền khỏi nguồn âm thanh trước khi lồng giọng lại. Xem Nhạc, hiệu ứng âm thanh & hội thoại.

Dubbing — dịch và lồng tiếng âm thanh hoặc video hiện có sang ngôn ngữ khác. Xem Lồng tiếng AI.

Effect — mẫu chỉ cần một chạm để biến ảnh thành đoạn video theo chủ đề. Xem Effects một chạm.

Gallery — nơi lưu trữ các kết quả đã tạo, sẵn sàng để tái sử dụng, chỉnh sửa hoặc đưa vào công cụ khác. Xem Cơ bản về tạo hình ảnh.

Guest — duyệt xem trước khi đăng nhập; bạn có thể khám phá nhưng chưa thể tạo nội dung. Xem Tài khoản và đăng nhập.

Image-to-video — tạo hoạt ảnh từ một hình ảnh tĩnh bạn cung cấp. Xem Hướng dẫn image-to-video.

Inpainting (annotate-edit) — tái tạo chỉ một vùng đã được đánh dấu trong hình ảnh. Xem Chỉnh sửa annotate & ảnh tham chiếu.

Instrumental — nhạc được tạo ra không có giọng hát, phù hợp để làm nền cho lời thoại. Xem Nhạc, hiệu ứng âm thanh & hội thoại.

Lip-sync — khớp miệng nhân vật với một bản âm thanh. Xem Avatar nói chuyện & lip-sync.

M–R

Model — bộ máy thực hiện việc tạo nội dung; mỗi model có điểm mạnh riêng. Xem Chọn model.

Motion brush — vẽ vùng trong cảnh quay mà chuyển động nên xảy ra, giúp kiểm soát tinh tế hơn. Xem Kling 3.0 motion brush.

Motion control — điều khiển nhân vật tĩnh bằng chuyển động từ video tham chiếu. Xem Cơ bản về text-to-video.

Multi-shot — nhiều cảnh quay được tạo ra trong một lần tạo video. Xem Kling 3.0 multi-shot và Prompting cho video.

Native audio — âm thanh được tạo cùng lúc với hình ảnh bởi model video có khả năng xử lý âm thanh, như Veo 3.1 native audio. Xem Chọn model.

Negative space — vùng trống được để lại trong hình ảnh, thường dùng để đặt văn bản sau đó. Xem Prompting cho hình ảnh.

Prompt — mô tả văn bản định hướng quá trình tạo nội dung. Xem Prompting cho hình ảnh và Prompting cho video.

Queue — thời gian chờ ngắn khi tải cao; các gói Pro được ưu tiên. Xem Khắc phục sự cố khi tạo nội dung.

Reference image — hình ảnh đính kèm định hướng phong cách, chủ thể hoặc bố cục; đề cập bằng @. Xem Chỉnh sửa annotate & ảnh tham chiếu.

Reference-to-video — đưa chủ thể hoặc phong cách từ tài liệu tham chiếu vào đoạn video được tạo. Xem Cơ bản về text-to-video.

Resolution — kích thước pixel của đầu ra (ví dụ: 1K–4K cho hình ảnh); phụ thuộc vào model. Xem Định dạng đầu ra và giới hạn.

Reward credits — credits thưởng có thể hết hạn; được dùng sau allowance nhưng trước top-up. Xem Credits và các gói.

S–Z

Start / end frame — hình ảnh đầu tiên (và tùy chọn hình ảnh cuối cùng) của video; model tạo hoạt ảnh từ đó. Xem Hướng dẫn image-to-video.

Text-to-image — tạo hình ảnh từ mô tả văn bản. Xem Cơ bản về tạo hình ảnh.

Text-to-video — tạo đoạn video từ mô tả văn bản. Xem Text-to-video AI là gì?.

Upscaling — tăng độ phân giải và chi tiết của hình ảnh hoặc video hiện có. Xem Công cụ chỉnh sửa & làm sạch.

Voice changer — lồng giọng lại bản ghi âm bằng một giọng khác trong khi giữ nguyên thời gian gốc. Xem Nhạc, hiệu ứng âm thanh & hội thoại.

Voiceover (text-to-speech) — tạo âm thanh giọng nói từ kịch bản. Xem Cơ bản về voiceover và âm thanh.

Không tìm thấy thuật ngữ bạn cần? FAQ có giải đáp các câu hỏi thường gặp.