AI メディア用語集
PonPon で出会う AI 画像・動画・音声の用語をやさしく定義——アスペクト比やインペインティングから、リップシンク、ネイティブ音声、枠、テキストから動画まで。
AI メディアの語彙を、やさしい言葉で。各項目は、さらに深掘りするガイドへリンクしています。
A–C
Allowance(枠)——プランに含まれ、サイクルごとにリフレッシュするクレジット;何よりも先に消費されます。クレジットとプランを参照。
Aspect ratio(アスペクト比)——フレームの形(16:9、9:16、1:1)。出力ごとに選ぶ;出力形式と制限を参照。
Batch(バッチ)——ベストを選ぶために複数の画像を一度に生成すること。出力形式と制限を参照。
Credits(クレジット)——生成ごとに消費するもの;コストはモデル・長さ・解像度による。クレジットとプランを参照。
D–L
Denoise(ノイズ除去)——録り直す前に音声素材から背景ノイズを取り除くこと。音楽・効果音・会話を参照。
Dubbing(吹き替え)——既存の音声や動画を別の言語に翻訳・再録すること。AI 吹き替えを参照。
Effect(エフェクト)——写真をテーマ付きのクリップに変えるワンタップのテンプレート。ワンタップの Effectsを参照。
Gallery(ギャラリー)——生成した結果が集まり、再利用・編集・別ツールへの持ち込みができる場所。画像生成の基本を参照。
Guest(ゲスト)——サインイン前の閲覧;探索はできるが生成はできない。アカウントとサインインを参照。
Image-to-video(画像から動画)——自分で渡した静止画を動かすこと。画像から動画ガイドを参照。
Inpainting(注釈編集)——画像のマークした領域だけを再生成すること。注釈編集と参照画像を参照。
Instrumental(インストゥルメンタル)——ボーカルなしで生成した音楽、ナレーションの下に収まる。音楽・効果音・会話を参照。
Lip-sync(リップシンク)——キャラクターの口を音声トラックに合わせること。トーキングアバターとリップシンクを参照。
M–R
Model(モデル)——生成を行うエンジン;それぞれ強みが違う。モデルの選び方を参照。
Motion brush(モーションブラシ)——ショットの中で動きを起こす領域を塗ること、より細かく制御するため。Kling 3.0 のモーションブラシを参照。
Motion control(モーションコントロール)——参照動画の動きで静止したキャラクターを動かすこと。テキストから動画の基本を参照。
Multi-shot(マルチショット)——1 回の動画生成で生み出される複数のカメラカット。Kling 3.0 のマルチショットと動画のプロンプト術を参照。
Native audio(ネイティブ音声)——音声対応の動画モデルが映像と一緒に生成する音、Veo 3.1 のネイティブ音声など。モデルの選び方を参照。
Negative space(余白)——あとで文字を置くためなどに、画像に残した空きの領域。画像のプロンプト術を参照。
Prompt(プロンプト)——生成を導くテキストの説明。画像のプロンプト術と動画のプロンプト術を参照。
Queue(キュー)——負荷が高いときの短い待ち;Pro 段階は優先される。生成のトラブルシューティングを参照。
Reference image(参照画像)——スタイル・被写体・構図を導く添付画像;@ で 1 枚に言及できる。注釈編集と参照画像を参照。
Reference-to-video(参照から動画)——参照メディアから被写体やスタイルを、生成するクリップに持ち込むこと。テキストから動画の基本を参照。
Resolution(解像度)——出力のピクセルサイズ(例:画像なら 1K〜4K);モデルに依存する。出力形式と制限を参照。
Reward credits(リワードクレジット)——期限切れになりうるボーナスクレジット;枠の後、チャージの前に消費される。クレジットとプランを参照。
S–Z
Start / end frame(開始/終了フレーム)——動画の最初の(任意で最後の)画像;モデルはそこから動かす。画像から動画ガイドを参照。
Text-to-image(テキストから画像)——書いた説明から画像を生成すること。画像生成の基本を参照。
Text-to-video(テキストから動画)——書いた説明からクリップを生成すること。テキストから動画 AI とは?を参照。
Upscaling(アップスケール)——既存の画像や動画の解像度と細部を上げること。編集とクリーンアップツールを参照。
Voice changer(ボイスチェンジャー)——元のタイミングを保ったまま、録音を別のボイスで録り直すこと。音楽・効果音・会話を参照。
Voiceover(ナレーション/テキスト読み上げ)——台本から発話音声を生成すること。ナレーションと音声の基本を参照。
用語が見つからない?FAQがよくある質問を扱います。