AI メディア用語集

PonPon で出会う AI 画像・動画・音声の用語をやさしく定義——アスペクト比やインペインティングから、リップシンク、ネイティブ音声、枠、テキストから動画まで。

AI メディアの語彙を、やさしい言葉で。各項目は、さらに深掘りするガイドへリンクしています。

A–C

Allowance（枠）——プランに含まれ、サイクルごとにリフレッシュするクレジット；何よりも先に消費されます。クレジットとプランを参照。

Aspect ratio（アスペクト比）——フレームの形（16:9、9:16、1:1）。出力ごとに選ぶ；出力形式と制限を参照。

Batch（バッチ）——ベストを選ぶために複数の画像を一度に生成すること。出力形式と制限を参照。

Credits（クレジット）——生成ごとに消費するもの；コストはモデル・長さ・解像度による。クレジットとプランを参照。

D–L

Denoise（ノイズ除去）——録り直す前に音声素材から背景ノイズを取り除くこと。音楽・効果音・会話を参照。

Dubbing（吹き替え）——既存の音声や動画を別の言語に翻訳・再録すること。AI 吹き替えを参照。

Effect（エフェクト）——写真をテーマ付きのクリップに変えるワンタップのテンプレート。ワンタップの Effectsを参照。

Gallery（ギャラリー）——生成した結果が集まり、再利用・編集・別ツールへの持ち込みができる場所。画像生成の基本を参照。

Guest（ゲスト）——サインイン前の閲覧；探索はできるが生成はできない。アカウントとサインインを参照。

Image-to-video（画像から動画）——自分で渡した静止画を動かすこと。画像から動画ガイドを参照。

Inpainting（注釈編集）——画像のマークした領域だけを再生成すること。注釈編集と参照画像を参照。

Instrumental（インストゥルメンタル）——ボーカルなしで生成した音楽、ナレーションの下に収まる。音楽・効果音・会話を参照。

Lip-sync（リップシンク）——キャラクターの口を音声トラックに合わせること。トーキングアバターとリップシンクを参照。

M–R

Model（モデル）——生成を行うエンジン；それぞれ強みが違う。モデルの選び方を参照。

Motion brush（モーションブラシ）——ショットの中で動きを起こす領域を塗ること、より細かく制御するため。Kling 3.0 のモーションブラシを参照。

Motion control（モーションコントロール）——参照動画の動きで静止したキャラクターを動かすこと。テキストから動画の基本を参照。

Multi-shot（マルチショット）——1 回の動画生成で生み出される複数のカメラカット。Kling 3.0 のマルチショットと動画のプロンプト術を参照。

Native audio（ネイティブ音声）——音声対応の動画モデルが映像と一緒に生成する音、Veo 3.1 のネイティブ音声など。モデルの選び方を参照。

Negative space（余白）——あとで文字を置くためなどに、画像に残した空きの領域。画像のプロンプト術を参照。

Prompt（プロンプト）——生成を導くテキストの説明。画像のプロンプト術と動画のプロンプト術を参照。

Queue（キュー）——負荷が高いときの短い待ち；Pro 段階は優先される。生成のトラブルシューティングを参照。

Reference image（参照画像）——スタイル・被写体・構図を導く添付画像；@ で 1 枚に言及できる。注釈編集と参照画像を参照。

Reference-to-video（参照から動画）——参照メディアから被写体やスタイルを、生成するクリップに持ち込むこと。テキストから動画の基本を参照。

Resolution（解像度）——出力のピクセルサイズ（例：画像なら 1K〜4K）；モデルに依存する。出力形式と制限を参照。

Reward credits（リワードクレジット）——期限切れになりうるボーナスクレジット；枠の後、チャージの前に消費される。クレジットとプランを参照。

S–Z

Start / end frame（開始／終了フレーム）——動画の最初の（任意で最後の）画像；モデルはそこから動かす。画像から動画ガイドを参照。

Text-to-image（テキストから画像）——書いた説明から画像を生成すること。画像生成の基本を参照。

Text-to-video（テキストから動画）——書いた説明からクリップを生成すること。テキストから動画 AI とは？を参照。

Upscaling（アップスケール）——既存の画像や動画の解像度と細部を上げること。編集とクリーンアップツールを参照。

Voice changer（ボイスチェンジャー）——元のタイミングを保ったまま、録音を別のボイスで録り直すこと。音楽・効果音・会話を参照。

Voiceover（ナレーション／テキスト読み上げ）——台本から発話音声を生成すること。ナレーションと音声の基本を参照。

用語が見つからない？FAQがよくある質問を扱います。

AI メディア用語集

AI メディアの語彙を、やさしい言葉で。各項目は、さらに深掘りするガイドへリンクしています。

A–C

Allowance（枠）——プランに含まれ、サイクルごとにリフレッシュするクレジット；何よりも先に消費されます。クレジットとプランを参照。

Aspect ratio（アスペクト比）——フレームの形（16:9、9:16、1:1）。出力ごとに選ぶ；出力形式と制限を参照。

Batch（バッチ）——ベストを選ぶために複数の画像を一度に生成すること。出力形式と制限を参照。

Credits（クレジット）——生成ごとに消費するもの；コストはモデル・長さ・解像度による。クレジットとプランを参照。

D–L

Denoise（ノイズ除去）——録り直す前に音声素材から背景ノイズを取り除くこと。音楽・効果音・会話を参照。

Dubbing（吹き替え）——既存の音声や動画を別の言語に翻訳・再録すること。AI 吹き替えを参照。

Effect（エフェクト）——写真をテーマ付きのクリップに変えるワンタップのテンプレート。ワンタップの Effectsを参照。

Gallery（ギャラリー）——生成した結果が集まり、再利用・編集・別ツールへの持ち込みができる場所。画像生成の基本を参照。

Guest（ゲスト）——サインイン前の閲覧；探索はできるが生成はできない。アカウントとサインインを参照。

Image-to-video（画像から動画）——自分で渡した静止画を動かすこと。画像から動画ガイドを参照。

Inpainting（注釈編集）——画像のマークした領域だけを再生成すること。注釈編集と参照画像を参照。

Instrumental（インストゥルメンタル）——ボーカルなしで生成した音楽、ナレーションの下に収まる。音楽・効果音・会話を参照。

Lip-sync（リップシンク）——キャラクターの口を音声トラックに合わせること。トーキングアバターとリップシンクを参照。

M–R

Model（モデル）——生成を行うエンジン；それぞれ強みが違う。モデルの選び方を参照。

Motion brush（モーションブラシ）——ショットの中で動きを起こす領域を塗ること、より細かく制御するため。Kling 3.0 のモーションブラシを参照。

Motion control（モーションコントロール）——参照動画の動きで静止したキャラクターを動かすこと。テキストから動画の基本を参照。

Multi-shot（マルチショット）——1 回の動画生成で生み出される複数のカメラカット。Kling 3.0 のマルチショットと動画のプロンプト術を参照。

Native audio（ネイティブ音声）——音声対応の動画モデルが映像と一緒に生成する音、Veo 3.1 のネイティブ音声など。モデルの選び方を参照。

Negative space（余白）——あとで文字を置くためなどに、画像に残した空きの領域。画像のプロンプト術を参照。

Prompt（プロンプト）——生成を導くテキストの説明。画像のプロンプト術と動画のプロンプト術を参照。

Queue（キュー）——負荷が高いときの短い待ち；Pro 段階は優先される。生成のトラブルシューティングを参照。

Reference image（参照画像）——スタイル・被写体・構図を導く添付画像；@ で 1 枚に言及できる。注釈編集と参照画像を参照。

Reference-to-video（参照から動画）——参照メディアから被写体やスタイルを、生成するクリップに持ち込むこと。テキストから動画の基本を参照。

Resolution（解像度）——出力のピクセルサイズ（例：画像なら 1K〜4K）；モデルに依存する。出力形式と制限を参照。

S–Z

Start / end frame（開始／終了フレーム）——動画の最初の（任意で最後の）画像；モデルはそこから動かす。画像から動画ガイドを参照。

Text-to-image（テキストから画像）——書いた説明から画像を生成すること。画像生成の基本を参照。

Text-to-video（テキストから動画）——書いた説明からクリップを生成すること。テキストから動画 AI とは？を参照。

Upscaling（アップスケール）——既存の画像や動画の解像度と細部を上げること。編集とクリーンアップツールを参照。

Voice changer（ボイスチェンジャー）——元のタイミングを保ったまま、録音を別のボイスで録り直すこと。音楽・効果音・会話を参照。

Voiceover（ナレーション／テキスト読み上げ）——台本から発話音声を生成すること。ナレーションと音声の基本を参照。

用語が見つからない？FAQがよくある質問を扱います。

AI メディア用語集

A–C

D–L

M–R

S–Z

関連記事

AI メディア用語集

A–C

D–L

M–R

S–Z

関連記事