クリエイティブ 2026.04.12

縦型動画のBGM・音声設計|
ミュートでも伝わる+音ありで刺さる両立法

縦型動画広告において、音声設計は「成果を2倍にも半分にもする」要素です。ミュートで視聴されるケースと音ありで視聴されるケース、その両方に対応するBGM・ナレーション・効果音の設計原則を、実務で使えるレベルまで落とし込んで解説します。

この記事のポイント

  • 縦型動画はミュート視聴と音あり視聴の二層設計が前提。字幕で情報を完結させつつ、音ありで没入感を足す構造が基本
  • BGMはジャンル選定・音量バランス・変化点の3要素で決まる。トレンド音源は商用ライセンス(Commercial Music Library)の範囲で活用する
  • ナレーションは「最初の1秒で耳を掴む」声質・トーン設計が鍵。AI音声とプロ収録の使い分けで量産とクオリティを両立できる

なぜ縦型動画で「音声設計」が成果を左右するのか

縦型動画広告のパフォーマンスを分析すると、同じ映像・同じ脚本でも音声設計を変えただけでCTRが1.5〜2倍変わるケースは珍しくありません。視聴者は映像と音声を別々に処理しているのではなく、両方を統合して「この動画は自分に関係があるか」を0.5秒単位で判断しているためです。

特に縦型動画の特徴として、視聴環境が極めて多様である点が挙げられます。通勤電車でイヤホンなし、自宅のベッドで音あり、職場の休憩時間にミュートで、など一人のユーザーが場面ごとに視聴モードを切り替えます。どのモードでも離脱させない設計が、成果を安定させる前提条件になります。

視聴モード別の特性

  • ミュート視聴:Instagram Reels・Facebook/Instagramフィードでは自動再生時にミュートで始まることが多い。字幕・テロップが情報伝達の主役になる
  • 音あり視聴:TikTokは標準で音ありの再生。BGM・ナレーションが感情のトリガーとなり、視聴完了率を押し上げる
  • ミックス視聴:ミュートで始まり途中で音ありに切り替わるケース。切り替え後でも違和感なく没入できる設計が求められる

BGM設計の基本原則

ジャンル選定は「感情の方向性」で決める

BGMを選ぶ際、テンポやBPMから入るのではなく、まず視聴後にどんな感情を持ってほしいかから逆算するのが定石です。

  • ワクワク・高揚感:アップテンポなポップ・EDM系。新商品発表、イベント告知、エンタメ系商材に合う
  • 安心・信頼感:ミドルテンポのアコースティック、ピアノ主体。金融・不動産・医療など信頼性が鍵の商材に
  • 切迫感・緊張感:ドラマチックなストリングス、パーカッション強め。問題提起型の訴求、比較訴求に効く
  • 共感・ノスタルジー:柔らかいローファイ、アンビエント系。マッチングアプリ、女性向け商材で成果が出やすい

音量バランスの3段階ルール

BGMが大きすぎるとナレーションが埋もれ、小さすぎると感情が乗りません。実務では以下の3段階で設計します。

  1. 冒頭2秒:BGMをやや大きめにして耳を引く。フックと同時に印象的な音を当てる
  2. 本文パート:ナレーションやセリフが流れる区間はBGMを-12dB〜-18dB程度下げる。情報伝達が最優先
  3. 締め(CTA直前):再度BGMを前に出して感情を盛り上げ、行動喚起の勢いを作る

全体のラウドネスは-14LUFS前後を目安にマスタリングすると、多くの配信プラットフォームで音量が安定します。音量が不均一な動画は視聴ストレスが高く、途中離脱の原因になります。

「BGMだけで15秒もたせる」は危険:BGMが主役になるクリエイティブは一見おしゃれに見えますが、縦型動画広告では情報密度が不足しやすく、完視聴率もCVRも伸びにくい傾向があります。BGMはあくまで感情のベース。情報を運ぶのは字幕とナレーションという役割分担を崩さないことが重要です。

トレンド音源の活用と著作権対応

TikTokのオーガニック投稿では、アプリ内のトレンド音源を自由に使えます。しかし、広告出稿になると話は別です。広告で使用できるのは、TikTokのCommercial Music Library(商用音楽ライブラリ)に登録された楽曲、または自社が権利を持つオリジナル楽曲のみです。

著作権・商用利用の観点で押さえるべきポイントは以下の通りです。

  • トレンド曲をそのまま広告に使うのはNG:広告停止・アカウント制限のリスクがある
  • ストックサービスの利用:Artlist・Epidemic Sound・Audiostock等の商用ライセンス付き音源が現実的
  • オリジナルBGM制作:ブランド世界観を統一したい場合、数本の共通BGMをオーダー制作する選択肢もある
  • 配信面ごとのライセンス確認:TikTokで使えてもYouTube Shortsで使えない、といったケースがあるため配信先ごとに要確認

ナレーション(音声)設計の実践

声質・トーンで「刺さる層」が決まる

同じ台本でもナレーションの声質を変えると、届く層が大きく変わります。

  • 20代女性の明るい声:コスメ・マッチング・エンタメ系アプリ。親近感と憧れの両立
  • 30代男性の落ち着いた声:金融・ビジネス・転職。信頼感・専門性の演出
  • 低めのナレーター調:比較・検証系コンテンツ。「調べてみた」「試してみた」の客観性を強調
  • 関西弁・方言:親しみやすさを前面に。商材と地域性のマッチ次第で強力

同じ訴求軸の台本でも、ナレーションの声質を3〜4パターン振り分けてテストすることで、商材と相性の良い声を見つけられます。これはクリエイティブ量産において極めてコスパの良いA/Bテスト項目です。

AI音声とプロ収録の使い分け

近年はAI音声合成の品質が飛躍的に向上し、広告現場でも実用レベルで使われています。ただし万能ではなく、使い分けの判断基準を持つことが重要です。

  • AI音声が向くケース:台本を大量に量産しテストしたい、短納期、情報解説系で感情抑揚が強く不要な場合
  • プロ収録が向くケース:感情の起伏が勝負になる訴求、ブランド認知が重要な商材、長期運用で同一声を使い続けるケース
  • 併用パターン:初期テストはAI音声で勝ちパターンを見つけ、本運用でプロ収録に差し替えて完視聴率を伸ばす

「最初の1秒」の音設計

視覚のフックと同様、聴覚にも1秒以内のフックが必要です。効果的な開始パターンとして以下が挙げられます。

  • 質問投げかけ:「〇〇で困ってませんか?」を強めのトーンで入れる
  • 数字読み上げ:「3日で結果が出た方法」を冒頭で断言
  • 効果音先行:ベル音、通知音、ドラム音などで注意を引いてからナレーション開始
  • 無音からの切り込み:0.3秒の無音を挟んでからBGMとナレーションを同時スタート。コントラストで耳を掴む

効果音(SE)で完視聴率を伸ばす

BGMとナレーションに加えて、効果音(SE)を適所に配置することで視聴者の集中を途切れさせない設計が可能になります。

  • テロップ出現時のポップ音:字幕が切り替わるタイミングで軽い「ポン」「シャキン」音を当てると視線が誘導される
  • シーン転換のスウィッシュ音:カット切り替えに合わせて配置。テンポ感が生まれ離脱が減る
  • 強調したい数字での効果音:「1,000円」「50%OFF」等の数字をナレーションで言う瞬間に効果音で強調
  • CTA直前のアクセント音:行動喚起を際立たせ、クリック率を押し上げる

SEは入れすぎると逆にノイズになり、うるさい動画という印象を与えます。1本あたり5〜8個程度に絞り、重要なポイントにだけ配置するのが基本です。

ミュート対応の具体的なチェックリスト

音を消した状態で動画を再生し、以下の項目をすべてクリアできるかを納品前に必ず確認します。

  1. 冒頭2秒で訴求内容が字幕で分かる(映像だけでも商材ジャンルが伝わるか)
  2. 本編の情報がすべてテロップで提示されている(ナレーションだけで語られている要素がないか)
  3. CTAが視覚的に明示されている(「今すぐダウンロード」等のボタン表示・テロップ)
  4. 字幕のフォントサイズ・可読性が小型スマホ画面でも問題ない
  5. 重要な数字・固有名詞が字幕で目立つ装飾になっているか(色替え・強調枠など)

「音ありが前提」の動画は配信面を間違えない:TikTok向けに音前提で作った動画をそのままInstagram Reelsに流すと、ミュートで見られてフック率が激減するケースが頻発します。配信面ごとに字幕強化版・音声強化版をセットで用意する運用が、配信効率を最大化します。

制作オペレーションに落とし込む

量産フェーズの音声テンプレ化

クリエイティブを月10〜30本以上量産する場合、毎回ゼロからBGM選定していては制作速度が落ちます。以下のテンプレ化が有効です。

  • 商材ジャンル別にBGM候補を5〜10曲ストックしておき、訴求軸ごとに割り当てるルールを作る
  • ナレーション冒頭のフック台本を10〜20パターン事前に準備し、差し替えで対応
  • 効果音ライブラリを社内共有し、ディレクター・編集者がすぐアクセスできる状態にする
  • 音量バランスのプリセット(ナレーション基準、BGM基準の2パターン)を編集ソフトに登録

勝ちパターンの音声要素を抽出する

配信後のデータ分析では、完視聴率とCVRが高かった動画の音声要素をパターン抽出します。BGMジャンル、ナレーター性別、冒頭1秒のSE有無など、変数を分解して記録し、次の制作に反映させるPDCAを回します。これを地道に続けることで、商材ごとの「勝ち音声レシピ」が社内資産として蓄積されていきます。

まとめ

縦型動画広告における音声設計は、映像・脚本と並ぶ成果ドライバーです。ミュートで字幕だけでも伝わる、音ありでさらに刺さるという二層設計を前提に、BGM・ナレーション・効果音をそれぞれの役割に沿って配置することが、安定して成果を出すための基本原則になります。

トレンド音源の扱いや著作権対応、AI音声とプロ収録の使い分け、量産体制のテンプレ化など、音声設計には意外と多くの実務判断が絡みます。自社だけで最適解を探すのが難しい場合は、縦型動画広告に特化したクリエイティブパートナーと組むことで、学習コストを抑えながら成果を伸ばすことが可能です。

よくある質問

縦型動画広告はミュート視聴と音あり視聴のどちらに合わせて作るべきですか?
両方に対応するのが基本です。配信面によって異なりますが、Instagram ReelsやFacebook/Instagramフィードでは自動再生時にミュート状態で始まるケースが多く、一方TikTokは音ありで再生されるのが標準です。そのため、字幕テロップで内容が完結する構造にしつつ、音ありで視聴された際に没入感を高めるBGMやナレーションを重ねる「二層設計」が効果的です。視覚と聴覚のどちらか一方だけでも訴求が成立する作りを意識しましょう。
TikTokのトレンド音源を広告で使っても大丈夫ですか?
オーガニック投稿ではTikTokアプリ内のトレンド音源を自由に利用できますが、広告出稿では商用ライセンスを持つ音源(TikTokの商用音楽ライブラリ、Commercial Music Library)に限定されます。トレンド感を出したい場合は、このライブラリ内でトレンド傾向に近い楽曲を選ぶか、オリジナル音源にトレンド要素を取り入れるのが安全です。権利関係を無視して流行曲を使うと、広告停止やアカウント制限のリスクがあります。
ナレーション(語り声)はBGMと比べてどちらが重要ですか?
訴求内容が複雑な商材ほどナレーションの比重が高まります。金融・転職・アプリなど情報量が多い商材では、ナレーションで文脈を補強し、BGMは背景として感情トーンを作る役割に徹するのが定石です。一方、ビジュアル訴求が強い商材(ファッション・コスメ等)ではBGMとテロップだけで成立させる設計も有効です。迷った場合はナレーション+控えめBGMの組み合わせが汎用性が高く、ミュート時も字幕で情報が完結しやすくなります。
BGMの音量バランスはどう設定すればよいですか?
ナレーションを主役にする場合、BGMはナレーション音量に対して-12dB〜-18dB程度下げるのが目安です。感情を煽る演出で一時的にBGMを前に出す場合でも、セリフや字幕の伝達を邪魔しないレベルに抑えます。また、ラウドネス基準(配信プラットフォームの目安は-14LUFS前後)を意識し、全編を通して音量が均一になるようマスタリングすることで、視聴者のストレスを減らし離脱率を抑制できます。

縦型動画の音声設計、プロに任せませんか?

BGM選定からナレーション収録、効果音設計までワンストップ。成果報酬型だから、成果が出るまで費用は発生しません。

無料で相談する

関連記事

※ 本記事は一般的な情報提供を目的としたものであり、特定の広告成果やパフォーマンスを保証するものではありません。記載されている数値・相場・ベンチマークは公開情報および当社の運用実績に基づく参考値であり、実際の成果は商材・市場環境・運用条件等により異なります。音源・音声の利用に関する権利処理は、各配信プラットフォームおよび権利者のガイドラインに従い、ご自身の責任において行ってください。