VSOとは?
ECサイトが取り組むべき6つの対策

シェア ツイート
公開日:

VSOとは音声検索最適化のことで、SiriやGoogleアシスタント、Alexaなどの音声アシスタントを介しての検索に対しサイトやその情報を最適化することを指します。ECサイトでも必要になってきているVSOについて詳しく解説します。

サクッと理解!本記事の要点まとめ

VSO(音声検索最適化)とは何ですか?

VSO(Voice Search Optimization)とは、SiriやGoogleアシスタント、Alexaなどの音声アシスタントを介した検索に対し、自社のサイトや商品情報が優先的に回答として選ばれるよう最適化する施策です。「音声SEO」とも呼ばれます。

音声検索と従来のテキスト検索の大きな違いは何ですか?

最大の違いは「クエリ(検索ワード)の形」です。テキスト検索が「単語の羅列」であるのに対し、音声検索は「〜〜を教えて?」のような「会話調・質問形式」の長文になる傾向があります。

ECサイトが優先的に取り組むべきVSO対策は何ですか?

まずは以下の3点を優先的に進めるのが効果的です。
@会話調への対応: ユーザーの問いかけ(Q&A)を意識したコンテンツ作成。
Aanswer-first構成: 質問に対する答えを冒頭に40〜60文字で簡潔に記述。
BFAQPage JSON-LDを実装: 音声での読み上げを想定して回答文を1〜2文・30〜60文字程度で設定。

VSO対策はAI検索(GEO)対策にもなりますか?

はい、非常に有効です。VSOで重視される「簡潔な回答(answer-first)」や「構造化データ」は、ChatGPTやGoogleのAI要約(GEO:生成エンジン最適化)が回答を生成する際のロジックと共通しているため、相乗効果が期待できます。

01|VSO(音声検索最適化)とは?ECサイトに関係する理由

VSO(Voice Search Optimization:音声検索最適化)とは、SiriやGoogleアシスタント、Alexaなどの音声アシスタントを使った検索で、自社のページや商品が優先的に表示・回答されるよう最適化する取り組みです。「音声SEO」や「ボイスサーチSEO」とも呼ばれます。

「音声検索なんてまだ少数派では?」と感じるかもしれません。しかし、デジタルマーケティング支援会社PLAN-Bが2025年3月に実施した調査(全国10代〜70代の男女2,000名対象)では、音声検索の利用率は全体で32%に達しており、利用者の半数以上が「ここ1〜2年で利用頻度が増えた」と回答しています※1。

また同調査では、音声検索の利用シーンとして「商品情報を調べるとき」が上位に挙がっており、ECとの関係性が確認されています。さらに利用デバイスの95.3%がスマートフォンであることから、スマートフォンでのEC利用と音声検索が重なる場面が増えていることがわかります※1。

日本の音声検索利用実態(2025年)
利用率
32%
全国10〜70代
2,000名対象
頻度増加実感
50%超
「1〜2年で
増えた」と回答
主な利用デバイス
95.3%
スマートフォン
経由
主な利用シーン
ハンズフリー
(運転中・料理中)
52.7%が回答

「利用率32%はまだ少ない」と感じるかもしれませんが、重要なのは利用が増えているフェーズにあるという点です。テキスト検索とほぼ同頻度で音声検索を使うユーザーが全体の約37%を占めており、「たまに使う層」が着実に増えています。今から対応しておくことで、競合に先んじた対策になります。

出典
※1 株式会社PLAN-B「音声検索の利用状況に関する調査」(2025年3月)
    https://prtimes.jp/main/html/rd/p/000000311.000068228.html

02|テキスト検索との違い:音声検索が変えるユーザーの行動

VSOを理解するうえで最も重要なのが、音声検索とテキスト検索の「クエリ(検索ワード)の違い」です。この違いに対応できていないと、音声検索流入はほぼ獲得できません。

クエリの形が変わる

テキスト検索では「ワイヤレスイヤホン おすすめ」のように短いキーワードで検索しますが、音声検索では話し言葉に近い自然な文章で検索します。

テキスト検索 vs 音声検索:クエリの違い(ECでの例)
テキスト
検索
「ワイヤレスイヤホン おすすめ」
「UVケア 日焼け止め 2025」
「プロテイン 安い 送料無料」
音声
検索
「ノイズキャンセリングが優れたワイヤレスイヤホンはどれ?」
「焼けにくくてベタつかない日焼け止めを教えて」
「コスパがよくて飲みやすいプロテインはどれ?」
音声検索は「会話調・質問形式・長文」が特徴。SEOキーワードとは別の対策が必要

実際の音声検索を試してみた画像を用いて確認してみます。

実際の音声検索の結果画面

今回はGoogleの音声検索でECサイト市場の規模について聞いてみました。音声検索はGoogleに問いかけるような形になるため、「EC」「市場」「規模」のような単語ではなく、「EC市場の規模を教えて」という文章での質問が自然にできました。

それに対し、Googleは最適な回答を返します。今回であれば経済産業省が出す電子商取引に関する市場調査の結果から、26.1兆円であると回答しています。

「ゼロクリック」が起きやすい

音声検索の回答はスピーカーや画面に「1つだけ」読み上げられます。テキスト検索のように複数の結果から選ぶことができず、AIや音声アシスタントが「最も正確」と判断したページの回答が採用されるか、されないかの二択になります。そのため、回答として選ばれるためのコンテンツ設計が重要になります。

購入意図(購買行動)との関係

音声検索ユーザーはキーボード検索より具体的な意図を持ちやすいとされています。「〇〇を買いたい」「〇〇はいくら?」のような購買に直結する質問が多く、音声経由のトラフィックはコンバージョン率が高い傾向があります。

03|ECサイトのVSO対策:6つの具体的な取り組み

ECサイトのVSO対策:6つの取り組み
コンテンツ
@ 会話調キーワードに対応
「〜は?」「〜を教えて」形式のQ&Aを用意
コンテンツ
A 回答を冒頭に書く
質問に対する答えを40〜60文字で簡潔に配置
技術
B FAQPage JSON-LD
音声アシスタントが読み取れるQ&A構造化データ
技術
C Product構造化データ
価格・在庫・レビューをスキーマで明示
サイト品質
D ページ表示速度の改善
モバイルでの高速化がVSOに直結
サイト品質
E ローカルSEO連携
店舗・エリア情報を整備して「近くで〜」に対応

取り組み@ 会話調キーワードに対応したコンテンツを用意する

音声検索のクエリは「〜はどれですか?」「〜を教えてください」のような会話調です。コラムページやFAQページに、ユーザーが声に出しそうな質問形式の見出しと、それに対応する回答を用意することが出発点になります。

具体的には、商品カテゴリページに「このカテゴリのおすすめ商品は何ですか?」「選ぶときに気をつけるポイントは何ですか?」のようなQ&Aセクションを追加するのが効果的です。テキスト検索向けのキーワードとは別に、音声検索向けのロングテールな質問フレーズをコンテンツに組み込んでいきましょう。

取り組みA 回答を冒頭に書く(answer-first構成)

音声アシスタントはページ全体を読み上げるわけではなく、質問に対する最もシンプルな回答を文章の冒頭から抽出します。見出しの直後の文章に、その質問への答えを40〜60文字程度で書く「answer-first構成」が音声検索にも有効です。

「このイヤホンの特徴は何ですか?」という質問に対して、「このイヤホンの最大の特徴はノイズキャンセリング機能で、電車内や職場での集中作業に最適です。」のように書き出すのが理想的です。回答の後に補足情報を続けるという構成を習慣化しましょう。

取り組みB FAQPage JSON-LDを実装する

「よくある質問」の内容をJSONの形式でHTMLに記述する「FAQPage JSON-LD」は、音声検索との相性が特に高い技術施策です。音声アシスタント(GoogleアシスタントやSiriなど)は、FAQPage構造化データを直接読み取って回答を生成するため、実装するだけで音声検索での採用率が大きく上がります※3。

実装例:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "このワイヤレスイヤホンは防水対応ですか?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "はい、IPX5等級の防水に対応しており、雨天時のランニングや汗をかく運動中にもご使用いただけます。"
    }
  }]
}
</script>

回答文は1〜2文・30〜60文字程度で完結させてください。音声での読み上げを想定して、長すぎず、それだけで意味が通じる内容にすることがポイントです。公式リファレンス:Google「FAQPage 構造化データ」

取り組みC Product構造化データで商品情報を整備する

「〇〇はいくらですか?」「在庫はありますか?」のような購買意図の高い質問に音声検索で答えるには、商品ページにPrice・Availability・AggregateRatingなどのProduct構造化データを実装することが不可欠です※4。

プロパティ 対応できる音声クエリの例 重要度
name(商品名) 「〇〇というイヤホンについて教えて」 必須
offers > price(価格) 「〇〇の値段はいくら?」 必須
offers > availability(在庫) 「〇〇は今買える?」 推奨
aggregateRating(レビュー) 「〇〇の評判はどう?」 推奨
description(説明文) 「〇〇の特徴は何?」 推奨
brand(ブランド名) 「〇〇ブランドのイヤホンを探して」 推奨

仕様は更新されることがあるため、Google「商品(Product)の構造化データ」の公式ドキュメントを定期的に確認することをおすすめします。

取り組みD ページ表示速度を改善する

音声検索はスマートフォンから行われることが95%以上と、モバイルでの閲覧が前提です。Googleは表示速度の遅いページを音声検索の回答候補から外す傾向があるとされており、モバイルでの読み込み時間の改善がVSO対策に直結します。

具体的には「Core Web Vitals(ページの快適さを示す指標)」の改善が有効です。特にLCP(最大コンテンツの表示速度)は2.5秒以内が推奨されています(Google「Core Web Vitals」)。画像の圧縮・キャッシュの設定・不要なJavaScriptの削減などを優先的に対応しましょう。

取り組みE ローカルSEOと連携する(店舗・エリア情報の整備)

「近くで〇〇を売っているお店は?」のようなローカル系の音声検索は、ECと実店舗を持つブランドにとって重要な流入経路になります。Googleビジネスプロフィールの情報(店舗名・住所・営業時間・在庫連携)を最新の状態に保つことで、音声検索での「近くの〇〇」クエリに対応できます。

またECサイト側でも、LocalBusiness構造化データ(schema.org/LocalBusiness)を実装することで、店舗のある拠点情報を音声検索に認識させやすくなります。

出典
※3 Epic Notion「FAQ Schema in 2025: Still a Valuable SEO Asset」(2025年3月)
    https://www.epicnotion.com/blog/faq-schema-in-2025/
※4 ALM Corp「Schema Markup in 2026: Why It's Now Critical for SERP Visibility」(2025年12月)
    https://almcorp.com/blog/schema-markup-detailed-guide-2026-serp-visibility/

04|VSOと音声EC(ボイスコマース)の違いと今後

VSOとよく混同されるのが「音声EC」または「ボイスコマース(Voice Commerce)」という概念です。両者の違いと、ECサイトとしてどちらを優先すべきかを整理します。

VSO と ボイスコマースの違い
VSO(音声検索最適化)
  • 音声で検索される段階への対応
  • 「〇〇はどれがいい?」に回答
  • ECサイトのコンテンツ・構造化データが対象
  • 今すぐ対応できる施策
ボイスコマース(音声購買)
  • 音声で注文・購入まで完結させる
  • 「〇〇を1つ注文して」で決済
  • スマートスピーカー・音声決済連携が必要
  • 日本での普及はこれから
ECサイトが今すぐ取り組むべきは VSO。ボイスコマースは中長期の準備として位置づけ

ボイスコマースの市場は海外で先行しています。米国ではWalmartが「Walmart Voice Shopping」でSiri Shortcutsと連携した音声購入サービスを展開しており、スマートスピーカー経由のEC購入が定着しつつあります。

日本でもAmazon Echoなどのスマートスピーカー経由での定期購入や、楽天市場での音声検索連携が進んでいます。日本の音声検索利用率が引き続き上昇していることを踏まえると、まずVSOでコンテンツと構造化データを整備しておくことが、将来のボイスコマース対応の基盤にもなります。

また、VSOはGEO(生成エンジン最適化)とも密接に関係しています。ChatGPTやGoogleのAI要約が回答を生成する際のロジックは、音声検索アシスタントが回答を選ぶロジックと多くの部分で共通しているからです。VSOとGEOは「別の対策」ではなく、answer-first構成・構造化データ・出典の明記といった取り組みが両方に効くという点で、一体的に進めることが効率的です。

05|まとめ

@VSO(音声検索最適化)とは、スマートフォンや音声アシスタントを使った検索で自社のページが回答として選ばれるようにする取り組みです。

A日本でも音声検索の利用率は32%に達し、利用者の半数以上が「利用頻度が増えた」と回答しています。スマートフォン経由が95.3%と、EC利用と重なる場面が多いです※1。

Bテキスト検索と異なり、音声検索は「〜はどれですか?」のような会話調・質問形式のクエリが中心です。コンテンツと構造化データをこの特性に合わせて設計することが必要です。

C具体的な取り組みの優先順位は、@会話調キーワードへの対応 Aanswer-first構成 BFAQPage JSON-LD CProduct構造化データ Dページ速度改善 EローカルSEO連携の順で進めるのが効率的です。

DVSOはGEO(生成エンジン最適化)と多くの施策を共有しています。両方をまとめて取り組むことで、AI検索・音声検索・通常検索のすべてに対応できる、強いコンテンツ基盤が築けます。

主な参考資料
※1 株式会社PLAN-B「音声検索の利用状況に関する調査」(2025年3月)
    https://prtimes.jp/main/html/rd/p/000000311.000068228.html
※2 PassionFruit「Schema Markup for AI Search」(2025年8月)
    https://www.getpassionfruit.com/blog/how-structured-data-increases-search-visibility-on-ai-search-engines-schema-markup-for-ai
※3 Epic Notion「FAQ Schema in 2025」(2025年3月)
    https://www.epicnotion.com/blog/faq-schema-in-2025/
※4 ALM Corp「Schema Markup in 2026」(2025年12月)
    https://almcorp.com/blog/schema-markup-detailed-guide-2026-serp-visibility/
  Google「FAQPage 構造化データ」
    https://developers.google.com/search/docs/appearance/structured-data/faqpage?hl=ja
  Google「商品(Product)の構造化データ」
    https://developers.google.com/search/docs/appearance/structured-data/product?hl=ja
  Google「Core Web Vitals」
    https://web.dev/articles/vitals?hl=ja

ecbeingでは、VSO・GEO対策を含めECサイト構築後のマーケティング支援を行っています。ぜひお気軽にご相談ください。




ecbeing

この記事の監修者

株式会社ecbeing
塩見 駿介
ECサイト構築プラットフォーム「ecbeing」・BtoB専用ECサイト構築プラットフォーム「ecbeing BtoB」をご導入いただいている企業のへの取材を通じて得た知識をもとに、EC構築・運用するうえで役に立つ情報や最新トレンド情報を発信。
03-3486-2631
営業時間 9:00〜19:00