BAsixs(ベーシックス)

「あたりまえ」をアップデートしつづける

ロジスティック回帰分析でゴールデンルートを「創る」

読了目安 : 9

  • 投稿日 :
  • 最終更新日 :

この記事を書いた人

プロフィールアイコン(イラスト):マーケティングディレクター 村上 仁
村上 仁セールス&マーケティンググループ/マーケティングディレクター(ビジネス・アーキテクツ)

出版業界の編集者からWeb業界のディレイター・マーケターに転身。大手ポータルサイトのコンテンツ制作や海外SaaSツールのプロジェクトマネージャー等を経験。ビジネス成果にこだわったマーケティング戦略の立案およびサイト制作、データ分析が強み。

コンバージョンを最大化させるために、GA4を駆使して分析しているマーケターやWeb担当者は多いと思いますが、その分析手法は本当にコンバージョンの最大化に有効ですか?

本記事では、統計学のロジスティック回帰分析を使って、コンバージョンしやすいページを「予測」する分析手法を解説します。「ゴールデンルート」が見つけられるだけでなく、積極的にゴールデンルートを「創る」といったマーケティング施策へつなげることができます。GA4だけでは決してわからない分析手法を、ぜひ身につけて活用してみてください。

ロジスティック回帰分析でゴールデンルートを「創る」

GA4の「経路データ探索」は「終点」から探そう

ユーザーがサイトに訪問してからコンバージョンに至るまでのルートの中で、最もコンバージョンに寄与している効果的なルートを俗に「ゴールデンルート」などと呼びます。アクセス解析では、そのゴールデンルートをいかに見つけるかが焦点の1つですが、皆さまがお使いのGA4でも簡単に見つけることができます。その方法の1つがGA4の探索レポートの中にある「経路データ探索」です。
この探索レポートは、「始点」となるページやイベントから、その次にユーザーがどのページを見たり、どんなアクションを起こしたりしたのかをツリーグラフで把握することが可能です。

通常は「始点」からユーザー行動をひもといていきますが、コンバージョンへのゴールデンルートを見つけるなら「終点」から探るのがポイントです。「経路データ探索」の右上にある青字の「最初からやり直す」をクリックすると、「始点または終点」を選択する画面が表示されます。そこで「終点」にコンバージョンページのパスを指定すると、コンバージョンに至ったユーザーの行動履歴を逆順に追うことができます。

ただし、ユーザーの行動を可視化できるという点で非常にすぐれたこのレポート機能ですが、デメリットがあるので注意が必要です。

  1. ページ数が多いサイトやトラフィックが多いサイトでは経路が複雑化し、読み解くのが難しくなる
  2. 最大9ステップまでしかたどれない
  3. サイトの規模が大きくなればなるほどデータを表示するまでに時間がかかる

下図は、Google Merchandise Storeのデモアカウントにて、経路データ探索を終点から逆順でひもといた時の画像です。ページ数やトラフィックが多い上にページを行ったり来たりしているユーザー行動も記録されているため、どういう経路がゴールデンルートなのか読み解くのは難しくなっています。

ゴールデンルートを見つけるという目的には適したレポート機能ですが、分析するサイト規模によって使い勝手が大きく変わってしまう点が難点だと言えるでしょう。

Google Merchandise Storeのデモアカウントで経路データ探索を終点から逆順でひもといた画像

GA4とロジスティック回帰分析の大きな違い

では、GA4に代わるゴールデンルートを見つける分析手法はないのかというと、答えはあります。
統計学の「ロジスティック回帰分析」と呼ばれる分析手法です。
ロジスティック回帰分析とは、マーケティングや医療分野、製造業などさまざまな分野で活用されている多変量解析の1つです。普段私たちが見慣れている分析ツールのGA4とはその分析の特長が大きく異なります。違いはたくさんありますが、私が考える最も大きな違いを挙げるとすれば、以下の2つでしょうか。

GA4 予測値を算出△:基本的に過去のデータ(予測機能は使用条件に制限あり) 扱うデータの種類 主に量的データ ロジスティック回帰分析 予測値を算出◯:記録された過去のデータから未来の「予測値を算出」する 扱うデータの種類 質的データのみ

  1. GA4は基本的に過去のデータ(予測指標には条件あり)を扱いますが、ロジスティック回帰分析は記録された過去のデータから未来の「予測値を算出」できます
  2. GA4は量的データを主に扱いますが、ロジスティック回帰分析は質的データのみを扱います

まずは1番目の「予測値を算出できる」という点について説明します。ロジスティック回帰分析とは、説明変数から目的変数の発生確率を予測する統計学的分析手法です。目的変数とは「結果」のことで、今回は「コンバージョン」に当たります。説明変数とは「要因」であり、今回の分析ではページA、B、Cに当たります。つまり、「ページA、B、Cのどのページを閲覧するとコンバージョンしやすいのか?」を予測する分析手法なのです。

では次に、2番目の「量的データ」と「質的データ」について説明します。量的データとは数値データのことです。「定量評価」などの言葉をビジネスシーンでよく聞くと思いますが、「量」とはすなわち「数値」のことです。
GA4はセッション数や表示回数などが数値として記録されていますから、量的データを扱う分析ツールということです。一方、ロジスティック回帰分析では「コンバージョンするか、しないか」とか「合格するか、しないか」といった数字では表せないデータのみを扱い分析します。こうした数字以外のデータのことを質的データといいます。

以降では、ロジスティック回帰分析を使って、どんな要因がどのくらいコンバージョンしやすいかの予測値を算出する方法を解説していきます。

ロジスティック回帰分析~準備編~

ロジスティック回帰分析を行うには、専門ツールやpython、R言語などを使う方法もありますが、より身近で簡単に扱えるGoogleスプレッドシートを使って説明します。
まずは、分析環境を整えましょう。

  1. Googleスプレッドシートを開き、上部のナビゲーションから「拡張機能」>「アドオン」>「アドオンを取得」を選択
  2. 表示されたポップアップの上部「アプリを検索」から「XLMiner Analysis ToolPak」を検索し、インストール

準備は以上です。次に、分析するためのデータを用意します。今回用意したデータでは、顧客20人のページA、B、Cの閲覧状況とコンバージョン状況をまとめています。なお、分析する前には下記の3つの処理をしておきます。

  1. 1行(1レコード)が顧客1人のデータであること
  2. 「閲覧した」「コンバージョンした」項目は「1」に置き換える
  3. 「閲覧しなかった」「コンバージョンしなかった」項目は「0」に置き換える

上記2と3の処理で質的データを「0」「1」の量的データに変換することをダミー変数といいます。そうすると下記のようなデータができます。

ロジスティック回帰分析のためのデータ

ロジスティック回帰分析~実行編~

準備ができたらいよいよ実行です。数クリックで分析は終わりますから非常に簡単です。
まず、先ほどインストールした「XLMiner Analysis ToolPak」を起動します。上部メニューから、拡張機能>XLMiner Analysis ToolPak>Startをクリックすると、画面に下記の左図のような値を入力するモーダルが表示されます。そのモーダルへ、右図の赤枠範囲を参考に選択範囲を指定します。

挿入する値について、「Input Y Range」には目的変数となる「コンバージョン」の値が入っている範囲を指定し、「Input X Range」には説明変数となる「ページA、B、C」の値が入っている範囲を指定します。なお「Labels」にチェックを入れておくと結果が見やすくなりますのでチェックを入れておきます。後は結果を出力する場所のセルを指定し、「OK」ボタンを押して実行してください。

Logistic Regressionの入力方法とデータ選択範囲

ロジスティック回帰分析~解釈編~

そして表示された分析結果がこちらです。

ロジスティック回帰分析の結果表

この結果で見るべきポイントは「Odds Ratio」(オッズ比)の列です。オッズ比が何かというのは、ロジスティック回帰分析を理解するための必須知識になります。まずは結果を読み解く上で、その元となるオッズについて簡単に説明します。下記のような例題でオッズとは何かを考えてみましょう。

「例題:今季サッカーチームAの成績は10勝5敗(ホーム8勝3敗、アウェイ2勝2敗)でした。下記の問いに答えなさい。」

  1. サッカーチームAのホームのオッズはいくつでしょうか?
  2. サッカーチームAのアウェイのオッズはいくつでしょうか?
  3. サッカーチームAのオッズ比はいくつでしょうか?

ちなみに、オッズの計算式は下記になります。

  • オッズ = 勝った数 ÷ 負けた数

上記式から、サッカーチームAのホームのオッズは「8÷3=2.66」となり、アウェイでのオッズは「2÷2=1」となります。オッズの計算式は、割合の計算式(割合=勝った数÷全試合数の合計)とは分母が異なるので注意してください。では、オッズ比はどうでしょうか?オッズ比の計算式は

  • オッズ比 = ホームのオッズ ÷ アウェイのオッズ

となり、計算すると「(8÷3)÷(2÷2)=2.66」です。
比率の計算では「1」が基準値となりますから、それより大きいか小さいかで勝ちやすいか負けやすいかという判断ができます。
つまりこの例題の場合、オッズ比を計算してみると、「1」より大きいため「サッカーチームAはホーム試合の方が勝ちやすい」と言えます。これが、オッズとオッズ比です。

では、今回のロジスティック回帰分析の結果に当てはめてみるとどうでしょうか?
まず言えることは、下記の2点です。

  • オッズ比の値 > 1:ページを閲覧した方がコンバージョンしやすい
  • オッズ比の値 < 1:ページを見なかった方がコンバージョンしやすい

この2点を理解した上で、上図の赤枠の「Odds Ratio(オッズ比)」を見てみると、「ページB > ページA > ページC」の順でオッズ比の値が大きいのがわかります。どのページも「1」を超えていますから、「ページを閲覧した方がコンバージョンしやすい」と言えます。
しかし、仮にページAの「Odds Ratio」(オッズ比)が「0.5」など「1」を下回っていた場合は、「ページAを閲覧しない方がコンバージョンしやすい」という解釈になります。

今回の分析では、ページA、B、Cの中で最も高い値の「ページBを閲覧した方がコンバージョンしやすい」という予測結果が得られました。
では、次に起こすアクションは何か?それは「いかにページBを閲覧させるか」という手法を考えることです。

ゴールデンルートを「創る」マーケティング施策

ここまで、GA4やロジスティック回帰分析を使って、コンバージョンしやすいページやコンバージョンに有効なルートをあぶり出す分析を行ってきました。ただ、最も重要なことは、これらの分析結果からどのような施策に落とし込むかという点にあります。例えば2つの打ち手が考えられます。

  1. コンバージョンしやすいページへのセッションを増やす
  2. コンバージョンしやすいページのコンバージョン率を上げる

この2つを軸として、例えば広告を打って流入数を増やしたり、ヒートマップなどから離脱ポイントを改善したりして、コンバージョンへつなげたりするなどの具体的施策が思いつくでしょう。

こうしてデータドリブンな分析を実行できれば、コンバージョンへ至るゴールデンルートを「創る」ことも可能なのではないでしょうか。

まとめ:データドリブンな分析を!

誰もが使っているGA4ですが、ロジスティック回帰分析など統計学の知識と合わせて分析することで、より深くデータ分析をすることができます。顧客を「創る」ことが皆さまに課されたミッションならば、よりデータドリブンな分析とそれに基づく施策実行を心がけましょう。

Business Architects(ビジネス・アーキテクツ)では、データドリブンなマーケティング戦略の立案から、KGI/KPIを達成するためのロジカルで効率的な施策提案など、企業のデジタルマーケティング活動を支援しています。どのようなご相談でも結構ですので、お気軽にお問い合わせください。お待ちしております。