Googleがユーザーデータ(興味関心、年齢性別等)を判断する方法

7a8733e2aaa3cc5e966e21755bc59ea1a710a057
Googleがユーザーデータ(興味関心、年齢性別等)を判断する方法

Webマーケティングにおいては、インターネットを利用するユーザーの年齢・性別といった属性と、ユーザーが持つ興味・関心のデータが非常に重要な役割を持ちます。
こういったデータは主にGoogleアナリティクスによるアクセス解析で閲覧することができ、Googleのアカウントに登録された情報だけでなく、検索エンジンやYouTube、その他Googleが持つ膨大なネットワークを通じて、Googleが独自に収集・蓄積したデータが使われています。
しかし、Googleはユーザーのどのようなデータを、どういう目的で、どういった手段で収集しているのでしょうか?

今回は、今やWebマーケティングには欠かせないものとなっているGoogleが持つ膨大なデータの種類・目的・収集方法について紹介していきます。
Googleが公開している多彩なデータの中から、本当に利用すべきデータや、実はあまり利用すべきでないデータについても解説していきますので、この機会にぜひ覚えていってください。

Googleが収集・取得しているユーザーのデータと利用目的

Googleが収集しているユーザーデータは、大きく2つに分けられます。

  • 1つ目は、ユーザーが自ら入力した情報を元に構成される「実データ」
  • 2つ目は、ユーザーの行動履歴からGoogleが推測した「類推データ」

この2つは、データの内容も収集される方法も大きく異なります。利用する際にはこの2つの違いを正確に理解しておくことが重要です。

①実データ:正確だがデータの範囲は狭い

1つ目のユーザーが入力する実データは、Googleのアカウントを登録する際に入力する情報や、ウェブサイトでフォームに入力した情報を収集したものです。ユーザーが自ら入力していることから正確な情報である可能性が高く、非常に参考にできるデータです。
他にはユーザーが使っているデバイスやブラウザなど、インターネットを利用しているだけで自動的に収集できるデータもあります。
しかし、主にユーザーの個人情報であるため、収集できる範囲は限られます。正確ではあるものの、Webマーケティングへの活用はやや難しいと言えます。

②類推データ:精度は劣るが活用範囲は広い

2つ目のGoogleが推測した類推データは、ユーザーのインターネット上での行動履歴を元にそのユーザーがどんな人物なのかを推測し分類したものです。
あくまでもGoogleによる推測なので、データの正確さは実データに比べると劣ります。
ですが、Googleが持つ膨大なネットワークから収集されるあらゆるデータを使った推測ですので非常に幅広いデータが蓄積されています。さらにユーザーの興味・関心といった、ユーザーが自分から申告することのない情報まで含まれるため、Webマーケティングではむしろこちらの方が有用な場合が多くあります。
普通ならアンケートを取るなどお金をかけないと集められないユーザーの心理面に関するデータが、大まかではあるものの無料で入手できるというのは非常に便利と言えます。
Googleは検索エンジンやGoogleアナリティクス、Google広告など、インターネット上で展開するサービスの質を高め、ユーザーがより快適にインターネットを利用できるようにするために、これらの情報を収集し、Webマーケティングを行う企業に提供しています。

アクセス解析とWeb広告でGoogleのユーザーデータを利用する

Googleが収集しているユーザーデータをWebマーケティングで利用する主な場面は、Googleアナリティクスを使ったアクセス解析と、Google広告によるリスティング・ディスプレイ広告の配信でしょう。
年齢・性別・地域・子供の有無・世帯年収・デバイス・OS・ブラウザ・興味・関心などなど、非常に幅広いデータを入手してWebマーケティングに活用することができます。

これらのデータは、ユーザーがGoogleアカウントにログインしているかどうか、そしてGoogleアカウントで個人情報の公開を許可しているかどうかといった条件次第で、実データであったり類推データであったりします。
全てが実データであれば、正確な情報を把握できるのですが、実際にはGoogleアカウントにログインしていないユーザーも多く、近年はプライバシー意識の高まりからGoogleにデータの収集を許可しない設定にしているユーザーも増えています。
そのため、これらのデータの大半はGoogleによる類推データと考え、参考程度に捉えた方が良いでしょう。

GoogleによるCookieを使ったデータ収集

GoogleアナリティクスやGoogle広告で閲覧できるユーザーデータは、その多くがブラウザに保存されるCookieを利用して収集されています。
Googleは、検索エンジンやGoogleアナリティクス、その他パートナーサイトなどを通じて、インターネット上のあらゆるユーザーの行動を追跡し自社のサーバーに蓄積しています。
それらの行動履歴データと、Googleアカウントに登録された実データや、Googleのパートナーから提供されたデータとを紐づけることで、ユーザーの属性ごとにどういった行動を取る傾向が強いのかというグループ分けが可能になります。

サイトAを閲覧するユーザーに40代の男性が多いということがわかれば、同じサイトAを閲覧した年齢・性別不明のユーザーは、40代の男性である確率が高いと言えます。
そして、サイトAを閲覧したユーザーはサイトBも閲覧する傾向が高いとしたら、恐らくサイトBのユーザーも40代の男性が多いでしょう。
さらに、サイトAとサイトBが、どちらも自動車に関する内容を扱っているウェブサイトだとしたら、この2つのウェブサイトに訪れているユーザーは、自動車に興味・関心を持っている可能性が高いはずです。

Googleはこのようにして、実際には入手できないユーザーに関する情報も、実データと行動履歴データを組み合わせて推測することで足りないデータを補っているのです。
実際には、Googleが保有するデータは今回の例とはけた違いに膨大で多彩なため、非常に高い精度でこの類推データを作り出すことができています。

Googleにも知らないことはある?属性が「不明」なユーザー

ただし、これらのデータはCookieを使って収集しているため、ユーザーが使っているブラウザがGoogleにCookieを渡さないように設定されていたり、ユーザーがこまめにCookieを削除していたりすると、Googleはユーザーデータを手に入れることができず、ユーザーデータも特定できなくなってしまいます。
こういう場合、Googleは当てずっぽうに適当なデータを割り当てるということはせず、「不明」なユーザーとして取り扱います。

この「不明」ユーザーは意外と多く、例えばGoogle広告を使って女性向けの商品を宣伝したい場合、女性だけをターゲティングして広告を配信するとあまり売上が伸びず、「不明」ユーザーも含めることで売上が大きく増えた、なんてこともあります。
「不明」なので、もちろん本来のターゲットである女性だけでなく、男性も含まれているのですが、そもそも「不明」の割合が高ければこの中に含まれる女性の数も多くなるので売上が増えるというわけです。
もちろん、「不明」に含まれる男性ユーザーにも広告は表示されてしまいますので、売上が増えても費用対効果は悪くなりがちなところがあることに注意が必要です。

実は当てにならない要注意なデータ

Googleが収集するデータの中には、実はかなり精度が低いものもあるので要注意です。
代表的なものが、Google広告でユーザー属性として閲覧できる、「世帯収入」という項目。
実際の金額ではなく、「上位10%」というような相対的な指標で表されるデータですが、実はこのデータは、そのユーザーが住む地域の平均年収で決められていると言われています。
ユーザー個人個人の収入ならともかく、世帯収入をインターネット上の行動履歴から推測するのはさすがのGoogleにも難しいということなのでしょう。
つまり、世帯収入のデータを使ったターゲティングは、実質的には地域でターゲティングをしているのと変わらないのです。
世帯収入に限らず、類推データは全てあくまでもGoogleによる推測であるということを忘れずに頭に留めておいてください。

Googleがユーザーデータを判断する方法まとめ

Googleがユーザーデータを判断する方法としては、実データと類推データの2つがあることと、大半は類推データで構成されていることについて解説してきました。
非常に多彩なデータが公開されているので、中には当てにならないものもありますが、それでもGoogleが持つデータのカバーする範囲と精度は驚異的です。
Webマーケティングを行う上では必ず役に立つはずですので、ぜひこれらのデータをうまく活用して、Webマーケティングを成功させる助けにしてみてください。