Google Dataset Searchの使い方|ワンランク上のデータマーケティング・リサーチ

99ef1ce9b54971dca4cbd5e674eb138fb353cc4d
Google Dataset Searchの使い方|ワンランク上のデータマーケティング・リサーチ

2020年1月23日、Googleが「Google Dataset Search」を正式リリースしました。2018年9月よりβ版として提供されてきましたが、1年以上の試験期間を経てついに正式リリースです。
Grabをご覧いただいているWebマーケター、Web担当者、広告運用者にもGoogle Dataset Searchを使う機会が今後増えてくるでしょう。

今回はGoogle Dataset Searchとは何か、どのように使うのかを紹介したうえで、Webマーケター、Web担当者、広告運用者がどう活用していくかを考えてみましょう。

Google Dataset Searchとは

Google Dataset Search

画像:Google Dataset Search 検索ボックスにキーワードを入力するだけで対象のデータへアクセスできる

「Google Dataset Search」は、Googleが提供するデータ検索ツールで、2018年9月からβ版として提供されてきました。Google Dataset Searchを使えば、世界中の公共機関や研究機関、学術団体など信頼における機関・団体が公表しているデータへアクセスでき、研究者だけでなく、マーケターなど様々な立場のプロフェッショナルがよりデータ活用を加速できるようになりました。
2018年9月のリリース時、Googleの公式ブログではAI研究員のナターシャ・ノイは次のように説明していました。

今日の世界では、多くの分野の科学者とジャーナリストがデータを産んでいます。Web上では数百万のデータセットにアクセスすることができます。また、世界中の地方自治体や政府もデータを公開しています。このデータに簡単にアクセスできるようにするため、科学者、データジャーナリスト、データオタクなど、誰もが自分の仕事やストーリーに必要なデータを見つけたり、単に知的好奇心を満たしたりするために、Dataset Searchを起動しました。

事実、Web上には無数のデータがあり、信頼できる正確なデータに効率的にアクセスすることが難しくなっています。例えば、通常のWeb検索で「音楽ストリーミングサービス 利用者数」と検索したとき、検索上位に掲載されるのは論文や調査データではなく、メディア記事がほとんどです。多くは信頼できる情報元を持っていると思いますが、そうではない場合もあります。
一般的な検索意図、この場合は「音楽ストリーミングサービスの利用者数が知りたい」という意図を満たすうえでは、正確性よりもわかりやすさ、伝わりやすさが重要なので、メディア記事が上位に掲載されることは問題ありません。
しかし、もし音楽関係のサービスを立ち上げるための市場調査であれば、情報の正確性が非常に重要になります。

そんな時に役立つのが「Google Dataset Search」です。前述の通り、Google Dataset Searchはデータに特化した検索エンジンで、通常の検索エンジンではたどりにくい論文データなどにもすぐにアクセスできます。

Google Dataset Searchの使い方

Google Dataset Searchの使い方は非常に簡単です。Google Dataset Searchにアクセスすると、Googleらしいシンプルで洗練された検索ボックスが表示されます。この何も説明が要らないデザインはGoogleならではですね。あえて言うまでもありませんが、検索ボックスにキーワードを入力すれば対象のデータにアクセスできます。

Google Dataset Search

画像:Google Dataset Search 「Music streaming service」と検索した結果

では、音楽のストリーミングサービス、つまり「Music streaming service」と調べてみましょう。上図はその結果です。Google Dataset Searchは日本語検索に対応していますが、日本語ではヒット数が大きく減少します。これはそもそも日本語の論文が少ないことと、Google Dataset Searchに掲載されるためのマークアップに対応している日本語サイトが少ないことが要因でしょう。将来的には日本語も十分使えるようになる可能性はありますが、現状は英語で検索してGoogle翻訳などを使い、必要なデータにアクセスしたほうが効率的です。

Google Dataset Search

画像:Google Dataset Search 対象データをフィルタリングできる

正式リリースのタイミングで、更新日やダウンロード形式でフィルタリングする機能も追加されました。データの種類や用途にもよりますが、データの鮮度や形式は非常に重要です。こうしたフィルタリングができることもGoogle Dataset Searchの利点です。

Google Dataset Search

画像:Google Dataset Search ヒットしたデータからは提供元や期間、概要等が確認できる

上図は「2019年日本で人気の音楽ストリーミングアプリケーション」という調査結果です。更新日は2020年2月27日で、提供元はドイツ発のデータプラットフォームStatista(スタティスタ)となっています。
概要を読むと、「日本のスマートフォンで最も使用されている音楽ストリーミングアプリはAmazon MusicとSpotify」とされており、提供元へ移動すると詳細なリサーチ結果が展開されています。アメリカではAppleMusicがシェアトップとなっており、日本にはiPhoneユーザーが多いことからこの結果は意外といえます。

このように特定のテーマに対して、必要なデータにスムーズにアクセスできるため、市場調査をはじめ様々な目的でGoogle Dataset Searchを使うことができます。

それでは、マーケティング担当者、Web担当者にとってGoogle Dataset Searchがどのように使えるか見ていきましょう。

Google Dataset Searchの活用方法

Google Dataset Searchは論文などのデータにアクセスするためのものです。使い方は簡単ですが、活用方法、どう自分の仕事に活かしていけばいいかがわからない方も多いと思います。
しかし、データはマーケティングのあらゆるシーンで活躍しますし、データをうまく扱えてこそ一人前のマーケターといえるでしょう。
そこで、Google Dataset Searchをマーケティングに活かす方法をいくつか紹介します。

マーケティングリサーチ・市場調査

まずはやはりマーケティングリサーチです。マーケティングリサーチとは、マーケティング課題に対して有効な意思決定をサポートするための調査・分析を指します。マーケティングリサーチは非常に幅広い概念なので、市場調査といってもいいかもしれません。
マーケティング活動において、次のような課題が度々発生することがあります。

  • 自社の商品・サービスはどんな人をターゲットとすべきか?
  • 新商品の価格はいくらにすべきか?
  • 競合商品はどういった戦略を展開し、どれくらい満足されているか?
  • 実施したキャンペーンの効果はどの程度だったのか?
  • ターゲットが持つニーズや価値観はどういったものか?

こうした課題は数え上げればきりがありません。そんな時に役立つのがデータであり、データに基づいたマーケティング戦略に欠かせないのがマーケティングリサーチです。上記のような課題は、一見正解がないように感じますが、データを調べれば限りなく正解に近い判断ができます。

例えば、大阪府で店舗ビジネスの展開を予定しているとしましょう。重要なのはどこに店舗を出店するかです。店舗ビジネスでは「商圏」がカギになります。商圏とはそのビジネスの対象となる場所、地域を指しますが、単純な人口分布だけではマーケティングリサーチとして不十分です。商圏は、人口特性の他、交通量・通行量、立地、施設、導線など様々な要素で構成されています。
人口が少なくても、周辺に大きな商業施設があれば交通量・通行量は多くなります。交通量・通行量のどちらが多いかによって、店舗に駐車場が必要かどうかも決まります。
このように、商圏に関する様々なデータを手に入れれば、どれくらいの集客、収益が期待できるかが見えてきます。

では実際に、Google Dataset Searchで「大阪府 人口」と調べてみましょう。

Google Dataset Search

画像:Google Dataset Search 「大阪府 人口」の検索結果

少し古いデータが多い印象がありますが、人口統計はすぐに変わるものではないので、過去3年に絞ってみましょう。それでも70件のデータがヒットします。一番上にヒットしたのは、大阪府の市区町村別将来人口推計で、2015年から5年ごとに2045年までの人口推移が確認できます。
この調査を見ると、大阪府港区は2015年82,035人だった人口が、2045年には56,327人に減少する可能性があることが分かります。一方、天王寺区は2015年75,729の人口が、2045年には86,595人まで増加する可能性があります。現在の人口だけでなく、将来の人口まで考慮できる、非常にいいデータです。
他にも、駅乗降客数など、店舗ビジネスに有益なデータが数多くヒットしています。

Google Dataset Search

画像:Google Dataset Search 「Osaka Population」の検索結果

英語で「Osaka Population」と検索した場合、より多くのデータがヒットしました。こちらでは人口密度や、65歳以上の人口数、外国人人口数、昼と夜の人口分布など、よりニッチなデータがヒットしているイメージです。

Google Dataset Searchでマーケティングリサーチを行うときは、日本語と英語両方で、テーマに対して様々な角度から検索したほうがいいでしょう。まだ新しいサービスなので、通常のGoogle検索よりは少しコツがあるイメージです。

各種資料への引用

提案資料、稟議資料、プレゼン資料など、仕事で資料作成の機会は数多くあります。マーケターだけでなく、すべての職種において言えることですが、資料の信頼性や権威性は、引用しているデータに左右されます。根拠として強力で、信頼性のあるデータを資料に盛り込めるか否かで、その資料の価値が大きく変わります。
とはいえ、通常の検索ではなかなか思うようなデータに辿り着けないでしょう。そんな時こそ、Google Dataset Searchの出番です。

例えば、弊社では随時セミナーを開催していますが、セミナー資料で重要なことは弊社独自のノウハウと、一般的なデータです。私たちが、「Instagram広告の活用はBtoCビジネスで効果的です」と言ったところで来場者にはあまり響かないでしょう。
「世界的に利用されているデータベースStatistaによると、Instagramは2018年6月に月間アクティブユーザー10億人を超え、2020年1月時点、アメリカだけで1億2千万ユーザーが利用しています。また、18~35歳で65%を占め、購買力のある若年層にアプローチするうえで最適です。さらに…」のようにデータに裏付けられた理論であれば、より多くの人に響くのではないでしょうか。

各種資料には何らかの説得力が必要で、説得するためには提案が魅力的なだけでは不十分です。魅力的な提案には、それを裏付けるデータが欠かせません。

Google Dataset Search

画像:Google Dataset Search サジェスト検索をうまく使えば、効率的にデータを探すことができる

上図のように、Google Dataset Searchはサジェスト検索の機能も持っています。こうした検索補助、Google翻訳を活用すれば、英語圏の論文でも比較的簡単に、欲しいデータにアクセスすることができます。

オウンドメディアの信頼性向上

よりマーケティング的な活用方法ですが、オウンドメディアの信頼性向上にも活用できます。オウンドメディアを持つ企業は年々増えており、効果的な事例、失敗に終わった事例が数多くあります。
オウンドメディアの成功方法についてはまだまだ確立されていない部分が多いですが、成功しているオウンドメディアは、少なくとも高い専門性と信頼性を持っています。そして、専門性と信頼性の元になるのもデータです。

例えば、GrabはWebマーケティングメディアとして、企業の広告、プロモーションに役立つ情報を配信しています。Web広告施策の中で、無視できないリスクの一つに「アドフラウド」があります。
アドフラウドは、広告配信の仕組みが複雑化したことにより問題視されるようになった広告詐欺のことです。詳細は省きますが、自社がかけた広告費のたとえ一部でも、不正なプログラムによって浪費されていたとすれば、無視できない問題なのです。

では、Google Dataset Searchで「Ad fraud」と調べてみましょう。

Google Dataset Search

画像:Google Dataset Search 「Ad fraud」の検索結果

一番上にヒットしたのは、Statistaです。「世界的なデジタル広告詐欺の損失2018-2022」というタイトルで、下記のような概要が説明されています。

世界のデジタル広告詐欺に関連するコストは、2018年から2022年までの4年以内に、190億ドルから440億ドルへと指数関数的に増加すると推定されました。米国では、2018年にデジタル広告詐欺により発生する費用は110億米ドルに達すると考えられていました。広告プロセスを含むプロセスのデジタル化が進むにつれて、詐欺のリスクが高まります。ますます多くの広告がプログラムで取引されるようになった現在、不正検出プロセスはまだ完全には開発されていないため、広告の大部分は潜在的な顧客ではなくボットに配信されています。

このように、信頼できる機関が調査したデータを元に自社メディアの主張を展開すれば、高い専門性と信頼性を持つことができます。
また、こうしたデータに基づいた信頼できるコンテンツを配信することは、SEO対策上も有益です。オウンドメディア運営者はぜひGoogle Dataset Searchを活用してみてください。

Google Dataset Searchの課題と活用のコツ

さて、私も正式リリースの2020年1月23日から本格的にGoogle Dataset Searchを使い始めましたが、いくつかの課題とコツが見えてきました。最後にそれらを紹介しますので、ぜひ自身の活用にお役立て下さい。

日本語のソースは想像以上に少ない

まず、日本語のソースがヒットすることは非常に少ないです。前述の「Ad fraud」は94件のデータがヒットしましたが、日本語の「アドフラウド」では0件でした。「Advertising agency」と検索すれば過去1ヵ月に絞っても100件以上がヒットしますが、日本語で「広告代理店」と調べても全期間で1件のみです。

これは、そもそもこうした調査データの母数が海外(主にアメリカ)のほうが圧倒的に多いことに加え、「schema.org」というマークアップガイドラインに準拠したサイトがまだ少ないことが要因と考えられます。
調査データの母数についてはどうにもなりませんが、今後日本の調査機関等がガイドラインに準拠したサイトに改修していくことで、日本語のソースも増えていくと考えられます。

Statistaのヒット率が非常に高くStatista有料会員でないと十分に活かせない

これはマーケティング担当者に対してのみ言えるかもしれませんが、マーケティング関連のデータの多くはStatistaが提供しています。
今回紹介した人口やSNS、広告関連の用語について、英語で検索した結果はほとんどがStatistaをソースとしていました。概要だけであれば見れますが、詳細を見ようと思うとStatistaの有料会員になる必要があるものも少なくありません。
ただしこれはマーケティング関連のデータを多く持っているのがStatistaというだけであって、Google Dataset SearchがStatistaを優遇しているわけではありません。例えば「癌(cancer)」と検索したとき、日本語では「国立研究開発法人国立がん研究センター」が、英語では様々な医療機関、(Statistaを含む)関連メディアのソースがヒットします。

欲しいデータを明確に

これは通常の検索でも同様ですが、Google Dataset Searchでほしいデータにアクセスするにはあらかじめどういったデータが欲しいかを明確にしておく必要があります。
Google Dataset Searcには現在約600万ものデータをインデックスしており、2018年にEUで何匹の猫がいたかというものから、機械学習モデルを訓練するための9000以上の猫の画像と学習用の注釈データがまとまったものまであります。
「猫(cat)」と検索すると、こうした多種多様な、まったく意味合いの違う猫に関するデータが表示されてしまいます。

通常の仕事でも「検索力」が重要といわれますが、少し使ってみた感想として、Google Dataset Searchでは通常の検索エンジンとは少し違った検索力が求められている印象があります。

まとめ|提案・戦略・コンテンツにデータによる魅力付けを

今回はGoogleが提供するGoogle Dataset Searchを紹介しました。比較的新しいサービスで、まだ使いこなせているわけではありませんが、Grabのようなオウンドメディアを運営している身としては非常に有効なサービスだと感じています。

現在、世界的に「オープンデータ」という考え方が広がっています。オープンデータとは、特定のデータを著作権等の制限なく、すべての人が自由に利用できるようにし、イノベーションを加速しようという考え方で、日本でも総務省が中心となって地方公共団体のオープンデータを推進しています。
こうした背景のなか、データをうまく使うスキルは基本のビジネススキルの一つになるでしょう。Google Dataset Searchも、Googleがこれまで提供してきた多くのサービスと同じく、ビジネスパーソンが当たり前に使うサービスになっているかもしれません。

現状、まだまだ課題も感じますが、ぜひGoogle Dataset Searchを自身の仕事に活用してみてください。