サードパーティCookieの代替技術としてGoogleが提唱してきた、広告ターゲティングを自動化するFLoCはユーザーの匿名性が高く、プライバシー保護に寄与できるとされた。しかし、実際には業界各社がFLoC IDと、ユーザー個人を特定できるデータを組み合わせて利用しはじめ、プライバシー援護派の不安を煽っている。
サードパーティCookieの代替技術としてGoogleが提唱してきた、広告ターゲティングを自動化するFLoC(Federated Learning of Cohorts:コホートの連合学習)は、Cookieに比べてユーザーの匿名性が高まり、プライバシー保護に寄与できる手法というふれこみだった。ところが、実際はそうでもないらしい。FLoCを導入するとエージェンシーたちがこれまでより速く、より簡単に、ウェブサイトのユーザーを特定して閲覧履歴データを入手できるかもしれないのだ。
プライバシー保護とデータ倫理の推進派が警鐘を鳴らしたとおり、業界各社はFLoC IDと、ユーザー個人を特定できる既存の情報を組み合わせて利用しはじめた。
オンライン行動データの知見と、サードパーティCookieによるトラッキング以前から把握していたプロフィール情報を紐づけるわけだが、代替ID技術ベンダーによれば、こうした情報はユーザー個人を特定する仕組みの精度を向上させるとともに、永続的識別子として使われる可能性を秘めているという。
Advertisement
「この種の信号が多ければ多いほど、ユーザー特定の精度が上がる。FLoC IDも、当社で使っている信号のひとつだ」と、ID技術ベンダーであるID5のCEO、マシュー・ロッシュ氏は説明する。
本当にプライバシーを保護するのか
GoogleはFLoCがプライバシー保護に配慮した広告ターゲティングの指針となるものだと主張する。その根拠は次のとおりだ。FLoCは個々人をトラッキングせず、ウェブサイト閲覧履歴にもとづいて、類似性が高いユーザーを機械学習によりグループ化する。また、ユーザーに割り当てられるFLoC IDは毎週更新されるため、ユーザー集団のデータは変化していく。
つまり、FLoC IDの永続的識別子としての使用が制限されることになる。機械学習はChromeなどのブラウザ内で自動的に処理されるシステムで、コホート収集プロセスを精緻に定義しない。またGoogleは、自社の「不透明なコード」を開示するラベルは提供しない。ただ広告業界はこれまで、CookieやIPアドレスを使ってインターネットのユーザーを特定する基盤技術を受け入れてきた。同様にFLoC IDを活用すれば、サードパーティCookie廃止による影響を抑えられると期待しているのではないか。
グループエム(GroupM)傘下のアドテク企業、ザクシス(Xaxis)で技術・運営部門のディレクターをつとめるニシャント・デサイ氏によると、FLoC IDはIPアドレスと同じ経過をたどり、最終的に永続的識別子の機能を果たす可能性があるという。IPアドレスと同様、FLoC IDも完全には固定されているわけではない。とはいえ、FLoC IDが単体で、またはID群の形で、個人の特定につながる恐れもある。
「あるユーザーのオンライン行動パターンに変化がない場合、機械学習のアルゴリズムはそのユーザーを同じコホートに割り当てつづける。結果として、永続的なFLoC IDに紐づけられるユーザーが出てくる可能性がある」と、デサイ氏は指摘する。Googleは現在FLoCの試験運用中だが、対象データがウェブ上のトラフィックのごく一部でしかないため、「データの活用方法や分析結果の統計的有意性には限界がある」と、デサイ氏をはじめ本稿執筆にあたって取材した企業の関係者は異口同音に述べた。
むしろ個人情報収集が容易に?
多くの関係者が、FLoCのデータ利用時に個人のプライバシーを保護するさまざまな仕組みについて語っている。
しかし、プライバシー擁護派はFLoC IDの導入で、企業による個人情報収集の障壁が低くなりかねないとして警戒している。デジタルプライバシー擁護団体の電子フロンティア財団(Electronic Frontier Foundation:EFF)のテクノロジスト、ベネット・サイファーズ氏は次のように述べている。「従来のプロセスでは、ユーザーがウェブサイトを閲覧して初めて、そのサイトが発行したCookieがデバイスに保存され、そこから閲覧履歴のトラッキングが始まる。一方、FLoC IDとそれが発する信号は直ちに取得できる情報だ。これはアドテク業界でも前例がない」。
サイファーズ氏は3月に自ら投稿したブログの記事で、FLoCについて「とんでもない考えだ」と批判した。エージェンシーが活用をもくろむ「識別子としてのFLoC ID」の可能性があるからだろう。「ブラウザを利用しているFLoCのコホートを対象にトラッキングがおこなわれるなら、ユーザーが属するコホートは(数億でなく)わずか数千単位のコホートとの比較で特定できる」とサイファーズ氏は書いている。
GoogleはFLoCシステムの試験運用中、Chromeのブラウザで生成されたFLoCデータの利用方法に関してルールを設けておらず、本記事の取材時には同社のコメントは入手できなかった。
FLoC IDとプロフィール情報を紐づける
広告業界各社はすでに戦略的意図をもってFLoC IDを収集し、ユーザーを特定できるデータと紐づけたり、個人に関する新たな情報を発掘する目的で分析したりしている。これらの取り組みは、サードパーティCookieを使ってユーザーのオンライン行動を追跡し分析していた手法と類似している。
ブランド企業向けにデータ活用とID技術のソリューションを提供するニュースター(Neustar)は、自社サイト内のアクティビティで生成されたFLoCのデータを収集し、クライアント企業のサイト上のトラフィックを対象としたFLoC試験運用の成果を検証中だ。同社のプロダクト・マーケティング部門ディレクター、デヴォン・デブラシオ氏によれば同社は今後、FLoCのデータを既存のユーザー識別データと紐づけて使用する予定だという。「当社のクライアントつまり広告主は、自社運営のウェブプロパティ上で認証されたユーザーのFLoC IDと、自社が管理するeメールアドレスなどのファーストパーティデータを関連づけられるようになる」。
ザクシスのデサイ氏は「FLoC IDは識別子問題を解決しうる新手法になるだろう」と述べている。同氏が期待しているのは、ID技術ベンダーやアドテク企業が新たな信号としてのFLoC IDを取り入れて識別子問題の解決策の一助とすること、そして、企業側がすでに把握しているユーザーのプロフィール情報について通知することだ。「FLoC IDがアイデンティティグラフ(ID graph:特定の顧客の異なるアイデンティティ間の関係を示すマップ)に記載されれば、ユーザーのプロフィール情報とFLoC IDの関連づけが可能になる」と、デサイ氏は述べた。
以前、米DIGIDAYの取材に応えたデサイ氏は一般論として、ID技術ベンダーによるFLoC ID操作の可能性に言及した。当時の取材では最初、「グループエム傘下の新興データ会社コレオグラフ(Choreograph)が、FLoC IDを自社のID技術に取り入れるべく分析をおこなっている」としていたが、コレオグラフはその事実はないと否定した。記事配信後、グループエムから「デサイ氏の発言は誤りで、コレオグラフでは現在、FLoC IDを自社のアイデンティティグラフに取り込む予定はない」との指摘があった。ただしグループエムでは、クライアントへの将来的なサービスとしてFLoCを実装するための最適な方法を検討すべく、デューディリジェンスを実施しているという。
期待感を見せるアドテク勢
ID5が提唱する確率論的ID技術は、IPアドレス、ページURL、タイムスタンプなど、さまざまな信号を用いて個人の識別情報を検知する。同社は、現時点ではFLoC IDを定常的なデータソースとして使っていないものの、CEOのロッシュ氏はFLoC IDを活用すれば自社システムの精度が上がると見込んでいる。
ひとつのFLoC IDで管理されるグループの構成は比較的少人数(何十万、何百万人規模でなく1000人程度)であるため、システムは過去に特定のFLoC IDに割り当てられたユーザーを認識しやすく、運用に必要なベクター(一次元配列)の数が少なくてすむ。「当社と取引のあるパブリッシャーが、広告ターゲティングと効果測定目的で取得し、ユーザー識別用に使っているデータ信号を共有してくれれば、それを利用して安定した識別子を生成し、パブリッシャーに提供できる」とID5のロッシュ氏は述べた。
広告主向けのデータ活用・管理コンサルティングを手がけるマイティハイブ(MightyHive)のデータ部門長、マイケル・ヌヴォ―氏は、「当社がFLoC IDを収集しているのはコホート分析が目的だ」と語る。「広告主は、グループに分類したユーザーの閲覧履歴を把握することで行動の傾向がつかめる。たとえば、あるFLoC IDに属するグループが、別のFLoC IDに属するグループに比べて特定商品の購入など、ある種の行動の頻度が高い、といった傾向がわかる。そうすれば、『コホート1000に分類されたユーザーはこの広告に関心があるようだから、類似したコホートのユーザーにも同じ広告を表示して、関心を示すかどうかを調べる』というような手法がとれる」とヌヴォ―氏は述べている。
デサイ氏らがDSPやアドテク企業に期待するのは、コホートIDの収集、分析、大規模なデータベースの構築だ。コホートIDが示す行動パターンにもとづいて人々の関心事を洗い出し、広告ターゲティングに活かすのである。
そうした取り組みはすでに始まっている。クリテオ(Criteo)は米DIGIDAYの取材に対し「FLoC IDを収集している」と答えたが、取得したデータの利用法や今後の計画については詳細を語らなかった。一方、アイポンウェブ(Iponweb)の子会社でサプライサイドテクノロジー専門企業のザ・メディアグリッド(The MediaGrid)で製品アーキテクトを務める、マイケル・ベスチャストノフ氏は次のように述べている。「GoogleがFLoCの本格運用を開始すれば、アイポンウェブ傘下のDSPもFLoC IDにより生成されたデータを広告ターゲティングに活用できるようになる。FLoC IDは現在、アイポンウェブ社内でテスト中だが、今後は我々の『製品の一部』となる可能性がある」。
FLoCの「リバースエンジニアリング」
オーディエンスのプロフィールを作成するには、FLoC IDを別のタイプのデータと紐づける方法以外に、GoogleによるCookie代替のターゲティング手法も使える。
広告サービスのカフェメディア(CafeMedia)でエコシステム・イノベーション部門のバイスプレジデントをつとめるドン・マーティ氏は4月、FLoC IDの構造を分析するリバースエンジニアリングを始め、どのコンテンツがどの匿名コホート集団に関連づけられているかを確認しようと試みた。「FLoCのデータは、グループ化されIDが割り当てられたオーディエンスに向けて広告を配信するだけでなく、IDのないユーザー向けにコンテキストにもとづいた広告を表示するときにも使える。ちなみに、ユーザーが利用しているブラウザがFLoCに対応していないか、FLoCが無効化されているか、あるいは当該のコホートがブロックされている場合、IDは割り当てられない。ほかのデータと関連づけないかぎり、FLoC IDのリバースエンジニアリングを行っても、ユーザー個人を特定できる事象はみられない」。
マーティ氏は、FLoC対応ブラウザから取得した数百万ものデータポイントを分析し、コンテンツのキーワードに関連して特定のFLoC IDがより高い確率で浮上するデータポイントの発見など、調査結果を記事にまとめてブログに投稿した。たとえば金融・ハイテク関連のコンテンツと紐づいた数万のFLoC IDの分析評価では、棒グラフの形状が「長い谷」のようにへこんで見える多数のコホートに、投資関連のコンテンツにあまり関心がないと思われる人々が分類されている一方で、14000番台の少数ユーザーからなるコホートには、関心が高いと思われる人々が集まっていた。「つまり、チャールズ・シュワブ(Charles Schwab)などの証券会社が、投資に興味のある人に訴えかける広告を打ちたい場合、まずは14000番台のFLoCを対象に配信を開始すべきだということだ」。
とはいえ、すべての広告代理店がFLoCの識別機能の可能性を確信しているわけではない。小規模パブリッシャー向けの広告サービス会社メディアヴァイン(Mediavine)は、FLoC IDを使ったおすすめコンテンツの通知サービスに関する実験を行ってきた。しかし共同創業者兼CEOのエリック・ホッホバーガー氏によれば同社は、「FLoCを自前のファーストパーティデータと紐づけていないし、これからも紐づける計画はない」という。メディアヴァインは、パブリッシャーと直接取引しているアドテク各社と同様、ユーザー識別を可能にするファーストパーティデータの将来性に期待を寄せている。サードパーティCookieの廃止後、オープン・ウェブ上で活動するパブリッシャーに広告・サブスクリプション収入をもたらすソリューションになると見込んでいるからだ。
「ファーストパーティは今後、データの提供元として価値がますます高まっていくだろう。FLoCのコホートはけっきょく匿名のID群にすぎず、Google独自の調査結果によると、広告ターゲティングの精度ではサードパーティCookieの95%がせいぜいといったところだ」と、ホッホバーガー氏は指摘する。「効果が薄いFLoCのデータを、より効果が高い自社データと紐づけることが得策とは思えない」。
「個人情報の小包」
FLoCの効果の是非はともかく、FLoC IDが価値あるユーザー識別情報になりうると判断する企業は確かに存在する。だからこそ、プライバシー保護を訴えるサイファーズ氏のような研究者がそういった企業を、想定されている理論を超えてプライバシー問題を起こす存在とみなしているのだ。
ChromeにおけるFLoC IDの機能を説明しよう。Chromeは、ユーザーが設定でプライバシーサンドボックスを無効にするか、または拡張機能によりブロックするか、いずれかの方法でプライバシーサンドボックスを「オプトアウトしていない」場合、ひとりひとりにFLoC IDを割り当てる。したがって、ある人がとあるサイトを一度も訪問したことがなく、本来そのサイトや広告システムが取得しえないその人の個人情報が、FLoC IDによって明らかにされるという不可解な状況が生じるリスクがあるのだ。
つまりこの種のデータ信号は、たとえばユーザーの性別、高所得者か低所得者か、特定の地域に居住しているかどうかなどを推定するきっかけとなる。FLoCは、サードパーティCookieによる行動トラッキングの代替案として、プライバシーを保護する意図で開発された手法であるにもかかわらず、「まるで個人のプライバシー保護が必要か否かを勝手に判断を下す新手法ではないか」と、サイファーズ氏は指摘する。
「Chromeは、ユーザーが初めて閲覧するウェブサイトに紐づくFLoC IDを発行する。ユーザーがほかに何もしなくても、閲覧行動が認識されるやいなや、ウェブサイトや広告システムはその人の『個人情報の小包』を自動的に受け取ることになる」。
KATE KAYE(翻訳:SI Japan、編集:分島 翔平)