Google は10月21日、Chromeブラウザを介した広告に関連する実験の結果をソフトウェア開発プラットフォームのGitHub上で公開 した。Googleによれば今のところ結果は良好で、業界各社にも、Google提供のアルゴリズムを試験的に利用して同社の実験結果を検証してほしいとの考えを示している。
Google は10月21日、Chromeブラウザを介した広告に関連する実験の結果をソフトウェア開発プラットフォームのGitHub上で公開 した。読者の興味・関心にもとづく広告の運用にChromeのFLoC(Federated Learning of Cohorts:コホートの連合学習)の手法が適用できるかどうかを評価するテストで、プライバシーへの配慮を強化し、サードパーティCookie(閲覧履歴データ)を排除する設定となっている。Googleによれば今のところ結果は良好で、業界各社にも、Google提供のアルゴリズムを試験的に利用して同社の実験結果を検証してほしいとの考えを示している。
FLoCの手法がChromeのプライバシーサンドボックスで初めて公開されたのは2019年。同サンドボックス環境では、Chrome担当の他チームもそれぞれAPI(Application Programming Interface)のソリューション案を公開しており、これには不適切な広告トラッキングを削減する目的や、サードパーティCookieのサポート打ち切り後も広告掲載を可能にする目的の提案が含まれる。FLoCは、デバイス上で実行される機械学習アルゴリズムを使用し、ブラウザの閲覧履歴のような行動記録にもとづきオーディエンスをセグメント化する。
この手法の狙いは、広告主がターゲットとするユーザーをFLoCで定義される集団として扱いつつユーザーのプライバシーを強化することだ。個々のユーザーの仮名IDを使わず、共通の関心事をもとに分類されたユーザー集団(コホート)をターゲティング広告の対象とする。ブライバシーサンドボックスで公開されたほかの提案とは異なり、FLoCのソリューション案は広告業界の注目を集めている。FLoCという名称は鳥の群れ(flock)を連想させるが、鳥にちなんで命名されたソリューションとしてはほかに、リターゲティング向けCookie代替策のTURTLEDOVE(タートルダブ:キジバトの意)がある。ソリューション案のなかでFLoCに対する関心が特に高いのは、Cookieの代替策というより、従来にない新しい仕組みを提唱しているためだろう。
Advertisement
Googleが行った実験の内容
Googleが行った実験では、コホートのクラスタ化にあたり複数の方法を採用し、公的に入手可能なデータセット2組を対象にテストを行った。ひとつめは音楽カテゴリ別、ユーザーID別にタグ付けされた歌を100曲分保有するデータベース。ふたつめは、ユーザー入力による映画評2500万件のデータがジャンル別に保存されたムービーレンズ(MovieLens)のデータセットである。
実験の結果、以下のことが判明した。共通の興味・関心にもとづいてユーザーのコホートを作成すると、アルゴリズムによりユーザーが正しいコホートに分類される回数が350%に増えた。また「精度」、つまりアルゴリズムによるデータが正確だった回数においても70%の改善がみられた。GoogleはSimHash(シムハッシュ)というランダム射影アルゴリズムの使用を推奨している。SimHashは、コホートID以外のユーザー情報を収集せずにブラウザを介してコホートIDを扱えるようにするアルゴリズムで、中央サーバーにユーザーの閲覧履歴データを保存する必要がない仕組みだ。
Googleのユーザー信頼・プライバシー・透明性部門のプロダクトマネージャーをつとめるチェトナ・ビンドラ氏は、「実験の立ち上がりは順調だが、結果をまとめた報告書の公表は取り組みの第一歩にすぎない」と強調した。
「予想を上回る結果が出て喜んでいる。この種のアルゴリズムは、サードパーティCookieの代わりに使えてプライバシー保護を強化する仕組みとして大いに役立ちそうだ」とビンドラ氏はつけ加えた。
Googleは今、ほかのアドテク企業にもSimHashアルゴリズムの活用を勧めており、各社保有のデータで実験を行い、アルゴリズムでユーザーデータを匿名化しても広告効果が得られるかどうかを検証してほしいと期待している。
「ブラウザ開発者側でも並行して、あるいは順次、こうしたアルゴリズムの活用方法を検討していければ、価値ある取り組みになるだろう」と、ビンドラ氏は述べた。
とはいえ、まだ時間がかかりそう
とはいえ、ネット広告の広告主にとってFLoCが日常的に使える手法となるまでには、まだ時間がかかりそうだ。昨年FLoCのソリューション案が発表されて以来、ブラウザベンダーやアドテク企業に勤務するGitHubユーザーの多くが問題を提起している。FLoCの手法について「技術がほぼブラックボックス」と評するコメントやFLoC分類によるユーザーの閲覧傾向の変化を指摘する投稿、コホートの裏の意味と称して数字ID以外のコホート情報保護に言及した投稿などが公開されている。
エレクトロニック・フロンティア財団(Electronic Frontier Foundation)は昨年、プライバシー保護をめぐる懸念を示すブログ記事を公式サイトに掲載し、FLoCはたとえていうと「人の額に表示されたデジタルのタトゥーに、人物像、好み、行先、買い物、関係先などが要約されて公開されているようなものだ」としている。
また、アドテク企業51ディグリーズ(51Degrees)のCEOであるジェームズ・ローズウェル氏は「FLoCはウェブ技術の標準化を行う非営利団体W3Cのお墨付きを得ていない」と指摘する。「W3C会員で(Google以外に)FLoCへの支持を表明した者はまだひとりもいない。プライバシーサンドボックスの精査もされていないようだ」。
ローズウェル氏はこうも語っている。「FLoCを話題にしているのは中高年層ではないか。最新情報を入手するつもりで説明記事を長時間かけて読んでいるのだろう。しかしFLoCは、Google以外の企業が提唱していたら、Twitterにさえ取り上げられないようなものだ」。
「論より証拠。実際の運用を見た上で」
GoogleによるFLoCに関する論文は、W3Cが今週(10月第4週)開催するTPACのバーチャルミーティングで取り上げられる見込み。10月21日に始まるウェブ広告事業改善グループのセッションは翌22日まで続く(※原文記事は22日に公開)。
サードパーティCookieなしでネット広告を運用するための代替手法を提唱するにあたり、Googleは有利な立場にある。優秀なエンジニアを数多く抱えているうえ、独自の広告システムとデータ管理システムにより徹底したテストを実施できる能力をもつ。また、世界トップシェアを誇るブラウザのChromeを有しているのも強みだ。
一方、デジタルメディア専門代理店カフェ・メディア(Cafe Media)の最高戦略責任者、ポール・バニスター氏は次のように指摘する。「FLoCの手法は目的にかなっているとは言いがたい。複雑で専門的すぎるし、公開されている関連情報が曖昧でわかりにくいからだ」。
バニスター氏はこうつけ加えた。「今後出てくる新たな情報により、内容が明らかになっていくだろう。とはいえ、論より証拠だ。うまく機能するどうかは実際の運用を見てみないとわからない」。
[原文:‘Very pleasantly surprised’ Google shares results of Privacy Sandbox experiments]
LARA O’REILLY(翻訳:SI Japan、編集:長田真)