毎週木曜日に配信している「データサイン・ランチタイムトーク」の模様をレポートします。

当記事で取り上げるのは以下の配信です。

  • 配信日:2021年6月3日
  • タイトル:FLoC オリジントライアル
  • 発表者:データサイン 代表取締役社長 太田祐一

サイト訪問者のブラウザを「興味コホート」と関連づける

FLoC(Federated Learning of Cohorts)とは、サイト訪問者のプライバシー保護と、ブラウザへの適切な広告配信を両立する新しいメカニズムのこと。既存のサードパーティーCookieによるターゲティング広告の代替としてグーグルが提唱し、W3Cにおいてその標準化が進められています。現在行われているオリジントライアルについて、データサイン代表取締役社長 太田祐一が解説しました。

FLoCは、サイト訪問者のインタレスト(興味)に基づいて広告を選択・配信する仕組みです。Chromeブラウザを提供するグーグルが2019年8月に公表したプライバシーサンドボックス構想に基づいて、アイデアの規格化やブラウザへの実装に向けた概念実証(PoC)が現在進められています。

オリジントライアルとは、ブラウザに新機能が正式にリリースされる前に実施される、パブリッシャーや広告主、アドテク事業者、ウェブ開発者向けのテストです。Chromeのバージョン89以降で、履歴データの同期を選択していること、サードパーティーCookieをブロックしていない、などいくつか条件を満たせば一般ユーザーもトラアイルに参加することが可能です。

「FLoCを主導しているのはグーグルですが、Chrome以外のブラウザ、たとえばSafariなどに正式実装された場合、各ブラウザで若干動作が異なることが想定されます。また、オリジントライアルは実装の前段階なのでブラウザが担う機能の一部を、グーグルが運営するサーバー側で代替していることが考えられます。グーグルによるPoCが含まれていることにご注意ください」(太田)

興味や関心で分類する「コホート」ってなに?

サードパーティーCookieを用いると、複数のウェブサイトを横断してアクセスしてきたブラウザを広告配信システム側が一意に識別することが可能です。

一方、FLoCでは、ブラウザをウェブサーバー側から一意に特定することができません。広告配信側に伝えられるのはコホートと呼ばれるある特徴を持った集団(広告におけるセグメント)のどれに帰属しているのか、という情報です。

「一例を挙げると、あるニュースサイト、旅行予約サイト、観光地の総合情報ポータルサイトの閲覧履歴を持つグループを1つのコホートに割り当てます。そして、コホートID『1番』というようにグループごとに識別子を付与します。あるチラシ・クーポンサイト、子供向けの通信学習サイト、ゲーム総合情報サイトを閲覧しているグループは別のコホートID(2番)にまとめる、という具合です。広告配信システム側は、『コホートID1番の人たちは、そのコホートの特徴を突き止め、観光旅行に興味・関心がありそうなビジネスパーソンかもしれないな。ならばこういう広告を表示しよう』というように広告戦略にコホートIDを活用します」(太田)

ただし、広告配信側に対して、あるコホートIDのセグメントに帰属する個々のブラウザが、どのような閲覧履歴を有しているか、という機微な個別情報は伝えられません。

「言い換えると、自社サイトへの訪問者のデータ、つまりファーストパーティーデータを持っている事業者は、それらとコホートIDの相関を分析すると、コホートIDの特徴をつかみやすいかもしれません」(太田)

コホートIDはどのように割り振られるの?

グーグルが実施しているFLoCのPoCでは、グーグルによってランダムに作成されたダミーの33,000種類の訪問履歴とそれを分類したコホートIDが用意されています。

このPoC参加者のブラウザが、同じくPoCに参加するウェブサイト(FLoCが動作するJavaScriptタグが設置されたウェブサイト)にアクセスすると、ダミーの訪問履歴とコホートIDを管理するシステムが呼び出され、ブラウザが保持する過去7日間の閲覧履歴と比較照合されます。そして類似するコホートを抽出し、ブラウザにそのコホートIDを付与します。

「あるコホートに分類されるブラウザの数が2000より多いかどうかシステム側は判定しているようです。仮に2000を下回る少数、極端ですが1つしかないような場合、ブラウザが特定されるプライバシーリスクがあります。ブラウザ数が一定値を超える、など条件を満たす類似コホートが見つかるまで比較作業は続けられます」(太田)

ブラウザにコホートIDを付与している、ダミーの訪問履歴とコホートIDを管理するシステムは現在グーグルが運用管理していると考えられますが、将来的にはブラウザ側で動作することも考えられます。グーグルの開発者ブログにも「個々の閲覧データがブラウザベンダーなどの他者と共有されることはありません」と記されています。

FLoCには、機械学習の一種であるフェデレーテッド・ラーニング(Federated Learning)が用いられています。コホートの特性と個々のブラウザの行動履歴を精度よくマッチングするには、より多くのサイト訪問者がFLoCに対応したブラウザを利用し、なおかつ、その動作を許諾することが前提となります。広告ネットワークにおいてサイト訪問者や広告主、広告配信事業者などが満足するよりよい広告ネットワークになりえるか。オリジントライアルを通じたグーグルやW3Cへのフィードバックが重要になりそうです。