釣り記事の線引き、ユーザーたちの判断は大体正しい:Gunosy 共同創業者 関 喜史

広告収益機会を求めるメディアにはページビュー(PV)を増やす強いインセンティブが働いており、ユーザーに記事をクリックさせるための工夫(メディアハック)が積極的に行われるようになった。Gunosyは2016年後半からクリックベイト(釣り)を回避するアルゴリズムを研究開発している。Gunosy 共同創業者 開発本部 データ分析部/東京大学大学院 工学系研究科 客員研究員 博士 関 喜史氏に、同社サービスの大規模データを活用した研究開発の状況や人々のニュースメディア接触の状況を聞いた。

「クリックベイトが広まった背景はいくつかある。『そもそもいままでインターネットってお金にならないよね』みたいな話が2000年代前半ぐらいから2010年代前半ぐらいまであった。広告技術(アドテクノロジー)の進歩や広告市場の拡大により、PVに対してお金がある程度読めるようになってきたのが、ひとつ大きな背景としてあると思っている」。

「つまり、2000年代中盤はメディアがお金を稼ぐためには『月いくらの広告をどんと取られたら売上が上がるし、取られなかったら売上が上がらない』、そういう世界感だった時期があったと思う。今はわりとPVに関してある程度、計画が立てられて読めるようになり、ビジネスとしてわりと成立するようになってきた」。

「一方で『じゃあPVが高まれば売上が上がるよね』という状況においては、コストを安くPVを高めようみたいな向きが当然ながら起こっている。そういった流れが過剰になっていくと、いわゆるタイトルだけで釣って中身は関係ないようなものを作るインセンティブが多少生まれてしまう」。

「ただ一方でそれをユーザーが見抜くのが現状難しい。当然ながらユーザーは読んだ後じゃないとそれがいいかどうかわからない。そもそもじゃあこのメディアの記事は信用できるけど、このメディアの記事は信用できないみたいな、その情報を頭にユーザーがインプットできるかというと、そういう問題ではない」。

タイトルとサムネイル画像の世界

「そういう意味でソーシャルメディアでは『どこのメディアのニュースか』みたいなこともだいぶ希薄になっている。ユーザーはタイトルや画像のサムネイル画像が並んでいるところからどのニュースを読むか意思決定を行う。タイトルには5W1Hの必要な情報がまとまっていて、ファーストセンテンスに重要なことが書かれていてというのは、雑誌や新聞で俯瞰(ふかん)して記事を見るなかでどれを詳しく読んでいくかの意思決定をするための造りだった。ウェブにおいてはそれを閲覧する意思決定をユーザーに委ねるところで結構違う気がしている」。

「最近の世の中で『釣り記事』と言われている一部は割とウェブフォーマットの適切な進化なのだろうかと思わなくもない。ユーザーがほんとに不快に感じるかどうか、結構よく分からない。ユーザーが不快に感じたかどうかは多分、メディア側が知る術が基本的にはほとんどない。『従来の記事の書き方の適切なタイトルの付け方ではないものは全部釣り記事という言い方をするのか』と言われると、そういうわけでもない。たぶん線は引けないという話が当然ながらある」。

関氏は自然言語処理を通じてメディアの特徴を評価する研究をした。メディアとトピックの関連性を推測し、その分布を調べる手法が使われた。「いままでだとユーザーはこの媒体を講読するみたいな意思を持ってやるので、メディアを比較することは多分、真の意味でほとんど行われていなかった。いまはわりとユーザーはプラットフォームからニュースを見る。メディアの特性とか比較はより現れてくる時代かもしれない。サムネイルとタイトルに集約されて、ほかのメディアが書いているのと同じものを書いても仕方がない。メディア収益化の面からも、有料会員やオフラインコミュニティーにより収益を加えるみたいな仕組みが結構わりと重要になる。メディアが特性を持つことがより重要になる」。

「ソーシャルメディアに対してニュースに関する意見を表明する層はかなりマイナー。2015年の研究では、ソーシャルメディアにおけるニュースのシェアの違いを扱った。すごいシェアする人も読むものとシェアするものは全然違う、そういう文脈があった」。

「なんとなく今日の情報がほしい」という意図

Googleはソーシャルメディア上のデータだけを扱っていても、自分を偽るので役に立たないと主張する記事をDIGIDAYに寄稿した。Googleは2015年のその記事でユーザーのインテント(意図)が含まれたデータこそ重要だと主張していた。

しかし、1日のなかで意図が明確なタイミングはそこまで長くないはずだ。関氏はGunosyが5年前にはユーザーの興味に合わせてニュースを出そうとしていたが、今は方針転換をしていると語った。

「『ZIP!』や『めざましテレビ』を見るときに、このニュースを見たいから『ZIP!』をつけてるわけではないだろう。みんな何か面白いものとか、何か世の中で何が起こっているかを知りたいという欲求で人々はニュースを消費するはず。そのなかで人の興味をどう刺激していくか。私は最近の釣りだって言われているもののなかでも、わりと釣りじゃないものも多いと思っている。いわゆる引き付けるようなワードがあって、それでも中身がしっかりしていれば、ユーザーは歓迎するかもしれない」。

エンゲージメントをどう評価するか

ユーザーが超合理的な人間で「すごいいいものだけに出合いたい」と考えると仮定したとき、100%釣りだけど中身がいいのと、そうではないのがあるとする。そうではないのを開くとかなり失望する可能性が高いだろう。「失望したときの評価はやりにくい。たとえばタイトルがいわゆるユーザーの意向をつかめたかはクリック率で評価できる、一方でそのあと、内容を見てどう思ったかはわからない。直帰率や『次の回遊をするか』は指標と考えるかもしれないが、別に読んで満足したら閉じるのは普通の行動だ。じゃあどのように評価していくのか。特に弊社のような大規模なデータがあって、いわゆるユーザー行動解析にそれなりの知見があれば、読者の感じるマイナスを最小化することによる事業上の利益が大きい」。

元は同じグループだったフィナンシャルタイムズ英エコノミストは時間ベースの評価にトライしている。堅い長文記事においては時間とエンゲージメントが相関すると推測された。

「そのような特性のものは、当然滞在時間というものがエンゲージメントと関係するのは当然だが。ただ(時間との相関性は)カテゴリーやニュースの種類に依存している。滞在時間が短いのを切れば、ユーザーのエンゲージメントが上がるのかを実験した。実際には一部のユーザーのエンゲージメントがよくなってたが、逆に一方では悪くなる局面があった。滞在時間だけだとちょっと駄目そうだった。コンテンツの特性×滞在時間で評価しないといけなくて部分がある」。

滞在時間が長くても、あまりよくないケースも当然ながらある。ユーザーを迷わせる設計の記事が存在する。「画像の中心のニュースで、サムネイル画像で大きいものを見れば、満足するみたいなケースがあって、そういうのとかがわりと滞在時間が極端に短いみたいなものに含まれるというのが分かってきている」。関氏はGunosy上で穫れている行動データと、コンテンツ、アンケートによる感情の調査を組み合わせて、統計的に解析するとよりいいインサイトが手に入ると考えている。

フェイクニュース「嘘であること以外は完璧」

「フェイクニュースは非常に難しい。『嘘であること以外は完璧なニュース』という定義を置いている。嘘かを見抜くかどうかは、二重に検証することをしなくてはいけない。でもフェイクニュース自体は、実はタイトルに必要な情報はすべて紛れ込んでいて、興味を持って閲覧するとなかにはさらに詳細な情報があって、付加情報が追加されている。つまりシェアしたくなるニュースだ。クリックベイトのニュースは釣ったが中身に満足できないため、シェアしたくないみたいな話があって、ニュースとしてはだいぶ不完全。定義にも依存するが、ユーザーの評判をニュースのひとつの価値、基準として定義していると考えたときに、フェイクニュースは嘘であること以外はパーフェクト」。

採用されているのは多数のユーザーに判断を委ねることでそのニュースの価値を測ることができるという考え方。意見の多様性があり、個々に独立した人たちの意見群は、概ね正しいことが多いとされる。群集の知恵(Wisdom of Crowds)と呼ばれるメカニズムだ。

Gunosyのユーザーはジェネラルな母集団か。「弊社のユーザーの母集団に偏りがないとは当然ながら言わないですし、いわゆるそういう意味では弊社のサービスにマッチしたユーザーだけが残っているっていう考え、捉え方もできる。でも、弊社のアプリ内で考えるのであれば、それでも十分」。

人間とコンテンツのマッチとは

人間とコンテンツが最適にマッチしているのはどんな状態を指すのだろうか。「ものによる。その人間の意図とか、どこの部分の時間を取りにいくかだと思っていて。その意味で言うと、人がその知識欲を満たし、その時間をつぶすみたいな話になってくるんですけど。僕の中では一番のモデルケースは『ZIP!』だったり『めざましテレビ』だったりとかするわけですよね、サービスとして。あれがもっとより個人に最適化されていて世の中で起こっていることはだいたい知ることができて、なおかつ明日役立つより、今日役立つような知識みたいなのが知れてみたいので基本的に不快にならないみたいな、そういう部分も含め、あれ結構、パーフェクトな情報の伝え方ではないかと感じている」

seki1Gunosy 共同創業者 開発本部 データ分析部/東京大学大学院 工学系研究科 客員研究員 博士 関 喜史氏

ソーシャルからユーザーの需要を予測することは可能かと質問した。「ソーシャルメディア上でのバズと、一般社会のバズがどのぐらい相関しているか。この領域ではソーシャルメディア上での中に盛り上がりとか盛り下がりみたいなものを可視化する研究ってもう結構よくやられている。一方で『現実世界とそれは一致しているの?』という面がある。現実社会をどうやってウェブ上のデータからモデリングしていくかはいま重要な課題のひとつだ」。

「中長期的に使い続けるアプリにするっていうところがあるのかなと思っている。悪い部分をひとつずつ減らしていく。基本的にはさまざまな難しさによって悪くなっている部分がある。その難しさみたいなものを解くのがある意味研究開発の仕事なのかなと思っていている。結局、ユーザーの中長期的な不満っていうのは、中長期的に使われているユーザーの不満は絶対放置できないが、さまざまな難易度から放置されている問題だったので、そういった部分を研究開発という枠組の中で解いていきたい」。

Written by 吉田拓史 / Takushi Yoshida
Photograph by GettyImage