PUBLISHING IN THE PLATFORM ERA

「音声にも、動画やテキストに続く『変化』の波が訪れている」:Voicy CEO 緒方憲太郎氏

DIGIDAY無料メルマガに登録しませんか?

平日朝9時にマーケティング業界の最新情報をお届けします。利用規約を確認


「○○元年」という表現はいささか陳腐ではあるが、2021年は間違いなく「音声」というフォーマット、コンテンツで始まった。

もちろん、これまで音声がまったく注目されていなかったわけではない。しかし、2021年はじめに起きた空前のClubhouseブームとそれに続く音声SNSやコミュニケーションツールへの爆発的な関心の高まりには、今までにない勢いがあった。コロナ禍において必要に迫られコミュニケーションツールやインスタントメッセンジャーを利用したり、そもそもリアルなコミュニケーションを渇望していた、といった素地があったとしても、大きな変化が起きていることを感じさせられた。

ここで広がった音声の間口と認知は、音声を必要不可欠なフォーマットへと押し上げ、新たな価値を提供することになるのだろうか。その問いに対する、VoicyのCEOである緒方憲太郎氏の答えは「イエス」だ。

3月25日に開催されたDIGIDAY[日本版]主催の「DIGIDAY PUBLISHING SUMMIT 2021」において、緒方氏は「Clubhouseブームから読み解く音声コンテンツの未来:パブリッシャーにもたらすインパクトは?」と題したセッションに登壇。「動画やテキストに比べ遅れていた変化の波が、音声にも訪れる」とし、その変化の中身やパブリッシャーと音声との向き合い方を示した。

以下にセッションの一部を紹介する。なお、読みやすさを考え、多少編集を加えてある。

セッションに登壇したVoicyのCEO、緒方 憲太郎氏

セッションに登壇したVoicyのCEO、緒方 憲太郎氏

−−2021年初めに起きた空前のClubhouseブームの背景について、どう考えているか?

インターネットサービス事業の伸長は、ガジェットの進歩に比例すると言われている。音声コンテンツに関して言えば、ワイヤレスイヤホンやスマートスピーカーなどのガジェットがこの数年で急激に浸透し、誰もがスピーカーにもリスナーにも容易になりうる土壌ができていた。これがClubhouseをはじめとする音声コンテンツや音声サービス躍進につながったと考えている。

情報のD2C化も見逃せない要因だろう。検索やポータルサイト、キュレーションメディアを通じて届けられるコンテンツにオーディエンスは供給過剰感を覚えている。多くのパブリッシャーがパーソナライズ化に取り組んでいるとはいえ、一人ひとりのオーディエンスに最適化するのは難しい。なにより、今は個人が情報を発信することが当たり前の時代だ。Clubhouseのようなサービスを、自分が求めている情報をダイレクトに得られる場だと感じたのではないか。

アメリカでPodcastのムーブメントが起きた際もそうだったが、リアルタイムで新しいコンテンツが生み出される場に自分もいることは、オーディエンスにとって刺激になったはずだ。たとえるなら、これまでは誰かが取材をして執筆していた原稿を読むだけだったが、誰もが取材現場に行けるようになり、コンテンツが生まれる瞬間に立ち会えるようになった。これは革命的なことだろう。

−−そして、今後はClubhouseにとどまらず、大手のサービスも含め音声コンテンツのプレーヤーは増えていく。

大手SNSの動向を見ても、Twitterは音声ライブ機能の「スペース(Space)」を、Facebookも「ライブオーディオルーム(Live Audio Rooms)」を展開予定だ。さらに、動画やテキストメディアも、音声というフォーマットに改めて注目しつつある。

YouTubeは昨年から音声広告を開始し、Netflixも音声のみの配信をテストしていると言われている。ニューヨーク・タイムズ(The New York Times)が2017年に始めたPodcastニュース番組のザ・デイリー(The Daily)は、いまや1日平均400万人のリスナーがいる。プラットフォームからパブリッシャーまで、誰もが「音声」という形をひとつは必ず持っているのが当たり前の状況と言えるだろう。

−−ラジオやテキストコンテンツ読み上げなど、コンテンツとしての音声というフォーマットはある程度の枠組みができている状態だ。ここからさらに新たな価値を示し、さらに成長していく可能性はあるだろうか?

可能性は十分にあると考えている。動画と音声、テキストをコンテンツの三大フォーマットとして捉えてみると、動画とテキストには短尺化、大衆化という大きな変化が起きていたが、音声は遅れた存在だった。動画はテレビからYouTubeなどの動画配信サービス、TikTokのような動画SNSと、そのあり方を変化させている。同様にテキストも書籍、ブログ、SNSと変化してきた。

動画はカメラマンが撮影するもの、テキストは記者や作家が書くものという時代から、誰もが自由に思い通りの長さで発信できるようになっているが、音声だけは長らくラジオに代表されるような受動的なスタイルにとどまっていた。つまり、遅れていた変化の波がこれから音声にも訪れることになる。

音声を発信する、つまり話すという行為は誰にとっても日常的なものだ。動画の撮影やテキストを書くよりも身近で当たり前の行為にも関わらず、(音声コンテンツのようには)「話さない」ことが日本では当たり前だった。だがその文化も変化し、音声コンテンツに関わるユーザーの数も確実に増えている。これからが成長フェーズになるだろう。

−−音声を取り巻く環境が変化しているなかで、パブリッシャーは音声とどう向き合い、どのようにコンテンツを作っていくべきなのか?

ベースになるのは、なんのために音声コンテンツを発信するのかという点だ。Voicyとともに音声コンテンツの発信に取り組んでいる日経新聞を例に挙げると、同社はコアバリューを「社会に経済情報を届けること」だと定義し、そのためにはテキストだけでなく音声でも情報を発信すべきだと考えている。これがもし、「テキストで情報を伝えること」をコアバリューとしてしまうと、音声との向き合い方を誤ってしまう。

新しいインターフェースや市場が登場したときに取り組むべきは、そこでまったく新しい牙城をひとつずつ作ることだ。テキストコンテンツが紙からデジタルへ、あるいは動画へと拡張していくなかで、「紙媒体の売上を伸ばすため」というプランニングで大きな成功を収めた例はない。オーディエンスはそれまで存在していたコンテンツを、少し形を変えて再生産しても振り向かない。新しい世界で、新しいコンテンツに触れることを求めている。

そもそも、なぜいま音声が求められるようになったのかと考えると、可処分時間が大きな要因になっている。テキストや動画など視覚を使ったコンテンツは飽和状態にあり、限られた時間を奪い合う形になっている一方で、聴覚を使う音声は「走りながら」「料理をしながら」といった、ながら時間でも触れてもらうことができる。音声だからこそ可能な新しい場所ができつつあるなかで、あえて視覚を前提としたコンテンツを再生産する必要はないだろう。

−−単なるフォーマットの変化への対応ではなく、オーディエンスやコンテンツを取り巻く環境の変化を読み取り、最適な形で届けていく必要がある。

たくさんのものを多くの人に届け少しでもコンバージョンさせる、という戦略が必ずしも正解ではないことに誰もが気がつき始めている。誰が発信しているのかという点はもちろん重要だが、コンテンツの最適化、パーソナライズといった文脈で考えたとき、情報を求めているオーディエンスに本当に必要な情報を伝わるまで発信することができる音声は、現代にフィットしたフォーマットだと感じている。

また、インターネット上のコンテンツの多くは受信する側の手間を軽減している一方で、発信側の手間やコストは重い。誰に対しても開かれているようでありながら、必ずしもそうとは言えない状態でもある。しかし、音声であれば多忙な人でも5分間だけ話して発信し、オーディエンスも5分かけてコンテンツに触れる。どちらも対等でありながら、発信にはスピード感と手軽さがあり、オーディエンスからは一定の滞在時間を得ることができるのは音声の最大の強みだ。

毎朝テキストや動画でニュースを見るのと同じように、音声を通じてコンテンツを消費する行為は習慣化しつつある。この変化のなかで、パブリッシャーはどう動くべきか。短期的な成果を求めるのではなく、長期的な視点に基づいてオーディエンスとコミュニケーションを取り、丁寧に情報を届けることだ。そして、オーディエンスを「ファン」にしていかなければいけない。

Written by 分島 翔平
Photo by 渡部幸和