なぜ FT は、テキスト記事を「音声変換」し続けるのか?

フィナンシャル・タイムズ(Financial Times:以下、FT)が人員4人で構成する研究開発部門FTラボ(FT Labs)は、記事を音声で聴くことを望む読者がどの程度いるのかを見極めるため、FTのテキスト記事を音声に変換することに取り組んできた。

FTは、音声変換サービスの「Amazon Polly(アマゾン・ポリー)」を使って、テキスト記事を音声に変換している。記事を読み上げるのは「エイミー(Amy)」と呼ばれる人工音声で、テキスト原稿は1~3秒ほどで音声に変換される。変換されるのは人気の高い記事で、短い記事も長編記事も含まれる。たとえば、米国人元プロボクサーのジェイク・ラモッタ氏を追悼する記事や、リスボンが旅行者のあいだで人気が高まっている理由を探る特集記事などだ。

FTは現在、購読者の10%に音声記事を提供しており、2017年末までには、残り90%にも提供したい考えだ。また、FTのプログレッシブウェブアプリ「リッスンFT(Listen FT)」でも記事を聴けるようにしている。

改善が進められるシステム

FTラボを率いるクリス・ギャザコール氏は、音声記事の利用状況について結果を公表するのは時期尚早としながらも、初期のデータからはユーザーが繰り返し利用していることがわかると述べた。

FTは今後数カ月で、読み上げのリズムや口調の問題を改善していく予定だ。たとえば、Amazon Pollyでは、「Trump(トランプ)」という単語が動詞として処理されていた。そのため、この単語が人名ではなく動詞として読み上げられたときに、不快な聴こえ方になっていた。これに対処するため、テキスト記事に「Trump」という語が現れるたび、変換プロセスが中断されるようにプログラムを変更した。ギャザコール氏によると、彼らがこの問題をAmazon Pollyのチームに報告した結果、いまでは問題は修正されているという。同じように、FTが「million(100万)」の略語として利用している「m」を、Amazon Pollyが「meter(メートル)」として処理するという問題もあった。

「このようなちょっとした調整を、すべてにわたって続ける必要がある。Amazonもこうした問題の修正に取り組んでいるので、数カ月後にはすべての購読者に音声記事を公開できると確信している」と、ギャザコール氏はウィー・アー・ソーシャル(We Are Social)がロンドンで9月27日に開催したイベントで語った。

別の問題もある。株価や市況など需要の多いコンテンツの多くがリスト形式になっており、そのままでは読み上げができないのだ。「これはシステムに内在する大きな欠陥だ。読み上げを行う際に音声が自動車事故に遭遇するようなものだ」と、ギャザコール氏は明かす。「そのため、バックエンドで多くの作業をこなさなければならない」。

すべてのユーザーに音声を

それでも、音声で記事を聴きたがっているユーザーがいるなら、FTが毎日配信する300件の記事すべてを音声に変換しない手はない、とギャザコール氏は語った。

市場調査会社ミンテル(Mintel)のデータによると、英国人の62%が、音声コマンドを使ってデバイスを操作しているか、将来使用したいと回答したという。このような状況を考えれば、音声で制御できるデバイスにも記事を配信する取り組みは、FTにとってきわめて重要だ。Amazonの「Alexa(アレクサ)」や「Google Home(グーグルホーム)」では、いくつかのメディア企業が1日のトップ記事を音声で配信している。記事を無料で公開しているパブリッシャーにとって、これは理にかなった取り組みだ。しかし、コンテンツを無料で提供すると、FTにお金を払う価値があるという前提が揺らぎかねない、とギャザコール氏は懸念する。

「我々に必要なのは、購読者がこうしたデバイスをもっと便利に利用できるようにすることだ」と、ギャザコール氏は語る。「FTのコンテンツを娯楽で読む人もいれば、情報を得るために利用する人もいる。あるいは、調査目的の人もいるだろう。音声制御デバイスで、こうしたさまざまなニーズのすべてに対応する必要がある。受け身の聴取は、未来の姿ではない」。

Lucinda Southern(原文 / 訳:ガリレオ)