人工知能によるPDCA、その数学的アプローチの可能性:2050年までにノーベル賞級の発見を

世界は我々が認識するのとは次元が異なる複雑さをもっている。この複雑さをクリアするには人間の力では足りない。人工知能(AI)により人間の力を拡張する可能性に光が当たっている。ライフサイエンスの分野でも、科学的発見をするAIや、膨大な手作業から医者や研究者を解放しクリエイティブな仕事に集中させるAIという発想が現れている。

集まった膨大なデータが、人間の処理能力を超え得るため、発展著しいAIを利用するというトレンドはどの業界でも同じだ。マーケティング業界でもAIという言葉が飛び交っているが、今回はライフサイエンス分野の科学者/研究者の言葉に耳を傾けてみたい。

「地球環境問題のような問題群を人間だけで解明しようとするのは困難極まりない」。ソニーコンピュータサイエンス研究所社長の北野宏明氏は、7月のTHE NEW CONTEXT CONFERENCE 2016 TOKYOでこう語っている。「2050年までに医学・生理学でノーベル賞級の発見をする人工知能をつくる。医学・生理学の分野は情報量が膨大で、複雑すぎるので人間がその全容を理解するのが難しい。数学的なアプローチには大きな可能性がある」。

「膨大なモデルを検証し、実験をする。 仮説設定を繰り返し、研究が成功するまでに20年かかった。非常に幸運に良い道を走ったけど『20年かかって意味なし』もありえた。分子間の相互作用を抽出しようとしたときも、6カ月、みんなでやってポストイットで整理して、最後はエディターで書いた。我々は産業革命以前のやり方をしている」。

北野氏はこう指摘する。「『セレンディピティ』『幸運な間違い』はとても美しいが、裏を返すと『運任せ』だ。実は我々は科学的発見が得意ではないじゃないか。科学者がいっちゃいけないんだけど」。

人間の認知が含むバイアス

すでに情報量は科学者が処理できる量を超えている。「データを貯め、管理する情報基盤ができたので、人工知能を載っけることを考えたい。情報量があまりにも多い。年間160万件の論文が出る。どう処理するかというと、もうできません、というしかない。こんなにたくさんは読めません」。

少数派の「発見」をどうするかという問題も研究に影を落とすのだ。「99%が『AがBを活性化する』、1%が『BがAを活性化する』としたとき、この1%は発見なのか誤りなのか。リアリティと我々が記述している言葉は異なるもの。バイアスを含んでいるのが人間の認知だが、これをサイエンスにもち込むとうまくいかなくなる。『Asking right question(正しい質問をする)』ができるAIがやるべきだ。仮説生成とベリフィケーション(検証)をがっちり固められる。それでいいものだけを研究する」。

kitano1

AIBOの開発にも携わったソニーコンピュータサイエンス研究所社長の北野宏明氏

「存在するさまざまな問題を解決するには仮説空間の大規模探索と大規模計算が重要だ。しかし、そんな時間が我々に残っているのでしょうか?」。

ディープラーニングの進歩により、AIに関していままで難しかった問題が解決しつつある。画像認識では人間を凌駕しているものがある。コンピュータパワーが高まり、ニューラルネットのアルゴリズム、ビッグデータと重要な要素が揃っている。

知識は人間だけのものではなくなる。「石器時代から知識が道具を生み出してきたが、道具が知識を生み出すというのは根本的な転換になる。新しい文明が我々の手を離れるというのが、エクストリームだ。生命科学の部分でもものすごいインパクトがある。人間の知能と人工知能は、はたしてどうなるのだろうか。生命はサバイブするようにデザインされている。だが、大半の人工知能、ロボッティックシステムはサバイブする本能をもつようにデザインされていない。人工知能は自分のテリトリーを拡大していこうとするというのは考えられない」

作業から人間を解放する

東大発・画像解析ベンチャー、LPixel(エルピクセル)代表の島原佑基氏は、同社のがん診断支援におけるAIの活用を紹介した。画像認識はAIの力が人間の力を凌駕したとみられている分野だ。「がんの診断件数が7年くらいで1.7倍に増えているのに、医師の数は一定のままだ。医師の数は変わらないのに画像数だけ増えていくという状況。診断のためにCTの画像を1日数千枚、数万枚も眺め続けて疲弊する医師の苦労している。10年以内に診断を代替するAIの開発が必要不可欠というのが業界のコンセンサス」。

人工知能を用いたガンの診断測定。医療費と誤審を大幅に減らす高精度の診療を提供を目指している。国立がんセンターとの協働特許。医師と同等か若干上回る精度で画像からガンを検出するという。

AIをつくるには高い演算能力のほかに、質の高いデータ量が重要だ。「日本は医療画像大国。CTスキャンのCTの台数を国別に示すとEUよりも台数が多い。実際に撮れる枚数は2位の米国よりも1桁多い。医療保険など恵まれた環境がある」。

さらに画像以外のデータも複合的に掛けあわせた学習を目論む。「ディープラーニングを利用して、画像だけでなく、プロフィールデータ、性別、病歴、喫煙歴のほか、作業量の関係で利用できていなかった血液、遺伝子データなども、有意な特徴量に選抜する。それからアクティブラーニングで、実際にAIが判断に迷う部分を医師から学習する」。

この技術はがんセンターにかぎらず、大手医療企業などと医療画像診断全般へと広めていくつもりだという。

エルピクセルは研究者のための画像解析も視野に入れているという。現在、医療、製薬、農業などのライフサイエンス分野では、研究者の9割が論文で画像を使用しているが、そのほとんどが画像解析の講義を受けたことがない状況だという。ライフサイエンス画像を撮影したらすぐにアップロードし、解析をはじめるクラウドをつくる。「こういう画像はこう解析すればいい、と教えてくれる。研究者は撮影後にコーヒーを飲んでいると、解析結果がでてくるので、そこからクリエイティブな仕事を人間がすることになる。科学を加速させるAIだ」。

Text by 吉田拓史
Image by Thinkstock / Getty Images