日本の主要産業である製造業が、データアナリティクスの活用を検討している。「インダストリー4.0」「インターネットインダストリー」という製造業者の心を打つバズワードが出てきてから、多くの企業が、データアナリティクスやロボティクス、ソフトウェアなどを基点に発展する、新しい製造業のモデルを考え始めている。
日本の主要産業である製造業が、データアナリティクスによるイノベーションを目指し始めた。「インダストリー4.0」「インダストリアル・インターネット」という製造業者の心を打つバズワードが出てきてから、多くの企業が、データアナリティクスやロボティクス、ソフトウェアなどを基点に発展する、新しい製造業のモデルを考えはじめている。
テラデータデータサイエンス部 部長 津田 高治氏とインダストリー・コンサルティング部 部長 村松 孝浩氏に国内外の製造業者の取り組み事例について語ってもらった。テラデータは米国でデータウェアハウスベンダーとして30年以上前にスタートしたが、近年はデータとアナリティクス、ビジネス領域のコンサルティングによる顧客ビジネスの成果への貢献を主要事業の1つとしている。日本の製造業でのデータアナリティクスの実践はどうなっているのか。またその課題は何なのか。
シーメンスがデータ分析に
村松氏はまず、テラデータが支援する老舗重電の独シーメンスのデータ分析プラットフォーム「シナリティクス(Sinalytics)」の事例を説明した。インダストリー4.0の主要プレイヤーであるシーメンスの例は日本でもとても有名だ。
Advertisement
シーメンスの事業は発電設備、発電調査、産業オートメーション、ヘルスケア、モビリティーシステム、鉄道車両と多岐にわたる。これらは大量のセンサーデータを生み出しており、データ分析に投資する余地が大きかった、と村松氏は説明する。
スペイン国鉄レンフェに対して行われたモビリティデータサービス。26台の高速列車(マドリード・バルセロナ・マラガ間)の運行について、シーメンスがアナリティクスを基点としたサービスをレンフェに提供した。鉄道車両が発するセンサーデータから車両の故障を予測し、あらかじめ部品交換を行うことなどで鉄道障害を予防している。
日本と違い、時刻表にルーズなスペインの鉄道会社レンンフェ(マドリードやバルセロナなどスペインの主要都市を結ぶ高速鉄道AVEを運行)は、車両の安定稼働を保証するサービスを受けることで、定時運行率を99.9%に達成し、15分超の遅延発生時に乗客に運賃を払い戻しするというサービスを提供している、村松氏は説明する。加えて、修理工程データ、天候データ、サプライチェーンデータを、鉄道事業のエネルギー消費、サービス改善に役立てたという。「シーメンスは故障したら部品を修復するというビジネスから、可用性(アベイラビリティ、システムが継続して稼働できる能力)を提供するビジネスに転換した。モノ売りからコト売りへという好例だ」(動画参照)。
このプロジェクトでは、テラデータが自社のデータウェアハウスや、データレイク(データ・ソースにおけるフォーマットを複製した形で、非構造化データのまま貯めておく格納システム)を含むデータマネージメントアーキテクチャの設計・導入を支援した。
村松氏は「アンゾフの成長マトリクスという古くからある企業成長戦略論がある。シーメンスが採ったのは、アンゾフが設けた四象限のうち既存市場(顧客)に対し新商品・サービスを投入することでシーメンスとその顧客が共に成長を図る戦略だ」と語った。
アナリティクスで製造現場の故障を判別する
次に日本の製造業の製造現場での事例について説明してもらった。製造現場・業種の詳細などは明かせないが、日本の製造業のアナリティクス活用を知ることができる機会は貴重だろう。
村松氏は機械の複雑化に人間の学習が追いつかない、と指摘する。「産業用の製造設備や自動車や航空機などの輸送設備は電子化により、どんどん高機能・複雑化してきている。機械もソフトウェアで制御しており、センサーで事細かにデータが取れている。ただ、うまく活用できている企業は少ない。設備の進化に対して人のスキル習得が追いつかない面がある」。
「メンテナンス要員を育てるのには時間がかかる。新しい人をトレーニングする要員を探すのも大変。日本ではまだ何とかなるが、新興国ではせっかくコストを負担してメンテナンス要員を育てても、維持するのが難しい面がある。これをアナリティクスで解決しようという事例だ」。
村松氏は、「設備ごとにさまざまなセンサーデータがある。消費電力、震動、回転数、部品の温度について時系列でデータがとれている。大きな括りでの故障発生のアラートを出せるが、より詳細な故障個所の特定を『センサーデータをもとに分析ができないか?』という課題に取り組んだ」と説明する。複雑化した機械自体の故障診断を、設備を分解し、あたりをつけてからではなく、データサイエンスで解決した例だ。
「センサーデータの波形を細かく分け、ありとあらゆる波形を特徴づける特徴変数をつくった。センサーの種類、時間の切り方などさまざまな切り方が考えられるので、万単位の変数が考えられる」と語った。
「無数の特徴変数から変数を選別し、選別された変数で最終的なモデルを策定する。この際、種々の機械学習のアルゴリズムを用いる。モデルの予測精度を高める運用方法を考慮することも必要で、故障原因の判断を外したときにはその部分をモデルに学習させることで100%とは行かないまでも精度を高めていく」。
村松氏は「いくつか試してみて2、3種類のアルゴリズムに絞り込む。運用するモデルが増えると、メンテンナンス側が大変になる。ただ1個のモデルで回せることはあまりない。精度と運用の容易性、このあたりのバランスが難しい。」と語った。
「センサーデータのアナリティクスにより現場のメンテナンス要員の業務の効率化・品質向上に寄与するが、その反面、新たな業務・仕組みが必要となる。データを蓄積し、アナリティクスを行い、モデルの精度を維持・向上するための仕組みとそのプロセスである。シーメンスのように全社的に立ち上げたアナリティクス組織があればいいが、なかなか簡単ではない。」
モデルが想定できない事態はないか?
故障原因をセンサーデータから予測するモデルが提供されているということだ。ときに予期しない故障の仕方が起きるケースがあるのではないか、と質問した。
テラデータデータサイエンス部 部長の津田 高治氏は「いままでの故障パターンをどれだけデータとして集めてデータ分析をしておけるかで、将来起きうる事象への対応力が決まる。『そのパターンのなかでは予測ができます』ということ。わかりやすいのは「10年以上前に、自社の売上予測をしていた時に、リーマンショックのようなことが起きるとは考えていなかった」となれば、それは予想外の出来事だ。たとえば、マーケティングの場合は外部要因が多く、大きな社会変革が起きてしまう、また全く新しい商品カテゴリーが生まれてしまった場合などお手上げになる場合もある。機械系の場合は、そのような社会変革などの外部要因に影響される度合いが低い。」と説明した。
津田氏は「データサイエンスの過程は、全てを機械学習的にコンピュータに任せてしまうのではなく、熟練したエンジニアなどの知識を参考にした方がうまく行きやすく、その意味で業界知識に長けたインダストリー・コンサルタントがお客様との会話の中からヒントを得て、データサイエンスと融合させることが重要と考えている。」と語った。
「データアナリティクスは、まだオペレーションを習熟していない人のレベルアップに活用することもできる。データサイエンスが示す内容は、しばしば熟練者の暗黙知を形式化して広げるもので、それによって全体のスキルの底上げや維持を実現している。尤も、熟練者が必ずしも正しいわけではない、と分かるときもある」。
津田氏は「モデルが判断を下すのはニアリアルタイム。技術的にはリアルタイムも可能だが、使う側でそれが適切でない場合、リアルタイム化すべきではない。仮に5秒後に故障しますと予測されても、5秒で機械が直せるはずもなく、故障アラートが出てから技術員を手配して現場に行き、修理するまでのリードタイムを考えた上でシステムを考えなくてはならない。ビジネスプロセスに依存する。」と語った。
反面、金融取引の場合は、ミリセカンドでの意思決定が重要になることがあるなど、まさにデータサイエンスの鮮度はビジネスプロセスに依存するといえる。
密かに進む製造業者のアナリティクス採用
データアナリティクスとビジネスの融合は欧米が先行している印象がある。「取り組みのスケールではシーメンスはすごい。だが、実際、内容の先進性では日本は負けてない。日本人は謙虚だからあまり声高に言わないが。日本も堅実にデータサイエンスを遂行している印象がある」。

テラデータ データサイエンス部 部長 津田 高治氏(左)、インダストリー・コンサルティング部 部長 村松 孝浩氏
最近はエッジコンピューティングがバズワードになっている。データウェアハウスやデータレイクにデータを貯めてからアナリティクスをするのではなく、データ発生源付近でデータサイエンスによる処理を行ってしまう手法だ。ディープラーニングなどで予め作っておいたモデルをデータ発生源付近で処理することでこれが可能だ。
津田氏は、ある程度データを貯めておかないと状況の変化に対応できない場合が多いと話す。「データが示すパターンに変化が見られたとき、データを貯めておかないと既知のパターンから何が起きたか解らないことがある。データがあるからこそ新たな問題が起きたときにその状況を知ることができる」。
データサイエンティスト不足、部門間の壁
企業のデータアナリティクスの活用をめぐる課題は何だろうか。津田氏はスキルについて話した。「データサイエンティストを育てるには、投資が必要で、時間もかかる。2つの方向性がある。『頑張ってみんなが勉強しましょう』はひとつの方法だ。もうひとつは、分析のアルゴリズムや実装できるソフトウェアができ、データサイエンス自体が自動化され、技術が進化することだ。データサイエンス技術が進化するなか、データサイエンティストも質量共に拡充されるというのがこれからの方向性かもしれない。が、現状はまだ『サイエンティストの力』に頼っている」。
村松氏は「顧客のデータの中身に依存する部分があるので、プログラミングでトライアンドエラーをまわしていける。一部自動化できる部分もある」と語った。
村松氏は「まだうまくデータを使いこなせてない企業が多いかもしれない。いろいろなメディア報道のおかげで、自分たちもやらなきゃ、という機運にはなっているが、どう扱っていいのかがわからないケースもある。」と語った。
「海外を見ていると、企業側がデータサイエンティストを積極的に採用している。日本企業にはダイナミックな人材活用は起きていない。IT企業ではそういう動きがあるが、製造業ではまだそうではない」
「日本企業にはIT部門とビジネス部門の溝がある。ビジネス側は『IT側から何も出てこない』と考えている。IT側は『ビジネス側に入って何ができるか自信がない』という。我々がその間に入って、コンサルタントとデータサイエンティストがそれぞれの知識を活かしてアナリティクスを進めているのです」と語った。
Written by 吉田拓史
Photograph by GettyImage