2018年10月11日木曜日

Microsoft、OINに参加し、6万件以上の特許をオープンソース化 「Linuxを保護する」

 米Microsoft1010日(現地時間)、Linux特許管理会社Open Invention NetworkOIN)に参加すると発表した。保有する6万件以上の特許をオープンソース化する。OINに参加する2650社以上の企業は、これらの特許を無償で利用できるようになる。

 

 OINは、2005年にIBMNovellPhilips Electronics、ソニー、Red Hatの出資により設立された特許管理会社。Linux推進のために、特許を買収してロイヤリティフリーで提供する。メンバー企業はLinuxに関する特許を無償で提供することに合意したことになる。米GoogleNEC、トヨタ自動車などもメンバーだ。

 
主なメンバー企業

 Microsoftは発表文で、「われわれは、開発者が"WindowsLinuxか"あるいは".NETJavaか"などという2択を迫られたくはなく、あらゆるテクノロジーをサポートするクラウドプラットフォームを求めているのは当然だと思っている。また、オープンソースプロセスによる協力的な開発イノベーションを加速することも学んだ」とし、「OINに参加することで、Microsoftは、Linuxやその他の重要なオープンソースのワークロードを特許問題から保護するために、これまで以上に貢献できると確信する」と語った。

 

宅建士試験の問題を予測するAIをGAUSSが開発、予想問題を無償提供

 GAUSS2018105日、サイトビジットと提携して、平成30年度宅地建物取引士(宅建士)試験向けのAI(人工知能)による試験問題の予測サービス「未来問」を開発したと発表した。

 サイトビジットが運営する資格試験のオンライン学習サービス「資格スクエア」で、同年109日から無料で提供。両社では、1021日に実施される実際の宅建士試験に近い予想問題を体験できるとしている。

 GAUSSは、サイトビジットが独自に93個のカテゴリーに分類した宅建士試験の過去問題データを用いて、LSTMLong Short-Term Memory)によるAIモデルを開発した。LSTMは、RNNRecurrent Neural Network:再帰型ニューラルネットワーク)の一種で、時系列データの予測に向けたアルゴリズム。

 
LSTMモデルの概要(出典:GAUSS

 このAIモデルに、19892017年に実際に出題された1450問の過去問題を教師データとしてカテゴリーごとの年度別出題数を学習させ、2018年の試験に出題されるであろうカテゴリーを50問予測させた。それらのカテゴリーからランダムに問題をピックアップし、これを予想問題とした。

 AIモデルの検証として、19892016年の過去問題を学習させて、2017年の問題を予測させ、実際に出題された問題と比較したところ、的中率は70%だったという。ちなみに、宅建士試験に合格するために必要な正解率は70%。

 今後はさらにチューニングや一般化を施し、宅建士以外の試験の予測にも対応させるという。

 

2018年10月10日水曜日

グーグルが新型スマホなど発表、音声AIの浸透狙う

 米アルファベット傘下のグーグルは9日、新型の「ピクセル」スマートフォンやスマートホーム製品、タブレットとラップトップ兼用が可能な「クロームブック」など、一連の新製品を発表した。いずれもユーザーの生活に、音声AI(人工知能)「グーグルアシスタント」を浸透させる狙いがある。

 モバイル向け基本ソフト(OS)「アンドロイド」搭載の新型スマホ「ピクセル3」と「ピクセル3 XL」はデザインを刷新し、高評価を得ているカメラにさらに改良を加えた。価格はピクセル3が799ドル(約9万円)、3 XL が899ドルとなっている。

 またグーグルは、ハイブリッド型「クロームブック」の新型「ピクセル・スレート」を発表した。これはキーボードドックのついた12インチのタブレット端末で、アップルの「iPad Pro(アイパッド・プロ)」やマイクロソフトの「サーフェス・プロ(Surface Pro)」と競合する。ピクセル・スレートの価格は599ドルからだが、キーボードは199ドルで別売りとなっている。

 これに加え、グーグルはスマートディスプレーの「ホーム・ハブ(Home Hub)」(149ドル)もあわせて発表した。これはアマゾン・ドット・コムの「エコー・ショー(Echo Show)」に似ており、スピーカーと大型タッチスクリーンが合体した製品だ。キッチンや寝室での利用を念頭に置く。スマート家電を操作するとともに、スクリーン上で「カレンダー」などグーグルの多くのサービスに加え、料理のレシピや動画の視聴が可能となる。

 エコー・ショーやフェイスブックが発表した「ポータル」とは異なり、ホーム・ハブにはカメラがついていない。グーグルの製品管理バイスプレジデント(ホーム・ネスト担当)、ディヤ・ジョリー氏は「家庭のプライベートな空間でも安心して使ってもらえるよう、当社は意図的にハブにカメラを搭載しなかった」と説明した。

AIが生成する画像「開発者も見抜けない」レベルに

人工知能の"生成力"が本格的に発展しようとしている。上に並べられた写真のうちひとつは、人工知能が生み出した偽物だ。みなさんは正解が分かるだろうか。正解は最上段の一番左の画像イメージ。おそらく、ほとんどすべての人が見抜けなかったのではないだろうか。

英ヘリオット・ワット大学の博士課程の学生であるAndrew Brock氏は、グーグル・ディープマインドの研究チームとともに、本物と区別がつかないほどの精巧さを持った、犬や蝶、自然物などの画像を生み出す人工知能を開発した。

これらの技術は「敵対的生成ネットワーク(GAN: Generative adversarial networks)」をベースにしたものだ。端的に説明するならば、「騙すAI」と「見抜くAI」を競争させ、より本物に近い対象(ここでは画像やイメージ)を生み出す技術である。人工知能関連のさまざまなイシュー中でも、昨今、特に注目が集まる分野である。今年6月、フェイスブックのAI開発者であるYann Lecun氏も、GANは非常に重要な技術と言及したことがある。

Brock氏ら研究チームは、開発したシステムに対して「BigGAN」という名前をつけている。研究者たちは、自らが開発した人工知能に「犬」など特定のキーワードともに、2千枚ほどの写真を与え学習させ、その後、新しい画像を生み出すようにした。

興味深いのは、新しく生み出されたイメージについて、開発者であるBrock氏ですらもはや見抜くことができなかったという点だ。BigGANは、犬以外にも、「ジャガー」や「熊」の写真を生成したが、Brock氏はそれらを「グーグル検索」で収集した素材だと錯覚したという。開発者ですら見破れない画像を生み出すAIというのは、なんだか頼もしくもあり、恐ろしくもある。

とはいえ、BigGANもまだまだ完璧ではない。足が14本あるクモのイメージ(クモは8本足)や、植物と猫が融合した新生物の画像イメージを生み出したりと、特定の動物以外の生物画像を完全に生成するまでにいたっていない。BigGANがあらゆる画像を完ぺきに生成するためには、いましばらく時間が必要ということになりそうだ。

GANは画像だけでなく、動画や音声の生成にも応用できると考えられる。いずれインスタグラムなどに掲載される「リア充写真」もしくは「パリピ動画」が、簡単に人工知能でつくれる時代がくるかもしれない。

冗談はさておき、写真や動画には、人物や現場に接した証拠、つまり「真実を映す」という点に価値があった。例えば、写真・ビデオジャーナリズムは、その真実という価値によって支えられてきた最たるものだろう。

しかし、GANなど関連技術が発達すれば、写真や動画に真実を求めることは不可能になる。何を持って真実とするか。人工知能時代には、存在を証明する新しい技術やテクノロジーが必要となってくるはずである。

ディ�`プラ�`ニングの欠点をカバ�`、多�淞骏签`タを短�r�g�Q�yして将来�酉颏蚋呔�度予�y�D�D�|京大学の研究グル�`プが新理�を���B

 �|京大学生�b技�g研究所の教授である合原一幸氏らの研究グル�`プは、多�涫�からなる�^去の�酉颏蚨�r�gだけ�Q�yしたデ�`タから、タ�`ゲット�涫�の将来の�酉颏蚋呔�度に予�yする新しい数学的基�A理�を���Bした。

 一般に、生体や�U�g、�力�Wのような�}�j系では、多数の�涫�が�}�jなネットワ�`ク��造を介して相互に影�する。その�Y果、システムを��成する各�涫�の情�螭�、多数の�涫�に分散されて保持されることになる。

 多�涫�の��を基に予�yするアルゴリズムには、人工知能(AI)の主要技�gで静止画像の�J�Rなどに高い性能を�k�]するディ�`プラ�`ニングがある。

 ただしディ�`プラ�`ニングは、学�のために大量の教��デ�`タと多大な�算�r�gを必要とする。さらに�r系列デ�`タを�Qう�龊稀�2つの欠点がある。第一に�r系列デ�`タのような�拥那�螭�I理に限界があること。第二にそもそも�r系列デ�`タを�L�r�g��yすることが容易ではないことだ。例えば、生物学の研究で�z�蛔影k�F量の�r系列デ�`タを��yすることは�Oめて困�yだ。

 こうした�}�j系の振る舞いは、数学的には「アトラクタ�`」と呼ばれる状�B空�g内の安定状�Bによって�述される。�兢盲啤⑼��rに��yした�}数の�涫�の��からアトラクタ�`を推定できれば、それを予�yに用いることができる。これが今回の研究の�Iだ。

 
�菹螗猊钎毪违�オスアトラクタ�`上の�Q�yデ�`タと予�yデ�`タの例 �い曲�の集合がアトラクタ�`。その中で�Q�yデ�`タに基づいた�L期�gに及ぶ予�yデ�`タの振る舞いの例を示したもの(出典:�|京大学生�b技�g研究所

ランダム分布埋め�zみ手法で�y定�r�gを「短�s」できる

 �F在は、�r系列デ�`タを��yするよりも、一度に多�N多数のデ�`タを同�r��yする方が容易な�龊悉猡�る。例えば、IoTInternet of Things)といった��y技�gの�M�iにより比�^的容易に、例えば2万以上の�z�蛔婴�らなる人のゲノムについて、得られたサンプルからそれぞれの�z�蛔婴伟k�F量を��y可能だ。

 合原氏らは、ある�r刻の多数の�Q�y�涫�についてその��からランダムに�涫�を�xんでその�r点でのアトラクタ�`の状�Bを推定する「ランダム分布埋め�zみ(Randomly Distributed EmbeddingRDE)」手法を考案した。

 
ランダム分布埋め�zみ(RDE)手法の原理(出典:�|京大学生�b技�g研究所

 この手法に基づいて特定のタ�`ゲット�涫�の将来予�y��を多数��成し、�y��I理することで、精度が高く、より�L�r�gの予�yを可能とした。この手法では��象の数理モデルを必要としないため、研究グル�`プでは、デ�`タの�Q�y期�gが短いときでも数理的�I理によって予�yシステムを���Bできる利点があるとしている。

 研究グル�`プでは、考案した手法を�z�蛔影k�F量や�L速、心�疾患患者数などの予�yに�g�Hに�暧盲筏皮饯斡�啃预虼_�Jしたという。�U�gや医学、エネルギ�`などさまざまな分野で、短�r�gの�Q�yデ�`タから将来の�酉颏蛴�yする高度な予�y技�gを用いたAIシステムの���Bが可能になるとした。

 今回の研究�文は米国科学アカデミ�`�o要(PNAS)のオンライン速�蟀妞枪��_される予定(DOIDOI10.1073/pnas.1802987115)。�k表者には合原氏の他、�K州大学数学科学学院の�R�g�w氏、�|京大学生�b技�g研究所の冷思阳氏、�偷┐笱�数学科学学院の林�ナ稀⒅泄�科学院上海生命科学研究院の�洛南氏が名を�Bねる。

 

“マルチAI”にどう対応するか システム管理の新たな課題

 「企業のAI(人工知能)活用では、IBM Watsonだけでなく、複数のAIが業務部門ごとに使われ始めている。そんな"マルチAI"をどう管理していくのかが、新たな課題として浮上してきた」——。日本IBMの山口明夫 取締役専務執行役員グローバル・ビジネス・サービス事業本部長は、同社が先頃開いた新サービス・ツール群の発表会見でこう指摘した。

 これまでにもさまざまなITツールで起きている現象だが、AIは業務に密接した活用が不可欠なだけに、起きるべくして起きているといっていい。ならば、山口氏が言うように、マルチAIをどう管理していけばよいのか。

 日本IBMの今回の発表は、そのニーズに応えたものである。企業全体で戦略的かつ効率的なAI活用を推進するための包括的なサービス・ツール群である「IBM Services AI Enterprise Knowledge Foundation」は、AI活用の戦略策定から、導入支援、AI人材の育成までの一連のサイクルをサポートするサービス群と、データやアルゴリズムなどのAI資産を公平に、透明性を保ちながら管理して可視化するツール群で構成される。

 ツール群の中でもとりわけ注目されるのが、AIによる意思決定のバイアス(偏り)を検出・軽減するソフトウェアサービス「Trust and Transparency capabilities」である。このツールは、AIの統合開発・分析環境である「Watson Studio」や、データの統合管理環境である「Knowledge Catalog」といったWatson製品を併せて活用することで、IBM製品だけでなく、オープンソースソフトウェア(OSS)も含めたAIシステム資産を管理し、高度な専門性がなくても容易に利用できるとしている。

 ちなみに、米IBMの発表資料によれば、Trust and Transparency capabilitiesは「Tensorflow」「SparkML」「AWS SageMaker」「AzurML」など、多種多様な機械学習フレームワークとAI構築環境で構築されたモデルにも対応し、「企業が使用する一般的なAIフレームワークの大半に対して管理が行える」としている。これがすなわち、「マルチAIの管理」のポイントとなるところである。

 このツールを含めたIBM Services AI Enterprise Knowledge Foundationの詳細な内容については発表資料をご覧いただくとして、ここからはマルチAIへの対応をめぐるIBMの基本的な考え方に注目してみたい。

 山口氏に続いて発表会見で説明に立った日本IBMの吉崎敏文 執行役員ワトソン&クラウドプラットフォーム事業部長によると、企業におけるAIへの取り組みは、これまでの実証実験(PoC)から一部業務で活用する段階に入ってきており、積極的なところではAIを強みにすべく全社で戦略的に活用する方向で動いている。

 ただ、そうした企業では、山口氏の冒頭の発言にもあるように、業務部門ごとに複数のAIが使われるケースも見受けられるようになってきた。吉崎氏は、「こうした業務ごとの個別AIシステムになってしまうと、使用するクラウドやデータの活用方法、学習方法などもそれぞれ個別になってしまい、それらへの対応を含めてシステムをどう管理していくかが、新たな課題になってくる」と説明した。

 そこでIBMが、その解決策として打ち出したのが「データ&AIプラットフォーム」を採用した仕組みだ。

 実はこのデータ&AIプラットフォームに、IBMの戦略転換が見て取れる。というのは、吉崎氏によると、IBMがこれまでこの部分に提供してきたのは、あくまでWatsonに対応したデータプラットフォームだったからだ。それを「データ&AI」と銘打ち、「さまざまなデータ」と「複数のAI」に対応する形に変えたのである。

 では、IBMが提供するデータ&AIプラットフォームとはどのようなものか。図3がその中身である。クラウドサービスの形態に対応した形で、最上部の業務アプリケーションがSaaS、その下のWatson APIからデータ・カタログまでがPaaS、その下のIBM CloudなどがIaaSという構造になっている。ただ、この図だとPaaSはWatsonの環境だけである。

 それをマルチAIに対応する環境に広げるべく、日本IBMが今回発表したのがTrust and Transparency capabilitiesである。

 今回はIBMの新製品発表を機に、マルチAIの管理について取り上げたが、企業において業務部門ごとに複数のAIが使われることは必然かもしれない。ただ、IT部門にとって、それらの管理を野放図にしておくのは、データガバナンスの観点からも避けたいところだ。そこに問題意識を持ってもらいたいというのが、筆者からのメッセージである。

「もうGoogleを使うのはやめないか?」 デジタルの巨人たちの“行動追跡”から逃れる方法

行動を「追跡」されるのが当たり前だからこそ

 インターネット上のサービスは、メール、検索、ドキュメント作成、地図、ストレージなど、そのほとんどが"無料"で使えるようになりました。これって、よく考えるとものすごいことだと思いませんか?

 今ではWebブラウザも「無料で使えて当たり前」と誰もが考えています。古くからインターネットに親しんでいる方は「Netscape」というブラウザをパッケージで買ってセットアップした経験があるかもしれませんが、もはや、それも忘れられつつある歴史なのかもしれません。近ごろはOSの大規模アップグレードですら無料ですし。

 ビジネスの原則に照らし合わせれば、それなりの工数を費やして開発したサービスを無料で提供できるということは、その投資を上回る何らかのリターンがあるはずです。サービスによっては、ごく一部の有料会員が全ての無料会員をまかなう、いわゆる「フリーミアム」的なビジネスモデルもあるでしょうが、ユーザーの利用状況を"追跡"し、そのデータを元に商売する、というケースも少なくありません。

 最近では、そのような追跡に関する懸念も大きくなりつつあります。欧州におけるGDPR(EU一般データ保護規則)の展開も、「どこまでが個人に属し、個人が管理すべき情報なのか」をはっきりさせるためのものだと思っています。

 「気にしないから考えない」のではなく、気にする人が一人でもいれば、それを保護するための仕組みを考えるべきでしょう。インターネット創生期の偉人、ティム・バーナーズ=リー氏が「個人情報をユーザーの手に戻すプロジェクト」、Solidを立ち上げたのも、現在のいき過ぎた情報集約をなんとかしたい、という思いの表れでしょう。

みんなが使うサービスの「代替」を持っておこう

 しかし、私たちの周りにはすでにとても便利な無料サービスがあふれていて、もはやそれらなしにはIT生活ができないほどになっています。無料ではありませんが、スマートフォンだって、利用履歴を取得されるデバイスであることを忘れてはいけません。

 私自身、メールはGmailを、検索はGoogleを多用しています。SNSは使わない判断をすれば何とかなるかもしれませんが、特にGoogleに関しては依存度が非常に高いと言わざるを得ません。皆さんもGoogleマイアクティビティを眺めてみれば、その依存度をはっきりと理解できるのではないかと思います。可視化できる仕組みを用意しているGoogleも立派ですね。

 そんなことをしているうちに、なかなか面白いページを教えてもらいました。Googleをやめたとして、"次はどうする"というのをみんなで投票する「No More Google」というページです。

Googleの代替になるツールを投票するWebサイト「No More Google

 例えばWebブラウザの場合、シェアの高いGoogle Chromeの代わりに、FirefoxVivaldiSafariがランクインしていますし、あまりに強力になり過ぎたGoogle検索の代わりに、プライバシー保護と非トラッキングを掲げるDuck Duck Goが選ばれています。その他にも、私も聞いたことがなかったサービスがいっぱいあり、試しにWeb解析サービスのGoogle Analyticsの代替として名前が挙がっている「Matomo」(Piwik)を少し触ってみたところ、十分代替になり得るツールでびっくりしました。

Google検索の代替として人気の「Duck Duck Go」。トラッキングや広告ターゲティングを行わないことをウリにしている

 企業システムでは「ロックインはよくない」ということが定説になっていますが、個人でもこれは同様です。特定のサービスや企業に依存してしまうと、情報漏えいなどの問題に巻き込まれる可能性が高まります。

 幸い個人利用においては、サービスのスイッチングコストもさほどではありません。クラウドストレージサービスの乗り換えも簡単ですし、Webブラウザの変更もブックマークの移行程度で済むでしょう。常に"代わりはいくらでもいる"という状況を作っておくことは、無料サービスを利用する際の「自己防御」として、今後重要になっていくかもしれません。

 私もNo More Googleを見てから、iPhonemacOSの標準検索エンジンをDuck Duck Goに変えてみました。検索に若干コツがいりますが、思えば昔の検索エンジンは全てこんな感じで、答えが一発で出てくることなどありませんでしたね。少し懐かしい思いを持ちつつも、「一発で答えが出てくるのは、むしろ恐ろしいことではないか」とも感じます。

 今、もしかしたら"デジタルの巨人たち"の手のひらに乗せられているかも——そう感じたときには、ぜひ代替案を。変えてみたら意外と快適だった、と感じるかもしれませんよ。

 

2018年10月9日火曜日

Google Cloudの「顧客を選ぶ」機械学習/AI共創プログラム、Advanced Solutions Labとは

 ユニクロなどのブランドで知られるファーストリテイリングが2018年9月、Google Cloudの「Advanced Solutions Lab(ASL)」というプログラムを通じて、需要予測などに関する共同開発を行っていることを明らかにした

 同時にGoogle Cloudは、ASLの拠点を東京にオープンしたことを明らかにした。これにより、Google Cloudは、ASLプログラムを日本国内で本格的に展開することになる。なお、東京のASL拠点は、米カリフォルニア州サニーベール、米ニューヨーク、アイルランドのダブリンに続き、世界で4番目となる。

 では、ASLとはどのようなプログラムなのだろうか。料金さえ払えば、誰でもGoogleのエンジニアを活用できるというものなのだろうか。ASLに関する責任者でもあるGoogle Cloudグローバルアライアンス&インダストリープラットフォーム部門プレジデントであるタリク・シャウカット氏の答えは「ノー」だ。

ASLを通じた共同作業は、誰にでも提供されるわけではない

 ASLは、機械学習/AIを活用してGoogle Cloudの顧客が困難なビジネス上の課題を解決できるようにすることを目指すプログラム。「トレーニング」と「共同作業」の2種類のサービスで構成されている。

 トレーニングは、Googleの機械学習関連研究者/エンジニアがASL拠点で実践トレーニングを行うという。トレーニングでは、顧客のビジネスに沿った、最小限の機能を備えた機械学習モデル(「Minimum Viable Model」)の開発を行う。

 共同作業では、Googleの機械学習関連研究者/エンジニアが顧客組織のエンジニアと「サイド・バイ・サイド」で、共に課題解決を行うという。期間は、正式には数カ月ということになっている。

 トレーニング抜きで、共同作業だけを頼むということはできないという。

 「(ASLの活動を行う)AIエキスパートはコンサルティングチームではない。Google社内のプロダクト開発を行うエンジニアだ。(例えばファーストリテイリングとの協業では)課題の困難さを考えると、コアエンジニアが必要だった」

 プロダクト開発エンジニアのリソースを投入するということであれば、「トレーニングについてはともかく、共同作業についてはスケールできないのではないか」という疑問が生まれる。

 これに対するシャウカット氏の回答は2つだ。

 1つは、Google Cloudにおける機械学習/AIプロダクト開発の取り組みが、特定業界/特定分野のニーズに応えるソリューションに広がってきている点(これについては、別記事で紹介する)。ASLにおける共同作業を、Google Cloudは業界別AIソリューションプロダクトの開発プロジェクトとして位置付けている。

 2つ目は、案件を選ぶという点。「例えば私がトヨタ自動車のCEOで、『いくらでも金を払うから、ASLで扱ってくれ』と言ったらどうするか」と聞いたところ、シャウカット氏はそれでも条件があると話した。

1. 顧客は自社側のリソースをコミットしなければならない

 「最初にやることは、顧客と議論し、どれほど真剣なのかを確認することだ。特定課題の解決を、完全にGoogle側へ委ねたいと言う顧客もあるが、『それはコンサルティングであり、パートナーを紹介します』と言うことにしている」

 機械学習/AI関連では、ソリューションを導入した後に、顧客がモデルのメンテナンスや応用的な展開を進めなければならないケースが多い。このため、顧客企業は、トレーニングおよび共同作業の双方に自社のスタッフを送り込む必要がある。送り込まれたスタッフは、自社の他のスタッフをトレーニングするといった役割を担える必要がある。

 「私たちの目標は、Googleのエンジニアに、顧客を未来永劫依存させることではない。従って、まずトレーニングを受けて問題解決のやり方を理解してもらい、次に、解決の困難な問題を複数のプロジェクトに分けて、サイド・バイ・サイドで取り組む。米国におけるこれまでの経験では、最初のプロジェクトでは密接な協業を行い、次のプロジェクトではGoogleはアドバイザー的な立場になる。さらに次のプロジェクトでは、顧客はほぼ自社だけでやれるようになる。私たちはこのようにして、ASLの活動がスケールするようにしている」

2. 解決したい課題を顧客が明確に定義できなければならない

 必ずしも共同作業の前提ではないが、解決したい課題を、顧客は明確に理解している必要がある。

 「大部分のAIへの取り組みが役に立たないうちに終わってしまうのは、あらゆる課題をまとめて解決しようとするからだ」

 課題を具体的なものに絞るほど、解決は容易になるし、短期間で得られるようにもなる。また、社内で展開しやすいものにもなる、とする。

3. 解決する課題は困難なものであり、他の企業にも共通するものでなければならない

 ASLの共同作業による解決の対象となる課題は、Google Cloudのコアエンジニアのスキルが必要とされるほど、困難なものでなければならない。また、ある企業に特有の問題であれば、コンサルティングパートナーに紹介する。「少なくとも対象領域として、他の企業にも適用できる部分がなければならない」とシャウカット氏は話している。

4 関連データを、Google Cloudに置く必要がある

 「私たちは機械学習のやり方、利用するツールについて、私たちなりの考え方を持っている。このため、共同作業の対象となるデータについては、Google Cloudに保存してもらわなければならない。そうでないと、何もできない」

エネルギー関連では、TotalGoogle Cloudと連携

 ASLプログラムは、約2年前に米国で始まった。前述の通り、Google Cloudにとっては業種別の高度なソリューションプロダクトを開発するための、重要な手段となっている。

 Google Cloudは、ASLを通じた共同作業のプロジェクト数を公表していないが、ヘルスケア業界、エネルギー業界での事例は明らかにしている。例えばエネルギー関連では、石油をはじめとしたエネルギーの開発・提供企業であるTotalが、Google Cloudとの提携で、資源の探査および評価への機械学習/AIの適用を進めていることを発表した

 「重点的に取り組んでいる業界は、金融サービス、ヘルスケア、小売、自動車および製造、エネルギー、メディア、エンターテイメント、ゲームだ。日本では、他の国に比べて製造業におけるニーズが非常に高い。他には小売業、金融サービスからの引き合いがある」

 

なぜ、AIシステムの導入検討が急速に進んでいるのか

ユーザー企業におけるAIシステム導入のフェーズが変わってきた。AIで何ができるかという検証から、実際の業務に適用してビジネス価値を生み出す改善へと移行しているのだ。改善が目的なら、通常の情報システム同様に、ユーザー企業の業務部門や情報システム部門とシステムインテグレータのSEが導入の中心となるべきだ。しかしそうなると、AIシステムをどのように構築するかが問題になってくる。どうすれば、価値を生むAIシステムを構築できるのだろうか。

2017年頃までは、ディープラーニングで画像を解析して何に使えるかを検証するなど、PoC(Proof of Concept:概念検証)のプロジェクトが多かった。ところが最近は、PoCで得られた知見に基づきビジネス化へ向けて導入の効果や価値を検証するPoB(Proof of Business)のプロジェクトが増えている。なかには、PoBを経て、AIシステムの構築・運用のフェーズへと進む企業もある。それに伴い、現在、AIシステムを導入する業界・業種は大きく拡がってきた。

例えば、保険業界でAIシステムが導入されたのは、事故審査の分野だ。ドライブレコーダーの画像データと衝撃センサーの時系列データを解析することで、事故の検知率を90%以上に改善させたのである。これは、保険金支払額の早期確定や安全運転のサポートにつながっている。

農業分野では、当初、植物の群生状況を見るために画像認識が導入された。さらに最近は、画像情報に含まれる可視光線以外の光の分布を解析することで病害発生を未然に防ぐ試みが行われている。複数の波長からなる不可視光線のデータを組み合わせることで、病害発生箇所を早期に検出するのだ。

製造業では、ベテラン職人のノウハウを継承するためにAIシステムが活用されはじめた。具体的には、作業時の手や頭の動きを3次元データとして取得し、スコア化したデータを時系列グラフに落とす。これにより、ベテランと新人の動作の違いを可視化でき、様々な気づきが得られる。技術継承に役立っているのだ。

金融業では、店舗における顧客の動線解析により、ATMの待ち時間を予測している。ATMに並ぶ人を分類することで、一人ひとりのおおよその待ち時間を算出し、集計するのだ。同じ技術を、富裕層のテラー案内や不審者の検知にも応用できる。

「AIによる解析データを共有することで、お客様から様々なアイデアが出てきます。アイデアを実現するためにディスカッションを重ね、実際に試してみることで、AIを業務で使いこなす力が伸びるのです」と、SCSK 全社営業統括部門 戦略ソリューション営業統括本部 イノベーション統括部 副部長 帯津 勉は話す。

昨今のメディアには、AIの活用にはビッグデータが必要であり、世界中から膨大なデータを集めるGAFA(Google、Apple、Facebook、Amazon)に日本企業は太刀打ちできないとする声が大勢を占める。

これに対して、SCSK 全社営業統括部門 戦略ソリューション営業統括本部 ソリューション営業統括部 第二課 課長代理 牧 和城は「機械翻訳のような汎用的なシステムの構築には、学習データが極めて重要で、膨大な母数のデータが必要です。しかし、個別業務の課題解決を目的とするのであれば、企業がすでに持っているデータからでも価値を生むAIシステムは構築ができます」と語る。

また、GAFAに依存することにはリスクも伴う。GAFAが持つビッグデータによって構築されたAIのAPIサービスを利用すれば、自社に知見や知的財産が残らないからだ。これは、自社主導で事業を運営する上で大きな問題となるだろう。

日本企業も徐々にこのことに気づき始めている。「業務課題を解決する上で重要になるデータを長期にわたって蓄積し、それをベースに、自社独自のノウハウを磨き上げたいとするお客様からの引き合いが増えています」と帯津は分析する。

AIシステムを導入するにあたってのアプローチも変わってきた。業務要件を厳密に定義して要件に応じたシステムをゼロから作り込むのではなく、求められる要件の機能に着目し、それを実現するAIをシステムに組み込む方式が主流となりつつある。この方式では、通常、サンプルデータを見ながら実現する機能を検討することになる。

サンプルデータを見て機能を検討する上で重要になるのが、データの特徴である。特徴とは、ものを識別するための要素だ。たとえば、リンゴには「赤い、丸い、芯がある」などの特徴がある。特徴を数値化した特徴量によって、他のものと区別するのがAIの原理だ。機械学習では人間が特徴量を定義し、ディープラーニングでは機械が自動的に特徴量を見つけるという違いがある。自社業務の特徴を見出すことが、企業の知的財産を蓄積することになるのだ。

そこで有効なのが、モデルベースの開発手法だ。ベースとなるモデルとは、特定の機能を実現するためにSIベンダー側が提供する製品・サービス群である。ユーザーはベースモデルを利用することにより、セミオーダー感覚で迅速にシステム環境を構築できるようになる。

SCSKがAIシステム環境を構築するために提供しているベースモデルが、SNN(SCSK Neural Network toolkit)だ。SNNを活用することで、迅速にAI環境を構築できるだけでなく、ユーザー企業にはAPIサービスの利用では残らない知的財産を自社に残せるようになる。その知的財産をモジュール化することで、新しい業態や事業への展開も可能になるだろう。

現在、AIシステム開発の中心となっているのは、ChainerやTensorFlowなどのフレームワークを用いたAIシステムの構築だ。しかしそのためには、特徴を抽出できるアルゴリズムを考え、さらにPythonなどのプログラミング言語でモデルに落とし込むAIエンジニアが必要となる。一方、SNNを活用したAIシステムの構築では、アルゴリズムの選定はベースモデルがカバーする。

SNNを使えば、不足しているAIに精通したIT人材をアサインする必要がないため、AIシステム構築のハードルが下がるのだ。これにより、業務知識があり、データの意味・内容が分かるユーザー企業の業務担当者とITベンダーのSEがいれば、すぐにAIシステム構築に着手できる。ビジネスにスピードが求められる今、この効果は極めて大きいと言えるだろう。

また、SCSK 全社営業統括部門 戦略ソリューション営業統括本部 イノベーション統括部 第二課長 島田 源邦は「最近お客様のご要望で、AIシステムによる靴の検品自動化に向けたPoCプロジェクトを手がけました。ところが画像認識技術を使って検品すると、人間であればひと目でわかるキズと模様との判別が、当初難しかったのです。こうした業務における知識が、AIシステムに業務を代替させる上で重要になります」と話す。

長年の業務で培ってきた様々な「常識」があるからこそ総合的な判断が可能になる。ブロック崩しなどのゲームであれば、基本的なルールさえ覚えれば、あとはロジックを突き詰めることで、人間を凌駕できる。しかし、人の業務を代替させようとすれば、様々な知見が必要になる。

医療のような専門知識が必要な分野では、この傾向がより強くなる。たとえば、現在放射線科の医師などが担っている画像診断をAIシステムで代替させるのであれば、画像のパターンや臓器の位置関係が持つ意味のほか、人種や性別、年齢や病歴などによる個体差など、必要な知見の幅は格段に増えることになるのだ。

SNNでは、今後も新たなベースモデルを提供していくと言う。例えば、新たに提供される時系列予測モデルを使えば、過去の実績データに基づいて農作物収穫予測や電力需要予測などが可能になる。自然言語処理や画像・映像の自動生成を担うモデルの導入も検討されている。こうしたモデルを活用すれば、画期的な事業を生み出せるかもしれない。

業界をまたいだユースケースの横展開も考えられる。例えば銀行の動線解析で使われるモデルは、自動レジやエレベーターの待ち予測、店舗設計の効率化などにも応用可能だ。その結果、課題のスピーディーな解決だけでなく、事業の競争力向上も図ることができる。

ベースモデルの活用に手を挙げるユーザー企業は、急速に増えている。今回の記事で紹介しきれなかった事例もある。まずは、PoCレベルでの導入に向けて相談してみてはどうだろう。

AI時代におけるデータサイエンスの根付かせ方、生かし方

 今春、データサイエンス界がざわついた。2013年の初代「データサイエンティスト・オブ・ザ・イヤー」に選出された河本 薫氏が、在籍していた大阪ガスを退社するというのだ。データ活用の先進企業といわれる大阪ガスを辞し、新天地として選んだのは滋賀大学。20174月に日本初の「データサイエンス学部」を新設した同大学の教授として、データサイエンティストの育成に心血をそそぐ道を選んだ。企業での実務経験者が教育に携わる意義は、大きい。というのも、データサイエンス、AIは机上で終わらせる学問ではなく、ビジネスで使ってこそ意味がある。

 その思いを強く持っているのは、NECで最も多くAI活用のプロジェクトに携わり、「人工知能システムのプロジェクトがわかる本」を上梓している本橋 洋介氏だ。NECは、いかにAIをビジネスで使えるかを念頭にAIの開発を続け、提供している。データサイエンスのスペシャリスト同士が、企業においてデータ活用文化を浸透させる方法論、慢性的に不足している専門人材の育成について意見を交わした。

企業との距離が近い学問

──この度の転身、かなり反響がありました。どういう経緯で決断されたのですか。

河本氏:
 2011年から大阪ガスのデータ分析専門チームを引っ張る立場になって、7年間。自分で言うのもなんですが、それなりに結果が出せたと考えています。

 社内でのデータ活用を定着させ、チームが認められ、後継者も育ってきた。自他ともに、そろそろバトンを渡す時期だという意識を持っていたところ、ちょうど滋賀大学からのお誘いがありました。実は、若かりし頃から教育への関心があって。いいタイミングが重なったし、とても自然な人生の流れだと感じて決意しました。

──滋賀大学に移籍してから、ちょうど半年になります。まったく別の世界ではないかと思いますが、想像していた通りですか。

河本氏:
 別世界に隠居しました、というイメージと全然違っていて、今までの20数年間の事業会社でのビジネス生活で養ったコミュニケーション力やビジネス感覚が、継続的に役に立っています。

 移ってみて期待以上だったのは、教鞭を執るだけではなく、いろんな企業との共同研究ができることです。企業に協力してもらって、学生もジョインするような「ビジネス×教育」の場を作れています。直接ビジネスをしているわけではないですが、ビジネスとの関わりあいを続けているんですよ。

本橋:
 大学だからこそ、より企業とのつながりができるような気がしています。私たちも河本先生にアドバイスを求める機会があるのですが、今までは「なぜ大阪ガスなんだ」という説明をお客様や社内に用意する必要があった。でも、大学の先生なら自然だから、企業としては関わりやすいんです。

河本氏:
 それは確かにあります。企業から見たらニュートラルな立場なので。前職よりも多くの企業から声がかかるし、いろんな話を深くしてくれますよ。前職時代は、自分の知見をよりオープンに伝えたくても、立場上難しい状況もありました。

 それから、大学の先生には企業経験がない人も多いから、企業の人たちとの接点が細いんですよね。そこに私が教育側で入って太くできるのは、学生にとっても、大学にとっても、企業にとってもいいことじゃないですか。

 大学1年生からインターンを引き受けてくれる企業もあって。いろんな切り口で企業と大学がうまく繋がることで、お互いハッピーになる機会って結構あるんです。

企業でデータサイエンスを定着させるには

──河本さんは、大阪ガスでデータサイエンスをどのように浸透させていったのですか。企業で定着させるコツ、教えてください。

河本氏:
 企業といっても星の数ほどありますので一概には言えませんが、大阪ガスは100年以上続くコテコテの日本企業。そして、他の企業と同じように、やっぱり現場が強い。

 「ヘルメットのおっちゃん」が強いんですよ。その中でデータサイエンスという新しい概念を活用していくのは、水と油のようなところもあるわけです。すると、ものすごくフラストレーションが溜まる日々が続くんです。なんで受け入れてもらえないのかと。

──それでもうまくいった。どうしてでしょうか。

河本氏:
 大阪ガスで浸透したのは、企業風土に2つの特徴があったからではと思います。1つは、超ボトムアップ。担当レベルの裁量がかなり大きい。だから、ビジネスアナリシスセンターは、どんな行動をするのか誰かに言われて行動するんじゃなくて、自分で考えて自分で行動できた。計画ガチガチじゃなくて、それなりの裁量を持って進むことができました。

 もう1つの特徴が大阪らしくて、「儲かってなんぼ」というのが強いんです。データ分析をして、説明する。でも、それでは評価されなくて「ほな、お前、これでいくら儲かるん?」って言われたら答えに窮して、「お前、アホか」って感じになる。

 そういうカルチャーの中で、無意識のうちにカネになるまで、最後までやり遂げる意識が芽生えてきたんでしょうね。

 結局、言葉ではなく成果を出さないと分かってくれないんです。現場へ4回も5回も行って、データ分析を現場に導入して、それで品質がすごく上がった、大幅にコストダウンできたとなると、誰が見ても「すごいやん!」となる。

 そういう案件が増えてきたら理屈を言わなくても、今まで反対していた人間が急に「もっとやれよ」という風になってくる。そんな感じのステップですね。

 あと、最初の頃は全然信用されていなくても、業務が効率化できたり、新たなアイデアが生まれるきっかけをデータ活用を通じて得たり、業務が変わるところまでやるから「河本さんのところは信用できる」となる。それをすごく大切にしてきましたね。信頼されることのありがたさを感じて、このレピュテーションを失いたくないという意識も強かったです。

──本橋さんのところへは、AIを使いたい、データを生かしたいという企業からの問い合わせが多いと思いますが、今の企業における進捗状況について教えてください。

本橋:
 日本全体では、データ分析専用組織がある企業は数パーセントではないでしょうか。ただ今はAIが流行っていて、流行っているから経営者は絶対に認識しているはず。そして若手なんかに「お前がミスターAIになれ」みたいな声を掛け始めています。

河本氏:
 ミスターAIですか(笑)。

本橋:
 若い人で意欲や関心がある方にとっては喜ばしいことで、勉強したり、取り組み始めたりしている。IT部門の中に、AIについて詳しい人が現れているところです。

 ただ、AIもデータサイエンスも時間がかかるもので、魔法ではない。データがすぐ結果につながってお金になることはまずありません。その辺を誤解して、成果と取り組みの関係にギャップがある会社もあります。例えば2年かけてデータを整備するぐらいの、もう少しゆっくり取り組めばよいのにと思うことも結構あります。

──企業はAIやデータサイエンスですぐに結果を求めがちですか。

本橋:
 そうですね。それは丁寧に説明をして、一緒にやらせていただいています。「ビッグデータ」という言葉ができて7年ぐらいでしょうか。以来、去年あたりの「デジタルトランスフォーメーション」まで、言葉は違えど似たようなコンセプトが続いています。ずっと辛抱強く取り組んでいる会社が出てきているのも確かです。

企業がデータサイエンスに取り組む本質

──大阪ガスのビジネスアナリシスチームは、2011年からでしたか。

河本氏:
 そうですね。ただその前から、20年ほど前から取り組んでいたんです。

本橋:
 その経験は先生の本にも書かれていますよね。それを読んで、すごく「企業人らしいサイエンティスト」で素敵だなと思ったものです。

 率直に言って、マネージメント寄りの人が好きな内容。データサイエンスの本や講演って、テクノロジー寄りのものが多いんですよね。Pythonでディープラーニング、みたいな。そうではなくて組織論や仕事の進め方の話は、発刊当時は今以上に稀有でした。仕事でデータを使うとは、そういうことではない、本質ではないという解説です。

河本氏:
 今、メディアの影響もあって、経営者の方々の頭の中にAIIoTって言葉が強烈にこびりついている。経営者は「AIをやろう」と言うようになって、いつの間にかそれ自体が目的になってしまっていることがありますよね。それから、ないものねだりが多いんですよ。

本橋:
 ないものねだり、ですか。

河本氏:
 データがあるから何かできるのでは、あるいは他の会社もやってるから何かやれとか。そういうのは、ないものねだりなんですよ。不毛な気がして。データも分析力も必要ですけど、それも手段です。

 では、何をすべきかと言えば、そのデータ分析力で成果を出す機会を作ること。さらにその源泉は何なのか考えたら、真剣な意思決定なんですよ。真剣に業務改革しよう、真剣に問題解決しよう、真剣にいい選択をしよう、とかね。

 真剣に意思決定をよりよくすることを考えていく風土があれば、そこにはおのずと「勘と経験」だけではなくて、データを生かそうってなるんです。

 その真剣さが少し弱い企業もあって、そういうところは、なかなかデータ活用が浸透しない。極端なことをいうと、経営危機に直面している会社ほど、当然真剣なわけですから入っていくんです。

 経営の危機感が弱くて、現状のいろんな意思決定に対する真剣な思いが緩いと、そこにデータ分析を持っていっても最後は「まあ、それはわかるけど後回し」って感じになるんです。

本橋:
 そうですよね。今までも勘で何となく意思決定できていたものを、「数値がこうだから」と意思決定するようになるのが変革で、そうなるかどうか。結果の半分ぐらいは、分析を見なくても定性的にわかっていますよね。

 例えば、高年齢は病気になりやすい、というのは当たり前ですよね。では、その高齢者とは何歳以上なのかを数字で出す。数字で出すことに意味を感じるかどうかだと思いますが、そこは受け手の気持ち次第ですね。

河本氏:
 そうですね。

本橋:
 そのほうが公平だったり楽だったりする感覚を身に着けると、よいスパイラルに回ると思います。人間が考え込む量も減って、楽なんですけどね。

全員が「研究者」になるわけではない

──先生は、大学教育でデータサイエンティストを育てるのに、何が大切だと思って教えていますか。

河本氏:
 データサイエンスの基礎となる「足腰」を鍛えること。まずは線形代数や解析学などの数学や、プログラミング言語をしっかりと勉強させています。これが、社会人になってからでは忙しいから勉強できなくて、とりあえず使うための道具だけ勉強することになるんですが、大学生だからこそ、足腰を鍛えておく。

 教えるにあたって、大切にしているのは、勉強して何のためになるのかという、「出口」も見せてあげること。

 そのために取り組んでいるのが、いろんな企業でデータ分析をしている人に来てもらって、学生に話をしてもらっています。すると、学生からの質問も、たくさん出るんですよ。

 仕事の進め方とか、会社の中でのデータの受け止められ方とか。このデータサイエンス学部を卒業した後、どんな仕事が待っているか強い興味を持っていて、そのために逆算したら、こういう勉強が必要だという意識を付けてもらうために行っています。

 近々始めるのが、データ分析の全体感を体験してもらうことです。専門的な知識をいっぱい勉強していないと、ゴールに行き着かないって思いすぎるわけですよ。あまりそこに壁を感じすぎると、全体のストーリーが見えなくなるんで。

 簡単でいいから自分で問題意識を持ってデータを見て、どこに問題があるか発見して、解決する。全体のプロセスを経験させるような、比較的簡単なお題を大学1年生の時点で提供してみようと思っているんです。

本橋:
 線形代数や統計は、一度応用を経験してからのほうが、間違いなく学ぶモチベーションになるでしょうね。例えば、なぜ行列を使うのかは、本当に大人にならないとわからないので。

河本氏:
 そうそう。なんで行列を学ばなあかんねんって。

本橋:
 ほとんど全てのデータ分析は、Excelでできる。でも、Excelだと一定のレベル以上になると線形代数などの知識がないとできないんですよね。今は便利なツールがあって、ボタンをポンで結果が手に入る。だけど、仕事にしていくとブラックボックスじゃ駄目で、中の挙動を理解したり、その結果を説明できたりしないといけないんです。

 だから先に1回、ブラックボックスでもいいから、使えるんだ、役に立つんだなって知ってから、それからの勉強がいいと思います。

──ベンダー側とユーザ側でどのようにデータサイエンスの人材育成をしていけばいいのですか。

本橋:
 NECの中の人材育成だと、まず1つにAIの企画ができる人材の育成です。「企画」とはお客様の会社の中でAIの提供分野は何かを検討することで、なんでAIが必要なのかから一緒に考えます。そのために、NECとしては引き出しが多いデータサイエンティストを育てています。

 次に、AIの実行やシステム実装ができる人材の育成の話をします。

 ITベンダーは短距離走の選手の瞬発力のように決められた期間で結果を出すことが求められます。そのためにさまざまな業種・業務の事例や手法を勉強するような教育プログラムや自主的な共有の仕組みを提供しています。

 また、自主的に学びたい人のために、NECグループの人間なら誰でも触れるAI(機械学習)ソフトウェアと練習用データがある環境を用意して、自ら自由に学習できる仕掛けを作っています。

 NECはシステムエンジニアが多く、そういった人は手に職をつけたくなるものです。2500人くらいがその環境を使って勉強しています。そして、いまNEC内のデータサイエンティストの育成ノウハウをお客様に外販できるように進めています。

河本氏:
 会社によって、全然違う。大阪ガスでは、全社員向けにデータ分析の必要性をわかってもらうための研修はありました。平均値と中央値の違いとか、そんなレベルの話です。

 でも、専門チームのメンバーにどうやって難しい分析方法を教えるかというと、ほぼ独学ですね。それなりに優秀な人が入ってきて、それに甘えられた良さはありました。

 ただ、それで一度失敗しました。修士卒の優秀な学生が分析チームに配属されたのですが、大学院生の気分がそのまま継続されちゃったんです。大学院時代も、会社に入ってからもやることはデータ分析で、何も変わらない。

 でも、今までは授業料を払っていて、これからは給料をもらっているという違いが意識できないようになってしまって。これは最初の段階で陥ると、根が深いんですよ。だから、そこだけはものすごくケアして、現場に使って実際に業務改革が起こるまでが仕事だと、肝に銘ずるような仕事を最初に与えるようにしていました。

──新設から間もない滋賀大学では、まだ卒業生がいません。どういった活躍が期待されますか。

河本氏:
 最近、データサイエンス学部を卒業する学生の出口を作ったんですよ。大きく3つあって、「研究者」、それからNECで多く活躍するような「職業データサイエンティスト」。

 そして「データサイエンスに明るいビジネスパーソン」。

 3つ目のカテゴリーの人たちのキャリアは、あくまでもビジネスをする人です。

──マーケティングかもしれないし、セールスかもしれないけど、データサイエンスの素養がある人ですね。

河本氏:
 そう。そして、企業からの需要は、3つ目も大きいんです。一方、学生の中には、データサイエンス学部に入ってみたけどデータ分析はそこまで得意じゃないとか、データ分析は得意だけどでも人生をずっとデータ分析だけに捧げるのではなくビジネスにも携わってみたいとか、そういった学生もいる。でも、現在は、学生の能力や価値観の多様性、それから企業の求める人材の多様性が整理されていない。

 世の中のイメージもそうじゃないですか。「職業データサイエンティスト」っていうキャリアだけになっていて。そうではなく、「データサイエンスに明るいビジネスパーソン」もポジティブな出口として学生に見せるし、企業のほうにも認識してもらいたい。

 そういう学生と企業の線を結んで、お互いハッピーなマッチングができるようにしたい。でないと、入学したら全員が職業データサイエンティストになるための学部だとなると、学生も企業も不幸になるかなって気がして。

本橋:
 素晴らしいビジョンで取り組まれていますね。データサイエンスは、あらゆる場面で求められる素養で、しかもビジネスで生かすことを前提に教育されているところが、まさに河本先生らしいし、今後のあるべき姿だと思うんです。

 NECでも、AIはビジネスで使えてこそだという大前提を大切にしていますし、AIが結果に至った理由を説明できるようにしたり、データサイエンティストでないと導き出せなかったことを自動化したり、そういうビジネスのど真ん中で使えるAIを作っています。

 とはいえ、やはり使う人の育成というのは欠かせません。その意味で、今日はお客様に、AIの使い手としての心構えをお伝えできるヒントを得られました。

河本氏:
 本当に社会で活躍できる人材を輩出するには、やはりビジネスの現場の声を学生の前で語ってもらう必要があります。ビジネスの最前線でお客様に向き合っている本橋さんは貴重な教材です(笑)。

(取材・編集:木村剛士、構成:加藤学宏、撮影:竹井晴清)

本対談で登場した滋賀大学の河本氏とNECの本橋は、NEC主催イベント「C&Cユーザーフォーラム&iEXPO2018」に登壇し、トークセッション「AIが変革する未来〜先進事例と組織づくり〜」を行います。AIの最新動向や、AI時代の組織の在り方、人材育成の考え方を紹介します。日時は11/9(金)16:1517:45です。無料で参加できます(事前登録制)ので、ぜひご参加ください。

 

「開発の丸投げやめて」 疲弊するAIベンダーの静かな怒りと、依頼主に“最低限”望むこと

 「AI(人工知能)は触ったことないし、プログラムも書けません。でも社長が"AIをやれ"って言うので何とかしてください」——こんな困ったオジサンたちを、ユーモアたっぷりの愛と皮肉で表現する人物をご存じでしょうか。

 その名は「マスクド・アナライズ」さん。正体は一切不明でソーシャル上のアイコンは覆面マスクと、一見イロモノ系アカウントに見えますが、Twitterでの発言は多くの人たちから「あるある」「共感する」と絶賛され、ときには何千回、何万回とRTやいいねされています。

 それもそのはず。普段の仕事では「AIを作ってほしいという相談から、導入後の改善まで請け負い、お客さまに合わせてAI開発、データ分析、IoT導入と結構幅広くやっている」とのこと。発言に信ぴょう性や具体性があって当然です。

 冒頭のようなむちゃぶりをしてくるオジサンに向けて、痛いところを突いて地味にダメージを与えるような発言を続けるマスクドさん。「各方面からいろいろ言われますけど」と笑う一方で、言わなきゃいけないことを誰かが言わないといけないという使命感も持っているそうです。

 そんなマスクドさんに、現場の最前線に立ち続けるからこそ分かるAI開発現場のリアルな現状をざっくばらんに語っていただきました。その覆面を通し、AI開発の今をどのように見ているのでしょうか。

「AI開発には時間も金もかかる」と分かり、急速にAIブームが覚めている説
 今ではさまざまな企業がAIをビジネスに活用しようと動いていますが、AIブームはまだ過熱しているのでしょうか。

 「AIブームは一時期すごく過熱しましたが、2018年の春ぐらいには落ち着きました。会社で突然偉い人からAI導入を指示されたものの、何をどう取り組めばいいのか分からず、途方に暮れる担当者が弊社のようなAIベンチャーに電話してあれこれ相談してくることを、私は「いきなり!AI」と呼んでいます。そういう「いきなり!AI」は減ってきて、ある程度AIについて分かっている人や、既にAI導入に取り組んでいる人からの相談が増えています」(マスクドさん)

 そう語るマスクドさんは、5年ほど前からAI開発に携わっているそうです。当時、ディープラーニングを研究する東京大学・松尾豊さんの著書「人工知能は人間を超えるか」が大きな話題となり、AIブームが勃興していました。

 ところが、当時から大忙しというわけではなかったそうです。

 「13年ごろのAIは、自社でビッグデータを持つ大企業だけのものでした。16年〜17年ぐらいからブームが過熱し始め、業種・規模問わず"いきなり!AI"だらけになっていきます。恐らく大手のSIer(※)なら見積もりで数億円になってしまうから、小さいベンチャーなら安上がりと思って連絡しているのでは? って感じの人たちが非常に多かった。深くは突っ込みませんけど」と、マスクドさんは当時の苦い思い出を振り返ります。

※SIer…システムインテグレーションを行う業者。情報システム構築の際、企画・設計から開発、運用サポートなどを一括で請け負う

 では、なぜ「いきなり!AI」は減ってきたのでしょうか。

 「企業でAIを活用するには、時間もお金もかかるんです。単にツールを入れれば済む話でもない。SIerに何度も問い合わせるうちに、その辺の感覚が分かってきたのでしょう」

 AIを作るための現実をまざまざと見せつけられて撤退する企業が多い中、「17年ぐらいになると、AI開発を内製化する会社と外注する会社の二極化が始まった」とマスクドさんは指摘します。

 「デジタル広告やアプリゲームを作っている企業は、15年〜16年にはお問い合わせが減っていきました。内製化に舵を切ったのでしょう。一方で16年以降、製造業などこれまでデータ分析からは縁が遠かった企業の問い合わせが増えています」

 マスクドさんは「製造業との取引」もあり、その体験談をnote上でも発表されています(参考:「発掘!モノMONO大辞典!」)。

 製造業は日本の古き良きお家芸ですが、AIやデータとは縁遠いイメージも付きまといます。実際、マスクドさんは「製造業は保守的な所がある。前例主義でやっているので、導入事例や実績が大事にされ、社内のチームでうまくいったツールなら使う、といった具合です」と説明します。

 AI開発を内製化する企業と、外注する企業の二極化が進んでいるという話がありましたが、この「内製化」も怪しい所があります。

 「Kaggle(※)を推奨しています!」「Google I/O(※)にエンジニアを行かせています!」という意識も技術力も高い意欲的な企業がある一方で、Pythonを使える人材を無理やり集めて「弊社はAIができます!」と手を上げているSIer企業もいます。この二極化が進んでいるというのがマスクドさんの意見です。

※Kaggle…データ分析や機械学習のさまざまなコンペに参加できる米国発のプラットフォーム
※Google I/O…Googleが米国で毎年開催する開発者向け会議

 AI開発に携わりたいと考えている人は「意識も技術力も高い企業」に入社したいはずですが、どうすれば技術力の高さを見極められるのでしょうか。実際、内製化をうたっていても肝心のアルゴリズムは外注していて、エンジニアもよく分からないまま作業しているという例を聞いたことがあります。

 マスクドさんも「正直、そういう会社もあると思う」と主張します。

 「僕も同業他社の動向が気になるのでチェックするんですけど、本当に自社でやってるのか? と疑いたくなる会社が多い。しかし、見極めるのは難しい。外注する立場になって、ちゃんとAIを作れる企業に頼みたいと思ったとしても、正直どこを見れば良いか分からないです。もう、ほとんど運任せの状態になってます」

 結局、地道だけど人材の育成に取り組むしかないというのがマスクドさんの結論です。このような、AI開発の外注がほとんど運任せになっている様子を、ソーシャルゲームの「ガチャ」に例えたnote「社会人のための「AIガチャ」入門」は、ソーシャル上でかなり話題になりました。

 既にデータサイエンティストの育成が始まっている会社であれば問題ないでしょうが、ゼロから始めるベンチャー企業は「相当辛い」。なぜなら、データサイエンスについて正しく評価できる人も評価する方法もないからです。「中小企業だとデータや予算が限られるので、すぐ行き詰まってしまう」のが現実のようです。

 AI開発をめぐる「残念な状況」は、なぜ起こるのでしょうか。少し歴史をさかのぼると、ビッグデータ、DMP(※)、ERP(※)など、「全ての問題を解決する魔法の機械と、うまくいかないシステム導入」という歴史は常に繰り返されてきました。

※DMP…Data Management Platformの略。企業が持つ顧客データやマーケティングデータなどを統合的に管理し、マーケティング活動全体を最適化するためのプラットフォーム
※ERP…Enterprise Resources Planningの略。日本語では、「統合基幹業務システム」や「統合業務パッケージ」などと呼ばれている

 マスクドさんは「システムに人が合わせるのか、あるいは人の業務にシステムを合わせるか。そうした考え方の違いなんです」と主張します。

 「システムがパッケージ化されていても、業務フローに合わせてカスタマイズしたいという声は根強くあります。しかし、それには限度がありますし、何億円も追加投資しないといけない。AIも同じで、人がやっていた作業をAIで再現したいという依頼はどこかで無理が生じる。人に合わせてシステムを開発しようとすると、残念な結果になってしまうんです」

 なぜ「人に合わせたシステム開発」が横行するのでしょうか? 本来は仕事のプロセス自体をAIで置き換える必要があるはずですが、実際は「現場の業務知識が欠落した状態でAI導入を進めないといけない」現状があるようです。

 製造業の例を見てみましょう。

 いきなり工場で使うセンサーの専門的な説明をされても、AIベンダー側はすぐに理解できません。業務知識については深い理解があるけれどAIが分からない依頼者、AIには詳しいが業務知識が欠落しているAIベンダーの間に溝があるのです。そのため、仕事のプロセス自体をAIで置き換えることができず、業務フローに合わせてシステムをカスタマイズするような結果になってしまうのです。

 「理想は、業務知識が分かっている現場の人と、AIに詳しくてなおかつ現場の人とコミュニケーションが取れる人がタッグを組んで、最適な仕組みを導入できれば最高です。ですが、そういう取り組みはイケてる内製化成功企業でしかできていません。そもそも、現場一筋30年の熟練者と、ロジカルにプログラミングする人はうまくかみ合わないんですよね」

 こうした問題を解消するために、発注側のエンジニアで「AIを勉強してみよう」と考える人はいるのでしょうか。マスクドさんは「新しいものを取り組んで向上心がある人は、大手メーカーではなくベンチャー企業に行くのではないでしょうか」と述べます。

 「意欲がある人が上申しても、保守的かつ大きな組織では意見が通りにくい。そうすると諦めて別の会社に行ってしまう。私のソーシャル上の知り合いで、からあげさんという方が書かれた『ディープラーニングおじさん』というブログ記事が大変バズりました。あれが理想形ではあるものの、本当にまれという印象です」

 確かに、自分自身に置き換えて考えてみると、45歳や50歳になって今までの知識が全く通用しない領域をゼロベースから勉強できるかと言われれば疑問です。しかし、マスクドさんは「勉強し続ける気概、情熱が大事だ」と強調します。

 「覚えないといけないことは山ほどあります。今はPythonが主流ですが、この先に新しい言語や技術が出てくるかもしれない。常にアップデートし続けないと生き残れないでしょう」

 米国や中国の勢いに押され、「AI後進国」ともされる日本。マスクドさんは、先進国入りするためには「内製化を進めるべき」と考えます。

 「自分のビジネスでAIがどう役に立つかを想像できるだけでも話は変わります。全員がコードを書ける必要はないんです。向き不向きはありますから。そうした努力をしないまま、とりあえずベンダーに丸投げするアウトソーシングはやめた方がいい。70年代の基幹システムやオフコンの頃から「ITが分からない」という人たちの丸投げ根性が、今もずっと続いています。その丸投げ先としてSIerさんが居続けるのも本来は問題です。これは、いよいよ産業構造の話になってしまいます。

 まずは、ITに関する知識のアップデートが大切です。全ての人が技術書や論文を読むべきとは思いません。でも、ある程度の知識は身に付けてほしい」

 「例えば松本さんの書かれた「誤解だらけの人工知能」を読めば、現時点でAIが人間より優れている面や得意分野が限られていると十分に分かります。自分で調べた限りでは、社会人が読むべきAI本はそこまで多くない。noteでも「社会人に役立つ人工知能本三冊しかない説」をまとめましたが、書店で売っている本を読むだけでも違います。