2018年10月10日水曜日

ディ�`プラ�`ニングの欠点をカバ�`、多�淞骏签`タを短�r�g�Q�yして将来�酉颏蚋呔�度予�y�D�D�|京大学の研究グル�`プが新理�を���B

 �|京大学生�b技�g研究所の教授である合原一幸氏らの研究グル�`プは、多�涫�からなる�^去の�酉颏蚨�r�gだけ�Q�yしたデ�`タから、タ�`ゲット�涫�の将来の�酉颏蚋呔�度に予�yする新しい数学的基�A理�を���Bした。

 一般に、生体や�U�g、�力�Wのような�}�j系では、多数の�涫�が�}�jなネットワ�`ク��造を介して相互に影�する。その�Y果、システムを��成する各�涫�の情�螭�、多数の�涫�に分散されて保持されることになる。

 多�涫�の��を基に予�yするアルゴリズムには、人工知能(AI)の主要技�gで静止画像の�J�Rなどに高い性能を�k�]するディ�`プラ�`ニングがある。

 ただしディ�`プラ�`ニングは、学�のために大量の教��デ�`タと多大な�算�r�gを必要とする。さらに�r系列デ�`タを�Qう�龊稀�2つの欠点がある。第一に�r系列デ�`タのような�拥那�螭�I理に限界があること。第二にそもそも�r系列デ�`タを�L�r�g��yすることが容易ではないことだ。例えば、生物学の研究で�z�蛔影k�F量の�r系列デ�`タを��yすることは�Oめて困�yだ。

 こうした�}�j系の振る舞いは、数学的には「アトラクタ�`」と呼ばれる状�B空�g内の安定状�Bによって�述される。�兢盲啤⑼��rに��yした�}数の�涫�の��からアトラクタ�`を推定できれば、それを予�yに用いることができる。これが今回の研究の�Iだ。

 
�菹螗猊钎毪违�オスアトラクタ�`上の�Q�yデ�`タと予�yデ�`タの例 �い曲�の集合がアトラクタ�`。その中で�Q�yデ�`タに基づいた�L期�gに及ぶ予�yデ�`タの振る舞いの例を示したもの(出典:�|京大学生�b技�g研究所

ランダム分布埋め�zみ手法で�y定�r�gを「短�s」できる

 �F在は、�r系列デ�`タを��yするよりも、一度に多�N多数のデ�`タを同�r��yする方が容易な�龊悉猡�る。例えば、IoTInternet of Things)といった��y技�gの�M�iにより比�^的容易に、例えば2万以上の�z�蛔婴�らなる人のゲノムについて、得られたサンプルからそれぞれの�z�蛔婴伟k�F量を��y可能だ。

 合原氏らは、ある�r刻の多数の�Q�y�涫�についてその��からランダムに�涫�を�xんでその�r点でのアトラクタ�`の状�Bを推定する「ランダム分布埋め�zみ(Randomly Distributed EmbeddingRDE)」手法を考案した。

 
ランダム分布埋め�zみ(RDE)手法の原理(出典:�|京大学生�b技�g研究所

 この手法に基づいて特定のタ�`ゲット�涫�の将来予�y��を多数��成し、�y��I理することで、精度が高く、より�L�r�gの予�yを可能とした。この手法では��象の数理モデルを必要としないため、研究グル�`プでは、デ�`タの�Q�y期�gが短いときでも数理的�I理によって予�yシステムを���Bできる利点があるとしている。

 研究グル�`プでは、考案した手法を�z�蛔影k�F量や�L速、心�疾患患者数などの予�yに�g�Hに�暧盲筏皮饯斡�啃预虼_�Jしたという。�U�gや医学、エネルギ�`などさまざまな分野で、短�r�gの�Q�yデ�`タから将来の�酉颏蛴�yする高度な予�y技�gを用いたAIシステムの���Bが可能になるとした。

 今回の研究�文は米国科学アカデミ�`�o要(PNAS)のオンライン速�蟀妞枪��_される予定(DOIDOI10.1073/pnas.1802987115)。�k表者には合原氏の他、�K州大学数学科学学院の�R�g�w氏、�|京大学生�b技�g研究所の冷思阳氏、�偷┐笱�数学科学学院の林�ナ稀⒅泄�科学院上海生命科学研究院の�洛南氏が名を�Bねる。

 

0 件のコメント:

コメントを投稿