学術系クラウドファンディングサイト「academist(アカデミスト)」
JP | EN

AI創薬における「教師なし学習による変数選択」の活用を広げたい!

%e3%82%b9%e3%82%af%e3%83%aa%e3%83%bc%e3%83%b3%e3%82%b7%e3%83%a7%e3%83%83%e3%83%88 2019 05 08 20.49.28
田口善弘
中央大学 / 教授
支援総額: 312,200 円
目標金額: 300,000 円
達成率
104 %
サポーター
48
残り時間
21
支援する

目標金額を達成しました!

%e3%82%b9%e3%82%af%e3%83%aa%e3%83%bc%e3%83%b3%e3%82%b7%e3%83%a7%e3%83%83%e3%83%88 2019 05 08 20.49.28

早々に達成させていただきありがとうございました。
まさかこんなに早く達成できるとは夢にも思っていませんでした。
本当に皆様には感謝の言葉しかありません。
友人や研究仲間、昔の同級生など、思ってもみなかった方々に支援頂きました。twitterでしか会ったことのない方にもたくさん支援頂きました。
何より、40人以上の方にご支援頂いたことに感激しています。

これだけご支援頂いているにもかかわらず、厚かましいとお思いかもしれませんが、以下の論文
Drug candidate identification based on gene expression of treated cells using tensor decomposition-based unsupervised feature extraction for large-scale data
https://rdcu.be/bGebq
の掲載料、15万円弱を立て替え払いしたままでして、よろしければそのご支援もいただけると嬉しいです。そこでセカンドゴールとして15万円上乗せした、45万円を設定させて頂きます。よろしければご支援ください。

academist スタッフからの一言
既存の薬がない場合でも、新薬の候補物質を探し出したい

大量のデータ蓄積とその利活用が進む現在、その波は生命科学の分野にも広がり、生命現象を情報科学的手法で解析する「バイオインフォマティクス」という分野が発展してきました。この分野では新しい創薬手法の開発などが期待されており、たとえばAI(人工知能)を活用した創薬は「AI創薬」とも呼ばれ、産学問わず研究が進められています。一方で「現状では、すでに開発された薬のデータを基に新薬を探索することしかできないことが課題」と考えた田口さんは、既存の薬がない場合でも薬の候補物質を探し出すための手法として、「テンソル分解を用いた教師なし学習による変数選択」を提案しました。まだ認知度が低いこの手法を多くの方に発信し、実績を積みながら活用を広めていきたいという田口さんに応援をよろしくお願いいたします!

Img 6854

大塚美穂

ヒトの「大量のデータ」を手に入れられる現在、生命科学が迎える新たな展開

最近、AI(人工知能)技術のひとつである機械学習が流行っています。少し前にはビッグデータというワードもよく耳にしました。いままではできなかったことをコンピュータを使って実現しようという動きは、21世紀になって各分野で大きく発展してきています。

いま私が取り組んでいる研究は、バイオインフォマティクスという分野に含まれます。生命現象を情報科学的手法で解析するこの分野も、2003年に「ヒトゲノム計画」において、人間のDNAの総体であるゲノムの塩基配列が読み取れた時点で大きな発展を迎えました。ヒトに関する「大量のデータ」を手に入れられるようになったからです。従来、実験中心だった生命科学にコンピュータという強力なツールが加わることで、新しい創薬手法、新しい診断方法、新しい治療法が生まれることが期待されています。

B1

「インシリコ創薬」の二大潮流と、現状の課題

計算機を使って新しい薬をみつけることは「インシリコ創薬」と呼ばれます。薬のなかで主流を担ってきているのは低分子医薬品と呼ばれるもので、低分子化合物が症状の原因となるタンパク質に結合し、何かしらの作用を引き起こすことで、薬としての効果を発揮します。インシリコ創薬の方法には、低分子化合物とタンパク質のどちらをベースにして薬を探索するかという点で、二大潮流があります。ひとつは既知の薬(低分子化合物)と似た構造の分子を探す「リガンドベースの方法」、もうひとつは、タンパク質と結合する分子を探す「構造ベースの方法」です。

リガンドベースの方法では既知の低分子化合物をもとに探索するため、低い計算コストで多くの分子を探すことができます。その意味で、新しい分子を探す能力は高いといえます。しかし既存薬と似た構造をもつものしか探し出せず、また、そもそも既存薬が無い疾患には無力でした。

一方、構造ベースの方法では、低分子化合物ではなくタンパク質をもとに薬の候補分子を探すため、既存薬が無くても探索することができます。しかし、「タンパク質と結合するかどうか」をシミュレーションする計算はコストが高く、ときに数百万個にも及ぶ候補分子のすべてを調べるのは難しいという問題があります。また、このシミュレーションにはタンパク質の構造が必要なのですが、その構造決定に高額の費用がかかるうえに、そもそも実験的に決めるのが難しい場合もあります。こういう場合にはタンパク質の構造もコンピュータで予測しなくてはならず、当然、そこには誤差が入ってしまうので、精度を落とす原因になるという欠点がありました。

B2

遺伝子発現プロファイルを使うというアイデアの誕生

このような欠点を補うために、最近は、「遺伝子発現プロファイル」を使おうという動きがあります。これは分子を投与したときの遺伝子の発現量の変化が、既存薬を投与したときのそれと似ていれば、その分子は薬になるのではないかというアイデアです。リガンドベースの方法と同様に既存薬が無い場合は使えませんが、分子の構造が既存薬と似ていなくても探し出すことができ、また、構造ベースの方法のような大規模な計算が不要というメリットがあります。

遺伝子発現プロファイルを活用する創薬は新しい方法で、リガンドベースの方法と異なり、低分子化合物の「作用メカニズム」をベースにしているともいえるでしょう。今後の発展が望まれますが、既存薬が無い場合は無力だという問題は残ったままです。

私は最近、この問題に対する解として、ある方法を提案しました。少し言葉が難しいのですが「テンソル分解を用いた教師無し学習による変数選択」を用いる方法です。この方法では、分子を投与したときの遺伝子発現プロファイルの変化と、疾患が生じたときの遺伝子発現プロファイルの変化をくらべることで、既存薬が存在しない疾患でも薬の候補分子を探し出します。つまり、既存薬が存在しないということは分子と疾患の関係が見い出せていないということなので、それぞれをサンプルとして着目すべき遺伝子(変数)を選択する、ということをやります。

テンソル分解を用いて統合的・多角的なデータ解析を実施する

遺伝子発現プロファイルについて、分子を投与したときの変化を表現するための要素としてはたとえば、分子・臓器・遺伝子が考えられます。「ある分子を投与すると、ある臓器の、ある遺伝子の発現に変化がみられる」といったものです。また、疾患が生じたときについては、疾患・臓器・遺伝子が要素として挙げられます。つまり「ある疾患が生じた患者さんでは、ある臓器で、ある遺伝子の発現に変化がみられる」といった具合です。

ここで、着目すべき遺伝子を選択するのに、テンソル分解を用います。テンソル分解というのは数学的な手法ですが、この手法を用いることで複数の条件を同時に考慮することが可能となります。通常、遺伝子発現プロファイルは行を遺伝子、列を被験者、という行列の形式でしか表現されません。これがテンソルになると、上記のような分子×臓器×遺伝子や、疾患×臓器×遺伝子のような形式で表現できるようになるため、より統合的で多角的なデータ解析が可能になります。なお現在は、疾患に関連するものとして「臓器」を変数としていますが、別の変数であってもこの手法は使えます。

最近書いた論文では治療薬が見つかっていない肝硬変の薬を探した結果を報告しました。計算で見い出した薬の候補分子をあとで検索してみると、過去に肝硬変の薬として試された薬剤分子でした。なおこの薬剤については複数の論文で臨床研究の結果が報告され、一定の効果があったことが論文にはなっているものの、残念ながら実際の発売には至っていません。何らかの副作用がその後見つかったか、あるいは、大規模な臨床実験に進むだけの有望な薬ではなかった可能性があります。

今後、薬剤の候補分子の探索に「テンソル分解を用いた教師なし学習による変数選択」の活用を広めていくためには、まだまだ事例を蓄積していく必要があると思います。ただ現時点でもこの方法の活用に興味を示してくださった製薬企業様もいくつかあり、将来性がある手法だと考えています。

B4

研究費サポートのお願い

この「テンソル分解を用いた教師無し学習による変数選択」という方法は、特に国内では私以外に研究している方があまりいらっしゃいません。論文はたくさん(この研究の前段階の主成分分析を用いた研究も含めると30本以上)書き、その研究をまとめた本を英文単著で出版する予定もあり、海外ではそれなりに評価されていると思うのですが、国内ではあまり認知されていないように感じています。研究実績を増やすとともに、この手法をより多くの方に発信して広めていきたいと考えています。

そんななかで、旅費は自分で賄う必要があるのですが、キューバの研究会から招待講義をしないかとお誘いをいただきました。ヨーロッパを中心に著名な研究者の方も多く参加されるようなので、海外の研究者との人脈を作りより研究を広げていくチャンスだと思っています。この旅費を、みなさまにサポートしていただけたらとてもうれしいです。ご支援のほどよろしくお願いいたします。

挑戦者の自己紹介

私は35歳くらいまで、物理の研究しかしてきませんでした。いまは生物の一分野であるバイオインフォマティクスを研究しているわけですが、この分野の研究をはじめてからはまだ20年くらいしか経っていないので、気分は若手か中堅くらいのつもりです。年食った大学教授の支援なんか萌えないと思わないでぜひお願いします。

%e3%82%b9%e3%82%af%e3%83%aa%e3%83%bc%e3%83%b3%e3%82%b7%e3%83%a7%e3%83%83%e3%83%88 2019 05 08 20.49.28

田口善弘

研究計画

時期 計画
2019年5月 クラウドファンディング挑戦
2019年10月24日〜27日 Bioinformics 2019でレクチャー

リターンの説明

1,000 円 (税抜)
注目のリターン: 研究報告レポート(PDF版)
研究報告レポート(PDF版)

研究の詳細な進捗などをレポートにまとめてお送りします。応援よろしくお願いいたします!

支援する

17人のサポーターが支援しています (数量制限なし)

5,000 円 (税抜)
注目のリターン: 学会発表資料の謝辞にお名前掲載
学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

2019年10月24日-27日のBioinformics 2019にて本研究に関する発表をする際、謝辞にお名前を掲載させていただきます。また、発表資料(電子版)を送付いたします。お力をお貸しください。応援よろしくお願いいたします! ※学会発表が叶わなかった場合、その後の学会発表資料の謝辞にお名前を掲載いたします。

支援する

9人のサポーターが支援しています (数量制限なし)

10,000 円 (税抜)
注目のリターン: サイエンスカフェ参加権
サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

サイエンスカフェにご招待いたします。日時は2019年7月28日で、場所は中央大学後楽園キャンパスを予定しています。当日は「AI(人工知能)の過去・現在・未来 ―AIは人間を超えるのか―」についてお話させていただきますので、ご参加をお待ちしています! ※当日ご参加いただけない場合には、後日資料を共有させていただきます。

支援する

21人のサポーターが支援しています (数量制限なし)

30,000 円 (税抜)
注目のリターン: サイン入り著書
サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

現在、バイオインフォマティクスについて一般向けの書籍を書かないかと言われています。出版されたらその本にサインしてお送りします(出版されなかった場合は原稿を印刷して送ります)。

支援する

1人のサポーターが支援しています (数量制限なし)

50,000 円 (税抜)
注目のリターン: 論文謝辞にお名前掲載
論文謝辞にお名前掲載 / サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

今後の研究成果を発表する際の謝辞にお名前を掲載させていただきます。 ※研究成果をまとめられるよう努力いたしますが、論文の掲載に至らない可能性もございますこと、ご承知おきいただけますと幸いです。

支援する

0人のサポーターが支援しています (数量制限なし)

100,000 円 (税抜)
注目のリターン: 出張講演
出張講演 / 論文謝辞にお名前掲載 / サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

講演会に出張いたします。ネタとしては2017年中央大学物理学科オープンキャンパス模擬授業のような、惑星の運動∼僕らの知らない太陽系∼(https://youtu.be/pQ6xpP_RA1k)、バイオインフォマティクスとは何か(https://youtu.be/Hpaun0YTm_U)、高校では習わない量子力学(https://youtu.be/3elcRAquqdo)、ゲノム科学でわかること(https://youtu.be/gxOjN0KxWJY) などがあります。ご要望にお応えする形で講演させていただきます! ※旅費・宿泊費等は別途頂戴いたしますのでご留意ください。

支援する

0人のサポーターが支援しています (数量制限なし)

このプロジェクトは、 2019年05月22日 08時30分 から 2019年07月11日 19時00分 までの間に目標金額300,000円を達成した場合のみ、決済が確定します。
お支払について
お支払にはクレジットカード(VISA, Mastercard)をご利用頂けます。
Available cards
銀行振込について

銀行振込をご希望の方は下記のフォームよりご連絡ください。 フォームへ

セキュリティについて

当サイトは SSL 暗号化通信に対応しております。入力した情報は安全に送信されます。

1,000 円(税抜)

研究報告レポート(PDF版)

17 人 が支援しています。
(数量制限なし)

支援
5,000 円(税抜)

学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

9 人 が支援しています。
(数量制限なし)

支援
10,000 円(税抜)

サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

21 人 が支援しています。
(数量制限なし)

支援
30,000 円(税抜)

サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

1 人 が支援しています。
(数量制限なし)

支援
50,000 円(税抜)

論文謝辞にお名前掲載 / サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

0 人 が支援しています。
(数量制限なし)

支援
100,000 円(税抜)

出張講演 / 論文謝辞にお名前掲載 / サイン入り著書 / サイエンスカフェ参加権 / 学会発表資料の謝辞にお名前掲載 / 研究報告レポート(PDF版)

0 人 が支援しています。
(数量制限なし)

支援

注目のプロジェクト一覧

Copyright © academist, Inc. All rights Reserved.