未来を切り拓く創薬DX!多角的な視点から探る最新トレンド―前編―
バイオベンチャーからメガファーマに至るまで、製薬企業における人工知能(AI)の活用は急速な広がりを見せています。すでに480社以上のバイオテクノロジー企業が創薬研究にAIを導入しており、メガファーマとAIスタートアップによる十数億ドルクラスの大型契約も、続々と行われています。2030年までには、新たに承認される医薬品の50%以上がAIによって発見または開発される見通しとなっています。
こうした流れを受け、2024年6月28日にイベント「未来を切り拓く創薬DX!多角的な視点から探る最新トレンド」が開催され、AI創薬の第一線に立つ3名による講演の後、パネルディスカッションが開催されました。本記事では、このパネルディスカッションの内容をご紹介します。
ファシリテーター:成田 周平(株式会社FRONTEO)
パネラー:
小松 寛(メルク株式会社)
牧口 大旭(株式会社ゼウレカ)
玉木 聡志(株式会社MOLCURE)
データに求められるもの
成田 本日は演者の皆さんと、創薬分野におけるデジタルトランスフォーメーション(創薬DX)について、我々はどうアプローチしていけばよいか話し合ってゆきたいと思っております。創薬DXには人、カネ、物などいろいろな要素が必要になりますが、まずはやはりデータとAI について伺いたいと思います。実際にAIを活用するにあたり、そこに用いるデータにはどのような要素が必要なのでしょうか。
小松 本当社の創薬支援ソフトウェア「AIDDISON®」は、メルクバイオファーマの研究で得られ、きちんとバリデートされた良質なデータが基礎になっています。逆合成解析ソフト「Synthia™」も、研究の現場を知る専門家がコードしたプログラムを使っております。機械学習による逆合成解析は他にも数多く行われていますが、ユーザー様の実際の評判を聞くと、やはりデータの質が揃ってないと見当違いの結果が出てしまうようです。やはり基礎となるデータをきちんと取るところから始めないと、なかなか正しいゴールにたどり着けないと感じます。
牧口 学習量、データ量が大事なのはもちろんなのですが、創薬の世界においてはデータの取得コストが非常に高く、大規模なデータを集めることが難しいという問題があります。そこで我々の場合は、実験データの代わりになるレベルの、高精度のシミュレーション結果をデータとして貯めていくことを意識しています。高精度のシミュレーションは非常に時間がかかります。しかしこうしたデータを貯めていけば、そのデータから予測モデルを作り、今度似たようなシミュレーションの際は同様な計算をしなくても済むといったことが可能になります。
玉木 生物学のデータで難しいのは、その一元性ですね。たとえば抗体やDNAの配列が修飾を受けているか否か、次世代シーケンサーから出てきたデータはどこまで信頼できるかといった問題が出てきます。ですので、あるクライテリア以下のデータは全部捨てるといった、「腹のくくり方」がとても大事だと思っています。
また、生データの管理や前処理の仕方によっては、他の用途に再利用ができなくなるといったことも起こります。これを予め意識し、再利用可能なようデータを管理していくことも重要です。データがどんな手法で、どの機会に誰によって取られたのかといった情報を一緒に保持しておくこと、これらは同じ解析で使っていいのか、ダイナミックレンジは一緒なのかといったところには非常に気を使っております。
計算資源をどうするか
成田 やはりデータについては各社いろいろな特徴がありますが、高品質のリアルなデータが鍵であるというのは共通ですね。では、この大量のデータを処理するための計算資源について、みなさまのお考えをお聞かせいただけますでしょうか。
小松 多量のデータを集め、大きなコンピュータで回していくというところについては、我々は決して本業ではありません。そこで、データについてはお客様で集めていただき、計算についてはクラウドを活用しています。ウェット実験をできる方が、スムーズに回せるような簡単なツールを提供するため、この方法を選択しています。ただしクラウドではどうしても限界はあり、ちょっと我々だけでは解決できないところがあります。AIDDISON®などもそうですが、現状ではいくつかのソフトウェアを連携させて、クラウドで分散させて回す方向で運用しています。
牧口 我々は大規模計算を得意とし、それによって価値を生むことを目指しています。ただ、数十個程度の実験データしかない場合にはAIが作れないのかというと、そういうわけでもありません。そのデータの特性から見えるものも当然ありますし、いいモデルも作れます。また、あと10個20個実験したらもっと別の範囲が見えるようになりますよといった提案も可能です。
我々の環境では、自由エネルギー摂動法(FEP)の大規模計算も可能です。FEPは基本的にリード化合物最適化のフェーズで使われるものですが、もっと計算量を増やしてヒット化合物を取得する段階で使えたら、圧倒的にスクリーニングの精度が上がるだろうと。計算速度が変わると、使えるフェーズが変わるということは確かにあると思います。
そのためには、やはり一定以上の計算資源を持たなければいけませんが、その一定というのはどのレベルか。言語モデルなどの活用を考えた時には、玉木さんのところでやっているように、少なくともセンタのモデルをファインチューニングできるぐらいの計算規模は必要になってくると思いますので、そこが一つのクライテリアかなと思います。
それ以外のところでは、クラウドサービスを利用することもあります。我々も、例えば1000~2000のコアを使って一気に計算したいというようなこともありますので、そういう時はクラウドで計算資源を確保してその時だけ使って、ということもします。やりたいこと、データ量とのバランスにより、リソースのベストミックスを考えるということですね。
玉木 我々も基本的にはクラウドを使っております。セキュリティの問題もありますので、基本的にプロジェクトごとに独立したクラウド上に管理して計算することにしております。ただそうするとGPUが足りないといった問題も起きますが、生物学の問題ではいかに小規模のデータでAIを早く賢くするかということが求められます。我々もそのためにアルゴリズムを頑張って開発しておりますので、少ない計算量でもちゃんとAIをチューニングできるようになっております。
創薬DXと人材
成田 次のテーマとして、人材の面についてお聞きしたいと思います。創薬DXという中で、創薬研究者がAIやデジタルツールを使わなければいけないという時、どういう変革が必要なのでしょうか。
小松 我々は試薬の会社ですが、最近では機械学習用のデータを集めるための試薬セットが欲しいという要望を、製薬企業の方からいただくようになりました。5年前にはそんな話はほとんどありませんでしたので、ウェットの研究にも大きな潮流の変化を感じます。限られた計算資源で研究を進めるために、精度の高いAI用のデータ取りというのも、メドケムの方たちの大きな仕事の一つになってくるのではと思っています。
牧口 最近ですと、データサイエンスの専門家が製薬企業の研究所に入ってきて、各種AIモデルを作って提案するというアプローチも多いと思います。しかし実際には、メドケムの目からは全然ありえない分子構造のリストを、平気で渡してくるということが結構ありました。やはり十分な創薬の知識を持った方がAIを作れるようになる、制御できるようになるのが一番いいには違いないと思います。ただ現状、その2つの技術の距離が少し離れているため、別々の人材が担うようなケースも多い。創薬に対して本当に有用なAIを作っていくには、おそらく双方で歩み寄り、理解し合いながら道を切り開くしかありません。
AIというのは、メールなどと同じでツールの一つ、手段の一つであり、今後どんどん使いやすくなっていくと思います。これから先、ツールとして使いやすさが改善され、使いこなす人が増えることが大事な要素になるのではとは考えています。
玉木 創薬とAIの両方がわかるスーパーマンがいればもちろんベストですが、実際にはなかなかそうはいきません。そこでどういう人材がDXに必要かと考えると、多分2種類の人材がこれから必要だと思っています。一人は、創薬とAI双方の専門家とコミュニケーションが取れる、「つなぐ」人材ですね。両方完璧でなくても、70点ずつでもいい。研究とAI両方の言うことがわかり、もちろんビジネスについても話せれば言う事なしです。
そしてもう一人重要なのが、機械学習の「超専門家」だと思います。「超」というのは、生物学などはわかっていなくても、最新のテクノロジーが分かっている人。本格的なAIの中身を深く理解していて、新しいアルゴリズムを作り出せる最先端のAI人材が必要です。そして、それとコミュニケーションできる、生物学がわかる人材。これがマストだと僕は考えています。
成田 ありがとうございます。それぞれの専門領域をどう融合していくかという点は、何かAIの使い方とも似ていると感じました。AIにもそれぞれの長所短所があるので、そこをどう融合していくかというのはこれから重要になってくると思います。データの共用もこれと同じかもしれませんね。クローズドばかりにしていると、全体から置いて行かれることになりかねません。人材育成、専門家の育成、デジタルの育成も合わせて進めていくべきと思います。
下記フォームでは、M-hub(エムハブ)に対してのご意見、今後読んでみたい記事等のご要望を受け付けています。
メルクの各種キャンペーン、製品サポート、ご注文等に関するお問い合わせは下記リンク先にてお願いします。
*入力必須