活動報告

第6回TAC-MI最先端研究セミナー開催報告

物質・情報卓越コースでは、2025年8月5日(火)、オンラインにて「第6回TAC-MI最先端研究セミナー」を開催しました。

最先端研究セミナーは、第一線の研究者の方をお招きして、情報科学と物質科学の最先端の話題を基本から分かりやすく解説していただくシリーズ企画です。

第6回となる今回は、Science Tokyoで日本語を中心とした多言語対応の大規模言語モデル「Swallow」の開発に取り組む横田理央教授と、2024年ノーベル化学賞受賞で注目されたAIによるタンパク質構造予測技術を用い、創薬研究を推進する大上雅史准教授にご講演いただきました。  

本セミナーは、情報科学と物質科学の最先端を広く一般の方に知っていただくため、一般公開セミナーとして開催されました。セミナー当日は、企業関係者や学内の学生・教職員、学外の研究者など多くの方にご参加いただき、盛況のうちに終了しました。

<第1部>「大規模言語モデルSwallowの開発について」

横田 理央(東京科学大学 総合研究院 スーパーコンピューティング研究センター 教授)

横田 理央(東京科学大学 総合研究院 スーパーコンピューティング研究センター 教授)

第1部では、「大規模言語モデルSwallowの開発について」と題し、東京科学大学が開発を進める日本語中心の多言語対応大規模言語モデル「Swallow」について、ご講演いただきました。横田教授は、これまでのAI技術の進化とChatGPT登場以降の変遷を振り返りながら、Swallowの研究開発背景、技術的特徴、そして応用展望について詳細にご紹介くださいました。

Swallowでは、最新のTransformer技術をベースに、日本語に最適化されたトークナイザの採用し、従来の英語ベースのモデルに比べて効率的な処理が可能となっています。また、何百ものGPUを用いた分散並列学習、混合精度学習などの先端技術を導入することで、学習効率とコスト削減を両立しています。さらに、評価ライブラリのメンテナンスにも力を入れており、単なるスコアでは測れない実用性を重視したモデル開発が進められています。講演では、Swallowのモデル構成やスケーリング戦略、使用したデータセットおよび計算資源について解説いただくとともに、各種ベンチマークにおける性能評価結果について示されました。

応用事例としては、対話生成、文書要約、コード生成など多岐にわたり、特に医療分野では電子カルテの自動生成や院内データの活用などが期待されています。Swallowはインターネット接続不要なローカルモデルとしても運用可能であり、セキュリティ面でも優れた柔軟性を持っています。

横田教授は、「AI for AI」から「AI for Science」への展開を強調され、AI自身がAI開発を加速するスパイラル構造の中で、科学分野への応用が今後ますます重要になると述べられました。 Swallowの開発は現在も継続的に進められており、今後はさらなる日本語処理能力の強化と、専門分野への応用拡大が期待されています。日本語に強くオープンな大規模言語モデルが登場したことで、日本における大規模言語モデルの研究開発・活用がさらに促進され、製品開発や技術革新が進むことが期待されます。

参加者の声

  • 日本語モデルの構築方法や性能比較がわかりやすく、関心が高まった。
  • 中国を含めた最新技術動向を知ることができて有益だった。
  • AI技術が新規性のあるアイデア創出にもつながる可能性を感じた。

<第2部>「AIとシミュレーションが駆動する創薬分子設計」

大上 雅史(東京科学大学 情報理工学院 准教授)

大上 雅史(東京科学大学 情報理工学院 准教授)

第2部では、「AIとシミュレーションが駆動する創薬分子設計」と題し、AI技術と計算科学を融合した創薬研究の最前線について、大上准教授よりご講演いただきました。2024年のノーベル化学賞を受賞したAlphaFoldの技術を起点に、創薬分野におけるAIの活用事例と今後の展望についてご紹介いただきました。

講演では、医薬品開発における膨大な時間と費用、そして成功確率の低さといった現状が示され、AIによる分子設計がいかにこの課題を克服し得るかが語られました。特に、タンパク質の立体構造予測技術であるAlphaFold2の登場により、従来は実験に頼っていた構造解析が、配列情報から予測可能となった点は大きな転換点といえます。

大上研究室では、創薬ターゲット探索から低分子・中分子・高分子薬のデザインまで幅広く取り組んでおり、Transformerを活用した潜在空間学習や、予測と解釈性の両立を目指す技術開発が進められています。また、AlphaFold3ではタンパク質と低分子・核酸・金属原子などとの複合体予測にも対応しており、今後の創薬研究における応用範囲の拡大が期待されています。

大上准教授は、「AlphaFoldによって創薬・生命科学でできることが増えた。アイデア次第でさまざまな活用が可能になる一方で、予測結果の正確性を見極める能力が求められる」と述べられました。

講演の終盤では、タンパク質や化合物を対象とした言語モデル技術の可能性にも触れられ、AIによる創薬支援が今後さらに進化することが示唆されました。 今後は、AlphaFold3のような複合体予測技術の進化に加え、タンパク質や化合物を対象とした言語モデルの開発が創薬分野において重要な役割を果たすと考えられています。これにより、データサイエンスとシミュレーションを駆使して、更なる研究開発が進むことが期待されます。

参加者の声

  • AlphaFoldを用いた創薬分子設計の現状の空気感が伝わってきて楽しかった。
  • 製薬という難しい分野においてAIを使うことで、効率よく機能性を持った分子が生成できる可能性を知った。
  • 90%の精度でも十分すごいが、さらなる進化に期待したい。

本セミナーにご参加いただいた皆様へ

この度は、多くの方にご参加いただき、誠にありがとうございました。
本セミナーはシリーズ企画であり、年に1~2回の頻度で開催いたします。物質と情報の最先端の情報を、第一線でご活躍する著名な先生方にご講演いただきます。今後も、皆様にとって有益でかつ、最新の話題を提供して参りますので、次回以降もぜひ最先端研究セミナーにご参加ください。

一覧ページへ
過去の記事へ