新薬開発プロセスに革新を。AI×創薬に挑む、鎌倉研究所のデータサイエンティスト

CHUGAI DIGITAL｜中外製薬

2020年10月26日 12:00

こんにちは、CHUGAI DIGITALです。
新薬開発のプロセスを革新するゲームチェンジャーとして注目されるAI（人工知能）技術。

今回は、中外製薬の創薬研究・開発研究においてAI活用に取り組む角崎太郎と上住芳史を訪ね、研究のねらいやデータサイエンティストから見た仕事環境について聴きました。

プロフィール

角崎太郎（研究本部創薬基盤研究部）：
2018年新卒入社。大学院での専門は生物情報科学。抗体や中分子の創薬研究において、機械学習を用いたモデル開発を行う。個人的な興味は生成モデルとベイズ最適化。

上住芳史（研究本部創薬基盤研究部）：
2016年新卒入社。大学での専門は薬物動態学。深層学習・画像解析技術で、疾患メカニズムの解明や前臨床研究に取り組む。個人的な興味は数理統計学と統計的仮説検定。

01：AIによる創薬プロセスの革新が始まっている

－角崎さんと上住さんが取り組んでいる研究について教えてください。

角崎：抗体は、体内に入ったウイルスや細菌を構成するタンパク質などの分子（抗原）に結合して無力化したり、退治する細胞を呼んだりすることができ、我々の体内で異物から守る役割を持っています。ヒトは体内で初めて出会う抗原でも、その抗原専用の抗体を作りだすことが出来ます。

体内の異常な細胞やタンパク質をより効果的に狙えるよう人工的に創って製品化したものが抗体医薬品です。抗原とどれくらい強く結合するか、物質として安定か、工場で生産しやすいか等、さまざまな特性の条件がそろってはじめて、抗体は薬へと仕上がります。

抗体はタンパク質なので、20種類のアミノ酸を並べた配列から構成されているのですが、私の仕事は、膨大な量の抗体配列パターンを計算機でつくり、薬の候補になりうる目的の特性を持つ抗体配列を提案することです。

生物学的な実験技術の向上により、抗体などのタンパク質のアミノ酸配列を自由に改変する技術が確立されてきました。タンパク質はアミノ酸を一つ変えるだけでも、性質が大きく変わることがあります。

一方、莫大な改変パターンのなかで、どれが開発したい薬剤として望ましい高い品質基準をクリアするのか予測することが難しく、これまでは研究員が人力で抗体配列パターンを考えて作製し、かなり大量の実験で特性を確かめるという手法をとっていました。

この抗体配列パターン生成と特性予測に機械学習を持ち込み、抗体のタンパク質構造を最適化するスピード・精度を向上させることを目指しています。

上住：私は病理学分野にAIを活用することで、病理診断にかかる時間・コストを圧倒的に効率化できると期待しています。

パソロジー（病理学）は、身体・臓器の形態変化（かたち・構造の異常）と病気（臓器の機能異常）の関係を探る研究分野です。

例えばがん組織を顕微鏡で見ると、正常組織では整然と並んでいるはずの細胞が無秩序になっています。このような病理画像をデジタル化し、AIで大量かつ高速に解析するシステムの構築に取り組んでいます。2012年のAlexNetを端にした画像解析におけるAIの飛躍的な進展が大きいですね。

【新薬開発のプロセス】

* 新薬開発は一般に９から16年の期間と数千億円のコストがかかるとされます。ヒトを対象として、医薬品の安全性や有効性などを確認するために行う「臨床試験」の前段階には、候補薬を育てる「創薬研究・開発研究」があります。（新薬開発のプロセスと期間について詳しくはこちら）

02：機械学習の実装：抗体配列の生成と特性予測モデル、デジタルパソロジー×深層学習

― 研究への機械学習の実装について、詳しく教えてください。

角崎：私が計算機で見ているデータは、抗体を構成するアミノ酸の配列と特性です。アミノ酸の配列を自然言語処理のアルゴリズムでベクトルに変換し（アミノ酸の1文字表記を単語に、配列を文章に変更）、抗体の配列パターンを自動生成する「新規抗体配列生成モデル」をつくりました。

アミノ酸の特徴量を入力すると抗体の特性を出力する「特性予測モデル」も同時につくり、生成した配列パターンをこの予測モデルで評価しています。また、予測モデルで良い特性が見られた配列は、同じ研究所にいる実験チームの研究員に提案し、実測値で評価・判断してもらいます。

これらのモデルは中外製薬が独自に開発したもので、Machine Learning x Antibodyの頭文字をとってMALEXA（マレキサ）と呼んでいます。

上住：私は病理画像に写る組織や細胞の大きさや形、色、位置などを定量的に測定する深層学習アルゴリズムを開発しています。

異分野で発展した技術を医学研究に応用していくことで、例えばぶどうやブルーベリーの房のように重なりあい密集した細胞を正確に計数するなどして、病理組織の画像中の変化を定量的に測定し、より精密に組織構造を観察できるようになると期待しています。

そして、今まで検出が難しかった画像の変化を捉え、疾患の原因と考えられる標的分子を見つけ出す可能性もあると考えています。

03：多様な専門性をもつ研究員がいるからこそ、データサイエンティストが活躍できる

― 中外製薬でデータサイエンティストとして働くことの魅力は？

角崎：データサイエンティストのキャリアとしては、まずはデータサイエンティストとしてのスキルがあり、そこに生物なら生物、金融なら金融のドメイン知識が組み合わさっていくものだと思います。

中外製薬には、生物学・薬理学、抗体工学・タンパク質工学・創薬化学、製剤学、トランスレーショナルリサーチ（基礎研究から臨床応用への橋渡し研究）、臨床開発、疫学調査といった多岐にわたるドメイン知識をもつ専門家同士で、チームで研究プロジェクトを進めることに慣れていて、自分の研究や業務を相手にわかりやすく説明することが当たり前に行われています。

データサイエンティストだけが特殊ということはありませんので、とても研究がしやすいです。

上住：「つくったモデルが、実際の現象に当てはまらないまま放置される」ということがありません。解析上データが不足する場合、実験系の研究員に相談すれば、必要なデータ取得に協力が得られるからです。データ・ドリブンにエビデンスを追求する考え方が十分に浸透していることのひとつの表れだと思います。

また、常に創薬研究の実験業務のなかで測定技術の腕が磨かれているため、データがきれいで扱いやすく高精度だと感じています。なので、「質の良いデータが足りないから、できませんでした」という言い訳ができません！笑

研究業務では、常に新しい領域の探索を進めています。そのとき、世界にまだデータとして記録されていない場面もあります。誰かの命を救うために、豊富な自社独自のデータと対峙しモデルを作り、研究実務のなかで役立ち評価されている実感があるのは、データサイエンティストにとって大きな魅力です。

04：自身のスキルを伸ばすと共に、新薬開発の意思決定にデータサイエンスの方法論を当てていく面白さ

― 今の研究環境をどのように捉えていますか？中外製薬でのキャリアに関心があるデータサイエンティストへのメッセージもお願いします。

角崎：自分自身は、機械学習の要素技術を突き詰めるというよりも、新しい抗体の作製や最適化という目的のために世の中にあるアルゴリズムを組み合わせ駆使するという研究スタイルをとっています。

私は大学院で生物情報科学を学びましたが、職場には工学系出身のデータサイエンティストもいます。必要となる生物学や薬学の知識は仕事をしながら学びやすい環境だと思います。

上住：実際に入ってみて意外だったこととして、かなり自由にやりたい研究をやらせてもらっていることです。上から与えられたテーマしか研究できない、ということでは全くないです。

「研究は自由闊達な研究員の独創性・専門性が推進力である」という風土がもともと研究所にあり、さらに今は、全社的なDX推進により、データサイエンスをあらゆる研究に方法論として当てていくことが期待されています。

私自身、新薬開発の意思決定において、自分の研究成果が活かされているという手ごたえを感じています。

採用サイトをリニューアルしました

社員座談会｜デジタル×創薬
https://www.chugai-pharm.co.jp/recruit/new/crosstalk/crosstalk1.html

社員インタビュー｜寺本礼仁　研究本部　創薬基盤研究部
https://www.chugai-pharm.co.jp/recruit/new/human/teramoto.html

社員インタビュー｜中臣政司　デジタル・IT統轄部門　デジタル戦略推進部
https://www.chugai-pharm.co.jp/recruit/new/human/nakatomi.html