中外製薬 臨床開発本部のデータサイエンティストが語る! AIブームにおける統計・データサイエンスのこれまでとこれから
こんにちは、CHUGAI DIGITALです。
今回は、中外製薬本社で医薬品の臨床試験やリアルワールドデータ(RWD)研究を推進する二人のデータサイエンティストが登場します。
山本英晴と杉谷康雄は、統計の専門家としてのバックグラウンド、米国バイオテックへの海外赴任、働きながらの博士号取得のため大学院に通うという、いくつかの点で共通のキャリアをもつ上司と部下。臨床開発の最前線から見るデータサイエンスのこれまでとこれからについて聴きました。(2020年12月2日 取材)
プロフィール
山本 英晴:臨床開発本部 バイオメトリクス部 統括マネジャー。専門は数理統計学。理学博士。日本製薬工業協会データサイエンス部会長、日本計量生物学会の理事を務める。
杉谷 康雄:臨床開発本部 バイオメトリクス部 PHCデータサイエンスグループマネジャーとデジタル戦略推進部データサイエンスグループを兼務。専門は生物測定学。薬科学博士課程に在学中。
01:中外製薬 臨床開発本部でのキャリアは?
山本:私は数理統計を専門とし、20年にわたり新薬の臨床試験や統計解析の業務に携わってきました。部署名にもなっている「バイオメトリクス」とは、計量的に生物を測定・解析する学問のこと。20世紀前半ピアソンとフィッシャーというライバル同士の科学者がその発展に寄与し、畑を区画に分けて収量を解析する実験計画法に始まって、農学、生物学、医学、生態学と幅広くカバーします。杉谷さんの大学時代の専門も、バイオメトリクスだよね。
杉谷:はい。まさに農学生命科学の分野でバイオメトリクスを学び、修士卒で中外に入社して臨床試験の統計解析に従事してきました。入社間もない頃の上司は山本さん。その後、米国のジェネンテック社に赴任するチャンスを得ました。2015年より1年間サンフランシスコに住み、臨床研究においてトップレベルといえるグローバルな環境で、統計の議論に没頭する日々を過ごしました。
山本:中外の臨床開発のメンバーは、ほぼ毎年、スイスのロシュ社(中外が戦略的アライアンスを結ぶ世界トップ製薬企業のひとつ)や同じロシュ・グループのジェネンテックに赴任しています。
私も杉谷さんより前にジェネンテックに赴任しましたが、FDA(米国の食品医薬品局)に申請する治験にも参画して最先端の解析手法を検討し、アカデミアの統計研究者やメディカルドクターと現地で議論できる経験に、とてもワクワクしたのを覚えています。杉谷さんは帰国後、デジタル戦略推進部の立ち上げにも関わり、働きながら大学院に通うようにもなったよね。
杉谷:ええ。2020年10月からは新設のPHCデータサイエンスグループのマネジャーとしてリアルワールドデータ活用にも取り組んでいます。大学院では薬科学の研究室で博士号取得に向けた論文を書いているところです。
山本:杉谷さんもそうですが、私もかつて仕事をしながら数理統計の博士号を取得しました。中外の臨床開発本部では、そうやって学位取得と仕事を両立させているメンバーが毎年何人かいます。
02:臨床開発の立場からAIをどう使うか
山本:昔なら臨床試験のデータは、患者さんが病院などで検査したタイミングで「点」として取得されるものでしたが、時代が変わり、アプリなどでデータがリアルタイムかつ24時間取得できるようになりつつあります。かつてないほど大量の経時的なデータが取得できる今、これらを可視化して未来を予測するためには、機械学習やディープラーニングの手法が必要になっていると感じています。
重要なのはデータを集め、他人にわかりやすく可視化して示すことであって、そのこと自体は従来の統計解析と変わりありません。そのための新たな手法としてAIが注目されているわけです。
杉谷:私もここ数年で、リアルワールドデータ、画像、自然言語、ウェアラブルデバイスのセンサーから得られるデータなど、多種多様なデータを扱うようになりました。そのため、自然言語処理や画像解析などデータの前処理から機械学習等で解析するための数値化が必要になっています。
具体的には、AI・ビッグデータ活用における産学連携を推進する「ライフ インテリジェンス コンソーシアム(LINC)」での活動として、他の製薬会社やIT企業と協働することで、これまでの臨床試験の治験実施計画書や治験情報について自然言語処理を用いることで分析可能なデータとし、治験の最適化をもたらすことができないか取り組んできました。
また、より医療現場に近い情報としては、国立がん研究センターと共同で、匿名化された電子カルテ情報を用いた有効性・安全性の探索的研究を実施しており、この研究の中でも画像や医師記載などの数値化されていないようなデータを扱うことを検討しています。
リアルワールドデータの分析では膨大なデータからいかに実際の医療現場における処方状況を理解することができるか、そこから医療現場・患者さんの真のニーズの理解につながるよう、医療実態の可視化に取り組んでいます。
また、開発中の医薬品の治療効果が「真か/真でないか」を証明するには従来の統計の手法が依然有効なのですが、対して深層学習を含む機械学習では、種類や量が膨大で複雑なデータから「多分こうなるよ」と予測を立てるのが得意です。
従来の統計学と、機械学習やRWDなど新しい技術・データを組み合わせることで、患者さん一人ひとりのニーズに応えていくデータドリブンのPHC(Personalized Healthcare、個別化医療)が実現できると期待しています。
実際の患者さん一人ひとりのデータを見ることで、これまで臓器や症状、治療方法や経過などによって分類されてきた疾患が再定義される可能性もあると思います。
03:仕事に必要とされるスキル・資格は?
山本:臨床試験の解析には長くSASが使われてきましたが、今はRやPythonにシフトしつつあります。
杉谷:臨床試験関連では、日本計量生物学会による試験統計家認定制度で責任試験統計家と実務試験統計家の認定者がいます。データサイエンス関連の資格で言うと、統計検定は学生の時に2級を取得している人が多く、入社してから準1級や1級を取得している印象です。最近はJDLA(日本ディープラーニング協会)のG検定を取得している人も増えてきました。
山本:バイオメトリクスで扱うのは生物、とくにヒト由来のデータですが、今後私たちはデータサイエンスを標榜し、取得できるあらゆるデータの解析をしていきたいと考えています。そのために扱いやすい解析手法に変えていくことは重要です。
新しいデータや技術という点では、ロシュ・グループのデータやノウハウにアクセスしやすいことも当社の強みのひとつですね。
04:データサイエンティストとしてのやりがいは?
山本:数字の山から真実にたどり着くことに醍醐味を感じます。
中外の臨床開発本部には、困難だがインパクトのある課題に対して、同僚と苦労しながらもディスカッションして解決していこう、というカルチャーがあります。自分たちが今まで使ってきた統計学は、意思決定(判断)するために有効な学問です。しかし、今はそれだけではもったいないほど、データと解析の両面で技術革新が起きている。データサイエンスによって患者さんに届けられる新しいメリットを探索していきたい。
杉谷: 「真実の追求」はやりがいであり、こだわりです。一生懸命解析した結果、医薬品に期待していたような結果が得られないこともあります。失敗すると残念ですが、失敗もまた真実にたどり着くための一歩で、社会に対する還元や貢献に通じると信じています。患者さんのことを考えれば、ある薬が効かないことがわかることも大切な真実なので。