「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化 人間の医師に残される役割とは?
大塚 篤司(皮膚科医/近畿大学医学部皮膚科学教室主任教授)

生成AIであるChatGPTを開発する米企業OpenAIはこの2月、新モデル「o3」シリーズの一つ「o3-mini」の提供を開始した。また中国のスタートアップ企業DeepSeekは独自の新モデル「R1」を公開、従来より大幅に低いコストで高性能なAIの開発に成功したと発表し大きな話題になっている。
加速度的な成長を見せる生成AI。AGI(汎用人工知能)、すなわち人間以上の能力で人間と同じような汎用的な作業を行えるAIの登場が現実的と言われる中で、医師など医療職の仕事は今後どのように変わるのだろうか。
2024年に2冊の著書を発表するなど「医師による生成AIの活用」で最先端を行く、大塚篤司医師(皮膚科医/近畿大学医学部皮膚科学教室主任教授)に、医療の翻訳家こと市川衛が迫った。

『医師による医師のためのChatGPT入門―臨床がはかどる魔法のプロンプト』(医学書院・2024年6月3日)

『医師による医師のためのChatGPT入門2―臨床現場ががらりと変わる生成AI実践術』(医学書院・2024年10月15日)
1.「信頼できるメンターと一緒に活用する」
――「エピロギ」で2024年の7月、大塚さんに生成AIの使いこなし方を聞いたインタビュー記事を公開したところ、大変多く読まれました。何か反響はありましたか?
はい(笑)、学会に行った時に「ウェブ記事読みましたよ」と言われたり、初対面でご挨拶した方に「拝読しました」と言われたりしました。
――医療界において、生成AIへの興味が高まっていると感じられますか?
そうですね、若い世代ほど注目していますね。まだ触っていない人でも、いよいよ触らないとやばいなと思っている人が増えています。
一方で、上の世代の先生方の中には一定「AIを使うのはけしからん」という声もあります。「AI任せで論文を書いたり読んだりしていたら、研究する力が育たない」という危機意識があるようです。
――その意見も共感できますね。AIは時に間違うこともあります。だからこそ、その回答を採用していいかどうかを人間側が判断できないといけない。AIに頼っていると、判断能力が身につかなくなるのではないでしょうか?
だからこそ、信頼できるメンター、つまり経験と知識を持つ先輩医師からフィードバックをもらいながら使うことが大事だと思います。
例えばいま、私はChatGPTに教えてもらいながらプログラミングを勉強しています。すると、書いたコードが動かなかったりする。じゃあどこが間違っていたのかとChatGPTと一緒に考えながら試行錯誤する。そうしていくと、学習が凄く早く進むんです。
プログラミングの場合は「動く、動かない」ですぐにフィードバックがかかりますが、医学研究の場合は必ずしもそうはいかない。だから、間違った時にすぐ「それはおかしい」と指摘してくれる先輩医師をメンターにしてAIを使うと、医学の学習もより進みやすくなるんじゃないでしょうか。
2.「去年は研修医、いまはもう大学教授クラス」
――大塚さんは今年1月、最新のAIモデルを用いた皮膚科診断精度の検証結果を論文発表しました。皮膚腫瘍性疾患15例と炎症性皮膚疾患15例の計30症例の画像をもとに、AIモデルと皮膚科専門医11名に診断を行ってもらった結果、AIモデルと専門医の正診率に有意差は認められませんでした。
いまはAIってChatGPTも含めて、マルチモーダル(※)化が進んでいるじゃないですか。もうこんなに賢くなっているんだから、写真でも行けるんじゃない? って思って、実際に公開されている論文の臨床写真を入れてやったら、本当に精度が高くておったまげた、という感じです。
※マルチモーダル……テキスト、音声、画像など複数の異なる情報源から情報を収集し、統合して処理できる能力。
――おったまげた(笑)。ということは、事前の想定より精度が高かった、ということですか?
正診率を、専門医の先生たちと比べたんですよ。そうしたら、専門医の平均値より、ちょっと上なんです(筆者注:統計的な有意差は無し)。それを見て、もう、ここまでできちゃうんだっていう感じでした。

大塚篤司さん(筆者撮影)
――確かに以前から「乳がんの画像診断でAIが人間の専門医を上回った」というような研究はいくつも発表されてきました。ただそれらは、画像診断専用のAIに、乳がんの画像を大量に学習させて精度を上げる、というような手法が取られていました。今回は、特別なトレーニングを受けていない生成AIに、いきなり画像を読んでもらった。それなのに、専門医と同じ精度が出たというのは衝撃的ですね。
そうです。ここから、ちょっとファインチューニングすれば、簡単にもっといいものができてしまいますからね。ここ数年で、AIのレベルは急激に進化しています。
ChatGPTで言えば、2024年前半の最新モデルであった4o(フォーオムニ)の場合、研修医から専門医になるちょっと前くらいの能力だと感じていました。いま私が使っているo1 pro(オーワンプロ:※)の場合、もう大学准教授、教授クラスと言っていいと思います。
※o1 pro……2024年12月に発表されたモデル。高度な推論を行うことができる。月額利用料が200ドル(およそ3万円)と高額なことも話題を集めた。
3.AI時代における「人間の医師」の役割は?
――AIの進化の中で、医療界や医師のキャリアについて、どのような未来像を描いていますか?
このままいくと医師はそんなに数が必要なくなるなって思っています。おおよそのことはAIがやってくれて、人間はチェックするだけで十分になる。
例えば大きい病院なんだけど、オペも診察も自動でAI搭載ロボットがやっていて、人間の医師はいわば司令塔的な役割で、オペレーションルームでモニターを見ている数人がいるだけというような。

大塚さんのイメージをもとに、画像生成AIのDALL-E3(OpenAI社)を用いて筆者作成
――ただ自分が疑問に思っているのは「AIに患者に寄り添った医療が可能なのか?」ということです。患者さんの持つ悩みは、単に病気のことだけではありませんし、例えば終末期の治療において、医学的に最適な治療が解決策にならないケースだってある。こうした複雑さに、対応できるのかなと。
私は、できるようになると思います。写真家の幡野広志さんがよく仰っていますが、携帯で何を入力しているとか、その画面などを見ていたら人の個性とか好みなどは分かるわけで、AIがそのデータをもとに、個人の好みや希望も加味した選択肢を考えることは当然、できるんじゃないかと。
――患者さん側が、理想の主治医を作れるようになるということですね。一方で、医師の仕事が奪われるようなことになれば、いろいろな抵抗もあると思いますし、なかなかドラスティックには進まないのではないかという気もします。
確かに、そうですね。技術の進化と完全にシンクロして普及が進むことはないでしょう。もし大きな変化があるとすれば、「医療経済の破綻」がきっかけになるのかもしれません。
現在の国民医療費は46兆円(2022年度)を超えていますが、今後さらに高騰して、もう社会として支えられないという声が高まった時に、AIを入れたらコストを圧倒的に下げられるとなったら、そこで劇的な変化が起きるかもしれない。
4.若手ドクターは「会いたいと言われる存在」を目指せ
――例えが正しいかは分からないんですが、自動車が普及した結果、人力車や馬車は使われなくなりました。でも、浅草など観光地に行けば使われている。そこでは「機能」ではなく「体験」に価値が移っているわけです。「人間の医師による診察」も、そうなっていく可能性はありますか?
未来のことは誰にも予想できませんし、僕の言っていることも100のうち1つ当たっていればいいくらいだと思っているんですが、AIにはできなくて人間にできることとして一つ思いついたことがあります。
ある研究で、患者さんにAI医師の回答と人間医師の回答を聞いてもらって、どちらが共感性が高いかを尋ねました。共感性とは、簡単に言えば「自分のことに寄り添って、考えてくれている」と感じるかどうかということです。
AIと人間どちらの回答かを伏せて尋ねると、AI回答のほうが「共感性が高い」と支持されました。ところが、どの回答が人間のものかを明らかにして尋ねると、そちらを選びたいという人が多くなったんです。つまり、いくらAIの回答が正確で自分好みだとしても、「やっぱりAIよりも人間が好き」という人は少なからず存在するわけです。
――なるほど。それも踏まえて、今後のAI時代に人間の医師はどう向き合っていくべきでしょうか。
僕は若手のドクターへのアドバイスとして、「患者さんから会いたいと言われる存在」を目指しなさい、と伝えています。
もちろん生成AIの進歩をキャッチアップすることは大切です。一方で、医師がこれまで果たしてきた役割のうち多くは、AIのほうが遥かによくできるようになっていくことは間違いない。その中でAIが絶対に代替できない価値は「人間であること」です。その価値を突き詰めた時に、同じ人間として会いたいと思われるかどうかは、大切なことなのではないかと。

大塚篤司さん(筆者撮影)
――大塚さんご自身は、AIとどのように向き合っていこうと思っておられますか?
市川さんは「医療の翻訳家」として活動されておられますが、私は「AIと医師の翻訳家」を目指そうかなと思っています。AIと、AIを使い始めた人たちの間に立って、橋渡し的なことをしていきたいなと。
こうして取材を受けたり、本を書くのもその一環ですし、AIの使い方について提案したり、みんなが間違った方向に行ってるから止めようよとかいうことを提案してみたり、そういうことをしばらくやっていこうかなと思ってます。
(聞き手・文=市川 衛)
<参考文献>
- ・Yamamura Y, Fujii K, Nakashima C, Otsuka A. Evaluation of the Accuracy of Artificial Intelligence (AI) Models in Dermatological Diagnosis and Comparison With Dermatology Specialists. Cureus. 2025 Jan;17(1):e77067. doi: 10.7759/cureus.77067.
- ・厚生労働省「令和4(2022)年度 国民医療費の概況」
- 大塚 篤司(おおつか・あつし)
- 1976年生まれ。近畿大学医学部皮膚科学教室主任教授。医学博士、日本皮膚科学会専門医・指導医、がん治療認定医、日本アレルギー学会認定専門医。
2003年信州大学医学部卒、京都大学医学部特定准教授(病棟医長)などを経て、2021年より現職。アレルギー薬剤開発研究にも携わり、複数の特許を取得。がんやアレルギー、生成AI活用の講演活動やコラムの執筆も手掛ける。
著書に『医師による医師のためのChatGPT入門-臨床がはかどる魔法のプロンプト』(医学書院)、『世界最高のエビデンスでやさしく伝える 最新医学で一番正しいアトピーの治し方』(ダイヤモンド社)、『白い巨塔が真っ黒だった件』(幻冬舎)など。
- 市川 衛(いちかわ・まもる)
- 東京大学医学部を卒業し、NHKに入局。医療・健康分野を中心に国内外での取材や番組制作に携わる。現在はREADYFOR㈱ 基金開発・公共政策責任者、広島大学医学部客員准教授(公衆衛生)、㈳メディカルジャーナリズム勉強会 代表、インパクトスタートアップ協会 事務局長などを務めながら、医療の翻訳家として執筆やメディア活動、コミュニティ運営を行っている。
コメントを投稿する