AI単体なら「名医」でも、人間が使うと「凡人以下」に? 最新研究が明かすAI医療相談のリアル
医学部卒業試験で満点に近いスコアを取るほど優秀な最新のAI。しかし、一般の人が実際に体調不良を相談してみると、その精度は驚くほど下がってしまうことがわかりました。今回は、デジタル時代の医療情報の探し方について、最新の大規模研究のデータをもとに考えてみましょう。
山田悠史
2026.02.25
サポートメンバー限定
医学誌『Nature Medicine』に興味深い論文(1)が報告されました。イギリスの一般市民1298人を対象に行われたこの研究では、参加者に「突然の激しい頭痛」や「長引く腹痛」といった10種類のよくある症状のシナリオを与え、私たちがよく用いるAI(GPT-4oなど)を使って「何の病気が疑われるか」「救急車を呼ぶべきか」といった判断をしてもらいました。
すると、AI単体に医師の書いた抜けのない全ての情報を与えて回答させた場合、関連する病名を94.9%という高い確率で正確に言い当て、次に取るべき行動についても平均56.3%の正解率を示しました。これは優秀な成績だと思います。ところが、一般の参加者が対話形式で同じAIに相談した場合、病名を正解できたケースは34.5%以下、受診の緊急性を正しく判断できたのは44.2%以下にまで急降下してしまったのです。さらに皮肉なことに、AIを使わずに従来のインターネット検索などで自力で調べたグループでは、AIを使ったグループよりも約1.76倍正確に病名を特定できていました。AIに尋ねるより、Googleなどで自分で調べたほうがよっぽど正確だったのです。
なぜすれ違うのか? 見えてきた課題
提携媒体
コラボ実績
提携媒体・コラボ実績