ヘッダー画像

医療コラム

T先生!AIに病気の相談をしても当たらないって本当?|つじファミリークリニック|大野城市東大利にある内科・ペインクリニック

T先生!AIに病気の相談をしても当たらないって本当?

 

📢 T先生!AIに病気の相談をしても当たらないって本当? 🤖


たろうくん
「T先生!最近、AIがお医者さんの試験でほぼ満点を取ったって聞いたんだけど、じゃあ具合が悪いときにAIに聞けば大丈夫なの?」

T先生
「いい質問だね、たろうくん!実は2026年2月に、イギリスの研究チームがNature Medicineという超有名な雑誌に、まさにその疑問に答える論文を発表したんだよ。」


🧪 どんな研究だったの?

T先生
「イギリスの一般の人1,298人に参加してもらって、『突然の激しい頭痛』や『長引く腹痛』といった10種類のよくある症状について、AIに相談してもらう実験をしたんだ。使ったAIはGPT-4oなどの最新のものだよ。」

たろうくん
「へぇ〜!で、AIはちゃんと正しい病気を当てられたの?」

T先生
「ここがすごく面白いところでね。AIにお医者さんが書いた完璧な情報を渡した場合は、正しい病名を94.9%という高い確率で言い当てたんだ。」

たろうくん
「94.9%!?それってめちゃくちゃ優秀じゃん!」


📉 でも、人間が使うと精度が急降下…

T先生
「ところがね、普通の人がチャットで相談した場合は、正しい病名を当てられたのは34.5%以下に下がってしまったんだ。」

たろうくん
「えっ!94.9%から34.5%!?なんでそんなに下がるの?」

T先生
「それだけじゃないよ。『救急車を呼ぶべきか』『明日病院に行けばいいか』という緊急性の判断も、正しくできたのは44.2%以下だったんだ。」

たろうくん
「半分も合ってないの?それって結構やばくない?」

T先生
「さらにね、皮肉なことに、AIを使わずに普通のGoogle検索で自分で調べた人のほうが、AIを使った人より約1.76倍も正確に病名を当てられていたんだよ。」

たろうくん
「ええーっ!AIより自分で検索した方がマシだったってこと!?」


🤔 なぜこんなにすれ違うの?

T先生
「大きく分けて3つの問題が見えてきたんだ。」

T先生
1つ目は、情報の伝え方。分析した30件の会話のうち、16件で最初のメッセージに症状の一部しか書いていなかったんだ。例えば胆石の症状の人が『食後に激しい胃痛があって、吐くこともある』とだけ書いて、痛みの場所や強さ、頻度を省いてしまっていたんだよ。」

たろうくん
「お医者さんなら『どこが痛い?いつから?』って聞いてくれるよね!」

T先生
「そのとおり!でもAIは積極的に聞き返さずに、不十分な情報のまま答えを出してしまうことが多かったんだ。」

T先生
2つ目は、正しい答えを選べない問題。AIが複数の病名候補を出しても、医学知識のない一般の人にはどれが自分に当てはまるか選べなかったんだよ。」

T先生
「そして3つ目が一番怖い。まったく同じような症状(激しい頭痛・首のこわばり・光がまぶしい)を伝えた2人に対して、GPT-4oが真逆のアドバイスをしたケースがあったんだ。」

たろうくん
「真逆って?」

T先生
「一方の人には『暗い部屋で安静にして』と言い、もう一方には『脳出血の可能性があるから今すぐ救急へ』と言ったんだ。違いは『突然』という一言があったかどうかだけだったんだよ。」

たろうくん
「たった一言で真逆の答え!?もし本当に脳出血だったら、暗い部屋で待ってたら大変なことになっちゃうよ!😱」

T先生
「そのとおり。AIの回答はちょっとした言い方の違いで大きく変わることがある。これが実際の場面ではとても危険なんだ。」


🛡️ じゃあ、AIとどう付き合えばいいの?

T先生
「大事なポイントを3つ教えるね。」

T先生
まず、AIの回答は不完全で一貫性がないことがあると知っておくこと。伝え方ひとつで答えがガラッと変わる可能性があるからね。」

T先生
次に、AIが出す候補の中から正解を選ぶのは素人には難しいということ。もっともらしい病名をいくつも並べてくるけど、自分で正しいものを見極めるのは至難の業なんだ。」

T先生
そして、緊急性の判断をAIに任せないこと。AIが『自宅で様子を見て』と言っても、あなたの『いつもと違う』という直感のほうが正しいことは多々あるんだよ。」

たろうくん
「なるほど〜!じゃあAIは『ちょっとしたメモ帳』くらいに考えたほうがいいってこと?」

T先生
「まさにそのとおり!AIは『お医者さんに相談する前のメモ帳』くらいの気持ちで使って、最終的な判断は信頼できるお医者さんに任せる。自分の体の声をしっかり聞くことが何より大事だね。」


📝 まとめ!

AI単体は病名正答率94.9%だが、一般人が使うと34.5%以下に急降下する
Google検索で自分で調べた方がAIを使うより約1.76倍正確だった
AIは伝え方のわずかな違いで真逆のアドバイスをすることがある
緊急性の判断をAIに任せるのは危険——「いつもと違う」という直感を大切に
AIは「受診前のメモ帳」として使い、最終判断は医師に相談しよう


たろうくん
「AIってすごく賢いんだと思ってたけど、使い方を間違えると逆に危ないこともあるんだね。僕も具合悪くなったら、まずはお医者さんに行くようにするよ!」 😊

T先生
「そうだね!テクノロジーは便利だけど、自分の体を守る最後の砦は、自分の感覚と信頼できるお医者さんだよ。いつでも聞いてね!」 🏥


📚 参考文献

Bean AM, et al. Reliability of LLMs as medical assistants for the general public: a randomized preregistered study. Nat Med. 2026;32:609-615.