メニュー

商品ジャンル

一覧

高血圧治療GLを用いて、ChatGPTの解釈能力を評価<徳島大学>

徳島大学は6月8日、高血圧治療ガイドライン (JSH 2019)に掲載されているクリニカルクエスチョンに対する ChatGPT の解釈能力を評価した結果を公表、クリニカルクエスチョン(根拠に基づいた質問)とクエスチョン(エキスパートの意見を統合した質問)を合わせた全体の正確性は64.5%だったことを明らかにした。両者を分けてみると、クリニカルクエスチョンの解答正解性は80%に達した一方、専門家の意見が重視されるクエスチョンの正確性は36%にとどまったという。この結果について同大では、「科学的根拠が明瞭な質問に対しては ChatGPT が高い精度で回答できるが、科学的根拠が不明瞭で、専門家間でも意見が分かれる可能性がある質問に対しては、正確な解答を出すのが難しいという事実を示している」「AIがガイドラインの解釈を補助するツールとして有用であることを示しているが、その能力には限界が存在し、全ての疑問を解決することはできない」としている。

プレスリリース