ما مدى دقة ChatGPT في تشخيص الأمراض البشرية؟

كشف فريق من الباحثين الطبيين في كلية شوليش للطب وطب الأسنان بجامعة ويسترن الكندية، عن "جانب غير مكتشف" منبرنامج LLM ChatGPT فيما يخص التشخيص الطبي.

وقال الباحثون إنه على الرغم من تدريبه على عدةتيرابايت من البيانات، فإن البرنامجالذكيما يزال غير جيد في تشخيص الأمراض البشرية.

وفي الدراسة، درّب الفريق برنامج LLM الشهير على 150 دراسة حالة طبية من Medscape، وهو موقع على الإنترنت أنشأه ويستخدمه المتخصصون الطبيون لأغراض إعلامية وتعليمية.

كما زُوّد البرنامج بمعلومات حول تاريخ المرضى ونتائج المختبر ونتائج الفحص المكتبي، ثم طُلب منه تقديم تشخيص مناسب أو وضع خطة علاج.

ثم صنّف الباحثون النتائجبناء على مدى اقترابLLM من التشخيص الصحيح. كما قاموا بتصنيفها بناء على مدى جودة الإبلاغ عن المنطق وراء الوصول إلى التشخيص، بما في ذلك تقديم الاستشهادات (وهو جزء مهم من التشخيص الطبي).

ووجدوا أن LLM أعطى تشخيصا صحيحا بنسبة 49٪ فقط من الوقت.

وأوضحت الدراسة أنه على الرغم من تسجيل LLM لنتائج ضعيفة، إلا أنه قام بعمل جيد في وصف كيفية الوصول إلى التشخيص، وهي سمة يقترحها الفريق، وقد تكون مفيدة لطلاب الطب.

كما لاحظ الفريق أن LLM كان جيدا بشكل معقول في استبعاد الأمراض المحتملة.

نُشرت الدراسة على موقع PLOS ONE المفتوح المصدر.

المصدر: ميديكال إكسبريس