مقارنة إجابات أطباء وChatGPT على 200 سؤال طبي

هلا أخبار- يمكن لـChatGPT أن يكون أداة مفيدة للمرضى الذين يسعون للحصول على معلومات وتوجيهات طبية، لكن أداة الذكاء الاصطناعي هذه لا يمكنها أن تحل محل الطبيب البشري بالكامل، وفق ما ذكرته الأداة بنفسها.

وكتبت أداة الدردشة الآلية: “رغم أنني نموذج لغوي تم تدريبه على كم هائل من المعلومات، إلا أنني لست ممارسًا طبيًا مرخصًا ولا أستطيع تقديم تشخيصات أو علاجات أو نصائح طبية”.

ومع ذلك، تشير الأبحاث الجديدة التي نشرت هذا الأسبوع إلى أن الأطباء قد يحتاجون إلى تعلّم بعض الأمور من خاصية الدردشة الآلية عندما يتعلق الأمر بالتواصل مع المرضى.

وقامت لجنة من المتخصصين في مجال الرعاية الصحية المرخصين بتقييم الردود على حوالي 200 سؤال طبي مختلف طرحها مرضى في منتدى عام على الإنترنت، ضمنًا استفسارات المرضى حول التشخيصات الطبية والحاجة إلى الرعاية الطبية وغيرها.

ووفقًا لدراسة نشرت الجمعة، تم “تفضيل ردود ChatGPT على ردود الأطباء، وتصنيفها بشكل أعلى لجهة الجودة والتعاطف”.

واعتبرت أكثر من ربع ردود الأطباء أقل من مقبولة من حيث الجودة، مقارنة مع أقل من 3% من تلك الواردة من ChatGPT.

وعلى النقيض من ذلك، اعتبرت نحو نصف ردود ChatGPT متعاطفة (45%) مقارنة مع أقل من 5% من تلك الواردة من الأطباء.

وفي المتوسط، حصل ChatGPT على درجة أعلى بنسبة 21% من الأطباء لجهة جودة الردود وأكثر تعاطفًا بنسبة 41%، وفقًا للدراسة.

في أحد الأمثلة الواردة في الدراسة، طرح أحد المرضى سؤالاً على منتدى وسائل التواصل الاجتماعي حول مخاطر الإصابة بالعمى بعد التعرض لرذاذ من المبيّض.

بدأ ChatGPT ردّه باعتذار عن الذعر الذي قد يسببه التعرّض لمثل هذا الحادث، متبوعًا بسبع جمل إرشادية وتحفيزية حول الاحتمالية “الضئيلة” للإصابة بالعمى.

في والوقت عينه، رد أحد الأطباء قائلاً “يبدو أنك ستكون بخير”، متبوعًا برقم هاتف مراكز مكافحة السموم.

وجد جميع الأطباء في اللجنة، الذين قاموا بتقييم هذه الردود، أن رد ChatGPT كان الأفضل.

كما في هذا المثال، لاحظ الخبراء أن الردود من ChatGPT كانت عادةً أطول بكثير من تلك الواردة من الأطباء، ما قد يؤثر على تصوّرات الجودة والتعاطف.

من جانبها، ذكرت ميريلا لاباتا، أستاذة معالجة اللغات الطبيعية في جامعة إدنبرة: “من دون التحكّم بطول الرد، لا يمكننا التأكد ممّا إذا كانت اللجنة تقيّم بالاعتماد على الأسلوب (على سبيل المثال، الخطاب المطوّل والمنمّق) بدلاً من المحتوى”.

وفي وقت سابق من هذا الشهر، طرح الدكتور ديفيد آش، أستاذ الطب ونائب العميد الأول في جامعة بنسلفانيا، سؤلاً على أداة ChatGPT حول إمكانية استخدامه في مجال الرعاية الصحية.

ووجد أن الردود كانت دقيقة، لكنّها مطولة.

قال: “يبدو أن ChatGPT لديه شخصية تكثر الكلام”.

وتابع: “لم يبدُ لي كأنه شخص يتحدث إلي، بل بدا وكأن شخصًا يحاول أن يكون شاملاً للغاية”.

أشار آش إلى أنه سيكون متحمسًا لمقابلة طبيب شاب أجاب على الأسئلة بشكل شامل، ومدروس، كما أجاب ChatGPT على أسئلته، لكنّه يحذّر من أن أداة الذكاء الاصطناعي ليست جاهزة بعد لمنحها ثقة كاملة من قبل المرضى.

وقال: “يتمثل أحد التحديات الخاصة بـChatGPT في أنّها تتواصل بشكل فعال للغاية. يملك هذا النوع من الكلمة المحسوبة، ويتواصل بطريقة واثقة. ولست متأكدًا من أن هذه الثقة مبررة”.

وقارن بحث إضافي، نُشر هذا الأسبوع، تعليمات رعاية ما بعد الجراحة لثمانية إجراءات أطفال شائعة قدمتها ChatGPT، و”غوغل”، وجامعة ستانفورد.

تم تحليل الردود على أساس مقياس موحد للفهم، وقابلية التطبيق والتحديد.

وبشكل عام، حصلت التعليمات مباشرة من المؤسسة الطبية على أعلى الدرجات. وكان كل من ChatGPT و”غوغل” متساويين من حيث الفهم، وكلاهما سجل أكثر من 80%.

وبينما حصل ChatGPT على درجة جيدة في قابلية التطبيق (73%)، إلا أن ردود “غوغل” حصلت على تقييم أعلى (83٪)

ورغم عدم تفوق ChatGPT على المصادر الأخرى، إلا أن الباحثين يقولون إنه لا يزال له قيمة وبعض المزايا، تشمل القدرة على تخصيص الردود لمستويات القراءة المختلفة.

وبالنسبة لهذا التحليل، طُلب من ChatGPT تقديم إرشادات بمستوى قراءة يناسب طلاب الصف الخامس.

كتب الباحثون: “يوفر ChatGPT إجابات مباشرة ومفصلة تكون غالبًا مكتوبة جيدًا وبصيغة السبب والنتيجة، ما يتيح للمرضى الوصول إلى المعلومات الفورية خلال انتظار الوصول إلى الطبيب المختص”.

ومع ذلك، لفت آش إلى أنه من الأفضل النظر إلى ChatGPT على أنه بمثابة دعم للأطباء بدلاً من كونه دليلا للمرضى.

وتابع:”لدي شعور متفائل جدًا بهذا الأمر، لكن كل هذا يعتمد على العمل ضمن حدود الحقائق. وفي الوقت الحالي، لا أعرف إذا كانت حدود الحقائق موجودة بالطريقة التي يستند إليها ChatGPT على ردوده”. (سي إن إن)






زر الذهاب إلى الأعلى
إغلاق