שאלו את הרופא.. רובוטי ה-AI נכשלו ב-80% מהאבחונים
SadaNews - עם העלייה בהסתמכות של אנשים ברחבי העולם על רובוטי צ'אט מבוססי אינטליגנציה מלאכותית, מחקר חדש מראה ש"אין מנוס מהרופא". המחקר חושף שרובוטי הצ'אט טועים ביותר מ-80% מהמקרים הרפואיים בשלבים המוקדמים.
במחקר חדש שפורסם אתמול (שני) ב-Jama Network Open, הודגשו הסיכונים בהסתמכות על רובוטים אלה כרופאים דיגיטליים, שהראו שקשה לרובוטים הללו להציע مجموعة של אבחונים פוטנציאליים כאשר המידע אודות המטופלים מוגבל, ולרוב הם מצמצמים את האפשרויות שלהם במהירות רבה עד לתשובה אחת בלבד.
התוצאות הראו גם שרובוטי הצ'אט יכולים לזהות מקרים סבירים כאשר המקרה מוגדר בשלמות ובבהירות, אך מהימנותם יורדת בשלבים המוקדמים או כאשר המידע פחות ברור.
סיכונים בהסתמכות על טכנולוגיה
תוצאות המחקר הדגישו את הסיכונים בהסתמכות על טכנולוגיה בלבד כדי לקבוע בעיות בריאות, במיוחד כאשר המידע שהכניסו המשתמשים מעורפל או מקוטע.
אריה ראו, הכותבת הראשית של המחקר וחוקרת במערכת הבריאות "מאס ג'נרל בריגהאם" ממסצ'וסטס, אמרה כי "דגמים אלה מצוינים בהגדרת האבחון הסופי כאשר המידע מלא, אך הם מתמודדים עם קשיים בתחילה, כאשר לא זמינות הרבה מידע", כך לפי דיווח בעיתון "פייננשיאל טיימס".
המחקר בדק דגמים של אינטליגנציה מלאכותית באמצעות 29 מקרים קליניים וירטואליים המבוססים על מקור רפואי. הניסוי כלל גילוי הדרגתי של נתונים צעד אחר צעד, כולל היסטוריה רפואית עדכנית, תוצאות בדיקות קליניות ותוצאות מעבדתיות. החוקרים הציבו לרובוטים שאלות אבחוניות, ומדדו את שיעורי הכישלון, שהוגדרו כאחוז השאלות שלא נענו כראוי לחלוטין.
כך גם העריכו חוקרים 21 דגמים של רובוטי צ'אט, ביניהם דגמים מובילים שפותחו על ידי חברות OpenAI, Anthropic, Google, xAI ו-DeepSeek.
אך הם גילו ששיעורי כישלון האבחון עברו את ה-80% בכל הדגמים כאשר ביקשו מהם לבצע את מה שמכונה אבחון מפלג, כלומר כאשר המידע המלא על החולה אינו זמין.
כשעברו לאבחון הסופי עם זמינות נתונים יותר שלמים, שיעורי הכישלון ירדו לטרם 40%, כאשר הדגם הטוב ביותר חצה את אחוז הדיוק של 90%.
חברת Anthropic ציינה קודם לכן שהדגם "קלוד" מיועד להנחות אנשים ששואלים שאלות רפואיות למומחים.
מנגד, "גוגל" הסבירה כי הדגם "ג'ימיני" נועד לעשות את אותו הדבר, וכולל תזכורות משולבות באפליקציה שמעודדות משתמשים לבדוק מחדש את המידע.
כמו כן, מדיניות השימוש של חברת OpenAI קובעת שלא ניתן להשתמש בשירותיה כדי לספק ייעוץ רפואי הנדרש לרישוי מקצועי מבלי לערב מומחים מוסמכים כראוי.
פלטפורמת RTX Spark של "אנבידיה" מעלה את מחירי המחשבים הניידים
דלף מאכזב לגבי מפרט הסוללה של אייפון 18 פרו
אנתיסר שניב הראשונה שתנהל מועדון ספורט בהיסטוריה של לוב
הילד שלך מגזים בבדיחות טיפשיות? מה שעומד מאחורי שלב זה יכול להפתיע אותך
אומנות ומילים.. ערב תרבותי בטאיז תופס את דלתות הזיכרון והצבעים
האם שירין באמת שיבשה? .. הוויכוח על "בחורית" מחזיר את השאלה
הודעה שכמעט קדם למותו הפתאומי.. מה קרה בשעות האחרונות לחייה של סיהם ג'לאל?