Під час первинного огляду в лікарні, коли часу обмаль, а інформації про пацієнта мінімум, штучний інтелект може давати не гірші підказки, ніж людина. Саме такого висновку дійшли дослідники, проаналізувавши роботу сучасних мовних моделей у медичній сфері.
Як пише TechCrunch, роботу виконали дослідники з Гарвардської медичної школи та медичного центру Beth Israel Deaconess, які порівнювали ефективність моделей OpenAI o1 і 4o з лікарями внутрішньої медицини.
З’ясувалося, що в умовах невизначеності — на початковому етапі обстеження — одна з моделей показала навіть кращі результати — 67% випадків, тоді як лікарі мали 55% і 50%. У задачах тріажу (дивись визначення наприкінці статті) вона правильно або майже правильно визначала стан пацієнтів у понад двох третинах випадків, тоді як лікарі демонстрували нижчі показники.
Попри це, автори дослідження не говорять про заміну медиків. Вони підкреслюють, що такі системи мають обмеження і поки що не готові працювати автономно, особливо коли йдеться про складні клінічні рішення або дані поза текстовим форматом.
Крім того, залишається відкритим питання відповідальності за дії алгоритмів, а також довіри з боку пацієнтів, які очікують людського контролю в критичних ситуаціях.
У підсумку дослідження радше демонструє потенціал технологій як допоміжного інструменту, здатного підсилити роботу лікарів, але не замінити їх.
Довідка:
Тріаж (медичне сортування) — це процес розподілу постраждалих за пріоритетністю надання медичної допомоги, що базується на тяжкості їхнього стану, коли кількість пацієнтів перевищує медичні ресурси. Основна мета — врятувати якомога більше життів, визначаючи, кому допомога потрібна негайно, а кому її можна відкласти
