ИИ начал ставить более точные диагнозы, когда его стали штрафовать

Исследователи из Йоханнесбургского университета показали, что введение системы штрафов для искусственного интеллекта за ложные результаты увеличивает точность его будущих предсказаний.
ИИ начал ставить более точные диагнозы, когда его стали штрафовать
Therese van Wyk, University of Johannesburg

Чтобы повысить точность прогностических моделей, исследователи ввели для алгоритма с машинным обучением систему штрафов. После этого ИИ стал точнее ставить диагнозы

Сегодня искусственный интеллект (ИИ) все чаще используется для прогнозирования опасных для жизни заболеваний. Но остается большая проблема в создании достаточно точных алгоритмов машинного обучения, которые позволили бы проводить такую диагностику. Такие алгоритмы могли бы стать отличным подспорьем для врачей, но их точность на сегодняшний день оставляет желать лучшего.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В новой работе ученые показали, как алгоритмы машинного обучения можно значительно улучшить в медицинских целях. Авторы использовали алгоритмы логистической регрессии, дерева решений, XGBoost и «случайного леса». Это контролируемые алгоритмы двоичной классификации — они обучаются, основываясь только на предоставленных им наборах данных с вариантами ответа «да/нет».

Ученые в своей работе показали, что точность этих программ можно повысить, если ввести для них «систему штрафов». Это значит, что алгоритм получает гораздо большее «наказание» за то, что диагностирует больного человека как здорового, а не наоборот. С медицинской точки зрения, алгоритмы получают большие штрафы за ложные отрицательные результаты, чем за ложные положительные.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Авторы использовали обучающие наборы данных для лечения диабета, рака молочной железы, рака шейки матки и хронических заболеваний почек. Наборы данных были собраны из крупных больниц и медицинских программ. В этих двоичных наборах данных люди классифицируются либо как больные, либо как здоровые.

Результаты показывают, что штрафы работают точно так, как планировали ученые. Например, для хронической болезни почек алгоритм «случайного леса» имел точность 0,972 из 1,000. После того, как исследователи добавили систему «штрафов», точность возросла до 0,990. С другими наборами данных результаты были разными для разных алгоритмов, но в любом случае точность диагностики для них оказалась выше с нововведением, чем без него.