Top.Mail.Ru

Разработана база данных для предсказания осложнений у пациентов

Библиотека Survivors, созданная на языке Python, предназначена для анализа событий во времени. Эксперты факультета вычислительной математики и кибернетики МГУ им. М. В. Ломоносова разработали инструмент, который помогает прогнозировать риски смерти пациентов при различных обстоятельствах, а также вероятность выхода из строя медицинского оборудования. Об этом сообщила пресс-служба университета.

Survivors основана на языке Python и используется для анализа временных событий. Этот инструмент способен предсказывать вероятность наступления событий с учетом сложных зависимостей в данных, при этом работает даже с пропущенными значениями.

Как сообщили в университете, благодаря своей гибкости библиотека может быть использована в разных областях. В медицине она помогает прогнозировать риски на протяжении времени и оценивать продолжительность жизни пациентов, основываясь на интерпретируемых правилах, понятных специалистам. В CRM-системах инструмент можно использовать для оценки вероятности ухода клиентов, а в промышленности — для предсказания износа оборудования и мониторинга технического состояния систем.

Как пояснили в МГУ, традиционные методы анализа выживаемости пациентов имеют ряд ограничений, так как требуют строгих предположений о распределении событий во времени и сложной предварительной обработки данных. Новая библиотека, которая может быть интегрирована в существующие аналитические системы, использует методы машинного обучения, что позволяет избежать этих ограничений.

Юлий Васильев, сотрудник лаборатории технологий программирования факультета ВМК МГУ, отметил, что библиотека Survivors решает задачи анализа выживаемости без необходимости предварительной обработки данных, обеспечивая при этом высокую точность прогнозов. Он добавил, что они стремились создать инструмент, который помог бы специалистам работать с реальными данными, учитывая их сложность и неопределенность.

Алгоритмы библиотеки оптимизированы для работы с большими объемами данных, обеспечивая высокую вычислительную эффективность благодаря параллельным вычислениям и улучшенным методам разбиения данных. Результаты тестирования библиотеки на девяти открытых медицинских наборах данных и промышленных датасетах показали, что она обеспечивает более стабильные и точные предсказания, требуя минимальной настройки со стороны пользователя.

Источник: ТАСС