Аннотация:Введение (цели/ задачи):
Липопротеин (а) (ЛП (а)) является независимым фактором риска атеросклеротических сердечно-сосудистых заболеваний и неблагоприятных сердечно-сосудистых осложнений. В условиях ограниченной
возможности диагностики и высокой вариабельности уровня ЛП (a), прогнозирование его концентрации на основе данных профилактических осмотров с использованием инструментов машинного обучения
(МО) представляет практический интерес. Интеграция клинических, лабораторных и демографических данных в прогностические модели может обеспечить раннюю идентификацию лиц с повышенным уровнем ЛП (a), способствуя персонализированной профилактике и оптимизации стратегий лечения сердечно-сосудистых заболеваний. Цель: создать модель МО для прогнозирования повышенного уровня ЛП (а) с использованием данных профилактического осмотра (пол, возраст, показатели общего анализа крови (ОАК), общего холестерина (ОХС) и глюкозы) и определить её точность на тестовой выборке пациентов. Материал и методы: В рамках исследования ретроспективно проанализирован обезличенный массив данных медицинских лабораторий, включающий сведения
о 13 504 пациентах с известными значениями анализируемых лабораторных параметров. Средний возраст обследуемых составил 39,9±18,4
года, средний уровень ЛП (а) – 24,1±34,7 мг/дл. Для разработки и проверки модели, данные были разделены на обучающую и тестовую выборки в пропорции 4:1. Для прогнозирования повышенного уровня ЛП(а) (>30 мг/дл) применяли бинарную классификацию с использованием логистической регрессии и градиентного бустинга деревьев
решений на платформе LightAutoML.
Результаты: Частота повышенного уровня ЛП (а) в исследуемой выборке составила 23,6%, что согласуется с данными литературы. Точность классификационной модели оценивалась с помощью ROC-анализа, площадь под кривой AUC в прогнозе повышенного уровня ЛП (а) составила 0,57.
Заключение: Разработанная модель МО продемонстрировала низкую точность в
прогнозе повышенного уровня ЛП (а) (AUC 0,57). Это указывает на недостаточную способность модели объяснять высокую вариабельность концентрации ЛП (а) на основе выбранных рутинных параметров (ОАК,
ОХС, глюкоза, пол и возраст). Полученные результаты подчеркивают необходимость включения дополнительных входных параметров для повышения точности прогноза модели.