Аннотация:Липидомика – новое и интенсивно развивающееся направление науки, осуществляющее всеобъемлющий анализ липидных метаболитов биологических систем. На сегодняшний день идентификацию липидов осуществляют на основании тандемного масс-спектрометрического анализа. Количество возможных изомерных форм, а также возможное перекрывание изобарных пиков затрудняют проведение аннотации. Использование информации о времени удерживания, полученной из хроматографического разделения, повышает точность и достоверность идентификации. В настоящее время для предсказания времен удерживания в высокоэффективной жидкостной хроматографии (ВЭЖХ) используют различные эмпирические модели, например, модели зависимости структура-удерживание (QSRR). Такие модели могут быть построены либо на основе экспериментально определенных молекулярных дескрипторов, либо – теоретически рассчитанных. Подобная вычислительная модель способна прогнозировать времена удерживания для любой молекулярной структуры и сужать список возможных кандидатов при аннотации.Данная работа посвящена построению эмпирической и полуэмпирической моделей для предсказывания времени удерживания липидов с использованием теоретически рассчитанных дескрипторов. Для всех установленных в ходе ВЭЖХ-МС/МС анализа брутто-формул липидных молекул собрана библиотека кодов SMILES, включающая в себя все возможные изомеры для каждого представителя. Структуры липидов были взяты из баз данных LipidMaps (http://www.lipidmaps.org/) и Swiss Lipids (http://swisslipids.org/). Файл SMILES был преобразован в файл MOL с помощью ChemAxon Molconvert (ChemAxon, Венгрия). Для расчета молекулярных дескрипторов использовали программное обеспечение PaDEL Descriptor (Национальный Университет Сингапура, Сингапур), рассчитаны все 1444 предлагаемых 1 и 2D дескриптора.Для двух участков градиентного профиля разделения липидов построены эмпирические модели удерживания, включающие 7 и 6 переменных (дескрипторов), соответственно. Ошибка предсказания времени удерживания оказалась на уровне 1,0 мин. Предложенная трехпараметрическая модель lgRT = f(MLogP, nBondsD, AATSC6e), учитывающая длину ацильной цепи (дескриптор MLogP), количество двойных связей (nBondsD) и влияния головной группы липида на его удерживание (AATSC6e), является наиболее универсальной и удовлетворительно работает для всех рассмотренных липидных классов. Средняя абсолютная ошибка составила 0,128 мин, что соизмеримо с разницей во временах удерживания отдельных изомеров липидов.