Аннотация:Метод ВЭЖХ-МС благодаря своей информативности и чувствительности является подходящим инструментом для определения биологически активных соединений. В данной работе были изучены возможности сочетания ВЭЖХ-МС с несколькими алгоритмами многомерного статистического анализа для извлечения полезной химической информации и кластеризации образцов. Образцы листьев 19 растений семейства Apiaceae были проанализированы в единых условиях методом ВЭЖХ в сочетании с масс-спектрометрией высокого и низкого разрешения в режиме сканирования в широком диапазоне. Статистическому анализу предшествовала предварительная обработка исходных данных ВЭЖХ-МС: сглаживание, вычитание шума и т.д. После этого использовались два способа организации данных: разложение тензора (на примере PARAFAC) и развертка тензора. Далее, несколько методов уменьшения размерности (PCA, ICA, NMF) и метод отбора признаков без учителя (UFS) были применены к двум развернутым тензорам данных (полученных с помощью масс-спектрометра высокого и низкого разрешения). Результаты, полученные этими методами, сравнивались с помощью разных критериев: площадь под ROC-кривой; коэффициент «силуэта»; время вычисления; число компонент, несущих шумовую информацию. Также был определен метод, который кластеризует образцы, принадлежащие к разным видам наиболее близко к биологическому таксономическому дереву. Кроме того, был предложен алгоритм выбора сигналов биомаркеров, из которых 23 потенциальных хемотаксономических маркера были предварительно идентифицированы с использованием данных МС2.