Аннотация:Проведен полногеномный анализ генетических ассоциаций с показателями липид-
ного обмена с применением технологии байесовских сетей для постановки диагноза по-
лигенной гиперхолестеринемии на основе генетических данных российской популяции
пациентов. Были проанализированы данные 1200 пациентов, для каждого из которых
кроме клинической информации, показателей липидного профиля — различных видов
холестерина, были получены 196725 однонуклеотидных полиморфизмов (SNP). Для
первоначального отбора наиболее значимых параметров использовался полногеном-
ный анализ ассоциаций (GWAS) и статистический метод критерия согласия Пирсона.
Были исследованы два состояния пациента связанные с липидным обменом: уровень
ХС-ЛПНП (липопротеины низкой плотности) и ХС-ЛПВП (липопротеины высокой
плотности). Для предсказания уровня липопротеинов использовались байесовские се-
ти простейшей топологии — наивной, а для оценки качества (надежности) предсказа-
ния применялось построение ROC-кривых и вычисление площади под этими кривыми
(AUC). После отбора значимых параметров с помощью методов GWAS или Пирсон
величина AUC повышалась от 0.5 для начальной сети до 0.9. Дальнейшее повышение
AUC до 0.99 и уменьшение числа прогностических параметров до 150 проводилось
с помощью оптимизации байесовской сети по числу узлов-параметров, где целевой
функцией была величина AUC. Показана неоднозначность получения прогностических
параметров при различных способах первоначального уменьшения числа узлов сети
с помощью метода GWAS и Pirson. Несмотря на очень хорошие результаты по каче-
ству предсказания, полученные на обучающей выборке, для независимой контрольной
группы пациентов были получены не высокие значения AUC. Дальнейшее применение
предложенной в настоящей статье методологии возможно при существенном уменьше-
нии числа SNP на основе анализа молекулярных механизмов.