ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Модели Quantitative structure activity relationship (QSAR) основаны на регрессионном или факторном анализе включающем “независимую” (Х) и “зависимую” (Y) переменные, при этом “независимые” переменные подразделены на категории. В моделях QSAR “независимыми” переменными являются физико-химические свойства или особенности молекулярной структуры химических веществ, “зависимой” переменной может быть биологическая (токсикологическая) активность этих веществ. Результатами QSAR моделирования является вид связи (например, уравнение регрессии) между структурными особенностями молекул и биологической активностью группы химических веществ (химический класс). Далее, полученную модель QSAR используют для предсказаний биологической активности новых химических веществ той же группы, на основе имеющихся данных о их молекулярной структуре (Nantasenamat, 2009, 2010). Дескрипторы (независимые переменные) - информация о структуре молекулы и физико-химических свойствах и их использование в QSAR моделях описано в ряде работ (Helguera et al., 2008; Karelson et al., 1996; Katritzky and Gordeeva, 1993). Общий математический подход к определению химических категорий - использование алгоритмов и индексов сходства. Индексы сходства могут использовать двух- или трехмерную информацию, например, индекс Танимото (также известный как коэффициент Жаккара), евклидово расстояние, расстояние Хэмминга) и т.п (Saliner, 2005). Тест-параметры (зависимые переменные) - результаты токсикологических экспериментов и данные о устойчивости веществ в окружающей среде. В качестве исходных данных будут использованы результаты, полученные сотрудниками Лаборатории эколого-токсикологических исследований ВНИРО в экспериментах с морскими организмами в соответствии с требованиями «Методических указаний по разработке нормативов качества воды водных объектов рыбохозяйственного значения, в том числе нормативов ПДК вредных веществ в водах водных объектов рыбохозяйственного значения», утв. приказом Росрыболовства 1. Описание молекулярной структуры вещества, отнесение к определенному классу веществ. 2. Выявление дескрипторов, ими могут служить такие параметры, как строение молекулы, электронные особенности, гидрофобность, липофильность, растворимость, квантовохимические параметры, стерические эффекты и т.д. 3. Подготовка данных - нормализация, стандартизация, поиск ошибок, гармонизация с подходами принятыми OECD и USA EPA. 4. Мультивариационный анализ - Multiple Linear Regression, Self-Organizing Map, Principal Component Analysis, Partial least squares regression и т.д. 5. Статистический анализ (R, R2, Q2, MSE, RMSE) Поэтапный процесс создания QSAR модели включает: Одним и наиболее важным предварительным шагом в создании модели является понимание используемого массива данных, классов исследуемых веществ, физико-химических свойств, используемых в анализе. Предварительная проверка данных позволит исключить возможные ошибки, связанные как с экспериментами, так и с процессом подготовки данных. Гармонизация с подходом, принятым OECD и USA EPA позволит сравнивать и интегрировать полученные результаты с ранее разработанными QSAR моделями. Гармонизация заключается в выборе сходных дескрипторов и тест-параметров, унификация и стандартизация условий проводимых экспериментов в соответствии с методами OECD и ISO (тест-объект, время эксперимента, температура, освещенность и т.д.).