ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
В проекте развит новый подход к проведению моделирования <структура-свойство>, основанный на аналогии между представлениями изображений и молекулярных графов. Признаковые пространства, в которых проводится описание молекул СБД - структурные спектры помеченных графов, - формируются автоматически с последовательным усложнением детализации описания и уровня представления молекул. Тип признакового пространства определяется уровнем сложности представления структуры. Исследована прогностическая способность двух типов классифицирующих функций - линейной и статистического взвешенного голосования, - примененных к таблицам "молекула-признак", которые описывали как топологическое, так и пространственное представление молекул обучающей структурной БД(СБД). Трехмерные формы молекул были рассчитаны для химических структур, обладающих: анти-ВИЧ активностью, антималярийной активностью, психотропной активностью и мускусным запахом. Для каждой обучающей СБД были построены структурные символьные спектры (ССС), описывающие как топологическое, так и пространственное представление молекул. Для каждого вида ССС спектра (признакового пространства) построены и сопоставлены компьютерные модели классификации свойства: линейные модели, формируемые эволюционным алгоритмом, и модели взвешенного статистического голосования. Показано, что обе модели на одних и тех же признаковых пространствах дают сопоставимые (по прогностическому качеству) результаты для биологической активности. Программно реализован генетический алгоритм поиска метрик, для которых верна гипотеза компактности распознавания образов. Двоичный ген определяется на элементах ССС спектра СБД. Вычислительные эксперименты подтвердили сходимость генетического алгоритма. Предложена и реализована программная модель машины клеточных автоматов для параллельного анализа особенностей двумерных форм молекул (на примере двоичных изображений)