Аннотация:Программы для реконструкции филогенетических деревьев по заданному выравниванию биологических последовательностей часто выдают деревья, в той или иной мере отличающиеся от реальной филогении входных последовательностей. В работе разработана система предсказания качества реконструкции, то есть расстояния в пространстве деревьев между реконструированным и реальным деревьями, на основе признаков, извлекаемых из входного выравнивания. Работа системы основана на методе машинного обучения, известном как градиентный бустинг. Система протестирована на нескольких тысячах выравниваний белков грибов, в качестве реального дерева использовалось таксономическое дерево организмов, из которых были взяты белки. Показано, что корреляция между истинным и предсказанным расстояниями составляет около 75% и почти не зависит от числа последовательностей в выравнивании в пределах от 7 до 38 последовательностей.