PhyloBench: A Benchmark for Evaluating Phylogenetic Programsстатья
Статья опубликована в высокорейтинговом журнале
Информация о цитировании статьи получена из
Scopus
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 10 июля 2024 г.
Аннотация:Филогенетическая реконструкция на основе выравнивания белковых последовательностей — широко используемая процедура. Было разработано множество филогенетических алгоритмов, большинство которых имеют много параметров и опций. Выбор программы, опций и параметров может стать нетривиальной задачей. Публично доступного бенчмарка для сравнения филогенетических программ на реальных белковых последовательностях не существовало. Мы разработали PhyloBench, бенчмарк для проверки качества филогенетической реконструкции, и использовали его для тестирования нескольких популярных филогенетических программ. PhyloBench основан на природных, не симулированных аминокислотных последовательностях ортологичных эволюционных доменов. Мерой качества реконструированного дерева служит его расстояние до соответствующего дерева видов. Протестировано несколько мер расстояний между деревьями, наиболее достоверные результаты были получены с использованием расстояние Робинсона — Фоулдса. Наши результаты подтверждают недавно полученные факты о том, что дистанционные методы в среднем более точны, чем максимальное правдоподобие и максимальная экономия (парсимония). Мы протестировали реализацию т.н. байесовского метода, программу MrBayes и обнаружили, что на нашем проверочном наборе она работает лучше, чем максимальное правдоподобие, но хуже дистанционных методов. Из протестированных нами методов наилучшие результаты показал метод сбалансированной минимальной эволюции, реализованный в программе FastME. Выравнивания и референсные деревья видов, составляющие бенчмарк, доступны по адресу https://mouse.belozersky.msu.ru/tools/phylobench/ , там же доступен полуавтоматический сервис, позволяющий сравнить любой филогенетический метод с набором популярных методов.