Аннотация:вычислительный кластер или какая-то его часть подвергаются тестированию, в процессе которого измеряются
задержки передачи данных в различных режимах. В ходе экспериментов было замечено, что задержки между некоторыми парами узлов источник-приемник имеют похожий характер и количество классов похожих
пар является не очень большим. В работе представлено алгоритмы кластеризации - модификации стандартных алгоритмов. Это: 1) DBScan, 2) дивизивная кластеризация, 3) кластеризация с использованием априорной информации о топологии (сопоставление кратчайших путей в графе). Алгоритмы 1 и 2 были применены к данным полученным в результате тестирования суперкомпьютеров Ломоносов-1, Ломоносов-2, Bluegene/P, Juropa. Алгоритм 3 использует спецификацию Ломоносов-2 и величины задержек для суперкомпьютера Ломоносов-2. Были найдены закономерности между кластерами, полученными при помощи алгоритмов 1 и 2. В разные кластеры попали пары узлов соответствующие одинаковому аппаратному способу передачи данных. Алгоритм 3 используется для предсказания задержек между узлами суперкомпьютера. Была произведена валидация алгоритма, при которой были вычислены абсолютная и относительная погрешности для всех предсказаний. Среднее арифметическое относительных погрешностей оказалось равным 0.066, однако в некоторых точках максимальная относительная погрешность имеет значение 0.954.