Аннотация:Основная цель работы – выбор метрики измерения расстояний и оптимального алгоритма кластеризации, при котором разбиение пятен почернения на пленке на кластеры происходит так, чтобы все пятна одного кластера соответствовали частицам одного взаимодействия, то есть, приходили с одной и той же высоты. Семейства наигранных данных используются для кластеризации девятью различными методами, которые можно классифицировать как дивизимные; опирающиеся на нормальность распределений внутри кластера, и алгоритмы нечёткой кластеризации.
Определён наилучший метод кластеризации, которым является алгоритм РАМ. На модельных данных показано, что для каждого типа первичных частиц определяется своя оптимальная метрика.
Была освоена библиотека NbClust, позволяющая математически определять требуемое число кластеров для метода РАМ. Рассмотрены различные комбинации входных данных, используемых метрик и способов определения расстояний между кластерами. Установлены наилучшие математические индексы для каждого из трёх рассматриваемых типов первичной частицы.