Аннотация:Выпускная квалификационная работа посвящена решению задачи разделения дикторов (т.е. тегированию «кто и когда говорит» на аудио-записи), которая разбивается на несколько частей: детектирование в аудио сегментов с речью, разбиение на сегменты равной длины, извлечение векторных представлений дикторов, определение матрицы схожести и кластеризация.