Сегментация изображений геологических аншлифов с использованием дообученных визуально-языковых моделей

Загайнов, С.Д.; Коршунов, Д.М.; Хвостиков, А.В.

Авторы: Загайнов С.Д., Коршунов Д.М., Хвостиков А.В.
Сборник: ГрафиКон 2025 : материалы 35-й Международной конференции по компьютерной графике и машинному зрению
Год издания: 2025
Место издания: Поволжский государственный технологический университет г. Йошкар-Ола
Первая страница: 595
Последняя страница: 606
DOI: 10.25686/978-5-8158-2474-4-2025-595-606
Аннотация: В работе предложен метод семантической сегментации минералов на изображениях геологических аншлифов, основанный на текстовых описаниях. Стандартные подходы к сегментации с открытым словарём (Open-Vocabulary Segmentation), использующие модели типа CLIP, показывают низкую эффективность на узкоспециализированных данных из-за того, что обучающие выборки общего назначения, на которых они обучались, не содержат достаточного количества примеров из целевой предметной области. Для решения этой проблемы предложен двухэтапный подход: сначала модель CLIP дообучается на целевом домене с использованием набора пар «изображение-текст», собранных с ресурса Mindat.org. Затем дообученная модель интегрируется в качестве энкодера признаков в фреймворк Trident, не требующий дополнительного обучения. Эксперименты показывают, что предложенный подход значительно улучшает качество сегментации по сравнению с использованием базовой модели CLIP. Метрика F1 для классификации минералов на тестовых изображениях выросла с 0.16 до 43, а индекс Жаккара – с 0.10 до 0.29.Ключевые слова: семантическая сегментация, сегментации с открытым словарём, геологические аншлифы, CLIP, глубокое обучение, компьютерное зрение.
Добавил в систему: Хвостиков Александр Владимирович

	ИСТИНА	Войти в систему Регистрация
	Интеллектуальная Система Тематического Исследования НАукометрических данных
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

Интеллектуальная Система Тематического Исследования НАукометрических данных

Сегментация изображений геологических аншлифов с использованием дообученных визуально-языковых моделейстатья

Прикрепленные файлы