Прогнозирование времени инференса больших языковых BERT-подобных моделей с учетом характеристик целевой вычислительной платформы.доклад на конференции