Аннотация:Данная работа была направлена на ликвидацию серьезного ограничения языка С-DVMH - невозможности эффективного выполнения на GPU параллельных циклов с регулярными зависимостями по данным.
При отображении циклов с регулярными зависимостями по данным на графический процессор приходится решать следующие 2 проблемы:
1) Эффективно отобразить порции цикла с зависимостями на архитектуру CUDA (метод параллелепипедов, метод гиперплоскостей и.т.п.).
2) Оптимизировать обращения к глобальной памяти GPU (изменение порядка обработки витков цикла приводит к невыравненным обращениям к памяти, которые выполняются очень медленно).