Предстоящая архитектура графических процессоров AMD RDNA 5, судя по недавним изменениям в кодовой базе LLVM, получит существенные доработки в механизмах выполнения инструкций. Основной акцент сделан на повышении эффективности шейдерных блоков и оптимизации процесса dual-issue, что в перспективе должно сказаться на производительности и энергоэффективности будущих видеокарт. Ключевым элементом этих нововведений стала поддержка новой инструкции FMA (Fused Multiply-Add), которая значительно расширяет возможности компилятора при распределении задач.
Инструкция VOPD3: новые правила планирования
Внесенный в LLVM патч добавляет поддержку инструкции VOPD3. Если объяснять проще, это механизм, позволяющий компиляторам более гибко подходить к спариванию инструкций. В архитектурах GPU, где дисциплина планирования непосредственно коррелирует с итоговой мощностью чипа, возможность «смягчить» условия для объединения операций критически важна. На практике это значит, что компилятор получает больше свободы в формировании пакетов инструкций, которые процессор может исполнять одновременно.
Рост пропускной способности через dual-issue
Функция dual-issue, или двухканальное исполнение, позволяет графическому ядру обрабатывать две инструкции одновременно в рамках одного такта. Улучшение этого узла напрямую влияет на пропускную способность: если конвейер работает слаженнее, GPU быстрее справляется с тяжелыми графическими задачами и вычислительными нагрузками. VOPD3 как раз помогает «загрузить» шейдерные блоки по максимуму, то есть сделать так, чтобы ресурсы процессора не простаивали в ожидании данных, а постоянно выполняли полезную работу.
Рост эффективности на уровне компиляции
Поскольку работа над патчами для LLVM находится на ранних этапах, эти изменения пока являются лишь индикатором вектора развития следующего поколения архитектуры. Оптимизация на уровне компилятора позволяет эффективнее использовать вычислительные блоки без изменения самого «железа». В итоге AMD планирует добиться прироста показателей производительности на ватт, что является стандартным требованием при смене поколений GPU. Эти программные улучшения, интегрируемые уже сейчас, станут фундаментом для раскрытия потенциала RDNA 5 при встрече с современными игровыми движками и вычислительными алгоритмами.