Computer Science
7.92K subscribers
2 photos
17 links
По всем вопросам: @altmainf

Уважаемый менеджер: @altaiface
Download Telegram
Инверсия цикла

Инверсия цикла (англ. Loop inversion) — оптимизация компилятора и трансформация цикла, в ходе которой while-цикл заменяется на оператор ветвления, содержащий do-while-цикл. При правильном использовании данная оптимизация повышает производительность за счет конвейеризации.

Пример на С, код:
int i, a[100];
i = 0;
while (i < 100) {
a[i] = 0;
i++;
}

в результате применения оптимизации преобразовывается в:
int i, a[100];
i = 0;
if (i < 100) {
do {
a[i] = 0;
i++;
} while (i < 100);
}
Индуктивная переменная

Индуктивная переменная — переменная в циклах, последовательные значения которой образуют арифметическую прогрессию. Наиболее распространенный пример — счётчик цикла. Индуктивные переменные часто используются в индексных выражениях массивов.

Например, в следующем примере, i и j являются индуктивными переменными:

for ( i = 0; i < 10; i++ ) {
j = 17 * i;
}

Традиционные методы оптимизации предусматривают распознавание индуктивных переменных и удаление их из цикла.
Межпроцедурная оптимизация

Межпроцедурная оптимизация - это вид оптимизации в программировании, который позволяет улучшить производительность программы, включая несколько функций и подпрограмм. Она основана на анализе потоков данных и контроля за использованием памяти, и как следствие, на основании этого, устранении избыточных действий.

Применение межпроцедурной оптимизации может ускорить выполнение программы, снизить потребление памяти, а также сократить объем программы за счет удаления неиспользуемого кода или упрощения сложных алгоритмов.

Кроме того, межпроцедурная оптимизация может применяться для устранения повторяющихся действий, таких как перезапись переменных, вызов одной и той же функции с разными аргументами и др.
Что такое peephole?

Peephole - это небольшой набор последовательных машинных инструкций, который обычно составляется для исправления архитектурных особенностей процессора или определенного набора инструкций.

Peephole может использоваться для оптимизации кода, например, замена нескольких инструкций на эквивалентную одну для сокращения времени выполнения программы.

Также, peephole может использоваться для обработки ошибок в коде, например, если происходит переполнение стека, то в peephole можно добавить инструкцию для очистки стека или добавление проверки на условия, при которых может произойти переполнение.
Peephole-оптимизация

Метод оптимизации программного кода, который заключается в анализе нескольких последовательных инструкций в программе (называемых "peephole"), чтобы определить, можно ли их заменить более эффективной комбинацией или порядком инструкций.

Для проведения peephole-оптимизации на уровне ассемблера, компилятор анализирует последовательность операций и заменяет их на более оптимизированные.

Например, удвоение числа может быть более эффективно выполнено с использованием левого сдвига или путём сложения числа с таким же.
Локальная оптимизация

Локальная оптимизация - это метод оптимизации, который применяется к небольшим фрагментам кода, называемым базовыми блоками, для улучшения его производительности. Она применяется в компиляторах на этапе генерации машинного кода для оптимизации программы.

Примеры локальных оптимизаций включают в себя следующие:
- Устранение идентичных операций;
- Устранение избыточных вычислений;
- Замена сложных операций более простыми (например, замена умножения на степень двойки на сдвиг);
- Замена медленных операций более быстрыми;
- Ускорение циклов;
- Встраивание функций;
- Устранение ненужных промежуточных вычислений и т.д.

Такая оптимизация позволяет сократить количество инструкций, необходимых для выполнения программы, что уменьшает время ее работы и повышает производительность.
Оптимизация циклов

Оптимизация циклов - это один из методов внутрипроцедурной оптимизации.

Основные методы оптимизации циклов:
- Раскрытие цикла - вместо выполнения цикла используются отдельные инструкции, которые применяются к нескольким элементам данных сразу. Это уменьшает количество итераций цикла и увеличивает производительность выполнения.

- Использование константной оптимизации - константные значения выносятся за пределы цикла, чтобы они не вычислялись каждый раз во время выполнения цикла.

- Обратный цикл - цикл выполняется в обратном порядке. Это может уменьшить количество пропусков кэша и увеличить локальность ссылок на данные.

- Предварительный выход из цикла - проверка условия выхода из цикла применяется на каждой итерации цикла в начале итерации, вместо того чтобы проверять его в конце итерации.
Расщепление тела цикла

Расщепление тела цикла или Loop fission — оптимизация компилятора, которая разбивает цикл в программе на несколько циклов, каждый из которых имеет те же индексные границы, однако содержит только часть тела исходного цикла.

Например, следующий код:
int i, a[100], b[100];
for (i = 0; i < 100; i++) {
a[i] = 1;
b[i] = 2;
}

в результате применения оптимизации преобразовывается в:
int i, a[100], b[100];
for (i = 0; i < 100; i++) {
a[i] = 1;
}
for (i = 0; i < 100; i++) {
b[i] = 2;
}

На некоторых архитектурах может оказаться более выгодным исполнить два цикла вместо одного объединённого, так как, например, локальность данных в таком случае может оказаться выше.
Слияние циклов

Слияние циклов — оптимизация компилятора, выполняющая объединение нескольких циклов, смежных в дереве циклов, в один. Преобразование возможно, если циклы имеют одинаковое количество итераций и не зависят друг от друга по данным. Слияние циклов может повысить локальность данных, что повышает эффективность работы кэша.

Например, код:
int i, a[100], b[100];
for (i = 0; i < 100; i++) {
a[i] = 1;
}
for (i = 0; i < 100; i++) {
b[i] = 2;
}

эквивалентен:
int i, a[100], b[100];
for (i = 0; i < 100; i++) {
a[i] = 1;
b[i] = 2;
}
Удаление общих подвыражений

Удаление общих подвыражений — это оптимизация компилятора (преобразование), которое уничтожает повторные вычисления общих подвыражений и заменяет их на использование сохраненного после первого вычисления значения.

Рассмотрим следующий фрагмент кода:
a = b * c + g;
d = b * c * d;

К нему применимо следующее преобразование:
tmp = b * c;
a = tmp + g;
d = tmp * d;

которое окажется эффективным, если суммарное время записи и нескольких чтений новой переменной "tmp" окажется меньше, чем суммарное время, затрачиваемое на вычисление выражения "b * c" каждый раз, когда оно встречается в коде.
Принцип оптимизации удаления общих подвыражений

Применение оптимизации основано на анализе доступных выражений.

Выражение x + y является доступным в некоторой точке p программы, если:

- вдоль любого пути от начального узла к p выражение x + y вычисляется до достижения точки p;
- между вычислениями выражений и достижением точки p нет изменения значений переменных x и y.

Эффективность преобразования главным образом определяется тем, что суммарное время записи и нескольких чтений новой переменной оказывается меньше, чем суммарное время, затрачиваемое на вычисление старого выражения каждый раз, когда оно встречается в коде.

На практике на итоговую эффективность влияет также ряд других факторов, в частности распределение переменных по регистрам.
Свёртка констант

Свёртка констант — оптимизация, вычисляющая константные выражения на этапе компиляции. Прежде всего, упрощаются константные выражения, содержащие числовые литералы(фиксированное значение). Также могут быть упрощены выражения, содержащие никогда не изменяемые переменные или переменные, объявленные как константы.

Рассмотрим пример:
i = 320 * 200 * 32;

Компилятор, поддерживающий свёртку констант, не будет генерировать две инструкции умножения и запись полученного результата. Вместо этого он распознает эту конструкцию как константное выражение и заменит её на вычисленное значение (в данном случае 2 048 000).
Распространение констант

Распространение констант — оптимизация, заменяющее выражение, которое при выполнении всегда возвращает одну и ту же константу, самой этой константой. Это может быть константа, определённая ранее, или встроенная функция, применённая к константам.

Рассмотрим следующий пример:
int x = 14;
int y = 7 - x / 2;
return y * (28 / x + 2);


Распространение x возвращает:
int x = 14;
int y = 7 - 14 / 2;
return y * (28 / 14 + 2);


Далее, свёртка констант и распространение y возвращают следующее:
int x = 14;
int y = 0;

return 0;
Перестановка циклов

Перестановка циклов — оптимизация компилятора при которой меняется порядок итерационных переменных, относящихся к группе вложенных циклов. Итерационная переменная, используемая во внутреннем цикле, перемещается во внешний цикл, и наоборот. Это часто делается, чтобы гарантировать, что элементы многомерных массивов доступны в том порядке, в котором они хранятся в памяти, т.е. для улучшения локальности ссылок.

Например, следующий код:
for (int j=0; j<10; j++) {
    for (int i=0; i<20; i++)       
        y[i][j] = i + j;
}


в результате применения оптимизации может быть преобразован в:
for (int i=0; i<20; i++) {
    for (int j=0; j<10; j++)       
        y[i][j] = i + j;
}


В отдельных случаях, такое преобразование может создать контекст для дальнейших оптимизаций.
Предвыборка кода

В компьютерной архитектуре, предвыборкой кода называют технологию, используемую в микропроцессоре для увеличения скорости исполнения программ, уменьшая время, в течение которого процессор находится в состоянии ожидания из-за отсутствия инструкций для исполнения.

Современные микропроцессоры гораздо быстрее чем память, вследствие чего инструкции исполняемой программы не могут считывыться достаточно быстро, чтобы обеспечить непрерывность работы процессора. Добавление кэша может обеспечить более быстрый доступ к необходимым инструкциям.

Другими словами, предвыборка кода - выдача запросов со стороны процессора в оперативную память для считывания инструкций заблаговременно, до того момента, как эти инструкции потребуется исполнять. В результате этих запросов, инструкции загружаются из памяти в кэш. Когда инструкции потребуется исполнять, доступ к ним будет осуществляться значительно быстрее, так как задержка при обращении в кэш на порядки меньше, чем при обращении в оперативную память.
Способы реализации предвыборки кода

1. Предварительная загрузка:
Способ заключается в том, чтобы загружать в память блоки данных, которые скорее всего понадобятся в будущем. Загруженные данные могут сохраняться в кеше для более быстрого доступа к ним в дальнейшем.

2. Спекулятивная предвыборка:
Способ заключается в том, чтобы загрузить в память данных, которые могут понадобиться в будущем на основе анализа предыдущих запросов. Например, если вы последовательно обрабатываете элементы списка, то спекулятивная предвыборка может загрузить следующий элемент в память на всякий случай.

3. Предвыборка на основе предсказаний:
Способ заключается в том, чтобы загрузить данные, которые вероятно будут запрошены в будущем, на основе анализа предыдущих запросов и статистических данных.

4. Асинхронная предвыборка:
Способ заключается в том, чтобы асинхронно загружать данные в фоновом режиме.
Аппаратные решения, упрощающие программную конвейеризацию

- «Вращающиеся регистры» — часть регистрового файла отводится на область вращающихся регистров. Инструкции, использующие некоторый архитектурный регистр из этой области будут обращаться к различным физическим регистрам по мере исполнения итераций. Через какое-то количество итераций, вновь произойдет обращение к исходному физическому регистру. Это позволяет работать с различными итерациями цикла одновременно, и при этом не требуется явных пересылок между регистрами.

- Предикаты и предикатное исполнение инструкций, при котором предикатом работает некоторые специальные предикаты цикла. Эти предикаты позволяют включать и отключать некоторые инструкции цикла в процессе прохождения итераций, тем самым реализуя пролог и эпилог цикла в основном его коде, а также упрощают раскрытие условных операций в теле цикла.

- Аппаратная поддержка циклов, при которой программа дает процессору информацию о размере цикла и о параметрах индексной переменной. Это позволяет сократить накладные расходы на организацию цикла. Также позволяет настроить скорость вращения и размер группы вращающихся регистров.
Программная конвейеризация

Программная конвейеризация - это методология разработки программного обеспечения, при которой процесс создания программного продукта разбивается на этапы, которые выполняются последовательно и независимо друг от друга. Каждый этап представляет собой отдельное звено конвейера и обрабатывает определенный набор функциональных задач, необходимых для создания конечного продукта.

Процесс выполняется следующим образом:
- на первом этапе код программы проходит через анализатор кода для обнаружения ошибок исходного кода,
- на втором этапе код проверяется на соответствие правилам проекта,
- на третьем этапе производится сборка и создание исполняемого файла,
- на последнем этапе программа тестируется на соответствие требованиям проекта.

Программная конвейеризация позволяет повысить качество создаваемого продукта и скорость его создания, а также повысить эффективность работы команды программистов. Кроме того, это позволяет ускорить процесс поиска и устранения ошибок и облегчить процесс масштабирования проекта.
Пул строк

Пул строк относится к двум видам оптимизации компилятора, связанным со строками:

1) Объединение строк из разных модулейПри обработке исходного кода компилятор должен каждую литеральную строку поместить в метаданные управляемого модуля. Если одна строка встречается в исходном коде много раз, размещение всех таких строк в метаданных приведет к росту результирующего файла. Чтобы не допустить роста объёма кода, многие компиляторы хранят литеральную строку в метаданных модуля только в одном экземпляре.

2) Ленивые присваивания строк
Обычно строка — это объект большого размера, требующий для своей работы выделения большого блока памяти. Данная оптимизация выделяет память под строки только при надобности, позволяя нескольким переменным указывать на одну цепочку символов. Только если одна из переменных меняет своё содержимое, строка копируется.
Разбиение цикла на блоки

Loop tiling - оптимизирующее преобразование, призванное сделать исполнение некоторых типов циклов более эффективным.

Данный способ оптимизации состоит в разбиении пространства итерирования исходного цикла на небольшие блоки меньшего размера, что позволяет хранить используемые в этих небольших блоках данные в кэше полностью для их неоднократного использования в процессе выполнения блока.

Пример: умножение матрицы на вектор
for (i = 0; i < N; i++)
     for (j = 0; j < N; j++)
         c[i] = c[i] + a[i, j] * b[j];

        
После разбиения цикла на блоки 2 × 2:
for (i = 0; i < N; i += 2)
     for (j = 0; j < N; j += 2)
         for (ii = i; ii < min(i+2, N); ii++)
             for (jj = j; jj < min(j+2, N); jj++)
                 c[ii] = c[ii] + a[ii, jj] * b[ii];
Размотка цикла 

Размотка цикла — техника оптимизации компьютерных программ, состоящая в искусственном увеличении количества инструкций, исполняемых в течение одной итерации цикла. Позволяет во многих случаях увеличить количество параллельно исполняемых блоков инструкций и более интенсивно использовать регистры процессора, кэш данных и исполнительных устройств.

Пример, код:
int i;
for ( i = 1; i < n; i++) {
    a[i] = (i % b[i]);
}


преобразуется в:
int i;
for (i = 1; i < n - 3; i += 4) {
    a[i] = (i % b[i]);
    a[i + 1] = ((i + 1) % b[i + 1]);
    a[i + 2] = ((i + 2) % b[i + 2]);
    a[i + 3] = ((i + 3) % b[i + 3]);
}