Промежуточное представление


Промежуточное представление (intermediate representation (IR)) — структура данных или код, используемый компилятором или виртуальной машиной для представления исходного кода. Промежуточное представление разработано, чтобы способствовать дальнейшей обработке, такой как оптимизация и трансформация кода.[1] «Хорошее» промежуточное представление должно быть точным — способным представить исходный код без потери информации[2] — и независимым от какого-либо конкретного источника кода или целевого языка.[1] Промежуточное представление может принимать одну из нескольких форм: структура данных расположенная в памяти (in-memory), или специальный кортеж- или стек-подобный код читаемый программой.[3] В последнем случае промежуточное представление также называется промежуточным языком (intermediate language).

Канонический пример может быть найден в большинстве современных компиляторов. Например, интерпретатор CPython преобразует линейный удобочитаемый человеком текст, представляющий программу в промежуточную графовую структуру, которая позволяет проанализировать поток данных и перестроить его перед выполнением. Использование такого промежуточного представления позволяет компилирующим системам подобным GNU Compiler Collection и LLVM быть использованными множеством различных исходных языков для генерации кода для множества различных целевых архитектур.

Промежуточный язык — это язык абстрактной машины, спроектированный для помощи в анализе компьютерных программ. Термин происходит от использования языка в компиляторах, где исходный код программы переводится в форму, более подходящую для улучшающих код изменений, прежде чем быть использованным для создания объектного модуля или машинного кода для целевой машины. Дизайн промежуточного языка обычно отличается от машинного кода тремя фундаментальными аспектами:

Термин также используется для обозначения языков, используемых в качестве промежуточных некоторыми высокоуровневыми языками программирования, которые не создают объектный модуль или машинный код, а используют только промежуточный язык. Код, созданный на этом промежуточном языке, затем подается компилятору данного языка, который создает финальный объектный модуль или машинный код. Обычно это делается для облегчения процесса оптимизации или увеличения портируемости, благодаря использованию промежуточного языка, для которого есть компиляторы для множества центральных процессоров и операционных систем, таких как C. Языки, используемые для этой цели, ранжируются по сложности между высокоуровневыми языками программирования и низкоуровневыми языками программирования, такими как языки ассемблера.