Registro de asignación y derramamiento, de la manera fácil?

Question

Registro de asignación y derramamiento, de la manera fácil?

Estoy buscando una manera de asignar variables locales a los registros. Soy consciente de un par de métodos serios para hacerlo (a saber, los mencionados en Wikipedia), pero estoy atascado en cómo se logra "derramar". Además, la literatura relevante es bastante intimidante. Espero que haya algo más simple que satisfaga mis prioridades:

Correctness an un algoritmo que generará código correcto sin importar cuántas variables locales haya ser.
Simplicidad something algo que puedo entender sin tener que leer demasiada literatura.
Eficiencia needs necesita ser mejor que el método actual, que es:

Traduce una operación x = y # z a:

movl y, %eax
movl z, %ebx
op %ebx, %eax
movl %eax, x

Como estoy apuntando a Intel 386, algunas restricciones relevantes son:

Las operaciones binarias toman dos argumentos, uno de los cuales es un origen y un destino. Las operaciones unarias toman un solo argumento.
Las operaciones solo pueden acceder una ubicación de memoria; por lo tanto, las operaciones binarias necesitan al menos un argumento en un registro.
Hay un máximo de seis de los registros disponibles: %eax %ebx %ecx %edx %esi %edi. (%ebp también podría incluirse como último recurso.)
Hay casos especiales como para la división de enteros y los registros de retorno, pero puedo ignorarlos por ahora.

Hay tres pasos a través del compilador en este momento:

i386ification: todas las operaciones son convertido a un formulario a = a # b (o a = #a para operaciones unarias).
Análisis de vivencia: se determinan los conjuntos de variables vivas antes y después de cada operación.
Asignación de registros: se construye y colorea un gráfico de interferencia.

Y luego el compilador lanza sus crayones en el aire y no sabe qué hacer a continuación.

Ejemplo

public int mf(int cr, int ci) {
    int i = 0;
    int zr = 0;
    int zi = 0;

    while (i < 100 && zr*zr + zi*zi < 4) {
        int t = zr * zr - zi * zi + cr;
        zi = 2 * zr * zi + ci;
        zr = t;

        i = i + 1;
    }
    return i;
}

Aquí está el gráfico de interferencia bastante bonito para la función, y el CFG con información de liveness. El Imagen CFG requiere un poco de desplazamiento vertical, por desgracia.

Se utilizaron siete colores. Me gustaría derramar uno de ellos (o el conjunto de variables asignadas a ese color). El método de elección que no es demasiado importante. Lo que se pone complicado es cómo lidiar con las variables derramadas.

Digamos que derrame "rosa", que es el conjunto de variables t, $t4, $t7. Esto significa que las operaciones que se refieren a una de estas variables accederán a ella desde su posición en el marco de la pila, en lugar de a través de un registro. Esto debería funcionar para este ejemplo.

Pero qué pasaría si el programa fuera:

...
a = a + b
...

Y ambos a y b tuvieron que ser derramados? No puedo emitir una instrucción addl b, a con dos direcciones de memoria. Necesitaría otro registro de repuesto para mantener temporalmente uno de los operandos, y eso significa derramar otro color. Esto sugiere un método general de:

Si todas las variables pueden ser coloreadas con r colores, ¡genial!
De lo contrario, derrama algunos colores y sus variables asociadas.
Si existe una operación que accede a dos variables derramadas, derrame otro color y use el registro de repuesto para el almacenamiento temporal para todas estas operaciones.

En este punto, sospecharía que se están derramando muchas más cosas de lo necesario, y me pregunto si hay alguna forma más inteligente de derramar cosas, como derramar parte de la vida útil de una variable, en lugar de toda la variable en sí. ¿Hay algunas técnicas simples (ish) que podría usar aquí? Una vez más, no estoy apuntando particularmente alto certainly ciertamente no lo suficientemente alto como para requerir leer algo demasiado profundo. ;-)

Problemas específicos

El principal problema específico es: cuando se derrama una variable, ¿cómo afecta esto a las instrucciones generadas? Hacer todo ¿las instrucciones que usan esa variable necesitan acceder a ella directamente en la memoria (desde su posición de pila) ? ¿Cómo funcionará esto si una operación utiliza dos variables derramadas? (La arquitectura no permite que las instrucciones accedan a dos ubicaciones de memoria distintas.)

Los problemas secundarios son:

¿Cómo determino dónde insertar instrucciones de carga/almacenamiento, para la corrección (y menos importante, la eficiencia) ?
Puedo derramar una variable solo durante esa parte de su vida cuando ¿no está en uso inmediato, y unspill él más adelante? Para que todas las instrucciones actúen sobre registros no rellenados. Una variable puede vivir en diferentes registros en diferentes momentos.
puedo ser un poco más eficiente con casos especiales. Por ejemplo, %eax se utiliza para el valor devuelto, por lo que sería bueno si la variable a devolver se asignara a ese registro en el momento en que se encontró el retorno. Del mismo modo, algunos registros son "callee-save", por lo que si se estar en vivo en el momento de una llamada a una función, tenerlos asignados a registros no-callee-save significaría que puedo evitar almacenar esos registros.
¿Ayudaría mucho el formulario SSA (si es que lo ayuda) ? Ser capaz de eliminar subexpresiones comunes y evaluar constantes podría reducir (?) registrar la presión, pero de lo contrario tendría algún efecto?

Los aspectos que no me preocupan (en este momento) son: {[24]]}

Asignación y optimización de pilas: ya se ha implementado ingenuamente, y se puede optimizar utilizando el gráfico de interferencia si es necesario.
Eficiencia en tiempo de compilación, siempre y cuando termine. (NP-completitud no implica un determinado algoritmo debe ser evitado.)

Actualización

Lo siento por el tiempo de inactividad've He estado pensando en las respuestas dadas y tratando de encontrar un enfoque fácil de tomar para comenzar a implementar algunas de las ideas. Para ser honesto, he estado postergando... :-\

Encontré la presentación muy agradable (PPT, tristemente):

Http://www.cs.princeton.edu/courses/archive/spr05/cos320/notes/Register%20Allocation.ppt

Que responde a la pregunta sobre cómo lidiar con necesidades de operación específicas (como usar el mismo registro para origen y destino; o necesitar un cierto registro para algunas operaciones). De lo que no estoy seguro es de si el ciclo de Asignación de Color-Vida termina.

Voy a tratar de hacer un poco de trabajo real pronto y espero cerrar el pregunta.

24

graph-theory compiler-theory i386 register-allocation

Author: Edmund, 2009-12-25

Source

2 answers

Primero: No hay una manera inteligente de hacerlo. El problema es NP-completo; -)

Cómo se derrama:

Ejecuta su algoritmo de asignación de registros y obtiene una lista de variables que tiene que derramar. Ahora puede asignar algo de espacio en la pila al principio de su función. Enlace cada variable derramada también un lugar en la pila. Si desea ser inteligente, combine la memoria con rangos en vivo no superpuestos. Cada vez que necesite derramar un registro, guárdelo en la memoria y cárguelo, cuando esté se necesita de nuevo.

Cómo manejar eax:

Marque el registro como rellenado, pero no almacene ninguna variable en él (preasignación). Esto hará que el generador de código claro que el registro. Para ser inteligente almacenar el valor en otro registro si es beneficioso.

Formas fáciles y correctas de manejar los derrames:

Sólo derrámalo todo. Esto supone que el rango en vivo de cada variable es todo el programa. Esto se puede aumentar usando cosas como LRU o usage count para elegir qué registros debería ser liberado.

La siguiente mejor cosa a hacer es probablemente asignación de registro de escaneo lineal. Debería ser bastante fácil de implementar incluso cuando se utiliza la preasignación. Le sugiero que busque en el documento vinculado.

Respuestas Específicas

¿Qué significa para ti la corrección? Incluso los algoritmos de asignación simples son correctos si no comete un error de programación. La corrección (matemática) de pruebas es mucho más difícil. Tanto las cargas como las tiendas necesitan para ser insertado antes de que el valor/registro sea necesario de nuevo. Ambos deben insertarse después de que se almacene/cree el valor.
Sí. Si lo programa de esa manera. Si su algoritmo puede manejar un valor en varios registros durante su livetime, puede usar esas optimizaciones.
De nuevo depende de usted implementar ciertas mejoras. Una posibilidad sería bloquear eax solo cuando sea necesario, no para todo el programa.
Bajo ciertas condiciones SSA ayuda. Los gráficos de inferencia del código SSA son siempre chordal, lo que significa que no hay un ciclo con más de 3 nodos. Este es un caso especial de coloración de gráficos, en el que se puede encontrar una coloración mínima en tiempo polinómico. Convertir a SSA no significa necesariamente más o menos presión de registro. Mientras que el formulario SSA tiene generalmente más variables, estas tienden a tener vidas más pequeñas.

6

Author: ebo,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-12-26 13:28:53

score 8 · Accepted Answer

He utilizado un enfoque codicioso en un asignador de JVM una vez, que funcionó bastante bien. Básicamente comienza en la parte superior de un bloque básico con todos los valores almacenados en la pila. Luego simplemente escanee las instrucciones hacia adelante, manteniendo una lista de registros que contienen un valor, y si el valor está sucio (debe escribirse de nuevo). Si una instrucción utiliza un valor que no está en un registro (o no está en el registro correcto), emita una carga (o movimiento) para ponerlo en un registro libre antes de la instrucción. Si una instrucción escribe un valor, asegúrese de que esté en un registro y márquelo sucio después de la instrucción.

Si alguna vez necesitas un registro, derrama un registro usado desasignando el valor de él y escribiéndolo en la pila si está sucio y vivo. Al final del bloque básico, escriba los registros sucios y en vivo.

Este esquema deja claro exactamente a dónde van todas las cargas/tiendas, las generas a medida que avanzas. Es fácilmente adaptable a instrucciones que toman un valor en la memoria, o que puede tomar cualquiera de dos argumentos en la memoria, pero no ambos.

Si está de acuerdo con tener todos los datos en la pila en cada límite de bloque básico, este esquema funciona bastante bien. Debería dar resultados similares al escaneo lineal dentro de un bloque básico, ya que básicamente hace cosas muy similares.

Puede complicarse arbitrariamente sobre cómo decidir qué valores derramar y qué registros asignar. Algunos lookahead pueden ser útiles, por ejemplo, marcando cada valor con un registro específico en el que debe estar en algún punto del bloque básico (por ejemplo, eax para un valor de retorno, o ecx para una cantidad de cambio) y preferir ese registro cuando el valor se asigna por primera vez (y evitar ese registro para otras asignaciones). Pero es fácil separar la corrección del algoritmo de la heurística de mejora.

He usado este asignador en un compilador de SSA, YMMV.