cpu-cache

¿Por qué el orden de los bucles afecta el rendimiento cuando se itera sobre una matriz 2D?

Posible Duplicado:Cuál de estos dos bucles for es más eficiente en términos de tiempo y rendimiento de caché A conti ... c int x[4000][4000]; for (j = 0; j < 4000; j++) { for (i = 0; i < 4000; i++) { x[j][i] = i + j; } } }

Costo aproximado para acceder a varios cachés y memoria principal?

¿Puede alguien darme el tiempo aproximado (en nanosegundos) para acceder a las cachés L1, L2 y L3, así como a la memoria pri ... UENCIAS CORE Y UNCORE, VELOCIDADES DE MEMORIA, AJUSTES DEL BIOS, NÚMEROS DE DIMM , ETC, ETC..SU KILOMETRAJE PUEDE VARIAR."

Qué orden de bucles anidados para iterar sobre una matriz 2D es más eficiente

¿Cuál de los siguientes ordenamientos de bucles anidados para iterar sobre una matriz 2D es más eficiente en términos de tie ... a[i][j] = 10; } } O for(i=0; i<100; i++) { for(j=0; j<100; j++) { a[j][i] = 10; } }

la herramienta más simple para medir el hit / miss de C program cache y el tiempo de cpu en linux?

Estoy escribiendo un pequeño programa en C, y quiero medir su rendimiento. Quiero ver cuánto tiempo se ejecuta en el procesa ... gran cantidad de gastos generales. Es por eso que quería una herramienta simple, como /proc/[pid]/stat, que siempre está ahí.

¿Por qué la velocidad de memcpy() disminuye drásticamente cada 4KB?

Probé la velocidad de memcpy() notando que la velocidad cae dramáticamente en i*4KB. El resultado es el siguiente: el eje Y e ... ta, añadiendo un búfer ficticio de 2 KB entre pbuff_1 y pbuff_2. Funciona, pero no estoy seguro de la explicación de Leeor.

¿Puedo forzar la coherencia de caché en una CPU x86 multinúcleo?

La otra semana, escribí una pequeña clase de hilo y una tubería de mensaje unidireccional para permitir la comunicación entre ... si hay x86 intrínsecos que no soy consciente de que la fuerza o se puede utilizar para hacer cumplir la coherencia de caché.

Localidad Temporal vs Espacial con matrices

Estoy un poco confundido sobre los significados de la localidad espacial y temporal. Espero que al mirarlo con un ejemplo de ... e alguna aclaración sobre cómo funcionan las localidades temporales y espaciales en código real me ayude a entenderlas mejor.

Cómo evitar "spaghetti puntero montón" en gráficos dinámicos?

El problema genérico Supongamos que está codificando un sistema que consiste en un gráfico, más reglas de reescritura de grá ... de trabajo en JS, con terrible eficacia de la caché (y de la lengua). Este video muestra el sistema en acción gráficamente.

¿Cómo escriben las CPU Intel Xeon en la memoria?

Estoy tratando de decidir entre dos algoritmos. Uno escribe 8 bytes (dos palabras alineadas de 4 bytes) en 2 líneas de caché, ... laridad de la línea de caché. También me sorprendería mucho si algo va a la memoria antes de la línea de caché es desalojado.

¿Por qué mi caché L3 de 8M no proporciona ningún beneficio para matrices de más de 1M?

Me inspiré en esta pregunta para escribir un programa simple para probar el ancho de banda de memoria de mi máquina en cada n ... r de tamaño, el programa hace alrededor de 9500 llamadas de memset, por lo que todavía es menos de 1 miss por llamada memset.

¿Son diferentes los registros de CPU y la caché de CPU? [cerrado]

¿Son diferentes los registros de CPU y la caché de CPU?

Descripción de la caché de CPU y la línea de caché

Estoy tratando de entender cómo funciona la caché de la CPU. Digamos que tenemos esta configuración (como ejemplo). Tamaño ... os ya que todos los 32 bytes están en la línea de caché de todos modos? Por Favor, hágamelo saber si tengo algo mal. Gracias

Ciclos / costo para hit Caché L1 vs. Registro en x86?

Recuerdo haber asumido que un golpe de caché L1 es 1 ciclo (es decir, idéntico al tiempo de acceso de registro) en mi clase d ... to en los procesadores x86 modernos? ¿Cuántos ciclos toma un golpe de caché L1? ¿Cómo se compara con el acceso de registro?