icc

Por qué vectorizar el bucle no mejora el rendimiento

Estoy investigando el efecto de la vectorización en el rendimiento del programa. En este sentido, he escrito el siguiente cód ... cesador complete una iteración cuando se compila con -O2. PD: Mi computadora es una Macbook Pro core i5 @2.5 GHz (dual core)

GCC optimiza el bucle for basado en rango fijo como si tuviera una longitud variable más larga

Tengo una matriz de estructuras POD y estoy tratando de sumar a través de un campo. He aquí un ejemplo mínimo: struct Item ... /godbolt.org/g/BGYggD (el código óptimo es 3 instrucciones; GCC 6 produce 8 instrucciones; GCC 7 produce 130 instrucciones)