¿Cuál es la tasa de crecimiento ideal para una matriz dinámicamente asignada?

Question

¿Cuál es la tasa de crecimiento ideal para una matriz dinámicamente asignada?

C++ tiene std::vector y Java tiene ArrayList, y muchos otros lenguajes tienen su propia forma de array dinámicamente asignado. Cuando una matriz dinámica se queda sin espacio, se reasigna a un área más grande y los valores antiguos se copian en la nueva matriz. Una cuestión central para el rendimiento de una matriz de este tipo es qué tan rápido crece el tamaño de la matriz. Si siempre crece lo suficientemente grande como para adaptarse al empuje actual, terminará reasignando cada vez. Así que tiene sentido duplicar el tamaño de la matriz, o multiplíquelo por decir 1.5 x.

¿Existe un factor de crecimiento ideal? 2x? 1.5 x? Por ideal me refiero matemáticamente justificado, mejor rendimiento de equilibrio y memoria desperdiciada. Me doy cuenta de que teóricamente, dado que su aplicación podría tener cualquier distribución potencial de empujones que esto es algo dependiente de la aplicación. Pero tengo curiosidad por saber si hay un valor que es "generalmente" mejor, o se considera mejor dentro de alguna restricción rigurosa.

He oído que hay un documento sobre esto en alguna parte, pero no he podido encontrarlo.

68

arrays math vector arraylist dynamic-arrays

Author: Joseph Garvin, 2009-07-09

Source

10 answers

Recuerdo haber leído hace muchos años por qué se prefiere 1.5 a dos, al menos como se aplica a C++ (esto probablemente no se aplica a los lenguajes administrados, donde el sistema de tiempo de ejecución puede reubicar objetos a voluntad).

El razonamiento es este:

Digamos que empiezas con una asignación de 16 bytes.
Cuando necesite más, asigne 32 bytes, luego libere 16 bytes. Esto deja un agujero de 16 bytes en la memoria.
Cuando se necesita más, se asignan 64 bytes, liberando los 32 bytes. Este deja un agujero de 48 bytes (si los 16 y 32 eran adyacentes).
Cuando se necesita más, se asignan 128 bytes, liberando los 64 bytes. Esto deja un agujero de 112 bytes (suponiendo que todas las asignaciones anteriores son adyacentes).
Y así y así sucesivamente.

La idea es que, con una expansión 2x, no hay ningún punto en el tiempo que el agujero resultante va a ser lo suficientemente grande como para reutilizar para la siguiente asignación. Usando una asignación 1.5 x, tenemos esto en su lugar:

Comience con 16 byte.
Cuando necesite más, asigne 24 bytes, luego libere los 16, dejando un agujero de 16 bytes.
Cuando necesite más, asigne 36 bytes, luego libere los 24, dejando un agujero de 40 bytes.
Cuando necesite más, asigne 54 bytes, luego libere los 36, dejando un agujero de 76 bytes.
Cuando necesite más, asigne 81 bytes, luego libere los 54, dejando un agujero de 130 bytes.
Cuando necesite más, use 122 bytes (redondeando) del agujero de 130 bytes.

83

Author: Chris Jester-Young,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2015-06-17 09:18:38

Idealmente (en el límite como n → ∞), es la proporción áurea: ϕ = 1.618...

En la práctica, quieres algo cercano, como 1.5.

La razón es que desea poder reutilizar bloques de memoria antiguos, para aprovechar el almacenamiento en caché y evitar constantemente que el sistema operativo le dé más páginas de memoria. La ecuación que había resolver para asegurar que esto se reduce a x^{n - 1} - 1 = x^{n + 1} - xⁿ, cuya solución enfoques x = ϕ para grandes n.

34

Author: Mehrdad,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2018-08-13 11:05:51

Un enfoque al responder preguntas como esta es simplemente "hacer trampa" y ver lo que hacen las bibliotecas populares, bajo la suposición de que una biblioteca ampliamente utilizada, al menos, no está haciendo algo horrible.

Así que simplemente comprobando muy rápidamente, Ruby (1.9.1-p129) parece usar 1.5 x cuando se agrega a una matriz, y Python (2.6.2) usa 1.125 x más una constante (en Objects/listobject.c):

/* This over-allocates proportional to the list size, making room
 * for additional growth.  The over-allocation is mild, but is
 * enough to give linear-time amortized behavior over a long
 * sequence of appends() in the presence of a poorly-performing
 * system realloc().
 * The growth pattern is:  0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...
 */
new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6);

/* check for integer overflow */
if (new_allocated > PY_SIZE_MAX - newsize) {
    PyErr_NoMemory();
    return -1;
} else {
    new_allocated += newsize;
}

newsize arriba está el número de elementos en la matriz. Nótese bien que newsize se añade a new_allocated, por lo que la expresión con el bitshifts y operador ternario es realmente sólo el cálculo de la asignación excesiva.

11

Author: Jason Creighton,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2018-03-12 14:49:27

Digamos que aumentas el tamaño de la matriz por x. Así que supongamos que empiezas con size T. La próxima vez que crezca el array su tamaño será T*x. Entonces será T*x^2 y así sucesivamente.

Si su objetivo es poder reutilizar la memoria que se ha creado anteriormente, entonces debe asegurarse de que la nueva memoria que asigne sea menor que la suma de la memoria anterior que desasignó. Por lo tanto, tenemos esta desigualdad:

T*x^n <= T + T*x + T*x^2 + ... + T*x^(n-2)

Podemos quitar T de ambos lados. Así que tenemos esto:

x^n <= 1 + x + x^2 + ... + x^(n-2)

Informalmente, lo que decimos es que en la asignación nth, queremos que toda nuestra memoria previamente desasignada sea mayor o igual a la necesidad de memoria en la enésima asignación para que podamos reutilizar la memoria previamente desasignada.

Por ejemplo, si queremos ser capaces de hacer esto en el 3er paso (es decir, n=3), entonces tenemos

x^3 <= 1 + x

Esta ecuación es verdadera para todo x tal que 0 < x <= 1.3 (aproximadamente)

Ver lo que x obtenemos para diferentes n abajo:

n  maximum-x (roughly)

3  1.3

4  1.4

5  1.53

6  1.57

7  1.59

22 1.61

Tenga en cuenta que el factor de crecimiento tiene que ser menor que 2 desde x^n > x^(n-2) + ... + x^2 + x + 1 for all x>=2.

7

Author: CEGRD,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2016-10-22 04:47:55

Realmente depende. Algunas personas analizan casos de uso común para encontrar el número óptimo.

He visto 1.5 x 2.0 x phi x, y el poder de 2 utilizado antes.

4

Author: Unknown,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-07-08 20:38:51

Si tiene una distribución sobre longitudes de matriz, y tiene una función de utilidad que dice cuánto le gusta perder espacio frente a perder tiempo, entonces definitivamente puede elegir una estrategia de redimensionamiento óptima (y dimensionamiento inicial).

La razón por la que se usa el múltiplo constante simple, es obviamente para que cada apéndice tenga tiempo constante amortizado. Pero eso no significa que no pueda usar una proporción diferente (más grande) para tamaños pequeños.

En Scala, puede anular loadFactor para el estándar tablas hash de biblioteca con una función que mira el tamaño actual. Curiosamente, las matrices de tamaño variable solo se duplican, que es lo que la mayoría de la gente hace en la práctica.

No conozco ninguna matriz de duplicación (o 1.5*ing) que realmente atrape errores de memoria y crezca menos en ese caso. Parece que si tuvieras una sola matriz enorme, querrías hacer eso.

Añadiría además que si usted está manteniendo los arrays redimensionables alrededor el tiempo suficiente, y usted favorece el espacio en el tiempo, podría tener sentido a sobreasigne dramáticamente (para la mayoría de los casos) inicialmente y luego reasigne exactamente al tamaño correcto cuando haya terminado.

2

Author: Jonathan Graehl,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-07-08 21:00:58

Estoy de acuerdo con Jon Skeet, incluso mi amigo theorycrafter insiste en que se puede demostrar que esto es O(1) cuando se establece el factor a 2x.

La relación entre el tiempo de cpu y la memoria es diferente en cada máquina, por lo que el factor variará igual. Si tiene una máquina con gigabytes de ram y una CPU lenta, copiar los elementos a una nueva matriz es mucho más caro que en una máquina rápida, que a su vez podría tener menos memoria. Es una pregunta que se puede responder en teoría, para un computadora uniforme, que en escenarios reales no te ayuda en absoluto.

1

Author: Tom,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-07-08 20:35:19

Sé que es una vieja pregunta, pero hay varias cosas que todo el mundo parece estar perdiendo.

Primero, esta es la multiplicación por 2: tamaño cualquier cosa entre 1 y 2: int(float(size) * x), donde x es el número, el * es matemática de punto flotante, y el procesador tiene que ejecutar instrucciones adicionales para lanzar entre float e int. En otras palabras, a nivel de la máquina, doblar requiere una sola instrucción muy rápida para encontrar el nuevo tamaño. Multiplicar por algo entre 1 y 2 requiere al menos una instrucción para lanzar tamaño a un flotador, una instrucción para multiplicar (que es la multiplicación de flotadores, por lo que probablemente toma al menos el doble de ciclos, si no 4 o incluso 8 veces más), y una instrucción para lanzar de nuevo a int, y eso asume que su plataforma puede realizar matemáticas de flotación en los registros de propósito general, en lugar de requerir el uso de registros especiales. En resumen, usted debe esperar las matemáticas para cada asignación para tomar al menos 10 veces más tiempo que un simple cambio a la izquierda. Sin embargo, si está copiando muchos datos durante la reasignación, esto podría no hacer mucha diferencia.

Segundo, y probablemente el gran trampolín: Todo el mundo parece asumir que la memoria que se está liberando es contigua consigo misma, así como contigua con la memoria recién asignada. A menos que esté pre-asignando toda la memoria usted mismo y luego usándola como un pool, este no es el caso. El sistema operativo podría ocasionalmente terminar haciendo esto, pero la mayoría de las veces, va a haber suficiente fragmentación de espacio libre que cualquier sistema de gestión de memoria medio decente será capaz de encontrar un pequeño agujero donde su memoria simplemente encajará. Una vez que llegues a trozos realmente pequeños, es más probable que termines con piezas contiguas, pero para entonces, tus asignaciones son lo suficientemente grandes como para que no las hagas con la frecuencia suficiente para que ya importe. En resumen, es divertido imaginar que el uso de algunos ideal number permitirá el uso más eficiente del espacio de memoria libre, pero en realidad, no va a suceder a menos que su programa se esté ejecutando en bare metal (como en, no hay ningún sistema operativo debajo de él tomando todas las decisiones).

Mi respuesta a la pregunta? No, no hay un número ideal. Es tan específica de la aplicación que nadie realmente ni siquiera lo intenta. Si tu objetivo es el uso ideal de la memoria, estás prácticamente sin suerte. Para el rendimiento, las asignaciones menos frecuentes son mejores, pero si fuimos solo con eso, podríamos multiplicar por 4 o incluso 8! Por supuesto, cuando Firefox salta de usar 1 GB a 8 GB de una sola vez, la gente se va a quejar, por lo que ni siquiera tiene sentido. Aquí hay algunas reglas de oro que me gustaría seguir sin embargo:

Si no puede optimizar el uso de memoria, al menos no desperdicie los ciclos del procesador. Multiplicar por 2 es al menos un orden de magnitud más rápido que hacer matemáticas de coma flotante. Puede que no haga una gran diferencia, pero al menos hará alguna diferencia (especialmente al principio, durante las asignaciones más frecuentes y más pequeñas).

No lo pienses demasiado. Si usted acaba de pasar 4 horas tratando de averiguar cómo hacer algo que ya se ha hecho, que acaba de perder su tiempo. Sinceramente, si hubiera una opción mejor que *2, se habría hecho en la clase vectorial C++ (y en muchos otros lugares) hace décadas.

Por último, si realmente quieres optimizar, no te preocupes por las cosas pequeñas. Hoy en día, a nadie le importa 4KB de la memoria se desperdicia, a menos que estén trabajando en sistemas embebidos. Cuando llegas a 1GB de objetos que están entre 1MB y 10MB cada uno, duplicar es probablemente demasiado (quiero decir, eso es entre 100 y 1,000 objetos). Si puede estimar la tasa de expansión esperada, puede nivelarla a una tasa de crecimiento lineal en un punto determinado. Si espera alrededor de 10 objetos por minuto, entonces crecer a 5 a 10 tamaños de objeto por paso (una vez cada 30 segundos a un minuto) probablemente esté bien.

Lo que todo en resumen, no lo pienses demasiado, optimiza lo que puedas y personaliza tu aplicación (y plataforma) si es necesario.

1

Author: Rybec Arethdar,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2016-05-21 04:55:35

Otros dos centavos

La mayoría de las computadoras tienen memoria virtual! En la memoria física puede tener páginas aleatorias en todas partes que se muestran como un único espacio contiguo en la memoria virtual de su programa. La resolución de la indirección es realizada por el hardware. El agotamiento de la memoria virtual era un problema en los sistemas de 32 bits, pero en realidad ya no es un problema. Así que llenar el agujero ya no es una preocupación (excepto los entornos especiales). Desde Windows 7 incluso Microsoft soporta 64 bits sin esfuerzo adicional. @ 2011
O(1) se alcanza con cualquier r > 1 factor. La misma prueba matemática funciona no solo para 2 como parámetro.
r = 1.5 se puede calcular con old*3/2 por lo que no hay necesidad de operaciones de coma flotante. (Digo /2 porque los compiladores lo reemplazarán con cambios de bits en el código de ensamblado generado si lo consideran conveniente.)
MSVC fue para r = 1.5, por lo que hay al menos un compilador principal que no usa 2 como relación.

Como lo mencionó alguien 2 se siente mejor que 8. Y también 2 se siente mejor que 1.1.

Mi sensación es que 1.5 es un buen valor predeterminado. Aparte de eso, depende del caso específico.

0

Author: Notinlist,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-01-03 16:42:55

score 37 · Accepted Answer

Dependerá completamente del caso de uso. ¿Le importa más el tiempo perdido copiando datos (y reasignando matrices) o la memoria extra? ¿Cuánto tiempo va a durar la matriz? Si no va a estar por mucho tiempo, el uso de un búfer más grande bien puede ser una buena idea - la penalización es de corta duración. Si se va a colgar alrededor (por ejemplo, en Java, entrar en generaciones más y más antiguas) que es obviamente más de una penalización.

No hay tal cosa como un "factor de crecimiento ideal."No es solo teóricamente dependiente de la aplicación, es definitivamente dependiente de la aplicación.

2 es un factor de crecimiento bastante común - estoy bastante seguro de que eso es lo que ArrayList y List<T> en.NET utiliza. ArrayList<T> en Java utiliza 1.5.

EDITAR: Como Erich señala, Dictionary<,> en.NET utiliza "duplicar el tamaño y luego aumentar al siguiente número primo" para que los valores hash se puedan distribuir razonablemente entre los cubos. (Estoy seguro de que recientemente he visto documentación que sugiere que los primos no son realmente eso excelente para distribuir cubos de hash, pero ese es un argumento para otra respuesta.)