cuda

¿Puedo / debo ejecutar este código en una GPU?

Estoy trabajando en una aplicación estadística que contiene aproximadamente 10 - 30 millones de valores de coma flotante en u ... lgún tutorial o tiene algún código de muestra (el lenguaje de programación no importa)? Cualquier ayuda sería muy apreciada.

CUDA determinar hilos por bloque, bloques por cuadrícula

Soy nuevo en el paradigma CUDA. Mi pregunta es determinar el número de hilos por bloque y bloques por cuadrícula. ¿Un poco de ... o en C = A * B) sería calculado por un solo hilo. ¿Cómo se determinaría la hilos / bloque, bloques / cuadrícula en este caso?

CUDA y Clases

He buscado por todas partes alguna idea sobre cómo usar exactamente las clases con CUDA, y aunque hay un consenso general de ... r cualquier ayuda, y si me estoy acercando a esto de la manera completamente equivocada, me encantaría escuchar alternativas.

¿Es posible ejecutar CUDA en GPU AMD?

Me gustaría ampliar mi conjunto de habilidades en la computación GPU. Estoy familiarizado con raytracing y realtime graphics ... a pregunta frecuente, pero lo mejor que vi fue a partir de 08' y me imagino que el campo ha cambiado un poco desde entonces.

Estructura de matrices vs Matriz de Estructuras en CUDA

De algunos comentarios que he leído aquí, por alguna razón es preferible tener Structure of Arrays (SoA) cambio Array of Stru ... ures (AoS) para implementaciones paralelas como CUDA? Si eso es cierto, ¿puede alguien explicar por qué? Gracias de antemano!

¿Por qué cudaMalloc () usa puntero a puntero?

Por ejemplo, cudaMalloc((void**)&device_array, num_bytes); Esta pregunta se ha hecho antes, y la respuesta fue "porque ... igo de error se colocará en catch_status, y devolver un simple puntero a la memoria GPU asignada debería ser suficiente, ¿no?

¿Puedo usar syncthreads () después de haber caído hilos?

¿Es seguro usar __syncthreads() en un bloque donde a propósito he dejado caer hilos usando return? La documentación estable ... if (threadIdx.x + 1 == size) { return; } // ... do more work ... __syncthreads(); // Is this safe? }

asignación de memoria compartida

Estoy intentando asignar memoria compartida usando un parámetro constante pero obteniendo un error. mi núcleo se ve así: __g ... la expresión debe tener un valor constante La cuenta es constante! ¿Por qué recibo este error? Y ¿cómo puedo evitar esto?

Uso de cudamalloc(). ¿Por qué el doble puntero?

Actualmente estoy revisando los ejemplos del tutorial en http://code.google.com/p/stanford-cs193g-sp2010 / para aprender CU ... simplemente devolver un puntero al principio de la memoria asignada en la GPU, al igual que la función malloc hace en la CPU?

¿Por qué atomicAdd no se ha implementado para dobles?

¿Por qué no se ha implementado atomicAdd() para los dobles explícitamente como parte de CUDA 4.0 o superior? Del apéndice F ... ile (assumed != old); return __longlong_as_double(old); } ¿Por qué no definir el código anterior como parte de CUDA ?

¿Cuáles son las diferencias entre las capacidades de cómputo de CUDA?

¿Qué suma compute capability 2.0 sobre 1.3, 2.1 sobre 2.0 y 3.0 sobre 2.1?

¿syncthreads () sincroniza todos los subprocesos en la cuadrícula?

...¿o solo los hilos en la urdimbre o bloque actual? También, cuando los hilos de un bloque en particular se encuentran (en ... sta línea, y luego el Hilo 69 en el Bloque 22 es el último en llegar a esta línea, el Hilo 69 sabrá que ya ha sido declarado?

nvidia-smi Volatile GPU-Explicación de utilización?

Sé que nvidia-smi -l 1 dará el uso de la GPU cada segundo (de manera similar a lo siguiente). Sin embargo, agradecería una ex ... 4514MiB | +-----------------------------------------------------------------------------+

Memoria Fija Predeterminada Vs Memoria De Copia Cero

En CUDA podemos usar la memoria fija para copiar de manera más eficiente los datos del Host a la GPU que la memoria predeterm ... amente desde la memoria del host. Mi pregunta es: Cuál de estos tipos de memoria fija es una mejor práctica de programación.

¿Cómo comienzo un nuevo proyecto CUDA en Visual Studio 2008?

Esta es una pregunta increíblemente básica, pero ¿cómo comienzo un nuevo proyecto CUDA en Visual Studio 2008? He encontrado ... htm" 1>CUDASandbox - 2 error(s), 0 warning(s) ========== Build: 0 succeeded, 1 failed, 0 up-to-date, 0 skipped ==========

¿Es la divergencia de ramas realmente tan mala?

He visto muchas preguntas esparcidas por Internet sobre la divergencia de ramas, y cómo evitarla. Sin embargo, incluso despu ... urante esa latencia, lo que resulta en la latencia oculta. Si este es el caso, el código divergente de la rama es más rápido.

Copiar una estructura que contiene punteros al dispositivo CUDA

Estoy trabajando en un proyecto donde necesito mi dispositivo CUDA para hacer cálculos en una estructura que contiene puntero ... ra contiene muchos punteros o estructuras con punteros, el código para la asignación y copia será bastante extenso y confuso.

CUDA / OpenCL dentro de una Máquina Virtual / Hipervisor

Cualquiera sabe de cualquier solución de virtualización que permita el acceso de CUDA/OpenCL directamente o implemente la abs ... ue la virtualización clásica del 'escritorio' sería agradable, sospecho que los gustos de Xen estarían más cerca de la marca.

¿Cómo se gestiona la memoria CUDA?

Cuando corro mi programa CUDA que asigna solo una pequeña cantidad de memoria global (por debajo de 20 M), obtuve un error de ... o debería existir. Debe haber algún tipo de datos en la memoria. 2. ¿Hay alguna forma de reestructurar la memoria de la GPU ?

Diferencia entre cuda.h, tiempo de ejecución cuda.h, api de tiempo de ejecución cuda.h

Estoy empezando a programar con CUDA, y en algunos ejemplos me encuentro con los archivos de inclusióncuda.h, cuda_runtime.h y cuda_runtime_api.h incluido en el código. ¿Puede alguien explicarme la diferencia entre estos archivos?