deep-learning

Comprensión de Keras LSTMs

Estoy tratando de reconciliar mi comprensión de LSTMs y señalado aquí en este post de Christopher Olah implementado en Keras ... ctualización 2: Tengo resumí la mayor parte de mi comprensión de LSTMs aquí: https://www.youtube.com/watch?v=ywinX5wgdEU

Cómo interpretar "pérdida" y "precisión" para un modelo de aprendizaje automático

Cuando entrené mi red neuronal con Theano o Tensorflow, reportarán una variable llamada "pérdida" por época. ¿Cómo debo int ... esta variable? Una pérdida mayor es mejor o peor, o ¿qué significa para el rendimiento final (precisión) de mi red neuronal?

¿Qué hace tf.nn.incrustar la función de búsqueda hacer?

tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) No puedo entender el deber de esta función. ¿Es co ... s tf.nn.embedding_lookup(embeddings, train_inputs), entonces para cada train_input se encuentra la corresponden incrustación?

Uso de una incrustación de palabras preentrenada (word2vec o Glove) en TensorFlow

Recientemente he revisado una implementación interesante para convolutional text classification. Sin embargo, todo el código ... sabe cómo utilizar los resultados de Word2vec o un guante de incrustación de palabras pre-entrenados en lugar de uno al azar?

¿Cómo agregar regularizaciones en TensorFlow?

Encontré en muchos códigos de redes neuronales disponibles implementados usando TensorFlow que los términos de regularización ... máticamente (por ejemplo, utilizada por optimizadores durante el entrenamiento)? ¿O se espera que use esa colección yo solo?

¿La mejor manera de salvar a un modelo entrenado en PyTorch?

Estaba buscando formas alternativas de guardar un modelo entrenado en PyTorch. Hasta ahora, he encontrado dos alternativas. ... ué la segundo método es preferido? Es solo porque antorcha.nn los módulos tienen esas dos funciones y se nos anima a usarlos?

Explicación de entrada de Keras: forma de entrada, unidades, tamaño de lote, dim, etc

Para cualquier capa de Keras (claseLayer), ¿puede alguien explicar cómo entender la diferencia entre input_shape, units, dim, ... En resumen, ¿cómo se puede entender / visualizar los atributos del modelo-en particular las capas-con la imagen de abajo?

¿Cómo asignar un valor a una variable TensorFlow?

Estoy tratando de asignar un nuevo valor a una variable tensorflow en python. import tensorflow as tf import numpy as np x ... x.assign(1) print(x.eval()) Pero la salida que obtengo es 0 0 Así que el valor no ha cambiado. ¿Qué me estoy perdiendo?

Estimación del número de neuronas y el número de capas de una red neuronal artificial [cerrado]

Estoy buscando un método para calcular el número de capas y el número de neuronas por capa. Como entrada solo tengo el tamaño ... ina probando diferentes topologías de red y seleccionando la que tenga el menor error. Desafortunadamente no puedo hacer eso.

Causas comunes de nans durante el entrenamiento

He notado que una ocurrencia frecuente durante el entrenamiento se está introduciendo NAN. Muchas veces parece ser introduci ... N ocurran durante el entrenamiento? Y en segundo lugar, ¿cuáles son algunos métodos para combatir esto (y por qué funcionan)?

Keras, Cómo obtener la salida de cada capa?

He entrenado un modelo de clasificación binaria con CNN, y aquí está mi código model = Sequential() model.add(Convolution2D( ... dation_data=(x_test, y_test)) Y aquí, quiero obtener la salida de cada capa al igual que TensorFlow, ¿cómo puedo hacer eso?

OpenCL / AMD: Aprendizaje profundo

Mientras "googl'ing" y haciendo algunas investigaciones no pude encontrar ningún framework/sdk serio/popular para la computac ... 15/16? ¿Cuál es un buen comienzo para deep learning con OpenCL/AMD? Cualquier literatura? Tutoriales? Miscelánea fuentes?

¿Qué significa global step en Tensorflow?

En este es código tutorial del sitio web TensorFlow, ¿Podría alguien ayudar a explicar qué significa global_step? En ... de que las variables tienen se ha actualizado. ¿Eso significa que después de una actualización global_step se convierte en 1?

TensorFlow-regularización con pérdida de L2, ¿cómo aplicar a todos los pesos, no solo al último?

Estoy jugando con una ANN que forma parte del curso Udacity DeepLearning. Tengo una asignación que implica introducir genera ... _dataset, hidden_weights) + hidden_biases) test_prediction = tf.nn.softmax(tf.matmul(test_relu, out_weights) + out_biases)

¿Cómo establecer la tasa de aprendizaje en capas en Tensorflow?

Me pregunto si hay una manera de que pueda usar diferentes tasas de aprendizaje para diferentes capas como lo que está en Caf ... o. Las primeras 5 capas tendrían una tasa de aprendizaje de 0.00001 y el último tendría 0.001. ¿Alguna idea de cómo lograrlo?

cómo desempaquetar un archivo pkl

Tengo un archivo pkl del conjunto de datos MNIST, que consiste en imágenes de dígitos escritas a mano. Me gustaría echar un ... aquetar el archivo pkl, excepto que no puedo averiguar cómo. ¿Hay alguna forma de descomprimir/descomprimir el archivo pkl?

Descenso de gradiente vs Adagrad vs Momentum en TensorFlow

Estoy estudiando TensorFlow y cómo usarlo, incluso si no soy un experto en redes neuronales y aprendizaje profundo (solo lo ... ro mis preguntas son: 1. ¿Cuándo es preferible usar uno en lugar de los otros? 2. ¿Hay diferencias importantes para saber ?

¿Cómo entrenar imágenes, cuando tienen diferente tamaño?

Estoy tratando de entrenar a mi modelo que clasifica las imágenes. El problema que tengo es que tienen diferentes tamaños. ¿Hay alguna posibilidad de entrenar esas imágenes sin redimensionarlas?

Encontrar el gradiente de un filtro conv de Caffe con respecto a la entrada

Necesito encontrar el gradiente con respecto a la capa de entrada para un solo filtro convolucional en una red neuronal convo ... l gradiente de un solo filtro conv con respecto a los datos en la capa de entrada, que es otra cosa. ¿Cómo puedo lograr esto?

Papel de "Aplanar" en Keras

Estoy tratando de entender el papel de la función Flatten en Keras. A continuación se muestra mi código, que es una red simpl ... . Entonces, si la salida de la primera capa ya es "plana" y de forma (1, 16), ¿por qué necesito aplanarla aún más? Gracias!