reinforcement-learning

¿Cuál es la diferencia entre Q-learning y SARSA?

Aunque sé que SARSA está en política, mientras que Q-learning está fuera de política, al mirar sus fórmulas es difícil (para ... e que SARSA solo busca el siguiente valor de la política, mientras que Q-learning busca la siguiente política máxima ¿valor?

Máquinas de Vectores de Apoyo-Mejor que las Redes Neuronales Artificiales en qué situaciones de aprendizaje?

Sé que los SVM son supuestamente 'asesinos de ANN' en que seleccionan automáticamente la complejidad de la representación y e ... nes (por ejemplo, FFBP, BP recurrente, máquinas Boltzmann, SOMs, etc.). en la práctica, y preferiblemente, en teoría también.