Cómo diseñar características para el aprendizaje automático [cerrado]

Question

Cómo diseñar características para el aprendizaje automático [cerrado]

¿Tiene algunos consejos o está leyendo cómo diseñar características para una tarea de aprendizaje automático? Las buenas características de entrada son importantes incluso para una red neuronal. Las características elegidas afectarán el número necesario de neuronas ocultas y el número necesario de ejemplos de entrenamiento.

El siguiente es un problema de ejemplo, pero estoy interesado en la ingeniería de características en general.

Un ejemplo de motivación: Lo que sería una buena entrada cuando se mira un rompecabezas (por ejemplo, 15-puzzle o Sokoban )? ¿Sería posible reconocer cuál de los dos Estados está más cerca del objetivo?

30

artificial-intelligence machine-learning classification neural-network pattern-recognition

Author: dmcer, 2010-04-20

Source

1 answers

score 47 · Accepted Answer

La buena ingeniería de características implica dos componentes. El primero es comprender las propiedades de la tarea que está tratando de resolver y cómo podrían interactuar con las fortalezas y limitaciones del clasificador que está utilizando. El segundo es un trabajo experimental en el que probarás tus expectativas y descubrirás lo que realmente funciona y lo que no.

Esto se puede hacer iterativamente: Su de arriba hacia abajo comprensión del problema motiva los experimentos, y luego el bottom up la información que aprendes para esos experimentos te ayuda a obtener una mejor comprensión del problema. La comprensión más profunda del problema puede conducir a más experimentos.

Características de ajuste a Su Clasificador

Digamos que estás usando un clasificador lineal simple como regresión logística o un SVM con un núcleo lineal. Si cree que puede haber interacciones interesantes entre varios atributos, puede medir y proporcionar como entrada al clasificador, deberá construir manualmente y proporcionar características que capten esas interacciones. Sin embargo, si está utilizando un SVM con un núcleo polinómico o gaussiano, las interacciones entre las variables de entrada ya serán capturadas por la estructura del modelo.

Del mismo modo, los SVM pueden funcionar mal si algunas variables de entrada toman un rango de valores mucho mayor que otras (por ejemplo, la mayoría de las entidades toman un valor de 0 o 1, pero una entidad toma valores entre -1000 y 1000). Por lo tanto, cuando está haciendo ingeniería de características para un SVM, es posible que desee intentar normalizar los valores de sus características antes de proporcionarlos al clasificador. Sin embargo, si está utilizando árboles de decisión o bosques aleatorios, dicha normalización no es necesaria, ya que estos clasificadores son robustos a las diferencias de magnitud entre los valores que asumen varias características.

Notas Específicas sobre la Resolución de Rompecabezas

Si estás mirando para resolver un problema con un espacio de estados complejo, es posible que desee usar un enfoque de aprendizaje por refuerzo como Q-learning. Esto ayuda a estructurar las tareas de aprendizaje que implican alcanzar algún objetivo mediante una serie de pasos intermedios por parte del sistema.