cluster-analysis

¿Cómo determino k cuando uso k-means clustering?

He estado estudiando acerca de k-means clustering, y una cosa que no está clara es cómo elegir el valor de k. ¿Es solo una cuestión de ensayo y error, o hay más en ello?

¿Qué es una explicación intuitiva de la técnica de Maximización de Expectativas? [cerrado]

Maximización de expectativas si es un tipo de método probabilístico para clasificar datos. Por favor corríjame si estoy equiv ... lasificador. ¿Cuál es una explicación intuitiva de esta técnica EM? ¿Qué es la expectativa aquí y qué se está maximizando?

Agrupación en Clústeres de Matriz numérica 1D [duplicar]

Posible Duplicado:Cluster de datos unidimensionales de forma óptima? Así que digamos que tengo una matriz como esta: ... ros? Algunas personas también sugieren particiones de rango rígido, pero no siempre renderiza los resultados como esperado

Python k-means algoritmo

Estoy buscando la implementación en Python del algoritmo k-means con ejemplos para agrupar y almacenar en caché mi base de datos de coordenadas.

trazado de resultados de clustering jerárquico en la parte superior de una matriz de datos en python

¿Cómo puedo trazar un dendrograma justo encima de una matriz de valores, reordenado apropiadamente para reflejar el agrupami ... razar la matriz de intensidad de datos con la barra de escala correcta al lado. Cualquier ayuda en esto sería muy apreciada.

Qué biblioteca de aprendizaje automático usar [cerrado]

Estoy buscando una biblioteca que, idealmente, tenga las siguientes características: implementa la agrupación jerárquica ... experiencia con la biblioteca que recomienda. P.D.: También podría usar diferentes bibliotecas para el clustering y el SVM.

Máquinas de Vectores de Apoyo-Mejor que las Redes Neuronales Artificiales en qué situaciones de aprendizaje?

Sé que los SVM son supuestamente 'asesinos de ANN' en que seleccionan automáticamente la complejidad de la representación y e ... nes (por ejemplo, FFBP, BP recurrente, máquinas Boltzmann, SOMs, etc.). en la práctica, y preferiblemente, en teoría también.

Agrupación de texto con distancias Levenshtein

Tengo un conjunto (2k - 4k) de cadenas pequeñas (3-6 caracteres) y quiero agruparlas. Dado que uso cadenas, respuestas anteri ... no de ustedes gurús mostrarme la manera de implementar la agrupación jerárquica en MATLAB o R con una función personalizada?

¿Cómo funciona exactamente k-means++?

Estoy teniendo problemas para entender completamente el algoritmo k-means++. Me interesa exactamente cómo se escogen los pri ... ién un código fuente muy bien comentado también ayudaría. Si está utilizando 6 matrices, por favor díganos cuál es para qué.

¿Cómo funciona el clustering (especialmente el clustering de cadenas)?

He oído hablar de clustering para agrupar datos similares. Quiero saber cómo funciona en el caso específico de String. Tengo ... é se necesita para identificar la similitud y agrupar cada palabra en un clúster? ¿Qué algoritmo se recomienda más para esto?

kmeans: Los pasos de la etapa de transferencia rápida superaron el máximo

Estoy ejecutando k-means clustering en R en un conjunto de datos con 636.688 filas y 7 columnas utilizando el paquete estánda ... unto de datos, pero agradecería que alguien pudiera aclarar de una vez por todas lo que puedo hacer para mitigar el problema.

Implementación en Python del Algoritmo de ÓPTICA (Clustering)

Estoy buscando una implementación decente del algoritmo OPTICS en Python. Lo usaré para formar clusters de puntos basados en ... enere una lista de clústeres, donde cada clúster de la lista contenga una lista de pares (x, y) pertenecientes a ese clúster.

sklearn agglomerative la agrupación de vinculación de la matriz de

Estoy tratando de dibujar un completo-link scipy.cluster.hierarchy.dendrogram, y me encontré con que scipy.cluster.hierarchy. ... pos y el número de observaciones originales, que scipy.cluster.hierarchy.dendrogram necesita. ¿Hay alguna manera de tomarlos?

¿El objeto pandas dataframe funcionará con sklearn kmeans clustering?

El conjunto de datos es pandas dataframe. Este es sklearn.Cluster.KMeans km = KMeans(n_clusters = n_Clusters) km.fit(dat ... A 1 2 3 4 5 6 B 2 3 4 5 6 7 C 1 4 2 7 8 1 ... Donde A,B, C son índices ¿Es esta la forma correcta de usar k-means?

Comprender el concepto de los Modelos de Mezcla Gaussianos

Estoy tratando de entender GMM leyendo las fuentes disponibles en línea. He logrado clustering usando K-Means y estaba viendo ... señado cómo lograr el means, covariances valores, pero no dicen mucho sobre cómo usarlos en términos de agrupación. Gracias