data-mining

¿Cómo funciona la función de recomendación de Amazon?

¿Qué tecnología entra detrás de las pantallas de la tecnología de recomendación de Amazon? Creo que Amazon recommendation es ... ta de Mercado Cesta de Mercado Análisis Análisis de afinidad Lectura Sugerida: Minería de Datos: Conceptos y Técnica

¿Puede alguien dar un ejemplo de similitud de coseno, de una manera muy simple y gráfica?

Coseno Similitud artículo en Wikipedia Puede mostrar los vectores aquí (en una lista o algo) y luego hacer las matemáticas,y vamos a ver cómo funciona? Soy un principiante.

¿Cuál es la diferencia entre regresión lineal y regresión logística?

Cuando tenemos que predecir el valor de un resultado categórico (o discreto) usamos regresión logística. Creo que usamos regr ... también el valor de un resultado dados los valores de entrada. Entonces, ¿cuál es la diferencia entre las dos metodologías?

¿Qué es una explicación intuitiva de la técnica de Maximización de Expectativas? [cerrado]

Maximización de expectativas si es un tipo de método probabilístico para clasificar datos. Por favor corríjame si estoy equiv ... lasificador. ¿Cuál es una explicación intuitiva de esta técnica EM? ¿Qué es la expectativa aquí y qué se está maximizando?

Agrupación en Clústeres de Matriz numérica 1D [duplicar]

Posible Duplicado:Cluster de datos unidimensionales de forma óptima? Así que digamos que tengo una matriz como esta: ... ros? Algunas personas también sugieren particiones de rango rígido, pero no siempre renderiza los resultados como esperado

¿Cómo acercarse a un algoritmo de juego de adivinanzas de números (con un giro)?

Estoy aprendiendo programación (Python y algoritmos) y estaba tratando de trabajar en un proyecto que me parece interesante. ... ) # Sample of dict = 1 : {'oranges': 0, 'apple': 0, 'pears': 0}..70 : {'oranges': 8, 'apple': 26, 'pears': 13} print graph

R Importancia Variable de Bosques Aleatorios

Estoy tratando de usar el paquete random forests para la clasificación en R. Las Medidas de Importancia Variable enumeradas ... plicara cómo usar una radio, no esperaría que la explicación involucre cómo una radio convierte las ondas de radio en sonido.

¿Por qué la Medida F es una media armónica y no una media aritmética de las medidas de Precisión y Memoria?

Cuando calculamos la Medida F considerando tanto la Precisión como la Memoria, tomamos la media armónica de las dos medidas e ... gar de una media aritmética simple. ¿Cuál es la razón intuitiva detrás de tomar la media armónica y no un promedio simple?

¿Cómo puedo extraer las palabras clave utilizadas en el texto? [cerrado]

¿Cómo puedo extraer datos de un montón de texto para obtener palabras clave por uso? ("Jacob Smith "o"cerca") ¿Y ya hay u ... forma semiautomática, y si puede filtrar palabras simples como "el", "y", "o", entonces podría llegar a los temas más rápido.

Calcular AUC en R?

Dado un vector de puntuaciones y un vector de etiquetas de clase reales, ¿cómo se calcula una métrica AUC de un solo número p ... R(Actual == 1)) ¿Porque R (no debe confundirse con el lenguaje R) se define como un vector pero se usa como una función?

Cómo calcular el parámetro de regularización en regresión lineal

Cuando tenemos un polinomio lineal de alto grado que se usa para ajustar un conjunto de puntos en una configuración de regres ... ros theta en el algoritmo de descenso de gradiente. Mi pregunta es ¿cómo calculamos este parámetro de regularización lambda?

¿Puede alguien dar un ejemplo de la vida real de aprendizaje supervisado y aprendizaje no supervisado?

Recientemente estudié sobre el aprendizaje supervisado y el aprendizaje no supervisado. Desde la teoría, sé que supervisado s ... aje supervisado o aprendizaje no supervisado durante mis estudios. ¿Puede alguien por favor dar un ejemplo de la vida real?

Mezclar datos categoriales y continuos en clasificador Bayes ingenuo usando scikit-learn

Estoy usando scikit-learn en Python para desarrollar un algoritmo de clasificación para predecir el género de ciertos cliente ... ener ambos datos categóricos y continuos en mi modelo, realmente no sé cómo manejar esto. Cualquier idea sería muy apreciada!

importancia de la PCA o SVD en el aprendizaje automático

Todo este tiempo (especialmente en el concurso de Netflix), siempre me encuentro con este blog (o foro de clasificación) dond ... guna versión del sistema de recomendación (digamos filtrado colaborativo): 1) Without SVD 2) With SVD Cómo ayuda Gracias

Kmeans sin conocer el número de clusters? [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo determino k cuando uso k-means clustering? ... acionada también estaría bien. Si hay formas alternativas de lograr el mismo algoritmo o un mejor, por favor hágamelo saber.

¿Qué información podemos acceder desde el cliente? [cerrado]

Estoy tratando de compilar una lista de información que es accesible a través de javascript como: Geolocalización Direcc ... á puramente relacionada con la confianza, pero todavía estoy interesado en qué otra información se puede extraer del cliente.

¿Cómo funciona el clustering (especialmente el clustering de cadenas)?

He oído hablar de clustering para agrupar datos similares. Quiero saber cómo funciona en el caso específico de String. Tengo ... é se necesita para identificar la similitud y agrupar cada palabra en un clúster? ¿Qué algoritmo se recomienda más para esto?

Implementación en Python del Algoritmo de ÓPTICA (Clustering)

Estoy buscando una implementación decente del algoritmo OPTICS en Python. Lo usaré para formar clusters de puntos basados en ... enere una lista de clústeres, donde cada clúster de la lista contenga una lista de pares (x, y) pertenecientes a ese clúster.

Diferencia entre Algoritmos de Minería de Patrones Secuenciales Cerrados y abiertos

Quiero usar algunos algoritmos para extraer mis datos de registro. Encontré un marco de minería de patrones en: http://www. ... se de datos de secuencias. ¿Puede alguien explicar la definición sobre los patrones secuenciales "cerrados" y los abiertos?

¿Usando la minería frecuente de itemset para construir reglas de asociación?

Soy nuevo en esta área, así como en la terminología, así que siéntase libre de sugerir si me equivoco en algún lugar. Tengo d ... utorial/ejemplo práctico (preferiblemente en Python) o al menos explicar en breves palabras sobre cómo abordar este problema?