information-retrieval

Cómo analizar los datos de las Alertas de Google?

En primer lugar, ¿Cómo obtendrías información de Google Alerts en una base de datos que no sea para analizar el texto del men ... de Alertas de Google. Si debe analizar el texto, ¿cómo analizaría las partes relevantes del mensaje de correo electrónico?

Similitud de coseno y tf-idf

Estoy confundido por el siguiente comentario acerca de TF-IDF y Coseno Similitud. Estaba leyendo en ambos y luego en wiki ... Pensé que tf-idf era algo que se podía hacer antes de ejecutar la similitud de coseno en los textos. ¿Me he perdido algo?