¿Por qué la Medida F es una media armónica y no una media aritmética de las medidas de Precisión y Memoria?


Cuando calculamos la Medida F considerando tanto la Precisión como la Memoria, tomamos la media armónica de las dos medidas en lugar de una media aritmética simple.

¿Cuál es la razón intuitiva detrás de tomar la media armónica y no un promedio simple?

Author: London guy, 2014-10-14

4 answers

Porque castiga más los valores extremos.

Considere un método trivial (por ejemplo, siempre devolviendo la clase A). Hay infinitos elementos de datos de clase B, y un solo elemento de clase A:

Precision: 0.0
Recall:    1.0

Al tomar la media aritmética, tendría un 50% correcto. A pesar de ser el peor posible resultado! Con la media armónica, la medida de F1 es 0.

Arithmetic mean: 0.5
Harmonic mean:   0.0

En otras palabras, para tener una F1 alta, necesita ambos tener una alta precisión y recordar.

 49
Author: Anony-Mousse,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2014-10-15 13:21:47

Para explicar, considere por ejemplo, ¿cuál es el promedio de 30 mph y 40 mph? si conduce durante 1 hora en cada velocidad, la velocidad promedio durante las 2 horas es de hecho el promedio aritmético, 35 mph.

Sin embargo, si conduces la misma distancia a cada velocidad, digamos 10 millas, entonces la velocidad promedio de más de 20 millas es la media armónica de 30 y 40, aproximadamente 34.3 mph.

La razón es que para que el promedio sea válido, realmente necesita que los valores estén en las mismas unidades escaladas. Millas por la hora debe compararse con el mismo número de horas; para comparar con el mismo número de millas, debe promediar horas por milla, que es exactamente lo que hace la media armónica.

La precisión y el recuerdo tienen verdaderos positivos en el numerador, y diferentes denominadores. Para promediarlos realmente solo tiene sentido promediar sus recíprocos, por lo tanto la media armónica.

 45
Author: Sean Owen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2014-10-14 14:54:57

La media armónica es el equivalente de la media aritmética para los recíprocos de cantidades que deben promediarse por la media aritmética. Más precisamente, con la media armónica, transformas todos tus números a la forma "promediable" (tomando el recíproco), tomas su media aritmética y luego transformas el resultado de vuelta a la representación original (tomando el recíproco de nuevo).

La precisión y el recuerdo son recíprocos "naturalmente" porque su numerador es el iguales y sus denominadores son diferentes. Las fracciones son más sensibles a la media aritmética cuando tienen el mismo denominador.

Para más intuición, supongamos que mantenemos constante el número de elementos positivos verdaderos. A continuación, tomando la media armónica de la precisión y el recall, implícitamente tomar la media aritmética de los falsos positivos y los falsos negativos. Básicamente significa que los falsos positivos y los falsos negativos son igualmente importantes para usted cuando el verdadero lo positivo sigue igual. Si un algoritmo tiene N más elementos falsos positivos pero N menos falsos negativos (mientras que tiene los mismos positivos verdaderos), la medida F permanece igual.

En otras palabras, la medida F es adecuada cuando:

  1. los errores son igualmente malos, ya sean falsos positivos o falsos negativos
  2. el número de errores se mide en relación con el número de verdaderos positivos
  3. los verdaderos negativos no son interesantes

El punto 1 puede o no ser cierto, hay variantes ponderadas de la medida F que se pueden usar si esta suposición no es cierta. El punto 2 es bastante natural, ya que podemos esperar que los resultados se escalen si clasificamos más y más puntos. Los números relativos deben permanecer iguales.

El punto 3 es bastante interesante. En muchas aplicaciones, los negativos son el valor predeterminado natural e incluso puede ser difícil o arbitrario especificar lo que realmente cuenta como un verdadero negativo. Por ejemplo, una alarma de incendio está teniendo un evento negativo verdadero cada segundo, cada nanosegundo, cada vez que ha pasado un tiempo de Planck, etc. Incluso un pedazo de roca tiene estos verdaderos eventos negativos de detección de incendios todo el tiempo.

O en un caso de detección de rostros, la mayoría de las veces "correctamente no devuelve" miles de millones de áreas posibles en la imagen, pero esto no es interesante. Los casos interesantes son cuando devuelveuna detección propuesta o cuando debe devolverla.

Por el contrario, la precisión de la clasificación se preocupa igualmente sobre los verdaderos positivos y los verdaderos negativos y es más adecuado si el número total de muestras (eventos de clasificación) está bien definido y es bastante pequeño.

 17
Author: isarandi,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2015-03-31 12:34:52

Las respuestas anteriores están bien explicadas. Esto es solo para una referencia rápida para entender la naturaleza de la media aritmética y la media armónica con parcelas. Como puede ver en la gráfica, considere el eje X y el eje Y como precisión y recuperación, y el eje Z como la puntuación F1. Por lo tanto, desde la gráfica de la media armónica, tanto la precisión como la memoria deben contribuir uniformemente para que la puntuación F1 se eleve a diferencia de la media aritmética.

Esto es para la aritmética significar.

introduzca la descripción de la imagen aquí

Esto es para la media armónica.

introduzca la descripción de la imagen aquí

 7
Author: gadde saikumar,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2018-09-17 09:55:30