Advertencia: no entero #éxitos en un glm binomial! (paquetes de encuestas)


Estoy usando el paquete twang para crear puntuaciones de propensión, que se utilizan como pesos en un glm binomial usando survey::svyglm. El código se ve algo como esto:

pscore <- ps(ppci ~ var1+var2+.........., data=dt....)

dt$w <- get.weights(pscore, stop.method="es.mean")

design.ps <- svydesign(ids=~1, weights=~w, data=dt,)

glm1 <- svyglm(m30 ~ ppci, design=design.ps,family=binomial)

Esto produce la siguiente advertencia:

Warning message:
   In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!

¿Alguien sabe lo que podría estar haciendo mal ?

No estaba seguro de si este mensaje sería mejor en stats.SE, pero en general, pensé que lo intentaría aquí primero.

 30
Author: Robert Long, 2012-10-18

3 answers

No hay nada malo, glm es solo exigente cuando se trata de especificar modelos binomiales (y Poisson). Advierte si detecta que el no. de ensayos o éxitos no es integral, pero sigue adelante y se ajusta al modelo de todos modos. Si desea suprimir la advertencia (y está seguro de que no es un problema), use family=quasibinomial en su lugar.

 42
Author: Hong Ooi,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2012-10-18 12:00:53

No hay nada malo, computacionalmente, pero estadísticamente puede que no estés haciendo algo que tenga mucho sentido. En tal caso, probablemente sea mejor usar un método de regresión robusto, que generalmente es una buena idea para los datos de respuesta proporcional si sus datos incluyen unidades con exactamente 1 o exactamente 0.

 6
Author: HaberdashPI,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2016-12-05 01:43:21

Lo sentimos, pero es más robusto en el sentido de que si el mecanismo subyacente es un modelo binomial sobredispersado, el binomio sobredispersado lo explicará al estimar el erorr estándar. Por lo tanto, obtendrá una mejor cobertura, a pesar de que las estimaciones de puntos son las mismas.

 0
Author: user2809432,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-06-01 19:09:32