TagSoup vs Jsoup vs Analizador de HTML vs HotSax vs [cerrado]
La abundancia de analizadores HTML para elegir (y seguir con) es alucinante:
Http://java-source.net/open-source/html-parsers
¿Cómo elijo uno que mejor se adapte a los siguientes requisitos:
- Maduro (menos errores que el resto)
- Vivir y respirar (es decir, ser mantenido)
- Rápido y eficiente en el uso de los recursos (destinado a ejecutarse en Android)
Basado en su experiencia, qué analizador HTML recomendaría (para cumplir con los requisitos anteriores) y por qué?
39
Author: Regex Rookie, 2011-03-03
1 answers
Bueno, encontré la respuesta, que fue dada por @BalusC en un hilo diferente :
- Si solo desea utilizar un XML basado herramienta para recorrerlo: JTidy.
- Si desea probar unitariamente el HTML: HtmlUnit
- Si desea extraer datos específicos desde el HTML: Jsoup
Gracias @BalusC.
38
Author: Regex Rookie,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 11:33:26
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 11:33:26