Cómo obtener HTML de un hermoso objeto soup


Tengo la siguiente lista de objetos bs4:

>>> listing
<div class="listingHeader">
<h2>
....


>>> type(listing)
<class 'bs4.element.Tag'>

Quiero extraer el html sin procesar como una cadena. He intentado:

>>> a = listing.contents
>>> type(a)
<type 'list'>

Así que esto no funciona. ¿Cómo puedo hacer esto?

Author: alecxe, 2014-09-08

1 answers

Simplemente obtenga la representación de cadena :

html_content = str(listing)

Esta es una versión no embellecida.

Si desea una engalanada, usa prettify() método:

html_content = listing.prettify()
 58
Author: alecxe,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2014-09-08 17:16:49