Microdatos, RDFa o JSON-LD Uso apropiado o mejor?


Me he estado preguntando cuál de esos formatos es "mejor"? Schema.org, Microdatos y RDFa son un poco difíciles de implementar. Pueden romper la validación y requieren un gran esfuerzo para poner en los documentos.

JSON-LD es, por fin para mí, una manera mejor de implementar datos estructurados. Pero ¿funciona? ¿Qué nivel de soporte existe para ello (al menos por parte de Google)?

Author: SunSparc, 2014-11-13

6 answers

Schema.org es un vocabulario que puede, como cualquier otro vocabulario, ser utilizado en muchas formas. El sitio web http://schema.org/tiene ejemplos usando Microdatosy las sintaxis RDF RDFay JSON-LD, pero estas no son las únicas sintaxis con las que se puede usar. Podría, por ejemplo, usarlo con cualquier otra sintaxis RDF como Turtle o RDF/XML .

No existe una sintaxis best. Todos tienen ventajas y desventajas. Ver por ejemplo mi respuesta sobre diferencias entre Microdatos y RDFa. Tenga en cuenta que puede usar diferentes sintaxis (y vocabularios) en el mismo documento.

Ahora, si tiene un consumidor específico en mente, debe consultar su documentación. Sin embargo, el soporte de sintaxis viene y va, y no todo lo que podrían soportar está necesariamente documentado, y no todo lo que está documentado necesariamente funciona.

En el caso de Google, probablemente esté interesado en sus Fragmentos enriquecidos. Su documentación sobre Rich Snippets menciona Microdatos, Microformatos y RDFa. Sin embargo, tenga en cuenta que no todos los ejemplos Schema.org vocabulario, pero los mayores Data-vocabulary.org o microformatos (ya que no puedes usar vocabularios como Schema.org nor Data-vocabulary.org con Microformatos). Y también hay algunos fragmentos enriquecidos que no aparecen en esa página, como el Cuadro de búsqueda Enlaces de sitio, para los que incluso recomiendan el JSON-LD sintaxis.

Como consejo general: Los motores de búsqueda suelen favorecer el contenido visible sobre los metadatos ocultos. Por ejemplo, tener palabras clave como metadatos ocultos permite fácilmente a los autores afirmar que sus documentos son sobre algo diferente de lo que realmente son (ya sea porque intentan engañar al motor de búsqueda, o porque los autores olvidan actualizar el contenido en ambos lugares). Por lo tanto, desacoplar los metadatos del contenido, como es el caso con JSON-LD, podría (posiblemente!) conducen a los mismos problemas que los motores de búsqueda actuales tienen con los metadatos ocultos. (Si o qué motores de búsqueda realmente lo manejan así es una pregunta que está fuera de tema en el Desbordamiento de pila.)

Otra posible ventaja para acoplar los metadatos con el contenido (por ejemplo, con RDFa), es que se podría generar fácilmente y automáticamente la misma información en JSON-LD, Turtle, etc. porque todo es RDF. Basta con analizar el RDFa, convertir a formatos de su preferencia, e incrustar (en script) o enlace (con rel-alternate) si tiene sentido.

Pero sí, agregar RDFa a menudo es más complejo que agregar un blob JSON-LD, porque tiene que adaptarlo al marcado existente. (Sin embargo, no debe "romper la validación" a menos que estés cometiendo errores.)

 47
Author: unor,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 12:26:43

Las líneas entre Microdatos, RDFa , y JSON-LD son actualmente muy borrosos y que todavía no hay ampliamente aceptado de facto entre los tres. Esto tendrá que esperar por ahora. Tal vez un par o más años.

Mientras tanto, los microdatos no deben etiquetarse con Schema.org como mencionaste porque esas dos son cosas diferentes. Schema.org es un vocabulario por lo que puede ser utilizado para Microdatos, RDFa, y JSON-LD.

Usando Schema.org como el vocabulario y usar JSON-LD como la representación de datos {[8] } es probablemente el par más esperado debido a dos aspectos comunes sobre ellos:

  1. Fácil de leer para los seres humanos; y
  2. Ligero legible por máquina

Pero aún así todavía hay desconexiones entre los dos como este ejemplo.

Respecto al soporte JSON-LD, desde Bing, Google, Yahoo! Yandex reconoce la uso de schema.org entonces quizás es seguro decir que también lo están apoyando como en este ejemplo.

Actualización de 2017

Google ha sido muy proactivo en la promoción JSON-LD-schema.org estos últimos dos o tres años.

 16
Author: Abel Callejo,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-07-04 03:47:27

Parece que Google se está inclinando hacia el uso de JSON-LD, pero no lo ha implementado para cada caso de uso!

Google está en el proceso de agregar soporte JSON-LD a más características de marcado. Hasta ahora, JSON-LD es compatible con todos Funciones de Knowledge Graph, cuadros de búsqueda de enlaces de sitio, Fragmentos Enriquecidos de eventos, y Fragmentos ricos de recetas; Google recomienda el uso de JSON-LD para esas características. Para los demás tipos de fragmentos enriquecidos y migas de pan, Google recomienda el uso de microdatos o RDFa.

Http://developers.google.com/structured-data/schema-org

 9
Author: JeroenVdb,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2015-10-06 10:23:10

Google utiliza JSON-LD como ejemplos de referencia para el SEO de Datos Estructurados para su Knowledge Graph (empresas y personas). Véase https://developers.google.com/structured-data/customize/overview

Yo personalmente uso una combinación de JSON-LD y Microdatos para mis sitios (por el momento).

Yo diría que tienen otros medios para identificar si la información que proporcionas a través de JSON-LD es relevante para su motor de búsqueda (como revisar tu página en realidad está hablando de lo que se dice que hablar).

 6
Author: Arnaud Leyder,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2015-05-05 15:03:41

(¡actualizando respuestas!)

Acerca de la "popularidad", por favor vea esta pregunta/respuestas.

Los microdatos hoy en día son los más populares: en un universo de 34 millones de dominios, 5,63 millones (~17%) usan "content markup" (usaré la jerga markup) por RDFa (0,9 millones), Microdatos (2,5 millones) o Microformatos, y menos de la mitad usan descriptores semánticos separados, notando los más populares como JSON-LD, con 2,12 millones (6%).
PD: preferimos "estadísticas por dominio" (en lugar de estadísticas por página) porque las páginas en el mismo dominio en general tienen las mismas plantillas y otras disposiciones de la convención de la autoridad local.

En un universo de "dominios que expresan semántica" (7,75 millones) el perfil estadístico es:

  • 73% de marcado semántico
  • 27% separados semánticos
  • (... intersección como mezcla "separado + marcado" puede ser cero para simplificar...)

Regla general en 2017

Use marcado semántico con Microdatos y, después de esto , si necesita expresar algo más a las máquinas, use JSON-LD.


Use marcado semántico porque es el más popular, y porque marcado contento será verificable/auditable simultáneamente por humanos y máquinas.

Importante: recuerde que los microdatos, RDFa (un estándar W3C) y JSON-LD (un estándar W3C) se pueden traducir (fácilmente) a RDF, por lo que todos estos formatos son compatibles.


PS: para tablas HTML ver también tabla-metadatos del W3C. Para recursos abiertos no HTML, como archivos CSV , use el modelo de datos tabulares del W3C compatible con RDF y/o frictionlessdata/specs.

 4
Author: Peter Krauss,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 11:55:19

Desde cero, JSON-LD sería el camino a seguir. Vamos a dejar uno de los principales creadores de JSON-LD , Manu Sporny, opinar:

El deseo de mejores API web es lo que motivó la creación de JSON-LD, no la Web Semántica. Si quieres hacer de la Web Semántica un la realidad, dejar de hacer el caso de que y pasar su tiempo haciendo algo más útil, como hacer máquinas más inteligentes o ayudar a las personas a publicar datos de una manera que sea útil para ellos.

JSON-LD se trata de publicar los datos de maneras que son útiles/fáciles de implementar porque...

Se basa en la tecnología que la mayoría de los desarrolladores web utilizan hoy en día.

 0
Author: Mac,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2018-01-29 14:41:14