Respuesta rápida:El schema markup para búsqueda con IA cumple una función distinta a la del marcado para fragmentos enriquecidos. No empuja una página hacia arriba en una lista ordenada; elimina ambigüedad para el modelo. Un schema eficaz en 2026 hace tres cosas: desambigua tu entidad para que una IA sepa de quién y de qué trata el contenido, estructura las afirmaciones para que se extraigan como hechos autónomos, y refuerza las señales de confianza de autor y editor. Identidad, extraibilidad y confianza — no la elegibilidad para resultados enriquecidos — son lo que ahora justifica el marcado.
Cuando un desarrollador pregunta si el schema markup "todavía importa", la respuesta honesta es que la pregunta está desfasada. El schema importó durante una década por una razón: daba elegibilidad para resultados de búsqueda enriquecidos. Esa recompensa se ha encogido. Google ha retirado discretamente los resultados enriquecidos de FAQ y HowTo para la mayoría de los sitios, y el premio visible por marcar una página es menor cada año.
Mientras tanto apareció una segunda recompensa, y casi nadie rearquitecturó sus datos estructurados para reclamarla. Los motores de respuesta con IA — ChatGPT, Perplexity, las Vistas Generales de IA de Google, Claude — no recorren una lista ordenada. Identifican entidades, extraen afirmaciones y sintetizan respuestas. El schema es una de las entradas más limpias para los tres pasos. Los equipos que ganan citaciones de IA no son los que tienen más marcado. Son aquellos cuyo marcado responde correctamente a tres preguntas de la máquina: ¿quién es esto, qué afirma y puedo confiar en ello?
Los Fragmentos Enriquecidos Eran un Juego de Google. La Citación por IA Es Otro Distinto.
Durante diez años, los datos estructurados tuvieron un único propósito medible: una aparición mejorada en los resultados ordenados de Google. Marcabas una receta para conseguir la ficha con el tiempo de cocción. Marcabas un producto para obtener el precio y la valoración por estrellas. Marcabas una FAQ para conseguir el acordeón desplegable bajo tu listado. El marcado era un medio para un fin visual, y ese fin vivía dentro de la página de resultados de un único buscador.
Ese contrato se ha debilitado por ambos lados. Google ha reducido la elegibilidad para resultados enriquecidos — los de FAQ se limitan ahora a un conjunto estrecho de sitios autorizados de salud y administración pública, y los de HowTo se eliminaron por completo. Al mismo tiempo, una proporción creciente de consultas de marca e informativas nunca llega a una página de resultados. Se responden dentro de una interfaz de IA que cita un puñado de fuentes y sigue adelante.
Este es el cambio de marco que importa. El schema ya no es ante todo una petición de formato a un buscador. Es una capa de legibilidad para máquinas que leen tu página para construir una respuesta. El mismo bloque de JSON-LD sirve ahora a un lector distinto con prioridades distintas. Google preguntaba: ¿eres elegible para este tratamiento visual? Un motor de respuesta pregunta: ¿es este contenido lo bastante inequívoco para citarlo sin equivocarse?
Ese cambio modifica qué marcado merece su lugar. Parte del schema que nunca generó un resultado enriquecido tiene ahora alto valor porque ancla tu entidad. Parte del schema que en su día ganaba un fragmento es ahora ruido. Separar uno de otro exige entender qué leen de verdad estos sistemas.
Qué Leen Realmente los LLM de tu Marcado
Los grandes modelos de lenguaje no ejecutan tus datos estructurados como instrucciones. No ven "aggregateRating": 4.8 y creen obedientemente que tu producto es excelente. Tratar el schema como un canal de órdenes es el error más común, y lleva a los equipos a marcar de más y pensar de menos.
Lo que el schema hace es reducir la ambigüedad. Las páginas en lenguaje natural están llenas de ella: un nombre que podría referirse a tres entidades distintas, una afirmación enterrada en un párrafo que un modelo podría atribuir al sujeto equivocado, una publicación cuya autoría se insinúa pero nunca se declara. Los datos estructurados resuelven estas ambigüedades en afirmaciones explícitas y legibles por máquina. Esa resolución es el valor.
Tres mecanismos hacen el trabajo. El primero es el anclaje de entidad. Un grafo de @id más enlaces sameAs conectan el sujeto de tu página con una identidad canónica que el modelo ya reconoce — un registro de Wikidata, un perfil de LinkedIn, un dominio oficial. El anclaje es lo que permite a un sistema decir con seguridad "esta página trata sobre el Fernando Angulo que trabaja en búsqueda, no sobre otra persona del mismo nombre".
El segundo es la extracción de afirmaciones. Tipos de schema como FAQPage, HowTo, Article y DefinedTerm presentan la información como unidades discretas y autónomas — exactamente la forma que un motor de respuesta quiere tomar y citar. Una afirmación envuelta en un par limpio de pregunta y respuesta es muchísimo más fácil de extraer correctamente que la misma afirmación incrustada a mitad de un párrafo de prosa narrativa.
El tercero es la atribución de confianza. author, publisher, dateModified y las propiedades de credenciales le dicen a un sistema de recuperación quién respalda una afirmación y cuán actual es. Para los sistemas que ponderan la autoridad de la fuente — y los principales lo hacen — estas propiedades alimentan el mismo cálculo de confianza que decide si tu fuente entra en la lista de citación. Por eso el schema de entidad y autor, que trato en mi artículo sobre ingeniería de relevancia, se ha vuelto discretamente más importante que cualquier marcado de resultado enriquecido.
El principio central: El schema no hace tu contenido más autorizado. Lo hace menos ambiguo — lo que aumenta la probabilidad de que un sistema de IA lo identifique correctamente, lo extraiga con limpieza y lo atribuya a la fuente fiable adecuada. Desambiguación, no persuasión, es todo el trabajo.
Los 4 Niveles de Schema para la Citación por IA
No todos los datos estructurados pesan igual en un contexto de búsqueda con IA. El modelo siguiente ordena el schema en cuatro niveles según lo que de verdad aporta a la citación. Trabaja de arriba abajo: una marca con el Nivel 1 y el Nivel 2 sólidos superará a otra con un grafo desbordado y sin jerarquía. El cuarto nivel es el que hay que dejar de publicar.
Nivel 1 — Identidad (los cimientos)
El schema de identidad responde a ¿quién y qué es esto? Es el nivel de mayor apalancamiento porque toda valoración posterior depende de que el modelo resuelva correctamente tu entidad.
Qué publicar: tipos Organization y Person, cada uno con un @id estable reutilizado de forma idéntica en cada página. Añade enlaces sameAs a tus registros externos autorizados — Wikidata primero, luego LinkedIn, Crunchbase, perfiles sociales oficiales. Conecta autor y marca para que el modelo vea un grafo de identidad conectado, no fragmentos aislados. Si tu organización o personas clave tienen ítems en Wikidata, referenciar esos QID mediante sameAs está entre las señales de anclaje más sólidas disponibles.
Nivel 2 — Respuesta (la capa de extracción)
El schema de respuesta contesta ¿qué afirma esta página, en unidades que pueda citar? Aquí es donde haces que tu conocimiento sea extraíble.
Qué publicar: Article con un headline, una description y un about precisos; FAQPage donde las preguntas sean reales y las respuestas se sostengan solas; DefinedTerm para los conceptos que quieras poseer; y una especificación speakable que apunte a tu bloque de resumen más nítido. El objetivo es que cualquier afirmación pueda extraerse sin el párrafo que la rodea como contexto. Si una respuesta solo tiene sentido en su posición original en la página, todavía no es extraíble.
Nivel 3 — Autoridad (la capa de confianza)
El schema de autoridad responde a ¿por qué debería confiar y preferir esta fuente? Rara vez produce un resultado visible, y precisamente por eso la mayoría de los equipos invierte de menos en él.
Qué publicar: un author totalmente especificado con credenciales y un @id de Person enlazado; un publisher claro; valores honestos de datePublished y dateModified mantenidos a medida que cambia el contenido; y propiedades citation o isBasedOn cuando tus afirmaciones se apoyan en investigación documentada. Estas señales corresponden directamente a los juicios de calidad de fuente que hacen los sistemas de recuperación. Fechas obsoletas o ausentes y autoría anónima son descalificadores silenciosos.
Nivel 4 — Ruido (deja de publicar esto)
El ruido es el marcado que consume presupuesto de mantenimiento, añade riesgo y no devuelve nada en un contexto de búsqueda con IA. Qué eliminar o nunca añadir: marcado interesado de aggregateRating y Review que un modelo no tratará como creíble; spam de BreadcrumbList en páginas sin jerarquía real; tipos Product u Offer irrelevantes atornillados a contenido editorial para perseguir un fragmento; y entradas de FAQ saturadas de palabras clave escritas para un rastreador en lugar de para un lector. Cada uno de estos o bien no ayuda o bien activa un filtro de calidad. Más tipos de schema no es una estrategia. Es un pasivo disfrazado de exhaustividad.
El Schema que la Mayoría Publica y la IA Ignora
Aquí viene la parte incómoda, y conviene decirla con claridad porque contradice una década de práctica heredada: una buena parte de los datos estructurados de la mayoría de los sitios empresariales no hace nada por la citación de IA, y una porción es un leve autosabotaje.
El ejemplo más claro es el marcado de reseñas y valoraciones aplicado a las propias páginas de una marca. Siempre fue una jugada de resultado enriquecido, y los motores de respuesta no tienen razón para ingerir la media de cinco estrellas autoinformada de una empresa como un hecho fiable. Marcarla no ayuda; si exagera la realidad respecto a fuentes independientes, añade un pequeño desajuste de confianza que el sistema puede detectar.
El segundo ejemplo es el marcado de migas de pan y navegación en sitios planos o poco profundos. Tenía sentido cuando producía una miga ordenada en un listado de Google. En una página sin jerarquía real, es estructura por la estructura misma — coste de análisis sin valor de extracción.
El matiz honesto: nada de esto significa que debas arrancar el schema mañana. Parte sigue sirviendo a la búsqueda tradicional, a la lógica interna del sitio o a las herramientas de accesibilidad, y esas son razones legítimas para conservarlo. El punto es más estrecho. Cuando decidas dónde invertir tiempo de ingeniería para la visibilidad en IA, el marcado de Nivel 4 no es donde vive el retorno. El retorno vive en hacer bien de verdad el anclaje de identidad del Nivel 1 — algo que la mayoría de los sitios no ha hecho.
Qué Significa Esto para tu Backlog de Desarrollo
Para un desarrollador o un responsable de SEO técnico, la traducción práctica es una repriorización, no una reescritura. El instinto de "añadir más schema" es el instinto equivocado. El movimiento correcto es auditar lo que tienes frente a los cuatro niveles y reasignar.
Empieza por una pregunta que tu marcado actual probablemente no pueda responder: si un sistema de IA aterrizara en tu página más importante, ¿podría identificar sin ambigüedad la entidad que hay detrás y conectarla con un registro externo autorizado? Para la mayoría de los sitios la respuesta es no — hay un bloque de Organization con un nombre y un logo y nada que lo ancle. Arreglar eso es medio día de trabajo con un retorno desproporcionado.
A partir de ahí, la secuencia es directa. Haz que cada afirmación importante sea extraíble mediante el schema de respuesta del Nivel 2 y la estructura de FAQ que los motores de IA citan con más facilidad. Especifica por completo las señales de confianza de autor y editor, y mantén honesto el dateModified. Después audita el Nivel 4 y deja de gastar ciclos de mantenimiento en marcado que no devuelve nada. Las decisiones estructurales que gobiernan la visibilidad en IA se extienden mucho más allá del schema, hasta cómo escribes el propio contenido — pero el schema es la capa donde un cambio pequeño y preciso mueve la aguja más rápido.
La Pregunta Abierta
Los datos estructurados son una de las pocas palancas de visibilidad en IA que un equipo técnico puede accionar por su cuenta, sin una reescritura de contenido ni una pelea de presupuesto. Eso hace tentador tratarlos como una casilla a marcar — valida el JSON-LD, pasa el test, sigue adelante. Los equipos que más se beneficiarán son los que los tratan, en cambio, como una decisión de identidad: una declaración deliberada de quién es la marca, qué afirma y qué registros autorizados la avalan.
Los validadores te dirán que tu schema es correcto. No te dirán si es legible — si un sistema de IA que lo lee sale sabiendo exactamente quién eres y qué afirmas de forma fiable. Ese es el estándar al que merece la pena someter tu marcado.
Así que la pregunta para tu próximo sprint es estrecha y respondible: si un motor de respuesta leyera solo tus datos estructurados, ¿sabría qué entidad eres — y tendría una razón para confiar en ti antes que en el competidor que aparece un párrafo más allá en la misma respuesta generada?
Preguntas frecuentes
No de forma directa, ni como prometían en su día las meta keywords. Los grandes modelos de lenguaje no leen tu JSON-LD como una instrucción de posicionamiento. El schema ayuda de forma indirecta: desambigua de qué entidad trata tu contenido, hace que cada afirmación sea extraíble con limpieza y refuerza las señales de confianza de autor y editor que ponderan los sistemas de recuperación y los motores de respuesta. Piensa en el schema como algo que elimina ambigüedad, no que inyecta autoridad. Aumenta la probabilidad de que tu contenido se entienda correctamente; no fuerza una citación.
Usa ambos, enlazados por un grafo de @id compartido. El schema de Organization establece la marca como entidad; el de Person establece al autor o experto detrás del contenido. La clave es la coherencia: el mismo @id para la misma entidad en cada página, con enlaces sameAs a perfiles externos autorizados como Wikidata, LinkedIn y Crunchbase. Una entidad única, canónica y referenciada de forma coherente es mucho más legible para un sistema de IA que una marca cuya identidad se insinúa de forma distinta en cada página.
Sí, pero por un motivo distinto al de 2020. Google redujo los resultados enriquecidos de FAQ en la búsqueda estándar, lo que llevó a algunos equipos a abandonar el marcado. Para los motores de respuesta con IA, el FAQPage schema sigue siendo valioso porque presenta el contenido en la forma exacta que estos sistemas prefieren extraer: una pregunta concreta acompañada de una respuesta autónoma. El valor ahora es la legibilidad para la extracción, no un fragmento enriquecido. Consérvalo donde las preguntas sean reales y las respuestas se sostengan por sí solas — un punto que desarrollo en el artículo sobre la FAQ como activo de GEO.
Usa JSON-LD. Es el formato que recomienda Google, el más limpio de interpretar para una máquina y mantiene los datos estructurados separados del marcado visible, lo que reduce errores. Los microdatos y RDFa siguen validando, pero entrelazan estructura y presentación y son más frágiles de mantener. Para implementaciones nuevas no hay ninguna razón práctica para elegir algo distinto de JSON-LD.
La propiedad sameAs conecta tu entidad con sus registros canónicos en otros lugares: Wikidata, Wikipedia, LinkedIn, perfiles sociales oficiales. Esto es anclaje de entidad: le dice a un sistema de IA que la entidad de esta página es la misma entidad documentada que ya conoce por bases de conocimiento autorizadas. Sin anclaje, un modelo puede confundir tu entidad con otra de nombre parecido o no conectar tu contenido con una identidad establecida. Un QID de Wikidata referenciado mediante sameAs es una de las señales de anclaje más sólidas disponibles.
Puede. El schema que tergiversa el contenido de la página, marca información invisible o inventada, o satura con tipos irrelevantes es un riesgo para la confianza. Los buscadores ya penalizan los datos estructurados de spam, y las mismas señales de baja calidad que erosionan la confianza en búsqueda erosionan la autoridad de fuente de la que dependen los sistemas de IA. Más marcado no es mejor. Un schema preciso, mínimo y acorde al contenido supera a un grafo desbordado de tipos que no reflejan lo que de verdad hay en la página.
FA
¿Tu estrategia está lista para la IA?
Ayudo a empresas globales a navegar la transición de la búsqueda tradicional a la era generativa.