¿Se ha convertido ya el archivo LLMs.txt en una promesa ilusoria en materia de SEO antes incluso de su adopción ?

SEO
Homme d'affaires entouré d'icônes marketing numérique et analytics

Con el auge de las inteligencias artificiales generativas, ha surgido de forma natural una pregunta: ¿cómo podemos hacer que las IA lean y comprendan mejor el contenido de los sitios web? En este contexto nació el archivo LLMs.txt.

Aunque se presenta como el equivalente al robots.txt para los modelos de lenguaje, este estándar propuesto suscita, sin embargo, más escepticismo que entusiasmo. El propio John Mueller, figura de referencia en Google, lo ha comparado con la etiqueta meta keywords, una reliquia del SEO que lleva años siendo ignorada.

¿Pero se trata de un gran avance para tu visibilidad o simplemente de un error más en materia de metadatos?

Para aclarar este debate que agita el ámbito del SEO, analizaremos en primer lugar la naturaleza técnica del archivo LLMs.txt y las expectativas que rodearon su creación.

¿Qué es exactamente el archivo LLMs.txt ?

Se trata, básicamente, de un archivo Markdown ubicado en el directorio raíz de tu dominio. Mientras que el archivo robots.txt indica a los robots las zonas prohibidas, el llms.txt los guía hacia tu contenido más relevante.

Ofrece una descripción clara y detallada de la arquitectura de tu sitio web.

El principio es sencillo: ofrecer una versión simplificada del contenido, normalmente en formato Markdown, sin navegación, sin publicidad y sin elementos superfluos.

Lo que no es:

  • No es un archivo robots.txt: no bloquea el acceso de los rastreadores.
  • No se trata de un estándar oficial reconocido por el sector.
  • No es una etiqueta HTML, sino un archivo de texto ubicado en el directorio raíz del sitio web.

La intención inicial es loable. Pero la intención no basta si nadie lee el archivo.

¿Por qué se creó el modelo LLMs.txt para la era de la IA ?

La aparición de este formato responde a unas necesidades técnicas concretas para facilitar la comunicación entre tu sitio web y los algoritmos de última generación. Estos son los pilares que justifican la existencia de este archivo:

1. Optimización de la ventana de contexto: la memoria de las IA es limitada. Un texto limpio y estructurado permite maximizar el espacio disponible para el procesamiento de datos.

2. Reducción de los errores de interpretación: al proporcionar directamente los datos esenciales, se reduce el riesgo de que se produzcan errores y se mejora la precisión de las respuestas generadas.

3. Exploración simplificada: este archivo ofrece acceso directo al contenido. De este modo, las IA ya no tienen que descifrar arquitecturas de JavaScript que, en ocasiones, resultan demasiado complejas.

4. La optimización para motores de búsqueda (GEO): es una herramienta estratégica para la Generative Engine Optimization. Aumenta tus posibilidades de aparecer como fuente fiable en las respuestas de la IA.

¿Por qué Google se muestra tan escéptico respecto a la utilidad real del archivo LLMs.txt ?

La incertidumbre no surge por casualidad, sino que proviene directamente de las propias instancias de Google. Durante un debate en Reddit, una observación llamó la atención de la comunidad SEO. 

Un administrador web se dio cuenta de que su archivo nunca aparecía en los registros del servidor. En concreto, ningún agente de inteligencia artificial lo consultaba.

John Mueller, portavoz de Google, lo ha dejado claro con una analogía histórica. Compara este nuevo archivo con la desaparecida etiqueta meta keywords. Según él, se trata simplemente de lo que el propietario afirma que es el tema de su sitio web. 

Esta declaración destaca tres deficiencias importantes que impiden la adopción de este modelo:

  • La imposibilidad de verificar la información: el archivo es meramente informativo y se basa únicamente en la buena fe del sitio web.
  • La falta de adopción por parte de los gigantes de la IA: ni ChatGPT, ni Gemini, ni Claude parecen utilizar este archivo para navegar.
  • El riesgo de manipulación mediante cloaking: un sitio web podría hacer trampa mostrando un contenido optimizado para las IA y otro diferente para los usuarios.

La comparación con las meta keywords es una señal de alarma para los expertos. Esta etiqueta fue eliminada porque permitía manipular fácilmente los resultados. 

El archivo llms.txt adolece exactamente del mismo defecto estructural. A falta de pruebas fehacientes, Google prefiere ignorar esta señal y dar prioridad a sus propios algoritmos.

¿Cuál es la situación actual de la adopción del archivo LLMs.txt ?

A pesar del revuelo mediático, las cifras muestran una realidad contrastada. La adopción varía enormemente en función del grado de madurez tecnológica de los sectores de actividad. 

A continuación se ofrece un resumen de las tendencias observadas sobre el terreno:

Indicador de usoNivel de adopciónPerfiles de interés
Alta tasa de adopciónGran dinamismoTécnicas de documentación, API, startups centradas en la IA
Baja adopciónPrácticamente inexistenteSitios web de noticias, pymes locales, blogs personales
Actividad de los botsEn aumentoOpenAI y Claude empiezan a analizar estos archivos
Apoyo oficialNuloNingún motor de búsqueda (Google, Bing) lo considera un criterio de SEO

No consideres este archivo como una herramienta para mejorar el posicionamiento, sino como un detalle técnico. No mejora tu SEO, pero allana el camino para el día en que las IA se conviertan en los principales navegadores de la web.

¿Deberías realmente incorporar el archivo LLMs.txt en tu estrategia actual de SEO ?

No abandones todavía tu estrategia principal de SEO por este archivo experimental.

El método más eficaz para prepararse para la IA sigue siendo el uso de datos estructurados (Schema.org).

Las IA destacan en la lectura de JSON-LD, que ya es un estándar web mundial. Sin embargo, si tu sitio web contiene mucha documentación, un archivo llms.txt puede ofrecerte una ligera ventaja.

 Preguntas frecuentes: Tus dudas sobre el archivo LLMs.txt

¿El archivo LLMs.txt es perjudicial para mi SEO ?

No directamente. Crear un archivo LLMs.txt en tu sitio web no va a provocar una penalización de Google de la noche a la mañana.

Por el contrario, existen dos riesgos indirectos:

  • Si el contenido de tu archivo difiere del de tus páginas reales, estarás incurriendo en una práctica de cloaking, lo cual está penalizado.
  • Puedes perder tiempo y recursos en una práctica que no ofrece un retorno de la inversión cuantificable, tiempo que podrías haber dedicado a optimizaciones realmente eficaces.

 ¿Es posible que IA como ChatGPT o Gemini realmente ignoren este archivo ?

Sí, y ahí radica precisamente el quid de la cuestión.

Los grandes modelos de lenguaje no rastrean la web en tiempo real de la misma manera que los motores de búsqueda. ChatGPT (OpenAI), Gemini (Google), Claude (Anthropic) o Perplexity cuentan con sus propios mecanismos de indexación, entrenamiento y recuperación de datos.

Ninguno de ellos ha publicado documentación que indique que lean o tengan en cuenta el archivo LLMs.txt. La ausencia total de este archivo en los registros del servidor de muchos sitios web es la prueba más clara de ello.

 ¿Podría el archivo LLMs.txt evolucionar y convertirse en un estándar reconocido ?

Es posible, pero no hay garantías, y la historia del SEO invita a la prudencia.

Han surgido numerosas iniciativas con buenas intenciones que nunca han llegado a implantarse a gran escala. Para que LLMs.txt se convierta en un estándar, sería necesario:

  • Una adopción oficial por parte de al menos un actor importante (OpenAI, Google, Anthropic).
  • Una especificación técnica clara y pública.
  • Mecanismos de control para evitar abusos.

Por el momento, no se cumple ninguno de estos tres criterios. Es mejor estar atentos a la evolución sin invertir recursos en ello.

¿Cómo puedo saber si hay bots de IA rastreando mi sitio web en este momento ?

El método más fiable sigue siendo el análisis de los registros del servidor.

Cada visita de un bot deja un rastro: dirección IP, agente de usuario, URL solicitada y hora. Al filtrar estos datos, puedes identificar con precisión qué agentes de IA visitan tu sitio web, con qué frecuencia y qué páginas consultan.

Estos son los user-agents a los que hay que prestar atención:

  • GPTBot (OpenAI)
  • ClaudeBot (Anthropic)
  • Google-Extended (Google)
  • PerplexityBot (Perplexity)
  • Applebot-Extended (Apple)

Herramientas como Screaming Frog, Semrush o tu solución de análisis del lado del servidor pueden ayudarte a extraer y filtrar estos datos.

 ¿Hay que bloquear los bots de IA en el archivo robots.txt ?

Es una decisión estratégica que depende de tus objetivos.

Motivos para bloquear:

  • Protege tu contenido para que no se utilice para entrenar modelos de IA sin tu consentimiento.
  • Evitar la sobrecarga del servidor si los bots realizan un rastreo masivo.

Argumentos en contra:

  • Bloquear ciertos bots puede reducir tu visibilidad en las respuestas de las IA (AEO, GEO).
  • La visibilidad en herramientas como Perplexity o ChatGPT se está convirtiendo en un canal de captación por derecho propio.

No hay una respuesta válida para todos los casos. Todo depende de si ves la IA como una amenaza o como una herramienta para ganar visibilidad.

¿Qué es GEO y tiene algo que ver con LLMs.txt ?

El GEO (Generative Engine Optimization) hace referencia al conjunto de prácticas destinadas a optimizar la visibilidad de un sitio web en los resultados generados por la inteligencia artificial, de la misma forma que el SEO se centra en Google.

LLMs.txt se presentó como una herramienta potencial para el GEO. Sin embargo, dado que los agentes de IA no lo leen, no resulta (por el momento) relevante en una estrategia GEO.

Los verdaderos factores clave de GEO en la actualidad son:

  • La calidad y la credibilidad del contenido;
  • Los datos estructurados;
  • La presencia en fuentes citadas por las IA (Wikipedia, prensa, foros especializados);
  • Un contenido objetivo, bien estructurado y fácil de resumir.

Alexandre MAROTEL

Alexandre MAROTEL

Fundador de la agencia SEO Twaino, Alexandre Marotel es un apasionado del SEO y la generación de tráfico en internet. Es autor de numerosas publicaciones y tiene un canal de YouTube destinado a ayudar a los emprendedores a crear sus sitios web y mejorar su posicionamiento en Google.

Twaino Agence SEO

Aumenta tu facturación gracias al SEO con la agencia Twaino

¿Necesitas un experto SEO?

Twaino te acompaña en tu estrategia de posicionamiento.

Reservar una llamada
📅 Reservar 15 min con un experto SEO / GEO