Indexación

Laindexación en SEO se refiere al procedimiento por el que un motor de búsqueda enumera, almacena y ordena las páginas de un sitio web para que se muestren rápidamente en cuanto un usuario lanza una búsqueda. Es un paso esencial en la referenciación natural sin el cual un sitio web no puede aparecer en los resultados de un motor de búsqueda

Los motores de búsqueda como Google o Bing son capaces de ofrecer miles de respuestas a una consulta en apenas una fracción de segundo. Pero detrás de esta velocidad de procesamiento, hay muchos pasos, incluyendoindexación

¿Qué es la indexación?

  • ¿Qué es la indexación?
  • ¿Qué importancia tiene para SEO ?
  • ¿Y cómo se facilita la indexación de un sitio?

Descubra la respuesta a todas estas preguntas y más en esta miniguía dedicada a la indexación

¡Empecemos!

Capítulo 1: Indexación – Cómo funciona y por qué es importante para el SEO

Antes de abrumarle con términos técnicos, vale la pena discutir cómo funciona este concepto para evitar la ambigüedad en el resto de la guía

1.1) ¿Cómo funciona la indexación?

Cuando se crea un sitio web o se añade una página a un sitio, no son accesibles automáticamente para los motores de búsqueda. Los motores tienen que pasar por una serie de pasos antes de poder encontrarlos

Y para llegar a estas páginas, los motores de búsqueda enviarán lo que se llama en SEOllamado orugas. Como su nombre indica, un rastreador explora los sitios web trazando una ruta basada en enlaces internos y enlaces externos

A través de estos enlaces, el rastreador «viajará» entre las páginas de un sitio o de un sitio a otro

Durante este viaje de exploración, el robot recogerá información, la ordenará y la almacenará en una base de datos: es la etapa de indexación. Esta base de datos se llama Índice »

Una vez lanzada una consulta, los motores de búsqueda recurrirán a la información almacenada en el índice para proponer respuestas basadas en las palabras clave introducidas por el usuario en su consulta.

Sin esta etapa de indexación, ninguna página de un sitio web puede aparecer en los resultados del motor de búsqueda tras una búsqueda. Es un paso esencial en la referenciación natural, pero no suficiente, para clasificar bien una página en motores de búsqueda

Esto significa que para clasificar bien en Google o en cualquier otro motor de búsqueda, es necesario cumplir con otros criterios de clasificación después de la etapa de indexación de la página

Así, cuando un internauta lanza una consulta en Google o Bing, por ejemplo, no lanza su búsqueda directamente en la web, sino en el índice de los motores

Si la búsqueda está relacionada con su tema, su página no tendrá ninguna posibilidad de presentarse al internauta si no ha sido previamente explorada e indexada

Además, hay que decir que los motores de búsqueda no siempre indexan todas las páginas disponibles en la web. A veces, debido a la mala calidad del contenido o a las malas prácticas de SEO, algunas páginas de un sitio pueden no ser indexadas

Volveremos sobre los factores que pueden impedir que una página sea indexada con más detalle en un capítulo posterior

Pero en cuanto el internauta lanza su petición, ¿qué ocurre realmente entre el tiempo que separa su petición y la respuesta del buscador?

Pues bien, el motor de búsqueda

  • Analizar la consulta del usuario para comprender su intención de búsqueda;
  • Busque en su índice y filtre la información según la intención del usuario;
  • Selecciona todas las páginas consideradas relevantes para la consulta en función de varios criterios de clasificación ;
  • A continuación, muestre estas páginas al usuario por orden de relevancia

Mientras que algunos sitios actualizan regularmente sus páginas, otros se vuelven obsoletos

Por lo tanto, cada día se crean nuevas páginas que aportan información nueva y más relevante que el contenido antiguo

Ante este continuo cambio de información, para seguir siendo eficiente robots de indexación se ven obligados a volver a visitar regularmente los sitios que ya han sido indexados

votre expert SEO

La frecuencia de las visitas de un oruga en un sitio depende de varios factores que definen la Presupuesto de arrastre del sitio

1.2) ¿Cómo funciona la indexación con Google?

Como se ha explicado anteriormente, Google también trabaja de la misma manera para indexar sus páginas web. Lo que hay que precisar es que para explorar la web e indexar las páginas disponibles, Google utiliza su robot de indexación llamado Googlebot

Si durante el rastreo, Googlebot se encuentra con una página optimizada para la indexación, el robot puede intentar comprender el tema que trata

Puede tratarse de una página recién creada o de una página antigua, siempre que cumpla los criterios de optimización de la indexación

Para iniciar el proceso de indexación, Googlebot analizará el contenido de la página, catalogará los elementos visuales insertados y cualquier otro dato disponible que le ayude a comprender el propósito de la página

Toda la información recopilada se clasificará por temas y se almacenará en el índice de Google

El índice de Google es una vasta base de datos que contiene varios cientos de miles de millones de páginas. El propio motor de búsqueda estima el tamaño de su índice en más de 100 millones de gigabytes

Veamos ahora la importancia de la indexación para el SEO de su sitio web.

1.3. ¿Qué importancia tiene la indexación para el SEO?

Cuando explicamos cómo los motores de búsqueda indexan las páginas web, mencionamos la primera importancia de la indexación para el SEO de su sitio web

Ya sabe que sin la fase de almacenamiento en el índice web, las páginas de su sitio no pueden ser visibles para los internautas en la página de resultados de un motor de búsqueda

Y eso no es todo, cuando el Googlebot visita su sitio, puede detectar malware, problemas técnicos o contenido de baja calidad

En otras palabras, puede tomar el índice de Google como una fuente fiable. Si algunas de sus páginas aparecen allí, es una prueba de que estas páginas son lo suficientemente «saludables» y relevantes como para ser presentadas a los usuarios de Internet

Sin embargo, recuerde que Google también tiene un índice secundario donde almacena las páginas de menor calidad. Estos incluyen páginas duplicadas o páginas consideradas «menos relevantes» por el motor de búsqueda

Normalmente, Google no muestra las páginas del índice secundario en sus resultados, porque no da la misma importancia a todas las páginas. Lo ideal es que sus páginas web estén clasificadas en el índice principal

Pero, ¿por qué algunas páginas no son indexadas por los motores de búsqueda? Hablaremos de esto en el próximo capítulo

Capítulo 2: Factores que impiden que una página sea indexada

Antes de entrar en los factores que podrían bloquear la indexación de sus páginas, esto es lo que enfrentará si realmente sucede

2.1. Las consecuencias de los problemas de indexación

La naturaleza y los problemas que afectan a la indexación de una página varían en cuanto a su impacto en el sitio

Si es una página menos importante para el propietario la que se ve afectada, ciertamente no es el fin del mundo

Pero si, por el contrario, es una página importante con un contenido altamente optimizado la que se ve afectada, es una pena y todos los esfuerzos de SEO se van por el desagüe.

Si se trata de una tienda de comercio electrónico, las consecuencias serán aún más graves. Está claro que para estos sitios de comercio electrónico, el tráfico orgánico es más rentable a largo plazo que los anuncios o las campañas de PPC

Imagínese que una buena parte del hojas de producto de las fichas de los productos de la empresa no son indexado por Google. Los consumidores no los verán y la tienda verá su tasa de conversión la tasa de conversión disminuirá considerablemente

Ahora veamos los factores reales:

2.2. 10 razones comunes por las que Google no indexa todos los enlaces

Es cierto que hemos definido el índice como la base de datos del motor, pero los rastreadores siguen siendo muy selectivos y no almacenan todo en su camino

Hay razones comunes por las que los motores de búsqueda no indexan todos los enlaces

2.2.1. Páginas que devuelven códigos de respuesta distintos de 200

Puede que no lo sepa, pero si las páginas de su sitio no devuelven el código de respuesta 200, no hay ninguna posibilidad de que sean indexadas, o de que sigan siéndolo si lo han sido

El código 200 (OK) indica una respuesta positiva del servidor tras una solicitud de acceso a una página

Por razones de redirecciones uRLs, el acceso a una página puede devolver errores 404 o 500 y hasta que no se elimine el error, los motores de búsqueda no indexarán la página

Puede comprobar el estado de sus páginas importantes en HTTPStatus.io. Sólo hay que introducir la URL de la página y la herramienta muestra el estado de la misma

Si encuentra páginas con el código 404, le invito a consultar mi artículo Error 404: ¿Por qué y cómo corregirlo eficazmente?

2.2.2. La indexación también puede ser bloqueada por el archivo Robots.txt

Puede invertir la misma cantidad de atención en la redacción de todos sus contenidos, pero probablemente haya algunas páginas que sean más interesantes para su negocio que otras

Aunque el reto de los motores de búsqueda es ofrecer páginas relevantes a los internautas, ¿qué interés tendría que dieran prioridad a páginas que no son necesariamente prioritarias para usted?

Por eso, los motores de búsqueda dan a los propietarios de los sitios web la posibilidad de indicar qué contenidos quieren que se indexen activamente

El archivo Robots.txt se encuentra en la raíz de su sitio y se utiliza para hacer recomendaciones de indexación a los motores de búsqueda. Así pues, si una de sus páginas no está en el índice de Google, lo primero que debe hacer es consultar el archivo Robot.txt

Si se trata de una página que ya está indexada por el motor de búsqueda, recibirá un mensaje que le notificará que la página ya no está disponible y que el problema proviene del archivo Robots.txt:

Fuente Kern Media

Ver mi artículo sobre el archivo Robots.txt para saber cómo optimizar su archivo Robots.txt y eliminar dichos errores.

2.2.3. La etiqueta Meta Robots con el valor «Noindex

Otra de las razones más comunes por las que un sitio web puede acabar sin ser indexado por Google es la presencia de la etiqueta Meta Robots en la parte del código fuente de la página

Si esta etiqueta está configurada como «noindex», es un mensaje a Google para que no indexe la página en cuestión. Y efectivamente, Google no indexará la página hasta que se cambie el valor

Para comprobar el valor del etiqueta Meta Robots en una página, haga clic con el botón derecho del ratón en la página y pulse «Inspeccionar elemento» para acceder directamente al código fuente

Para ir rápido, puede combinar las teclas » Ctrl + Upara acceder al código fuente

Una vez en el código, sustituya el valor del parámetro «content» por el que más le convenga. Descubra más sobre la sintaxis de la etiqueta y los diferentes valores posibles a asignar en este artículo, que define el etiqueta Meta Robots.

2.2.4. La etiqueta X-Robots con el valor «Noindex

Esta etiqueta funciona un poco como los Meta Robots. También permite controlar la forma en que Google indexa una página. Pero hay que decir que la etiqueta X-Robots se encuentra más bien en la cabecera de respuesta de las páginas web o de ciertos documentos

Suelen ser páginas no HTML sin la sección como PDF, DOC, etc

A menos que haya añadido intencionadamente «noindex» a la etiqueta X-Robots, es muy raro que esto ocurra por accidente. En cualquier caso, compruebe también esta eventualidad para asegurarse de que no es la etiqueta X-Robots la que impide que su página sea indexada

Para ello, puede utilizar la extensión de Chrome Herramientas del sitio SEO :

Fuente Kern Media

2.2.5. Contenido duplicado en el sitio

El contenido duplicado en el mismo sitio son muy perjudiciales para la referenciación en general. Un contenido parcial o totalmente duplicado en otra página del mismo sitio puede impedir que las otras sean indexadas por los motores de búsqueda

Por lo tanto, si observa contenido duplicado en su sitio, puede ser la raíz de su problema de indexación. Si el número de copias es elevado, incluso la página original bajará de categoría en las SERPs de Google

Para saber si tiene contenido duplicado en su sitio, puede utilizar la herramienta Siteliner para rastrear rápidamente el sitio y recuperar las URL de las páginas duplicadas

Es bastante sencillo de utilizar, sólo tiene que introducir el nombre del dominio del sitio y la herramienta le proporcionará un gráfico con el porcentaje de contenido duplicado.

Google se muestra bastante firme con el contenido duplicado y tolera algunos pequeños pasajes que puedan repetirse

Así que, hasta cierto punto, es muy posible que las páginas con un contenido similar en su sitio puedan ser indexadas y clasificadas en Google

Pero si se trata de un gran volumen de contenido copiado y pegado íntegramente en otras páginas, es probable que Google penalice estas páginas e incluso las elimine de su índice

2.2.6. Contenido duplicado fuera del sitio

Incluso si tiene cuidado con el contenido duplicado en su sitio, el contenido duplicado de fuera de su sitio, es decir, de otros sitios, puede llegar a usted

Una gran cantidad de contenido duplicado de su sitio en varios otros sitios también se vería mal para el motor de búsqueda

Independientemente de su sector o del tipo de sitio que tenga, las penalizaciones de Google por contenido duplicado son las mismas. Si sospecha que algunos sitios web han plagiado un extracto de su contenido, ponga el extracto entre comillas y luego haga una búsqueda en Google

Obtendrá una lista de sitios web que han utilizado el extracto en su contenido, de forma similar a como se encuentran las citas en Google

Para estar seguro del resultado, puede utilizar una herramienta dedicada capaz de detectar el contenido duplicado, se llama Copyscape. La herramienta proporciona un informe detallado de los sitios web que le han plagiado

También puede utilizar el comprobador de plagio Quetext comprobador de plagio para ver si los sitios han copiado su contenido con exactitud

Una vez que estos sitios están en la lista, descúbralo en este artículo estrategias para reclamar su contenido duplicado y pedir a Google que le devuelva el derecho

2.2.7. Páginas que no aportan ningún valor a los internautas

El primer reto de los motores de búsqueda es ofrecer resultados que sean relevantes y que respondan eficazmente a la consulta del usuario

Por desgracia, no todos los contenidos de la red aportan valor a los usuarios.

Si cree que está en la misma situación, arregle la calidad de su contenido lo antes posible para ofrecer una mejor experiencia a sus usuarios. Google le recompensará indexando regularmente sus páginas

La diminution de l'expérience utilisateur sur votre site

Tenemos por ejemplo elsitios afiliados que generalmente generan anuncios sin preocuparse demasiado por la satisfacción del usuario. Los algoritmos de Google son cada vez más inteligentes y son capaces de detectar estas páginas de bajo valor y no indexarlas.

2.2.8. Su sitio acaba de ser creado

Si acaba de crear su sitio, es importante saber que su indexación no será sistemática. Google o cualquier otro motor de búsqueda tarda en descubrirle.

Como se ha explicado anteriormente, Google llegará a su sitio a través de los enlaces. Por eso es importante tener buenas estrategias de construcción de enlacesespecialmente si se trata de un sitio de reciente creación

2.2.9. La velocidad de carga de su página

Más allá de la calidad del contenido textual, un sitio debe mejorar también su rendimiento técnico

A pesar de su contenido, un sitio que tarda una eternidad en cargarse, o que aparece de forma intempestiva, o que ofrece una mala experiencia al usuario, siempre será mal visto por los motores de búsqueda

El tiempo que tardan sus páginas en cargarse tiene un impacto directo en su tasa de tráfico. Cuanto más lento sea el tiempo de carga, menos tiempo pasarán los usuarios en su sitio

Y como Google siempre aboga por la experiencia del usuario, desaconseja los sitios que no tienen una velocidad de carga rápida

Si el problema de lentitud persiste, Google puede incluso decidir eliminar la página en cuestión de su índice

Hay una serie de herramientas disponibles para probar la velocidad de carga de sus páginas, incluyendo Page Speed Insights de Google o el GTMetrix

2.2.10. Páginas huérfanas

Para actualizar su índice, Google rastrea regularmente los sitios web, incluyendo sitemaps MAPAS DE SITIO XML. Si el suyo es visitado a menudo por Googlebot y cumple los factores de clasificación, el motor de búsqueda puede mejorar su clasificación en sus SERPs

Pero si durante el rastreo Google no encuentra enlaces que redirijan a un contenido concreto de su sitio, ese contenido simplemente no será indexado

No importa si el enlace es interno o de un sitio externo, Google lo necesita para llegar al contenido, rastrearlo y, si es posible, indexarlo

Estas páginas que no tienen enlaces internos son lo que se conoce en SEO como páginas huérfanas «. Si su sitio tiene demasiadas páginas huérfanas, esto puede disuadir a Google de indexar su sitio regularmente

Para detectar las páginas huérfanas en su sitio, puede utilizar la función La Rana Gritona

Para el truco, puede exportar todas las URLs rastreadas por Screaming Frog a una hoja de cálculo

A continuación, compare esta primera lista de URLs con la disponible en su mapa del sitio XML. Cualquier enlace que termine en el mapa del sitio y no en el informe de rastreo de Screaming Frog será por lo tanto considerado como páginas huérfanas

Es bueno ser capaz de reconocer y arreglar los problemas de indexación que perjudican a su sitio.

Pero es aún mejor mantener un ojo constante en el sitio para detectar rápidamente estos problemas antes de que afecten a su SEO

2.3. supervise el estado de indexación de su sitio con Google Search Console

Como hemos visto, tener errores de indexación puede arruinar el SEO de un sitio y reducir sus ingresos

Pero antes de que esto ocurra, Google pone a su disposición una herramienta para supervisar constantemente el estado de indexación de su sitio: es el Consola de búsqueda de Google

Para utilizar esta herramienta, acceda primero a su página de inicio

A continuación, en la barra lateral izquierda, haga clic en las siguientes opciones situadas justo debajo de la pestaña «Índice»:

  • Cobertura
  • Mapas del sitio
Google Search Console Sitemaps

Se recomienda comprobar el estado de indexación al menos una vez al mes o dos meses para detectar errores en su lugar

Después de solucionar los problemas de indexación de su sitio, a menudo surge una pregunta entre los propietarios de sitios: «¿Cuándo se indexará mi página?

2.4. Saber cuándo se indexará una página

Muchos propietarios de sitios web se preocupan y se preguntan cuándo se indexará su página. Por desgracia, no se puede dar una respuesta precisa a esta pregunta

El hecho es que usted no controla todo cuando se trata de indexar una página. A pesar de sus mejores esfuerzos, según las directrices de Google, hay otros factores externos que no dependen necesariamente de su voluntad de ver una página indexada rápidamente.

Simplemente porque usted no es el único que quiere ser indexado por Google. Hay millones y millones de otras páginas disponibles en la web esperando a ser exploradas

Su turno puede ser mañana, o la próxima semana, o dentro de unos meses, es es difícil dar un marco temporal exacto. Dependerá de la frecuencia con la que Google se haya fijado para rastrear su sitio.

Sin embargo, Google ofrece una forma de solicitar el rastreo de sus nuevas URL

2.5. ¿Cómo puedo solicitar un rastreo a Google?

Para cualquier página nueva o recientemente actualizada en su sitio, puede enviar una solicitud de rastreo a Google utilizando los siguientes métodos

2.5.1. Utilice la herramienta de inspección de URL para solicitar la indexación de algunas páginas

Antes de presentar el procedimiento a seguir, es importante destacar que sin acceso a una cuenta de Google Search Console, no se puede solicitar una indexación con la herramienta de inspección de Google

Para ello

  • Supervise la URL correspondiente con elherramienta de inspección de URLs herramienta de inspección
  • Seleccione «Inspección de URL». La herramienta iniciará una prueba en línea de la URL para ver si ya está indexada o no:

Se le notificará si hay algún problema o si la página ya está presente en el índice de Google:

Pero si la página aún no está indexada, puede solicitar una indexación:

Nota : La solicitud de rastreo no garantiza que la URL se almacene automáticamente en el índice de Google. En algunos casos, la indexación puede ni siquiera tener lugar. Por ejemplo, en el caso de contenidos de baja calidad

2.5.2. Solicitar la indexación de un gran número de URLs con el mapa del sitio

El mapa del sitio es un archivo en el que Google se hace una idea de las URL que tiene su sitio. Si no sabe cómo crear un mapa del sitio, puede consultar esto artículo propuesto por Google

Si un mapa del sitio no ha sido modificado desde la última exploración de Google, es inútil enviarlo de nuevo al motor de búsqueda. Pero si ha añadido páginas a su mapa del sitio, asegúrese de etiquetarlas con el atributo atributo ..

Estos son los diferentes pasos a seguir para alertar a Google de los cambios realizados en el mapa del sitio

  • Envíe un mapa del sitio utilizando el informe del mapa del sitio
  • Con su navegador o editor de comandos, puede enviar una solicitud GET a la siguiente dirección con el enlace completo del mapa del sitio: http://www.google.com/ping?sitemap=

Ejemplo:

http://www.google.com/ping?sitemap=https://example.com/sitemap.xml
  • A continuación, vaya a su archivo Robots.txt y añada el siguiente código

Mapa del sitio: http://example.com/my_sitemap.xml

Con los siguientes pasos, Google podrá rastrear las páginas añadidas al mapa del sitio en su próxima visita

Capítulo 3: Otras preguntas sobre la indexación

3.¿Qué significa ser indexado por Google?

Se dice que una página está indexada por Google cuando :

  • Ha sido visitado por el rastreador de Google («llamado Googlebot»);
  • Se ha arrastrado completamente
  • Finalmente, se almacena en el índice de Google.

Aunque la gran mayoría de las páginas web pasan por la fase de rastreo antes de ser indexadas, Google también puede indexar páginas sin acceder a su contenido. Por ejemplo, cuando una página está bloqueada por un archivo robots.txt.

3.2. ¿Qué es el rastreo y la indexación de la web?

Rastreo: Se trata de una etapa de rastreo de Internet por parte de los rastreadores web en busca de contenidos, explorando el código/contenido de cada URL que encuentran

Indexación: Es la etapa de almacenamiento y organización del contenido encontrado durante el proceso de rastreo. Una vez que una página se almacena en el índice, que es la gran base de datos, está a la espera de ser mostrada en respuesta a las consultas pertinentes.

3.3) ¿Por qué es útil la indexación de sitios web?

Los motores de búsqueda indexan los sitios web para responder lo más rápidamente posible a las consultas de búsqueda con información relevante. Por ello, almacenan en una base de datos información sobre las páginas web indexadas, por ejemplo: palabra clave, título o descripción. De este modo, los motores de búsqueda podrán identificar fácil y rápidamente las páginas relevantes para una consulta de búsqueda.

3.4. ¿Qué son los errores de indexación?

Si aparece el mensaje «La URL no está en Google: errores de indexación», significa que Google ha eliminado la URL de su índice porque no ha podido acceder a ella, o bien que no estaba en su índice porque no estaba disponible cuando lo intentó por primera vez.

3.5. ¿Por qué mi sitio no está en Google?

Si su sitio no aparece en Google, probablemente sea por una de las siguientes razones:

  • Google aún no ha indexado su sitio web
  • Google no considera que su sitio sea lo suficientemente «fiable» o «relevante» como para que se muestre para las palabras clave para las que quiere clasificarse
  • Ha bloqueado el rastreador Googlebot en su archivo de robots.

Para resolver este problema, realice una inspección en vivo, resuelva los problemas que pueda tener y envíe la página para su indexación.

3.6. ¿Cómo puedo evitar que Google indexe mi sitio?

Para evitar que una de sus páginas aparezca en la búsqueda de Google, basta con incluir una metaetiqueta noindex en el código HTML de la página o devolviendo una cabecera noindex en la respuesta HTTP.

3.7. ¿Cómo comprobar si su página está indexada por Google?

Para ver si los motores de búsqueda como Google y Bing han indexado su sitio, introduzca : » site:URL de su dominio »

Los resultados muestran todas las páginas de su sitio que han sido indexadas y las metaetiquetas actuales registradas en el índice del motor de búsqueda.

Es importante saber que a veces los motores de búsqueda pueden tardar en rastrear su sitio.

3.8. ¿Qué parte de Internet será indexada por Google en 2020?

Google ha almacenado en su índice unos 35.000 billones de páginas web en Internet en todo el mundo. Aunque se trata de una estadística asombrosa, lo crea o no, 35 billones son sólo la punta del iceberg. El índice de Google sólo representa alrededor del 4% de la información que existe en la red.

Conclusión

En resumen, la indexación es un paso esencial en la referenciación de una página web y forma parte de un proceso llevado a cabo por los robots de indexación

Después de haber creado un sitio web o publicado una nueva página, totalmente optimizada para el SEO, la mejor manera de ayudar a que su página sea indexada sería esperar

Aunque por algunas razones, a veces uno se ve obligado a utilizar métodos para indicar algunas recomendaciones a los motores de búsqueda

Espero que esta definición de «indexación» le haya sido útil y añada algo a sus conocimientos de SEO

Si tiene alguna otra pregunta, no dude en preguntarme en los comentarios

¡Gracias y hasta pronto!

Deja un comentario