Para nadie es un secreto que todos los sitios webs dependen de Google. Pues las páginas son indexadas por el motor de búsqueda, y esto es lo que hace esto posible que los usuarios puedan encontrar la información que tú ofreces. Sin embargo, eso no siempre es posible porque muchas veces es difícil que tu sitio web sea indexado por Google.
Y es que, quizás hayas notado que en un sitio web, en especial si es uno grande, no llega a indexar todas las páginas o se demoran muchas semanas antes de que Google las recoja. Pero, ¿por qué sucede esto?
Existen diversos factores que contribuyen a esta situación particular. Pero algunos de los más comunes tienen que ver con la calidad del contenido y los enlaces. Muchas veces estos factores suelen ser muy complejos y bastante técnicos. Porque los sitios webs modernos dependen en gran medida de las nuevas tecnologías que han padecido muchos problemas de indexación en el pasado y todavía continúan con las mismas dificultades.
Si eres de los que crees que los aspectos técnicos son los que impiden que Google indexe tu contenido, debes saber que esto es un mito. Aunque bien es cierto que Google puede no indexar tus páginas si a nivel técnico no eres consistente, otra cosa importante para el buscador es que puedas ser coherente con la calidad de tu contenido. A continuación, te contaremos por qué es tan difícil que tu sitio web sea indexado y algunos consejos para solucionarlo.
¿Por qué tu sitio web no está siendo indexado?
En primera instancia debes saber que, Google Search Console siempre te informará sobre los estados de las páginas, por ejemplo, “Rastreado: actualmente no indexado” o “Descubierto: Actualmente no indexado”. Y aunque esta información no es la que soluciona el problema directamente, sí es importante que la conozcas para que puedas comenzar con el diagnóstico.
“Rastreado: actualmente no indexado”
Si te llegas a encontrar con este mensaje, entonces deberás saber que es porque Google visitó una página, pero no la indexo. Y esto, por lo general, ha sucedido por un problema de calidad del contenido. Debes tener presente que es normal que Google se vuelva cada día un poco más exigente respecto a la calidad de la información. Esto quiere decir que deberás verificar que las páginas en cuestión sean de valor y únicas:
- Emplea títulos, descripciones e información única en todas las páginas indexables.
- No copies descripciones de productos de fuentes externas.
- Emplea etiquetas canónicas para que puedas consolidar contenido duplicado.
- No permitas que Google rastree o indexe secciones de baja calidad. Para evitarlo, deberás hacerlo mediante el archivo robots.txt o por medio de la etiqueta “noindex”.
“Descubierto: actualmente no indexado”
Acá puede ser que ocurran desde problemas de rastreo o incluso mala cantidad de contenido, puede ser cualquier cosa y es un problema complejo. En particular, si ocurre en un gran sitio web de comercio electrónico, y si Google te informa sobre este error, es porque:
Hay un problema de presupuesto de rastreo: quizás hay demasiadas URL´s en la cola de rastreo, entonces es posible que se indexen luego.
- Existe un problema de calidad: Es posible que Google pueda pensar que no vale la pena rastrear ciertas páginas de un dominio. Es por esto por lo que elige no visitarlas buscando un patrón en su URL. En estos casos puedes hacer lo siguiente:
- Identifica si hay patrones de páginas que entran en esta categoría: Puede ser que el problema tenga que ver con una categoría de productos y no con toda la categoría. O puede ser que muchas de las páginas están en cola para ser indexadas.
- Optimiza tu presupuesto de rastreo: Detecta páginas de baja calidad en las cuales Google se concentra mucho tiempo rastreando. Algunos de los problemas habituales son las páginas de categorías filtradas y las de búsqueda interna, que pueden llegar a millones en un sitio de comercio electrónico común. Piensa que si Googlebot tiene la posibilidad de rastrearlos fácilmente, entonces es probable que no tengas los recursos necesarios para acceder a lo realmente valioso de tu sitio web indexado en Google.
Contenido duplicado
Puede deberse a:
- Variaciones de idioma, si por ejemplo, tienes la misma página dirigida a diferentes países, quizás algunas de ellas no se indexen.
- Contenido duplicado que utilizan tus competidores, es probable que varios sitios web utilicen la misma descripción de producto porque es la que ha sido proporcionada por el fabricante.