Contenido duplicado: Por qué perjudica y cómo solucionarlo

Jazmie Jamaludin

El contenido duplicado es uno de esos problemas de SEO que rara vez se anuncian. No hay ningún mensaje de error, ninguna advertencia obvia y su sitio sigue funcionando perfectamente bien para los visitantes. Sin embargo, detrás de escena, puede diluir silenciosamente el rendimiento de su búsqueda, confundir a los motores de búsqueda sobre qué página mostrar y desperdiciar la limitada atención que le prestan a su sitio. Lo frustrante es que la mayor parte del contenido duplicado es accidental, creado por la forma en que se construyen los sitios web en lugar de por alguien que copia algo.

Esta guía explica qué es realmente el contenido duplicado, por qué funciona en su contra y cómo solucionarlo sin necesidad de ser un experto técnico. Está escrita para propietarios de negocios que desean comprender el problema lo suficientemente bien como para detectarlo y dirigir una solución sensata, ya sea que lo aborden ellos mismos o le den instrucciones a otra persona. El objetivo es la claridad, no la jerga, para que pueda irse con una idea práctica de qué verificar y qué hacer al respecto.

Qué significa realmente el contenido duplicado

El contenido duplicado es simplemente el mismo contenido o contenido muy similar que aparece en más de una dirección web. Esto puede significar texto idéntico en dos páginas diferentes de su propio sitio, la misma página accesible a través de varias direcciones diferentes, o su contenido que aparece en otros sitios web por completo. Los motores de búsqueda encuentran las tres situaciones constantemente, y si bien una pequeña cantidad es normal e inevitable, la duplicación a gran escala crea problemas genuinos.

Ayuda separar dos ideas que a menudo se confunden. Una es la duplicación interna, donde el problema reside dentro de su propio sitio. La otra es la duplicación externa, donde su contenido también existe en otras partes de la web. Tienen diferentes causas y diferentes soluciones, pero el desafío subyacente es el mismo: los motores de búsqueda tienen que decidir qué versión es la real para mostrar, y cuando esa decisión no está clara, todos pierden.

Sin penalización, pero con costo real
Google dice que el contenido duplicado rara vez genera una penalización, sin embargo, aún puede dividir señales y desperdiciar el rastreo.
Fuente: Google Search Central

Por qué perjudica su SEO

Vale la pena aclarar primero un mito común. No existe un castigo específico que elimine todo su sitio por tener contenido duplicado en la mayoría de los casos ordinarios. El daño es más sutil que una penalización. Cuando el mismo contenido se encuentra en varias direcciones, las señales que de otro modo apuntarían a una página fuerte se dividen entre varias más débiles. Los enlaces, la relevancia y la fuerza de clasificación que deberían acumularse en un lugar se dispersan, por lo que ninguna versión individual funciona tan bien como podría.

También está el asunto del rastreo. Los motores de búsqueda asignan una cantidad finita de atención a cada sitio, decidiendo cuántas páginas visitar y con qué frecuencia. Si una gran parte de esa atención se dedica a rastrear versiones duplicadas del mismo contenido, se destinan menos recursos a descubrir y actualizar sus páginas genuinamente únicas. En un sitio pequeño, esto apenas se nota, pero en uno más grande puede ralentizar significativamente la rapidez con la que se encuentran y actualizan sus páginas importantes.

Finalmente, la duplicación obliga a los motores de búsqueda a adivinar qué versión desea que se muestre. A veces adivinan mal, mostrando una dirección menos adecuada, una versión para imprimir o una copia obsoleta. Usted pierde el control sobre la experiencia que obtienen los visitantes, lo cual es razón suficiente para limpiarlo.

Las causas habituales

La mayoría del contenido duplicado proviene de un puñado de fuentes predecibles, casi todas técnicas y accidentales. La más común es tener la misma página accesible a través de varias direcciones ligeramente diferentes. Una página podría ser accesible con y sin ciertos prefijos, con y sin una barra final, a través de conexiones seguras y no seguras, o con varios parámetros de seguimiento agregados al final. Para un humano, todas estas parecen la misma página, pero para un motor de búsqueda, cada dirección distinta es potencialmente una página separada.

Causas comunes y de dónde provienen
Causa Origen típico
Múltiples versiones de dirección Seguro y no seguro, barras finales, parámetros de seguimiento
Texto de producto o categoría repetido Filtros, clasificación y paginación que crean páginas casi idénticas

Otras causas frecuentes incluyen descripciones de productos copiadas de un proveedor y reutilizadas por muchos sitios, texto estándar repetido en docenas de sus propias páginas, versiones separadas para dispositivos móviles e imprimibles del mismo artículo, y sistemas de gestión de contenido que generan páginas de etiquetas o categorías que listan las mismas publicaciones en diferentes combinaciones. Ninguna de estas implica que alguien copie deliberadamente algo, que es exactamente la razón por la que pasan desapercibidas durante tanto tiempo.

Cómo encontrar contenido duplicado

Antes de arreglar algo, debe saber dónde reside el problema. Comience con las herramientas gratuitas para webmasters proporcionadas por los motores de búsqueda, que pueden mostrarle cómo se indexan sus páginas y señalar cuándo varias direcciones están compitiendo. Observe cuántas páginas están indexadas en comparación con cuántas tiene realmente, ya que una gran brecha a menudo apunta a la duplicación. También puede buscar oraciones distintivas de sus propias páginas para ver si el mismo texto aparece en direcciones inesperadas.

Preste especial atención a las diferentes formas en que se puede acceder a su página de inicio, porque ahí es donde más comúnmente surgen los problemas de direcciones múltiples. Verifique si su sitio se carga tanto en conexiones seguras como no seguras, con y sin prefijos comunes, y si todas esas versiones se resuelven en una única dirección canónica o permanecen separadas. Detectar estos problemas fundamentales a tiempo a menudo resuelve una sorprendente cantidad de duplicación de una sola vez. Nuestra guía para rastrear el rendimiento del SEO explica cómo leer estas herramientas correctamente.

Las soluciones que realmente funcionan

Elija una versión preferida

La solución más efectiva es elegir una versión canónica de cada página y asegurarse de que todas las demás versiones apunten a ella. La etiqueta canónica es una pequeña instrucción en el código de una página que les dice a los motores de búsqueda qué dirección es la copia maestra. Cuando tiene páginas casi duplicadas que deben existir para los usuarios, como un producto disponible en varias variaciones, la etiqueta canónica consolida su fuerza de clasificación en la versión que usted designa.

Redirigir cuando sea apropiado

Cuando una dirección duplicada no debería existir en absoluto, la solución más limpia es una redirección permanente que envíe tanto a los visitantes como a los motores de búsqueda a la página correcta. Este es el enfoque correcto para cosas como consolidar versiones seguras y no seguras o retirar direcciones antiguas después de un cambio de sitio. Las redirecciones transmiten la mayor parte de la fuerza de clasificación acumulada, por lo que protegen el valor que ya ha construido al tiempo que eliminan el duplicado.

Consolidar páginas delgadas o superpuestas

A veces, la mejor solución es editorial en lugar de técnica. Si tiene varias páginas débiles que cubren casi el mismo tema, fusionarlas en una página más fuerte y completa generalmente sirve mejor a los lectores y a los motores de búsqueda. En lugar de tres artículos delgados compitiendo entre sí, termina con una página autorizada que consolida las señales. Esto está estrechamente relacionado con la disciplina de escribir menos y mejores piezas, que nuestro artículo sobre publicaciones de blog amigables con el SEO explora.

Escriba descripciones únicas

Para las tiendas en línea, la duplicación de contenido más común proviene del uso de descripciones de productos proporcionadas por el proveedor que también utilizan cientos de otros sitios. Reescribirlas con sus propias palabras, agregando detalles genuinos y su propia perspectiva, diferencia sus páginas. Requiere esfuerzo, especialmente con un catálogo grande, pero las descripciones únicas son una de las formas más confiables de elevar las páginas de productos por encima de las de los competidores que confían en el mismo texto genérico.

Previniéndolo en primer lugar

Arreglar la duplicación existente es bueno, pero prevenirla es mejor. La prevención más efectiva es una estructura de sitio limpia y bien considerada desde el principio, lo cual es mucho más fácil de hacer bien en un sitio nuevo que de adaptar más tarde. Decida un formato de dirección preferido único y aplíquelo en todas partes. Sea deliberado sobre cómo los filtros, la clasificación y la paginación generan páginas, y asegúrese de que los motores de búsqueda sean guiados hacia las versiones que realmente desea indexar.

Cuando publique contenido nuevo, déle a cada página un propósito claro y distinto para no crear casi duplicados por accidente. Si dos artículos planificados se superpusieran mucho, esa es una señal para combinarlos en una pieza más fuerte. Incorporar estos hábitos a su proceso significa que la duplicación rara vez se acumula en primer lugar. Para las empresas que comienzan de nuevo, nuestra guía de SEO para nuevos sitios web cubre cómo sentar estas bases correctamente, y la estrategia más amplia se encuentra dentro de nuestra guía de servicios de SEO. Comprender qué páginas realmente importan también es más fácil cuando combina el SEO con una medición adecuada, como se explica en análisis de datos para PYMES.

¿Qué tan preocupado debería estar?

Para la mayoría de los sitios web pequeños y medianos, el contenido duplicado es un trabajo de limpieza en lugar de una crisis. Unas pocas direcciones duplicadas o algún texto repetido no hundirán su sitio. Los casos que vale la pena tomar en serio son los grandes catálogos construidos con texto genérico de proveedores, los sitios que generan miles de páginas de filtro casi idénticas y las páginas de inicio accesibles a través de muchas direcciones competidoras. Aquí es donde el rastreo desperdiciado y las señales divididas realmente se suman.

El enfoque sensato es buscar las causas comunes, solucionar primero los problemas fundamentales como las versiones de direcciones múltiples y luego abordar la superposición de contenido como parte de su mantenimiento continuo. Una vez hecho correctamente y luego vigilado, el contenido duplicado deja de ser una preocupación. Es el tipo de problema que recompensa un poco de atención ahora con un rendimiento más fluido durante mucho tiempo después.

Preguntas frecuentes

¿El contenido duplicado hará que mi sitio sea penalizado?+
En la mayoría de los casos ordinarios, no. Los motores de búsqueda simplemente eligen una versión para mostrar y el resto se ignora. El costo real son las señales de clasificación divididas y el rastreo desperdiciado, no una penalización directa, aunque la copia deliberada a gran escala es otro asunto.
¿Qué es una etiqueta canónica?+
Es una pequeña instrucción en el código de una página que les dice a los motores de búsqueda qué dirección es la versión maestra cuando existe contenido similar en varias direcciones. Consolida las señales de clasificación en su página preferida.
¿Necesito reescribir cada descripción de producto?+
Priorice primero sus productos más importantes. Reescribir el texto genérico del proveedor con sus propias palabras ayuda a que esas páginas se destaquen, así que concentre su esfuerzo donde tenga el mayor impacto en lugar de intentar hacerlo todo a la vez.
¿Cómo sé si mi página de inicio tiene varias versiones?+
Intente cargarla con y sin prefijos comunes y a través de conexiones seguras y no seguras. Si todas permanecen separadas en lugar de redirigir a una sola dirección, tiene varias versiones que deben consolidarse.

Referencias

  1. Google Search Central, Consolidate duplicate URLs and canonicalization documentation, developers.google.com/search
  2. Moz, Duplicate Content guide, moz.com

El contenido duplicado suele ser accidental y casi siempre solucionable. Encuentre dónde reside, consolídelo en una única versión preferida, redirija lo que no debería existir y escriba descripciones únicas para las páginas que más importan. Para la estrategia más amplia en la que encaja esto, lea nuestra guía de servicios de SEO, y si desea ayuda para auditar su sitio, puede contactarnos.

Regresar al blog

AUTOMATICE. OPTIMICE. DOMINE.

Optimice sus operaciones y ofrezca una experiencia de cliente fluida. Deje que nuestros expertos implementen tecnología de vanguardia y flujos de trabajo optimizados para que pueda concentrarse en lo que mejor sabe hacer.