Contenido duplicado

Ahora Google prefiere que no usemos el archivo robots.txt u otros métodos para bloquear el acceso a URLs con contenido duplicado en nuestro sitio web.

¿Cómo tratar entonces las páginas con el mismo contenido?

Una solución mejor es señalarlas como contenido duplicado utilizando uno de los métodos recomendados por Google, pero dejar que puedan ser rastreadas. Si le permitimos rastrear estas direcciones URL, el robot puede aprender las reglas para identificar los duplicados con sólo mirar la dirección y evitar rastreos innecesarios.

Google anunció hace unos días una nueva herramienta para ayudar con la gestión de contenido duplicado: la manipulación de parámetros: La manipulación de parámetros le permite ver los parámetros que Google considera que deben ser ignorados o no a la hora de rastrear.

Si Google sabe que varias páginas contienen el mismo contenido, con la nueva herramienta puedes especificar hasta 15 parámetros que te gustaría que Google tuviera en cuenta a la hora de determinar qué páginas son incluídas en el índice y cuáles no. (Google trata a estas peticiones como sugerencias, no como órdenes).

Métodos recomendados por Google para evitar contenido duplicado:

  1. Reconocer que tienes contenido duplicado en tu sitio Web.
  2. Determinar las URLs preferidas: Herramientas para Webmaster > Información del sitio > Configuración.
  3. Ser coherente dentro de tu sitio Web usando siempre las URLs elegidas (incluído el archivo sitemap).
  4. Redireccionamientos 301 cuando sea necesario y posible.
  5. Utilizar el atributo rel = «canónica» como elemento de enlace cuando se pueda.
  6. La manipulación de los parámetros de URL con la nueva herramienta de manipulación de parámetros, (en el panel de Herramientas para Webmaster > Configuración del sitio).

Por supuesto lo primero es intentar reducir al mínimo los contenidos duplicados de nuestra web.
Aunque Google no penaliza el contenido duplicado, éste sí puede afectar a la indexabilidad de tu sitio, haciéndola más difícil, y a la distribución del Page Rank.

¿Utilizar la manipulación de parámetros o rel = «canónica»?

  • Rel = «canónica» tiene que ser puesto en cada página, mientras que el manejo de parámetro se establece desde las «Herramientas para Webmaster».
  • Rel = «canónica» es respetado por muchos motores de búsqueda, mientras que las sugerencias de manipulación de parámetros solamente se proporcionan a Google.

contenido duplicado: Webmaster Central Blog

Si te ha gustado esta entrada puedes dejar constancia de ello aquí o compartirla, y si no también. Si quieres comentar algo puedes hacerlo aquí. Y gracias por venir.
Juana Corbalán de Corbax

1 comentario en “Contenido Duplicado: acceso libre?”

  1. Será apasionante cuando llegue Google a la autoconciencia y la omnisciencia. ¿Seguirá llamandose así o se decantará por algo más críptico , unas líneas de código o algo parecido?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba