Contenido duplicado en WordPress, aprende a detectarlo y eliminarlo para que no te penalicen [Actualizado]

Contenido duplicado en WordPress

Hoy te voy a hablar sobre el contenido duplicado que se suele crear en WordPress, como detectarlo y eliminarlo para no ser penalizado.

Mucha gente cree que hacer SEO es solo tirar enlaces externos y el SEO es más que eso.

Es crear enlaces externos (pero de calidad), también enlazar artículos internos, escribir contenido de calidad, tener una web rápida y mucho más.

Pero aparte de todo ésto, hacer SEO también requiere optimizar lo que ya tienes.

Y uno de los errores que se suele tener es no contar con el contenido duplicado dentro de WordPress.

Tú me dirás que no escribes artículos repetidos, ni haces las páginas dobles.

Pero eso no es tener contenido duplicado y de eso quiero hablarte.

¿Qué es el contenido duplicado? Y ejemplos de como se crea

Cuando hablamos de contenido duplicado nos referimos a cuando un mismo contenido aparece repetido en varios sitios.

Osea cuando los mismos textos están en varias páginas.

Te pongo un ejemplo para que lo entiendas de forma más sencilla.

Cada vez que escribes un artículo y lo ordenas mediante las categorías y etiquetas de WordPress, ya lo estás duplicando.

¿Y eso?

Porque el texto resumen de ese artículo se muestra en todas ellas y en algunas más.

Te pongo algunos ejemplos de donde aparece:

  • Página principal: si tienes algún widget que muestre los últimos artículos.
  • Página del blog: porque obviamente aparece en el listado.
  • Archivos de categorías: cuando le asignas alguna categoría.
  • Archivos de etiquetas: si le has asignado alguna.
  • Página del autor: puesto que es otra página de archivos.
  • Paginación: cada vez que pasa de la página uno a la 2, la 3, etc.
  • Y no termina aquí…

Bueno, ésto si contar que tengas bien puesto tu blog en Search Console.

Si tu blog lo tienes por un lado con las www o por otro sin ellas, con https o https, también se duplica.

Osea que para los ojos de Google le estás intentando engañar con el mismo contenido por varios sitios.

Tu blog WordPress crea contenido duplicado aunque no te des cuenta #SEOHaz click para twittear

Tipos de contenido duplicado

Tipos de contenido duplicado

Antes de seguir me gustaría aclararte que no hay un solo tipo de contenido duplicado.

Existe el interno que es el que te he explicado y que podemos resolver nosotros.

Pero después tenemos el externo que se crea cuando alguien nos copia algo.

Si existe un artículo que te hayan copiado y este se posiciona delante del tuyo, que sepas que te han penalizado.

Obviamente sobre el externo no tenemos ningún control, aunque podemos controlar si hay alguien que lo hace.

En este caso te voy a explicar el interno que es el que afecta directamente a WordPress.

Herramientas para detectar contenido duplicado

Hay varias herramientas para detectar contenido duplicado y que son sencillas de usar.

Yo te voy a explicar las que uso a diario y que además no te tendrás que gastar un Euro en ellas.

Search Console

Search Console es el panel de Google con el que podremos ver la salud de nuestro sitio web.

Hay muchas cosas que puedes ver y una de ellas es la que estamos hablando en este momento.

Mas abajo te explico como usar esta herramienta para detectar este problema.

Búsqueda de Google

También podemos detectar sin tener que entrar al ningún panel haciendo una búsqueda simple en Google.

Para ello usaremos los Footprints o comandos avanzados de Google.

Si por ejemplo hacemos un site:dominio.com inurl:/page/ podremos ver si se nos está indexando la paginación.

Detectar contenido duplicado

¿Cómo saber si tengo contenido duplicado?

Cómo te he dicho, te voy a explicar cómo detectar contenido duplicado de forma sencilla.

Aunque te aviso de antemano que seguramente lo tendrás.

No es que yo sea adivino.

Pero la mayoría de blogs lo tienen porque no se le pone remedio, bien por desconocimiento u otra causa.

Te voy a explicar un método que te ayudará a saber si tienes problemas serios de contenido duplicado.

Pero que no aparezca no significa que no tengas.

Search Console mejoras de HTML

Entra en Search Console y en la parte izquierda pulsa en Aspectos de la búsqueda y Mejoras de HTML.

Si no tienes nada, mejor.

Todavía estás a tiempo de que no se vea afectado tu posicionamiento.

¿Cómo solucionar el contenido duplicado en WordPress?

A la hora de solucionar esto es algo complejo, porque depende del tipo de contenido y tus necesidades.

Puede que haya contenidos que nos interese indexar para mejorar nuestro SEO y siempre que se optimicen correctamente.

Y habrá otros que nunca merezca la pena indexarlos porque siempre nos van a fastidiar.

La mejor forma de solucionar este problema es no indexándolos.

Osea evitando que aparezcan en los buscadores.

Piensa que si todas estas páginas por llamarlas de alguna forma se muestran en los buscadores, aparte de la penalización por parte de Google.

Corres el riesgo de que estos contenidos de mala calidad se posicionen por encima de los demás.

Por eso es importante una estrategia previa a la hora de montar nuestro blog.

Sea como sea, hay 2 formas de evitar que esto nos ocurra y son evitando que se indexen estas páginas y bloquearlas desde el archivo robots.txt.

Pero no es cosa sencilla y te explico porqué.

Noindex VS disallow

Cuando aplicamos noindex a páginas, entradas o lo que sea, le estamos diciendo a Google que directamente no lo indexe.

En el caso de que estos contenidos no se hayan indexado, nunca lo harán y si ya estaban, irán desapareciendo poco a poco de los resultados.

Aunque también podemos ayudar a que esto vaya más rápido eliminando estas url de Google de forma manual.

Pero si aplicamos la directiva disallow en el archivo robots.txt lo que estamos haciendo es bloquear a los robots a que accedan a este contenido.

Quiere decir que si estos contenidos no se habían indexado y no tienen la directiva noindex, se indexarán, pero aparecerán bloqueados.

Si ya estaban indexados, seguirán estando en los resultados, pero indicando que están bloqueados por el archivo robots.txt.

Además, no podremos eliminarlos porque los robots no podrán acceder a ellos.

En resumen.

La mejor forma de evitar el contenido duplicado es no indexandolo.

Hoy te explicaré como realizar todo en cada uno de los contenidos básicos que suelen crear este problema en WordPress.

Pero que sepas que aparte de estos hay muchos más.

Categorías y etiquetas

Ya he hablado de si es mejor indexar o no las categorías o las etiquetas.

Personalmente estoy en contra de hacerlo por el motivo de la duplicación del contenido.

Como te he explicado, si las indexas son páginas con el mismo contenido de los artículos.

Pero si no la indexas, tendrás algo menos visitas.

Te recomendaría que si estás dispuesto a realizar la optimización SEO de las categorías, que las uses y si no es así, no las indexes y te quitas de problemas.

Yoast noindex categorías y etiquetas

Para ello entra en nuestro maravillo y estupendo plugin Yoast SEO para WordPress.

Y en el apartado Títulos y etiquetas meta, entra en Taxonomías y activa la casilla noindex de cada una de ellas.

Páginas de autor y fecha

Al igual que con lo anterior no deberías de indexar las páginas de autor y fechas.

Ya que estamos dentro del plugin y si miras al lado de las pestaña taxonomía, hay una que pone archivos, así que haz clic en ella.

Yoast noindex páginas autores y fechas

Cambia las mismas casillas tanto en el autor como en las fechas a noindex.

O directamente puedes desactivarlas como he hecho yo.

Con ésto ya no se indexarán este tipo de contenidos.

No te salgas de ahí que no hemos terminado.

La paginación de WordPress

Si ya tienes varios artículos en tu blog, verás que te aparece abajo los botones para cambiar de la página 1 a la 2, 3, etc.

Ésta función de WordPress que está muy guay y útil que se llama paginación, también es la culpable de fastidiar creando contenido duplicado.

Nosotros lo vemos de éste modo.

  • http://misupermegablog.com/
  • http://misupermegablog.com/page/2/

Pero para Google es la misma página duplicada.

Éstas puede que te aparezca en las herramientas que te he comentado antes.

Para desactivar esta función y evitar este problema, hacemos clic en la última pestaña que pone otro.

Yoast noindex a paginación

Al igual que con las anteriores, deberemos de poner en noindex la casilla de subpáginas de archivos.

Ya no tendremos más problemas con la paginación de WordPress.

Parámetros de url

Ésta si que es buena.

Un parámetro de url es una terminación que se le añade a la misma según la función.

Un ejemplo muy claro son los comentarios en WordPress.

Las url de los comentarios en WordPress son con la terminación /?replytocom=XX.

Si por ejemplo tenemos un artículo en nuestro blog que tenga varios comentarios, queda más o menos así:

  • http://misupermegablog.com/nombre-del-articulo/
  • http://misupermegablog.com/nombre-del-articulo/?replytocom=23.
  • http://misupermegablog.com/nombre-del-articulo/?replytocom=40.

Osea que por cada nuevo artículo se van creando nuevas urls.

Al final tienes un solo artículo, pero duplicado por el número de comentarios.

Yo tengo sitios webs que un solo artículo supera los 300 comentarios.

Así que ajusta la cuenta.

Yoast quitar variables replytocom

Para soluciona ésto es sencillo, poque dentro del plugin de SEO hay una opción para ésto.

Nos vamos a Enlaces Permanentes o Permalinks y más abajo verás la opción.

Así que actívala.

Pero ésto solo nos sirve para éste parámetro de url.

Porque hay cientos más de parámetros como los ?share de redes sociales y otros que ahora no caigo.

Search Console parámetros de url

 

Si quieres saber los que tiene tu blog.

Vete de nuevo a Search Console y entra en Rastreo y Parámetros de url.

En ésta web vemos que hay de las que hemos hablado, más otras como las de Google Analytics.

Los adjuntos

Otra de las cosas que nos puede crear contenido duplicado son las url de los adjuntos.

Si quieres solucionar éste problema lo puedes hacer en éste último punto que hemos estado.

Yoast redireccionar url de adjuntos

Más arriba de la opción de las Replytocom hay una casilla que te indica ésto.

La activas y la url del adjunto apuntará a la url del artículo.

Para serte sincero, lo mejor que puedes hacer es no adjuntar imágenes con enlace.

Aprende a detectar y eliminar el contenido duplicado de tu blog WordPress #SEOHaz click para twittear

Resumo

Ésto que te he explicado es casi tan importante como crear contenido y demás.

De nada te sirve escribir y escribir si por otro lado Google te está penalizando.

A lo mejor éste artículo te resulta algo complejo, pero es solo activar unas casillas a tiempo.

  • Evita indexar lo que no te sirva o vayas a optimizar.
  • Limpia de Google lo que no necesites.

No hay más.

¿Tienes este tipo de problemas en tu blog?

Cuéntame tu experiencia.

Foto: Shutterstock

¿Quieres más visitas a tu blog?

Descarga mis 50 técnicas para mejorar tus visitas y

entra a formar parte de mi comunidad.

Información básica sobre Protección de Datos

Responsable: Raúl González Sedeño.

Finalidad: Gestión del envío de información solicitada y de suscripciones al blog.

Legitimación: Consentimiento del interesado.

Destinatarios: Se comunicarán datos a Active Campaign para gestionar las suscripciones al blog como plataforma de envío de boletines.

Derechos: Tienes derecho a acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional.

Información adicional: Puedes consultar la información adicional y detallada sobre protección de datos personales en mi página web ragose.com + info.

He leído y acepto la política de privacidad.

42 comentarios en “Contenido duplicado en WordPress, aprende a detectarlo y eliminarlo para que no te penalicen [Actualizado]”

  1. Hola,

    tenías por ahí un tuto para cambiar el tamaño del avatar no?…lo quiero cambiar y no lo encuentro..
    Bonita foto, más grande no entraba…
    Gracias

      1. No, quiero que mi foto en el sidebar sea más grande..centrada y el texto debajo, he cotilleado por tu web y no lo encuentro, he salseado en la plantilla y se donde viene pero no he hecho pruebas. Gracias Raúl.

  2. Hola Raúl,
    Te escribí la semana pasada al mail, por el tema de una migración y no perder posicionamiento y demás… finalmente la he hecho, y ya tengo el tráfico redireccionado con el upgrade de wordpress. Lo que no sabía, es que google penaliza poner en webmaster tools ambas url (con www y sin ellas). yo he hecho la cuenta con ambas…debería cancelar una??
    Gracias!

    1. Hola Cristina. Pues aquí una de dos. O agregas los dos dominios indicando que son webs diferentes, o haces lo que yo. Solo agrego la url sin www y después redirijo todo el tráfico a la sin www. Saludos.

      1. Hola Raul, me parecio muy interesante tu post, pero quiero que me aconsejes… Yo trabajo con adsense, y coloco NO FOLLOW y NO INDEX por un tiempo pues manejo codigos, y con programas de trafico logro tener muchas visitas y manualmente por facebook y otras redes posteo… Uso los mismos tags en todos las entradas y webs que tenga por ejemplo la palabra forex. y acabo de registrar en el webmaster tools mis dominios con y sin www. pero acabo de leerte que se redirecciona y a la verdad no sé como hacer eso, y con adsense la redireccion no esta permitido…
        Que me puedes aconsejar… por favor si puedes pasar algun link para saber como redireccionar el trafico que escribes… Muchas Gracias.

  3. Hola, hoy abrí un blog y antes quiero configurarlo bien, mi pregunta es si esta es la única forma de que no se cree contenido duplicado y si me recomendas que haga exactamente todo o que espere un tiempo cuando tenga más entradas? Gracias!!

  4. hola: tengo dudas a ver si me las puedes solucionar para evitar duplicados:
    estoy creando etiquetas y categorías. en cada categoría y etiqueta le doy una decripcion, pero es que tengo etiquetas y categorías cuya descripción tengo que poner prácticamente la misma descripción porque realmente hablan de lo mismo. y en el SEO tengo etiquetas y categorías como Index, follow, porque pienso que me interesa que sí se encuentren todas cuando las busque google.
    ejemplo:
    categoría: titulo SEO: PLC S7 200; decripcion SEO:Documentación técnica, ejemplos de programación y tutoriales relacionados con el plc S7-200 y el software MicroWin de Siemens.
    etiqueta: titulo SEO: S7 200; decripcion SEO:Documentación técnica, ejemplos de programación y tutoriales relacionados con el plc S7-200 y el software MicroWin de Siemens

    puedo usar lo mismo?? o que tengo que hacer?? gracias
    y en el titulo SEo y en la descripción, y en el slug le puedo poner tilde donde le toque? o es mejor dejarlo todo en mayúsculas sin tildes, o como??
    gracias de antemano.

    1. Ángel, es tu caso, yo sí las indexaría, dado que es una tienda y puede que te entren visitas desde las categorías y etiquetas.
      Yo pondría los títulos, pero en la descripción, pondría algunas de las características para diferencias.
      Respecto al slug, no debería contener ni mayúsculas ni acentos, porque es lo que aparece en la url.

      Saludos.

      1. pero al indexarlas, tengo que poner una descripción diferente para cada etiqueta y cada categoría??
        y la descripción es importante?? tengo que explicar mucho en la etiqueta ?? o hago una explicación amplia en la categoría y en la etiqueta hago una descripción cortita??

  5. una pregunta:
    estoy buscando un plugin que me permita:
    en la pagina de inicio de mi web será una pagina estatica: ahí quiero poner las 10 ultimas entradas de mi categoría S7 200, mas abajo quiero poner las 10 ultimas entradas de mi categoría s7 300, y mas abajo las 10 entradas de mi categoría tecnología… cada una con una foto pequeña.
    me puedes ayudar a encontrar un plugin que haga esto???? es que no lo encuentro. he encontrado uno que se llama SRP Free pero esto solo lo hace en un wiget lateral pero no lo hace en la pagina que yo quiero hacerlo.
    sabrias decirme alguna por fa??? que sea gratis claro…

  6. Hola Raúl

    Perfecto! ya he seguido tus instrucciones y he eliminado el ?replytocom de las URL.

    Por cierto, tenía activado el eliminar “category” de las URL de las categorías. Supongo que viene así por defecto o lo hice siguiendo el consejo de alguien.

    Cuál es tu opinión sobre eso?

    Un saludo y gracias

    1. Hola Javi,

      Bien por lo del replytocom!

      Ten cuidado con hacer ese tipo de cambios en las urls (category) porque después te vienen los errores 404. Está bien hacerlo para limpiar las url, pero sabiendo que cualquier cambio te va a traer eso.

      Saludos.

  7. Hola, Raúl. Acabo de aterrizar en tu blog y llevo media mañana leyéndote y aplicando lo que he aprendido. ¡Gracias! 🙂

    Me surgen las siguientes dudas:

    1. ¿Es conveniente en una tienda online tener las categorías y etiquetas index o no index? No acaba de quedarme claro.
    2. Igualmente en una tienda online, ¿estaría bien desactivar la opción de subpáginas de archivos o sólo es interesante para blogs sin tienda?

    Muchas gracias por tu ayuda.

    1. Hola Elena!

      Me alegro que te guste. Por cierto, te llamas como mi madre,jaja.

      Te respondo a las preguntas.

      1. Si las optimizas bien si, sino no. Esta es la clave para evitar problemas.

      2. La paginación en blogs da contenido duplicado, tenga una tienda o no. Y en las tiendas pasa lo mismo. Yo prefiero evitarlo.

      Espero que te sea de ayuda y si no, pues aquí estoy para ayudarte.

      Saludos!

  8. Gracias a este post me he puesto a investigar el tema en mi propio blog y parece que no tengo problemas de contenido duplicado interno en mi blog jejeje

    Gracias Raul.

  9. Genial el articulo pero en YOAST ha desaparecido la opción que comentas de otro para evitar el duplicado de contenido de subpaginas, los famosos page/2/…..

    No lo encuentro, ni se con el YOAST nuevo como evitar que indexe esas sub-paginas-…

    Gracias de antemano

  10. Buenas noches Raul muchas gracias por el articulo, me gustaria saber si es aconsejable usar paginas de trafico y sin son confiables, muchas gracias saludos!

  11. Andrés Vanegas Patiño

    Hola Raúl. Muchas gracias por tu valiosa información.
    Es posible detectar si somos victimas del copy-paste, es decir saber quien está copiando y tratando de indexar nuestro contenido.
    De antemano muchas gracias.

  12. Hola Raul, me enviastes a este enlace por lo de contenido duplicado y he puesto el codigo site:dominio.com inurl:/page/ en google y solo me aparecen dos paginas de authoy y page, y yo tengo unas 200 entradas que creo que es lo que me deberia salido. Entonces en mi web algo no va bien yo segui las recomendaciones del post tuyo del que vengo.
    Lo primero que me sale en el titulo nombre de mi dominio sin el .com seguido de autor en – Página 4 de 8
    Lo segundo que me sale en el titulo mi nombre de dominio sin el com seguido de  autor en – Página 8 de 8

    Esas dos unicas cosas me salen, agradeceria pudiera decirme algo de porque sale esto y que deberia salir y como eliminar eso que creo que no vale para nada.

    Ojala pudieras arrojarme algo de luz.
    Gracias y un saludo.

  13. Gracias por la pronta atencion. Entonces me quedo tranquila. Sobre duplicado hice todo al pie de la letra y ahora a esperar los resultados, solo tengo de unas 200 entradas y 67 indexadas y de 400 imagenes solo tengo indexadas unas 110 y asi llevo bastantes meses casi para tirar la toalla y no renovar de nuevo, solo tengo 3 visitas diarias y es frustrante. Que mas podria mirarle o que articulo me recomiendas a ver si se diera con la tecla.
    Un saludo y gracias de nuevo.

  14. Hola Raul, interesante tu articulo. Soy un poco nuevo en esto del SEO. Te quiero hacer una pregunta, veo que tus párrafos son cortos, ¿Cual es el promedio de longitud de parrafos que se debe utilizar en un articulos?. Gracias de antemano

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

He leído y acepto la política de privacidad y la política de comentarios.

Información básica sobre Protección de Datos

Responsable: Raúl González Sedeño.

Finalidad: Gestión del envío de información solicitada, gestión de suscripciones al blog y moderación de comentarios.

Legitimación: Consentimiento del interesado.

Destinatarios: Se comunicarán los datos a Active Campaign para gestionar las comunicaciones con el usuario.

Derechos: Tienes derecho a acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional.

Información adicional: Puede consultar la información adicional y detallada sobre protección de datos personales en mi página web ragose.com + info