Contenido duplicado: Cómo no ser sancionados por Google
“Nuestro sitio aparecía siempre en los primeros lugares, pero ahora no aparecemos y nuestro tráfico cayó repentinamente. Estamos muy preocupados, nuestro negocio depende en gran parte de Google”
Lo anterior, no es un invento ni tampoco un testimonio extranjero traducido al español. Es la pura y santa verdad de una empresa pyme nacional que de un día para otro, vio como su tráfico y visibilidad online que por tanto tiempo había cultivado, se iba en picada.
Desde hace muchos años, esta empresa estuvo posicionada en inmejorables posiciones en resultados de búsqueda, para palabras clave en su negocio. Este ranking se traducía en un alto nivel de tráfico, el cual intentaban transformar en conversiones de negocio, en su caso, solicitudes de productos y servicios. El negocio marchaba bien, hasta que un día San Google, la gran G de hoy, se encaprichó y le desconoció una amistad de años.
En Estados Unidos hoy se discute fuertemente el gran cambio del algoritmo que Google realizó a fines de febrero, el cual sancionó fuertemente a miles de sitio del tipo “Content Famer” o “Granjas de Contenidos”, es decir, aquellos que generan contenido de muy baja calidad o que toman “prestado” contenido integral desde otros websites y lo publican como propio. Este cambio de algoritmo, también llamado “Panda Update“, pretende darles a los usuarios resultados más relevantes en el menor tiempo posible. Pues, no fueron decenas ni centenas, sino miles los sitios que fueron afectados tanto positiva como negativamente, en sus rankings. Google señaló que al menos un 11,8% de los resultados cambiaron producto de esta variación en el algoritmo.
Más allá de lo alarmante que puede ser para grandes empresas, bajar bruscamente de posiciones, es importante entender lo que Google pretende con estos cambios que seguirán en el futuro: “darles a los usuarios resultados más relevantes en el menor tiempo posible”. ¿Cómo Google puede entregar mejores resultados en el menor tiempo posible? Pues para ello recordemos la labor básica de un buscador.
¿Cómo funciona un motor de búsqueda?
Rastreo (Crawling)
Indexación (Indexing)
Relevancia y Ranking
Entregar resultados
Esto quiere decir, que los robots de nuestros queridos buscadores, llegan a nuestro sitio, y mediante los links descubren el resto de páginas que lo componen. Esto se llama rastrear. Pero no solo rastrea sino que guarda una copia de los contenidos del sitio en sus propios sercidores; y esto se denomina indexar. Lo que indexan los robots, luego se cataloga y se compara con el resto de millones de páginas con el fin de poder identificar las páginas que mejor autoridad y fortaleza poseen; acá entonces el buscador genera relevancia y ranking. Finalente, según al consulta de búsqueda de un usuario, el motor de búsqueda tomando las páginas indexadas y la posterior evaluación de relevancia, analiza cuáles de éstas responden mejor a las palabras clave ingresadas. Y así es como nos encontramos con los resultados que día a día encontramos en nuestros motores de búsqueda favoritos.
No obstante, cada motor de búsqueda tiene sus propios parámetros para determinar, según su punto de vista, qué páginas responden mejor a las consultas de búsqueda. En el caso de Google, son más de 300 los items que componen su algoritmo de búsqueda y ranking. Sin embargo, la última modificación le dio realce a un en especial: El contenido duplicado vs el contenido original.
El contenido duplicado desde hace mucho tiempo, ha sido uno de los elementos que más perjudican a un sitio web. Tomar prestado sin aviso ni mención, es considerado una falta grave que no solo se sanciona con pérdida en posicionamiento sino que puede llegar hasta el baneo o completa desaparación en los resultados de búsqueda. En el caso de la pyme nacional con la cual inicié este post, el fantasma del contenido duplicado apareció repentinamente e hizo todo lo posible para que Google lo notara. Pues, nuestros queridos amigos habían iniciado una práctica no muy favorable, de tomar contenido de distintos medios: noticiosos, enciclopédicos, entre otros, para generar una gran sección de artículos de interés. Quizás el tamaño pequeño del sitio, no llamó la atención de la gran G… al comienzo. Pero cuando lo notó, comenzó el infierno de esta pyme.
¿Qué es contenido duplicado?
Google define contenido duplicado como “bloques de contenido considerables en varios dominios que coinciden completamente o que son muy parecidos”. Al querer intentar entregar resultados con información diferente, Google a menudo se encuentra con páginas que poseen bloques de contenidos que tanto en texto o en código, son muy pero muy similares. En estos casos, decide cuál de los dos tiene mejor relevancia y castiga al perdedor ignorándolo dentro de sus resultados.
Por esta razón, es que aquellos sitios que copian contenido desde otras fuentes, muy pocas veces son considerados seriamente, sino es que bloqueados de los resultados de forma permanente.
¿Cómo saber si un contenido es duplicado?
Si Ud. está en la inocente categoría de aquellos que no saben si su contenido es duplicado, es sencillo, tome un extracto de un artículo e ingréselo en Google. Si nota que muchos sitios tienen exactamente el mismo texto, puede darse la escasa probabilidad de que le haya robado parte de su valioso trabajo, o lo más probable, que su sitios tenga las mismas prácticas que el resto de los que ve en los resultados de búsqueda.
Contenido Duplicado en Google
En la imagen anterior (haga clic para agrandar), se muestran solo dos de muchos más resultados en los cuales al menos 20 sitios tiene el mismo contenido. Ahora si desea un mecanismo más seguro para saber si al menos el contenido “interno” de su sitio posee o no duplicados, Seomoz posee una herramienta (pagada) que rastrea todas las páginas del sitio y determina si existe o no contenido duplicado.
Contenido duplicado en el tiempo
En muchos casos, el contenido duplicado “interno” se debe a una mala estructura de URLs, especialmente aquellas que utilizan parámetros, que dirigen al mismo contenido pero con distintas urls. Por ejemplo, puede darse el caso de que un sitio utilice http://www.misitio.com/acerca-de y http://www.misitio.com/acerca-de?id=101 para dirigir a la sección “Acerca de”, o que http://www.otrositio.com/contacto/ y http://www.otrositio.com/node/101 (alguien usa Drupal?) dirijan ambas al formulario de contacto. Aunque a ojos humanoides, estas páginas aparenten ser las mismas, solo por el hecho de tener variaciones en la URL, se transforman en páginas distintas para los robots de búsqueda, por lo tanto, caen en la categoría de contenido duplicado.
¿Cómo evitar contenido duplicado?
Lo más básico: cree contenido único y original, ojalá con alto valor para el usuario. Esta es la mejor forma no técnica, de hacer las páginas de su sitio relevantes tanto para personas como para motores de búsqueda
Optimizar estructura de URLs: Como en los ejemplos anteriores, sea coherente en la forma en cómo crea URLs. Si su página de inicio carga tanto con http://www.miweb.com/ como con http://www.miweb.com/index.htm y con http://www.miweb.com/index.htm?key=ab1 entonces arriesga que Google decida mal cuál de éstas es la más relevante
Utilice redirecciones 301: Este tipo de redirecciones permanentes, les dice a los motores de búsqueda que la URL que se intenta cargar debe de redirigirse a otra. De esta manera se traspasa su autoridad y fortaleza. Cuándo utilizar un 301, por ejemplo para redirigir http://www.migranweb.com a http://www.migranweb.com/ (sí, la única diferencia es el slash o barra “/”). Así se realza solo una URL como página principal
Guíe a Google con el uso de sus parámetros: Si su sitio utiliza URLs con parámetros que generan contenido duplicado, puede señalarle a Google mediante Webmasters Tools, que ignore parámetros que no juegan un rol clave en la identificación de la URL
Organizacion de Parámetros en Google Webmasters Tools
Citas y menciones enlazadas: Si quiere citar contenido de otros sitios, intente hacerlo solo con frases o textos pequeños, no párrafos completos. En cualquier caso, siempre pero siempre, incluya un enlace al contenido original.
El contenido duplicado, tanto externo como interno, es un problema que poco a poco se comienza a notar con más fuerza. Detectarlo a tiempo y cambiar la estrategia de gestión de contenidos antes de que Google lo note, es vital para evitar caer en sanciones que como la pyme de nuestra historia, son críticas para sus negocios