¿Por qué Google Analytics no es 100% preciso?

Estoy a punto de cumplir mi primer mes como Consultor en Métricas en Multiplica Chile, y ya en las primeras reuniones con clientes, surgen dudas que son bastante similares entre quienes están comenzando a crear e implementar estrategias de analítica web: ¿por qué los datos de mi servidor no coinciden con los que entrega Google Analytics?

Ninguna herramienta de Analítica web es 100% precisa, sencillamente porque los métodos que utilizan para capturar datos tienen tantas ventajas como desventajas en lo que respecta a la exactitud de los datos.

Dos de los métodos más populares de captura de datos, son los archivos Logs (logfiles) y Page Tagging (o marcación de páginas). Google Analytics utiliza el Page Tagging mediante el empleo de Cookies y Javascript, en el cual las primeras registran los datos de la visita de un usuario y el segundo envía estos datos a los servidores de Google, quien se encarga de realizar los reportes.

Dado que las cookies y el javascript son elementos del tipo client-side es decir, se ejecutan en el navegador del usuario, cualquier configuración que el usuario realice sobre éstos, afecta la marcación de las páginas y por consiguiente el correcto conteo y registro de datos como visitas, fuentes de tráfico, páginas visitas, etc.

En resumen, los principales inconvenientes respecto a la exactitud de los datos, que existen en una herramienta de analítica web, como Google Analytics, son:

    • Eliminación de cookies por parte del usuario
    • Errores en la configuración
    • Restricción por Firewalls (cortafuegos)
    • Ubicación del tag en la página
    • Errores de ejecución de Javascript
    • Varios usuarios utilizando el mismo computador
    • Un mismo usuario utilizando varios computadores
    • Latencia entre fecha de visita y fecha de compra
    • Porcentaje de páginas no marcadas

Eliminación de cookies por parte del usuario

Esta es una de las principales desventajas que se le pueden encarar a una herramienta de page tagging. La privacidad y seguridad de los datos, es quizás la principal razón por la cual los usuarios borran sus cookies, debido principalmente a la existencia de third-party cookies, utilizados por terceros como empresas de publicidad hasta programas de spyware, que utilizan los datos de los usuarios para personalizar anuncios, etc.

Y es justamente uno de los principales temas de discusión en Europa, especialmente en Inglaterra, país en donde se acaba de establecer una norma que obliga a los administradores web a incorporar en sus sitios una solicitud de permiso a los visitantes, para utilizar cookies durante sus sesiones de navegación.

Estudios indican que al menos un 30% de los usuarios de internet, borran sus cookies en un mes.

Importante es destacar que es muy distinto borrar las cookies, que deshabilitar el uso de éstas en un navegador. En la primera, el borrado de cookies hace perder un seguimiento histórico, transformando a visitantes recurrentes en visitantes nuevos, generando confusión en la asignación de conversiones a campañas, etc. En cambio en la segunda, la desactivación de cookies, es un bloqueo completo al seguimiento y captura de datos, por lo que no es posible identificar visitas, fuentes de tráfico, y todos aquellos parámetros que se envían por cookies. Afortunadamente, la desactivación de cookies es muy poco común, dado que la mayoría de los sitios las utilizan para sus principales funcionalidades, por lo que se hace poco factible y conveniente para un usuario promedio, no utilizarlas.

Errores en la configuración

Los errores en la configuración se refieren a aquellos realizados en la implementación de la herramienta en las páginas del sitio. Si se inserta un código con errores, o con una ID incorrecta, simplemente no se envían los datos a los servidores de Google, o quizás estos no sean consistentes.

Lamentablemente, el método por page tagging (a diferencia del método por logs) no guarda un histórico de datos que ante un error puedan reprocesarse para enmendar el error. Todo dato que ingresa o se captura, se procesa y pasa a los reportes. No es posible, reparar el error y volver a procesar los datos, por lo que es importante testear muy bien una implementación ante una potencial pérdida de datos.

Restricción por Firewalls (cortafuegos)

Frente a los encargados TI hay poco que hacer. Si deciden bloquear, no hay mucho por batallar. Los cortafuegos pueden configurarse para bloquear o rechazar cookies de forma automática, también para bloquear accesos a dominios de distintos sitios web (como google.com). Cualquiera de estas acciones impiden la captura y análisis de datos de tráfico.

Ubicación del tag en la página

Muchas herramientas de analítica web, recomiendan instalar el código de seguimiento en la etiqueta en una posición inferior, de manera que los elementos importantes del sitio, html, imágenes, contenidos, se carguen en primer lugar. Sin embargo, cualquier demora en la carga de la página, puede hacer que el usuario o abandone el sitio o haga clic en algún link de navegación antes de que la página finalice su carga en un 100%. Esto sin duda puede ocasionar que el tag de seguimiento no se alcance a ejecutar lo que impedirá el seguimiento de este tipo de visitas.

Frente a esto, Google Analytics lanzó en el 2010 el tag asíncrono, que se implementa en el encabezado del código, precisamente ende manera que se reduce el riesgo de que el tag código de seguimiento no se alcance a ejecutar. Sin embargo, si un sitio utiliza el código tradicional u otra herramienta de analítica web que recomienda implementar el código en corre este tipo de riesgos.

Errores de ejecución de Javascript

De forma similar al punto anterior, la ubicación del código de seguimiento también es clave cuando existen errores de ejecución. Cualquier inconveniente de código javascript que se sitúe sobre la marcación, detendrá toda ejecución javascript posterior, por lo que impediría el funcionamiento del código de seguimiento.

Varios usuarios utilizando el mismo computador

El principio básico de la utilización de cookies para la identificación de visitas y usuarios, es que un usuario utiliza un navegador para visitar un sitio. Este navegador crea una cookie única que le permitirá a la herramienta de analytics identificar la cantidad de usuarios únicos que llegan al sitio, así como la cantidad de visitas que realizan. Si un usuario utiliza otro navegador, se crean nuevas cookies y como consecuencia la herramienta lo interpreta como nuevas visitas. Esta situación es exactamente igual si un usuario utiliza otros computadores (por lo tanto, otros navegadores que crean nuevas cookies). Si se consideran los distintos computadores que una persona utiliza para navegar (en la oficina, en la universidad, en el ciber café e incluso desde dispositivos móviles), las visitas únicas simplemente están lejos de representar de forma exacta, la realidad.

Un mismo usuario utilizando varios computadores

Similar pero al revés que el punto anterior. El PC de una familia, puede ser utilizado por varios miembros de ésta, incluso con el mismo navegador. Las transacciones o conversiones que realicen estos en distintas sesiones, pueden ser asociarse a un mismo usuario (misma cookie id), por lo que la herramienta en vez de reportar tres o cuatro usuarios visitando y generando conversiones, reporte solo uno.

Latencia entre fecha de visita y fecha de compra

En el campo de las conversiones y transacciones, muchas veces el ciclo de vida de compra no se ajusta a los tiempos con lo que una herramienta mide el tráfico. Si un usuario visita un sitio producto de una campaña online, se decide por un producto, pero finalmente realiza la compra meses después, posiblemente la herramienta no asocie la campaña a dicha compra, por el riesgo de que el usuario haya borrado cookies, haya instalado actualizaciones en el navegador, o simplemente, por un vencimiento de las cookies.

Porcentaje de páginas no marcadas

Ya sea porque se tiene que hacer de forma manual o porque algunas páginas poseen una configuración distinta, es muy común no marcar todas las páginas de un sitio, sobre todo cuando éste posee miles y miles de páginas. Aquellos sitios que cuentan con CMS, tienen la posibilidad de utilizar plantillas o includes, para taggear todas las páginas. Sin embargo, estudios señalan que incluso aquellos sitios para los cuales se creía habían marcado todas las páginas, un 20% de éstas no lo estaban.

¿Entonces qué esperar de Google Analytics?

Tendencias y aproximaciones estables. La toma de decisiones en web analytics está lejos de depender de cifras absolutas… absolutamente exactas. Por supuesto que es importante considerar los errores de precisión a la hora de abordar preguntas complejas asociadas a campañas o rendimiento de nuestro sitio web. Analytics puede responder a preguntas como:

    • ¿Qué tipo de campañas online son más rentables?
    • ¿El diseño de mi página hace que los usuarios abandonen mi sitio?
    • ¿Qué hacen los usuarios antes de comprar?
    • ¿Qué palabras utilizan los usuarios para llegar a mi web?
    • ¿Qué productos son los más visitados en las ciudades en donde vendo?
    • ¿Dónde y por qué los usuarios están  abandonando mi carrito de la compra?

El benchmarking de datos, también es un dato interesante y a pesar de Google Analytics no entrega información de tráfico de sitios de la competencia, existen servicios como Compete y Alexa que permiten justamente comparar sitios en base a estimaciones de datos de tráfico, que en el mediano plazo y para aspectos generales, son muy útiles para comprender el peso que tiene cada sitio en la industria.

Google Analytics, finalmente, es una herramienta estratégica, en constante actualización y proceso de mejoras, que acaba de lanzar una nueva versión (en beta) con notables mejoras no solo en la forma de capturar datos, sino también incorporando nuevas funcionalidades que potencian aún más las posibilidades para las empresas de sacar mayor provecho de sus sitios web.

Esta entrada fue publicada en google analytics, Web Analytics el por .

Acerca de Richard Johnson

He trabajado en la industria digital por más de 15 años y caí de forma divina en la Analítica Digital. Soy ingeniero comercial y licenciado en administración y ciencias económicas de la Universidad Santa María en Chile y cuento con un Master en Digital Analytics de la University of British Columbia. Actualmente soy orgulloso Director de Metriplica America, liderando un increíble equipo en cuatro oficinas: Chile, Mexico, Colombia y Peru. He tenido el placer de participar en proyectos de analítica de gran envergadura, como desarrollar la analítica digital para Telcel y America Movil (Mexico), impulsar el área de Analítica Web para Latam, ex-Lan.com (Chile), desarrollar una estrategia de medición global para TigoUNE(Colombia), o empujar iniciativas de optimización y mejora continua para CMR Falabella (Chile). Mi pasión por la analítica y la medición digital me ha llevado a impartir docencia, siendo continuo profesor del "Master de Analítica Web y Multidispositivo" y del "Master de Marketing Digital y Comercio Electrónico" todos de la Online Business School, así como también continuo relator de cursos de Adobe Analytics (ex- Omniture Sitecatalyst) o Google Analytics. Me gusta mucho dar pláticas, charlas y conferencias de analítica web, comercio electrónico y marketing digital en general. En esa línea, creé el Web Analytics Wednesday Mexico, evento gratuito que convoca a profesionales de la industria a compartir y colaborar casos y ejemplos para fomentar la analítica en las empresas. Si quieres contar con nuestros servicios de Analítica Digital, escríbeme... al menos te invitaré un café de alguna de nuestras oficinas en Latinoamerica (la de Colombia corre con ventaja). Si te gustaría ser parte de nuestro equipo, contáctame... a ver si logramos seducirte de participar del desafío. O si crees que podemos caminar parte de la aventura juntos como socios o buenos amigos, házmelo saber... ya verás que nunca nos aburriremos.

3 comentarios en “¿Por qué Google Analytics no es 100% preciso?

  1. Josep M.

    Gracias Richard, está muy bien el resumen, solo encuentro a faltar que ventajas aportaria analizar los logs respecto a los inconvenientes del javascript+cookie.
    I comentar lo costoso que es analizar los logs, y si hay posibilidad de combinar ambos sistemas.

    Respuesta
  2. Richard Johnson Hurtado

    Hola Josep, claro los logs fueron los ciemientos de la medición en la analítica web. Pero hoy esta metodología de medición es poco utilizada, además de cara como tú señalas. Por supuesto, las ventajas de los logs van primero por la existencia de datos históricos que puedes reprocesar cuando quieras y luego por la seguridad de contar con estos datos en tus propios servidores (o de quienes tu confíes). Pero hoy la utilidad de los logs se ve reducida simplemente porque el comportamiento de los usuarios no permite confiar demasiado en logs. Así sucede cuando analizas una visita que proviene de una IP determinada, y aunque nunca lo sepas, esa visita provenía de una empresa con IP fija en donde no fue una, sino un centenar de visitas las que fueron contabililizadas como una sola.

    Aunque los tags, como se señala en el artículo también tiene sus desventajas, más hoy con múltiples plataformas con conexión a la red, en donde es casi imposible poder identificar un usuario único entre estas distintas plataformas (a no ser que además registres los logins).

    Combinar logs y tags? quizás, pero depende del tipo de decisiones que requieras tomar y los datos que necesitas para ello. Si tu problema está en la definición clara de la cantidad de usuarios, pues valdría la pena combinar ambos. Pero si tu intención está en el análisis de tendencias para evaluar campañas de marketing online, quizás no sea tan valioso. En fin, depende justamente de tu propósito.

    Te agradezco mucho el comentario, sin duda aporta al contenido original

    Respuesta

Agregar un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *