domingo, 30 de septiembre de 2012

Google Analytics: Diferencias entre filtros y segmentos avanzados

Post creado por Iñaki Huerta.

Esta entrada pretende ser solo un pequeño apunte para resolver las dudas en un punto donde la gente suele confundirse a la hora de crear sus informes personalizados y segmentaciones varias. Esto sucede sobretodo cuando pasamos a usar la descarga de datos mediante la API de Google Analytics para crear informes más ricos y enfocados a negocio, aunque al tratarse de un error de concepto puede sucederle a cualquiera.
Y es que estas dos herramientas parecen lo mismo a simple vista, pero en la práctica, al usarlas, la información que extraemos de Google Analytics puede ser totalmente falsa si no tenemos en cuenta sus peculiaridades y podemos acabar presentando informes que poco tienen que ver con la realidad de nuestro tráfico.

Partamos desde el principio: ¿que son los filtros y que son los segmentos avanzados?

Google Analytics es un sistema que se basa en dimensiones (formas de clasificar los datos por distintos criterios en grupos) y métricas (datos numéricos que realmente se miden, suman, etc.). Cuando nosotros vemos un informe o extraemos datos de Google Analytics siempre lo hacemos bajo este orden: dividimos los datos en las dimensiones demandadas y por lo tanto acabamos viendo una tabla con dos ejes: las dimensiones y las métricas seleccionadas.
En nuestra selección de datos de nuestro perfil podemos decidir, además, que no queremos ver todos los datos de tráfico acumulados, sino solo una porción de los mismos. Para esto existen los filtros y los segmentos que nos van a permitir escoger solo una porción del tráfico deseado.
El sistema en un principio es simple: utilizamos reglas condicionales sobre las propias dimensiones y métricas para seleccionar o desechar una parte del tráfico.
Así podemos por ejemplo escoger ver solo el tráfico orgánico, solo las revisitas, solo el tráfico con más de 2 páginas vistas, etc. Puedes encontrar muchisima documentación e ideas sobre distintas formas de filtrar el tu tráfico para descubrir patrones en el comportamiento de tus usuarios. Y no nos engañemos, realmente la diferenciar entre saber sacarle partido a Google Analytics y ser un mero observador radica fundamentalmente en saber lo que hacemos cuando usamos estas herramientas.

El problema con los filtros y los segmentos

Si todo es tan sencillo y obvio, ¿Donde está el problema?. Pues básicamente en que podría parecer que ambas acciones hacer exactamente lo mismo y cuando trabajamos con nuestros informes muchas veces la gente se decanta por la herramienta que más a mano tiene. Así pues, muchas veces se usan filtros y segmentos creyendo que van al filtrar el tráfico de una forma específica cuando en realidad estan realizando el corte en un lugar que no sospechamos.

El problema está en los filtros por métricas, no en las dimensiones

Cuando creamos un filtro o una segmentación en base a una serie de dimensiones no existe demasiado problema. Al final las propias dimensiones son microsegmentaciones del tráfico por lo que simplemente escogemos algunas de estas microsegmentaciones y las añadimos o desechamos según nuestras necesidades. Esto resulta bastante fácil.
Por ejemplo podemos decidir que queremos solo el tráfico con medio = organic y sabemos que tanto si usamos un filtro como un segmento vamos a ver sólo el tráfico SEO.
Pero cuando la selección tiene que ver con las métricas nos dejamos llevar por el sentido común o por nuestros deseos de lo que queremos que haga la herramienta y esto no siempre es lo más acertado. La herramienta se comporta como ha sido programada y no como nosotros desearíamos que lo estuviese.
Pongamos un caso clásico: Queremos obtener solo el tráfico que ha realizado alguna conversión.
La configuración parece fácil:
  • Crearemos una regla por la que
  • [Incluir] solo el tráfico con
  • [Cumplimiento de Objetivo 1]
  • Mayor que [0].
Pero cuando realizamos este filtro nos vienen las sorpresas. No tenemos tantas conversiones... ¿por qué aparece tanto tráfico en nuestros informes? Es decir, podemos ver como muchos de nuestros datos del informe ni siquiera han cambiado y tan solo han desparecido algunos datos del mismo... ¿que falla?

La clave: Las Diferencias entre el filtrado con métricas en filtros y en segmentos

El motivo por el que las cosas no funcionan como queremos es que Google Analytics necesita realizar agrupaciones del tráfico para poder dar respuesta a nuestro filtro. Con las dimensiones lo tenía fácil pues estas agrupaciones o microsegmentaciones ya estaba hechas. Pero con las métricas debe decidir como hacerlo.
Piensa por ejemplo en un filtro sobre la métrica "páginas vistas > 5": ¿que debe ser filtrado? ¿Las visitas con más de 5 paginas visitas? ¿Los usuarios únicos con más de 5 páginas visitas? ¿Las dimensiones con más de 5 páginas visitas?
Google Analytics necesita realizar estas agrupaciones antes de nada y luego filtra sobre los valores de la métrica en estas para eliminar partes del tráfico. Al final el proceso es el mismo que con las dimensiones, salvo porque esta agrupación debe hacerse antes.
Cuando nosotros creamos un filtro sobre un informe estas agrupaciones quedan marcadas por el propio informe y ahí suele estar el error de comprensión. Si por ejemplo nuestro informe desglosaba todo nuestro tráfico por medios (una de las variables de campaña), y le pedimos que las conversiones del objetivo 1 sean mayores que 1, el informe final nos mosrtará cualquier medio que tenga más de una conversión y no solo el tráfico con conversiones. Esto suele llevarnos a ver casi el mismo informe que si no hubiésemos creado ningún filtro.
En cambio cuando creamos un segmento, la agrupación que se crea es por visitas. Cada visita es evaluada según las normas que indiquemos para ver si se contabiliza en el total de tráfico presentado en el informe o no. Por lo tanto si en lugar de un filtro para incluir el tráfico con conversiones hubiesemos usado un segmento con "objetivos 1 > 0" el resultado si que sería el esperado: El segmento contemplaría solo aquellas visitas con más de 0 conversiones y por lo tanto si que veremos los datos que queremos.
Por lo tanto, la conclusión es que cuando deseamos filtrar el tráfico para generar un informe siempre debemos tener en cuenta, aparte de las propias reglas de filtrado, que si estas usan métricas debemos saber si estas van contemplarse agrupando los datos por visitas o por las propias dimensiones del informe:
  • Si queremos eliminar las dimensiones del informe que no cumplen ciertos criterios en sus valores totales usaremos filtros
  • Si por el contrario queremos eliminar visitas completas por no cumplir criterios durante su navegación usaremos segmentos

Ejemplo: Aplicando todo esto a las extracciones mediante la API de Google Analytics

Llegados a la API, esto se vuelve una herramienta realmente interesante pues esta nos permite usar segmentos dinámicos. Los segmentos dinámicos son segmentos avanzados declarados en la propia solicitud. Así, para consultas concretas puedo declarar las reglas para filtrar o no el tráfico de la web en el mismo momento que lanzo las consultas y sin necesidad de crear nuevos segmentos avanzados en la herramienta de Google Analytics. Estos datos tendrán menos fiabilidad que los segmentos reales pero por otro lado nos permitirán extracciones a nuestra medida en cualquier momento.
Veamos un caso sencillo:
Quiero extraer a una tabla el tráfico con conversiones provocado por los medios que me traen un minimo de 1000 visitas al mes. No voy a poner el código exacto de como se realizaría la consulta pues cada uno usa su propio sistema pero vendría a ser algo asi:
  • Seleccionamos un mes en el rango de fechas
  • Escogemos como dimensión ga:medium
  • Escogemos como métricas ga:visits y ga:goal1Completions
  • Como segmento solicitamos el segmento dinámico donde ga:goal10Completions > 0
  • Como filtro solicitamos que ga:visits sea mayor que 1000
Ya tenemos nuestra consulta perfectamente preparada.
- Como hemos puesto la comprobación de objetivos como segmento, esta se hará sobre las visitas y por lo tanto solo contemplará visitas con al menos una conversión.
- Y como hemos puesto la comprobación como filtro esta se hará sobre las dimensiones seleccionadas en el informe, así que tendrá en cuenta aquellos medios con más de 1000 visitas.

¿Y los filtros de perfil?

Los filtros de perfil son una historia distinta. Yo creo que se prestan mucho menos a confusión.
Aparte de que no pueden crearse retroactivamente (si no los creaste con antelación no funcionan) estos actuan sobre la captación de cada dato de Analytics. Es decir, cada página vista que se realiza se evalua con los criterios de los filtros y si pasa los filtros esta información termina formando parte de los informes y si no no. Este es el motivo por el que muchas veces no encontramos la opción que deseamos a la hora de usar filtros: hay criterios que simplemente no son posibles.

Cuenta tu caso o tu problema

Para terminar el post simplemente pediros a los que hayais vivido o estéis viviendo experiencias relacionadas con este tema que paseis por los comentarios. Los post siempre se quedan en lo genérico y siempre es bueno saber de casos reales.

No hay comentarios:

Publicar un comentario