martes, 7 de agosto de 2012

Conoce los límites de tus fuentes de datos


Post creado por Paulino González  via analiticaweb.es.  
Decimos que conocemos la calidad del dato que nos proveen las herramientas de medición de medios sociales.
Fuente de datos
¿Pero de verdad investigamos si es cierto que las herramientas nos dan todo el caudal del dato, o solamente un parte del total…?
Las fuentes de datos (redes sociales, blogs, marcadores sociales…) pueden contener algunas características que nos impidan obtener el total de los datos que se vierten en esa fuente o canal.
  • Pueden ser privadas, como el caso de Facebook donde un usuario puede cerrar sus publicaciones a un grupo “selecto” de amigos.
  • Pueden no proveer información de datos analíticos, como es el caso de Tuenti.
  • Pueden no ofrecer todo el caudal de de datos mediante las búsquedas tradicionales.
Sobre esta última, por ejemplo, en Twitter, el caudal de datos completo, es enorme y está sólo a disposición de un puñado de compañías. Una muestra típica sobre los datos de Twitter de la mayoría de herramientas está entre el 1% y el 10% del total, con esto no estoy diciendo que algunas herramientas estén limitadas, ya que el 10% de Twitter es muchísimo y puede ser suficiente para algunas organizaciones, simplemente debes valorar si esa cantidad de datos te limita en tus análisis.
Fuente de duda
Si hubiera tal limitación, para solucionarlo, existen compañías que toman sus datos directamente del “almacén” de Twitter  y éstas a su vez ofrecen, el volumen total, un porcentaje o un filtro basado en palabras clave de todos los datos de Twitter, todo ello por “un módico precio”. Incluso van más allá, ofreciendo digeridos de datos de varios canales juntos y ofertándolos de forma paquetizada y de fácil acceso mediante APIs u otros métodos.

En cuanto al análisis:

Como resultado de ello, si sabes que tienes los datos de 80% de los blogs, pero sólo el 5% de Twitter, tendrás que tener en cuenta que tus métricas y conclusiones están basadas en una muestra parcial, y deberás tenerlo en  cuenta a la hora de transmitir esa información, sobre todo si estás tratando de demostrar el impacto en tu organización en la web social en su conjunto.
La manera de trabajar con estos datos es advertir, crear y comunicar los niveles de confianza para las métricas basadas en datos inconsistentes o dar a conocer el % de la muestra analizada, lo que llamaríamos porcentaje de confianza.
¿Te ha tocado enfrentarte a esto con Twitter o algún otro medio social?

No hay comentarios:

Publicar un comentario