A menudo se considera que las conversaciones en redes sociales son una muestra representativa de las opiniones de toda una población.

diagnosticando-jovenesNada más lejos de la realidad

Para que un conjunto de individuos, de observaciones de una realidad, puedan considerarse como un amuestra representativa, han de cumplirse una serie de circunstancias que no se dan en ninguna red social. Si me permitís, repasaremos algunos conceptos relacionados con el muestreo en una investigación de mercados-

Llamamos población a todos los posibles elementos a analizar. Sobre este conjunto de individuos conocemos algunas características, pero desconocemos otras, sobre las que vamos a efectuar alguna hipótesis que contrastaremos gracias a la información obtenida al efectuar el muestreo. Deberemos delimitarla muy bien, ya que esta información es la base de todo el proceso posterior.

Todos los individuos que la compongan deberán ser idénticos respecto a la característica que hemos utilizado para definir la población, para asegurarnos que la variable a estudiar tiene la misma distribución de probabilidad condicionada a la variable definitoria de la población. Es decir, que en todos ellos la variable a estudio esta idénticamente distribuida.

Cuando queremos investigar una o varias características de una determinada población, podemos medirlas de diferentes formas:

  1. Tomar cada uno de los individuos y observarlo.
  2. Tomar algunos individuos y extrapolar los resultados a toda la población.

Este segundo caso es lo que denominamos muestreo, caso habitual cuando:

  • Al observar un elemento se destruye.
  • La población es infinita o extremadamente grande.
  • Queremos ahorrar tiempo y dinero en el estudio sin perder confianza en el resultado.

Llamamos muestra a un subconjunto de la población, a los individuos elegidos para cuantificar la variable estadística que estamos estudiando. Es decir, un grupo de individuos elegidos en función de los datos conocidos sobre la población, pero sobre los no conocemos cual es el valor que va a tomar la variable en estudio hasta no efectuar el trabajo de campo, es decir, la medición de la variable.

En ese sentido decimos que la muestra es un vector aleatorio, al igual que lo es la población, pero de un tamaño más reducido y manejable. Mediante las técnicas de inferencia estadística podemos averiguar los parámetros de la función de probabilidad conjunta de la población, viendo que ocurre con la función de probabilidad conjunta de los individuos de la muestra.

Las condiciones que debe cumplir toda muestra deben ser:Los internautas no son una muestra representativa

  1. Ser representativa de la población. Si deseamos conocer las costumbres de compra de los esquimales, no deberemos entrevistar a los habitantes de España. En este sentido, exigiremos que cada individuo que la componga tenga la misma distribución de probabilidad respecto a la variable en estudio que la población. A esto lo llamamos estar idénticamente distribuidos, entre sí y respecto al resto de la población.
  2. Cada individuo de la población debe tener una oportunidad igual e independiente de ser incluido en la muestra. 
  3. La muestra debe tener el tamaño adecuado, en función del nivel de significación deseado.

Con los datos de la muestra, construiremos un estadístico, es decir una función que depende solo de los valores posibles de los datos muestrales, pero que sigue una distribución de probabilidad conocida y perfectamente determinada sin depender de los datos muestrales. Es un resumen de la información de campo, un número que se formará con la cuantificación de la variable en la muestra,  que podremos comparar con un dato en tablas para contrastar la hipótesis de trabajo.

Para que el estadístico sea válido ha de ser insesgado, [es decir, que su media coincida con el valor a estimar] y con mínima varianza [o lo que es lo mismo, alta precisión, valores muy concentrados en su media]. Las varianzas del estimador dependen del tamaño de la muestra y de la forma en que hemos decidido que individuos van a componerla para asegurar la representatividad de los mismos. Por eso se denomina también “error de muestreo”.

¿Cómo son las personas activas en redes sociales?

No todos los ciudadanos están en las redes sociales. Y de los que están, sólo una pequeña parte emite opiniones personales. Y muchos menos son los que hablan si estas opiniones tiene que ver con política, religión o cualquier otro asunto potencialmente conflictivo. Habitualmente, sólo aquellos que están muy sensibilizados con un tema, muy involucrados, emiten opinión publica sobre ello.

Por lo tanto (y siento desengañar a algún visionario político) que un hashtag sea trending topic no significa que la sociedad esté cambiando hacia esa forma de pensar. Sólo significa que, en ese momento, está de moda (valor más frecuente en estadística) hablar de eso. Y que, igual que esa idea ha llegado, puede desaparecer.