viernes, 22 de mayo de 2015

Sosa Escudero nos ilustra sobre las encuestas electorales

Las estadísticas, como una hamburguesa o un remedio
La letra chica de las encuestas, como las que miden a Macri, Scioli o Massa, permite entender qué credibilidad tienen
Por Walter Sosa Escudero  | Para LA NACION



Prepárense. Frente a la inminencia del largo proceso electoral, se avista en el horizonte una autentico tsunami de estadísticas. Todos los medios asignan considerable espacio a los resultados de diversas encuestas sobre intenciones de voto. La pregunta inevitable es si uno debería creer en estas encuestas, o en las estadísticas en general. Esto cambia con una breve visita a la cocina de las estadísticas. Como las hamburguesas, quedará a juicio del lector seguir consumiéndolas luego de ver cómo se fabrican.

Una encuesta reciente sugiere que Daniel Scioli tiene una intención de voto de 33.4%, por lo que aventaja a Mauricio Macri, con un 27.3%. ¿Qué es posible concluir de esta información? La estadística viene con "letra chica". Una encuesta es una aproximación a una realidad inalcanzable. La única forma de confiar en un 100% en una encuesta electoral es si todos los votantes son encuestados. Desde este punto de vista, el acto electoral es algo así como la madre de todas las encuestas, una tarea costosísima. En el día a día debemos conformarnos con alguna aproximación, con un sondeo basado en un pequeño subconjunto de la población. Por eso, una encuesta de opinión es errada por construcción tanto como la muestra difiera de la población.

La tarea de la estadística consiste en garantizar que esta información sobre la base de muestras sea útil a pesar de ser errada. En el caso de la discusión de Scioli versus Macri, el yerro tiene que ver con que los guarismos que favorecen a Scioli en realidad dicen que el 33,4% de los encuestados dijeron que lo votarían. ¿Es posible extrapolar esto a toda la población? Y aquí es cuando entra en acción la letra chica de la estadística, que a veces aparece en auténtica letra ínfima incluyendo frases enigmáticas como "muestreo polietápico" o "error de muestreo".

Una encuesta estándar se maneja con unos 1000 casos, que suenan a pocos en comparación con los cerca de 30 millones habilitados para votar. ¿Es creíble la información que surge de tan ínfima cantidad de datos? Antes de concluir rotundamente que no, hay que pensar en la cantidad de sangre que nos extraen para un análisis de colesterol.

La tarea de la estadística profesional es medir cuán grande puede ser la discrepancia entre la parte (la encuesta) y el todo (la población). El más simple de los esquemas de muestreo debería contactar a la gente al azar, es decir, de una lista que contiene a toda la población, elegir una muestra por sorteo, en donde cada persona tiene la misma chance de aparecer que cualquier otra, como quien revuelve bien la cacerola de salsa antes de sacar una cucharadita para ver si está salada.

Estos métodos puramente al azar son extremadamente costosos, de ahí que en la práctica se apele a estrategias más sofisticadas. Por ejemplo, muchas veces se divide a una ciudad en barrios y luego se procede a encuestar al azar dentro de cada barrio. A este tipo de procedimiento se lo llama "muestreo por etapas" o polietápico.

El paso siguiente consiste en calcular una suerte de margen de error, es decir, en cuanto deberíamos esperar que cambien los resultados si en vez de haber tomado una muestra hubiésemos tomado otra. Una aproximación burda sugiere que para una encuesta de 1000 casos el margen de error es aproximadamente 3,2%. O sea que si de 1000 personas encuestadas, el 33,4% dijo que votaría a Scioli, la respuesta para toda la población debería estar entre 30,2% y 36,6%. Y acá aparece la frase "con un nivel de confianza de 95%", qué debe ser interpretada como un grado de credibilidad, que va de 0 a 100. La pregunta obvia es si no será posible obtener una estimación con un nivel de confianza del 100%, y la respuesta es positiva pero decepcionante: de lo único que estamos 100% seguros es que la proporción de votantes a Scioli (y a cualquier candidato) esta entre 0% y 100%, concepto tan cierto como inútil ya que lo sabíamos sin hacer ninguna encuesta. Aumentar la confiabilidad implica agrandar el margen de error.

"Puede fallar", decía Tu Sam cuando uno de sus trucos no funcionaba. Y lo mismo ocurre con las estadísticas. Más concretamente, no es del todo claro que la ventaja de 6% que Scioli tiene sobre Macri no sea simplemente un "error estadístico". Entonces, la letra chica de la estadística debería decir cómo, cuándo y donde se hizo la encuesta, el número de casos, y alguna idea del margen de error estadístico.

Volviendo a la analogía con los remedios, más que leer la letra pequeñísima de los prospectos el paciente confía en su médico, que a su vez confía en la escuela que lo formo, que cree en las instituciones reguladoras, que a su vez lo hace en la comunidad científica. Las estadísticas también derivan su validez de una comunidad responsable, científica y comunicacional. Los que hacen seriamente su trabajo estadístico (que son muchos) juegan su prestigio y lo exponen al escrutinio de los expertos.

El debate social (sobre las elecciones, la pobreza o el dólar) sin datos concretos es irresponsable, tanto como la proliferación de estadísticas sin una discusión metodológica seria que permita que el usuario pueda consumirlas con tranquilidad, como los remedios o las comidas de un restaurante confiable.

El autor es profesor de Udesa e investigador del Conicet

No hay comentarios:

Publicar un comentario en la entrada