Dada mi amplia experiencia, casi 50 años en encuestas políticas y estudios de mercado, cada vez que encuentro a gente que conozco me preguntan, “¿Quién va a ganar?”, mi respuesta inmediata es “NO TENGO LA MENOR IDEA”. Por lo general me insisten en que les diga el porqué de esta respuesta enigmática y tengo que darles una extensa explicación del porqué de mi respuesta.

Ya que las encuestas han sido desde hace décadas una parte importante de los procesos electorales, decidí escribir este artículo que explica en detalle la situación actual que guardan las encuestas, no sólo en México sino en prácticamente todo el mundo.

Recordemos que a últimas fechas las encuestas han tenido errores en sus predicciones y algunas de ellas han sido desastrosas como en el caso del Brexit, las elecciones en Estados Unidos y más recientemente las elecciones de Colombia y el referéndum del aborto en Irlanda.

Ilustración: Víctor Solís

Los profesionales que han estudiado las causas de estos fracasos han determinado que estas son varias, y aquí las describo a continuación.

Muestreo

Cualquier encuesta, especialmente las electorales, debe estar basada en un muestreo que represente al universo del cual se quiere conocer la opinión. En el caso de las encuestas electorales en México, tanto a nivel federal como estatal y municipal, el universo está conformado por aquellas personas que tienen una credencial vigente para votar expedida por el IFE/INE.

El principio estadístico básico para tener una muestra representativa es que cualquier persona del universo tiene que tener la misma posibilidad de ser elegido para contestar la entrevista. Actualmente, es casi imposible cumplir con esta premisa básica porque dadas diversas condiciones técnicas, económicas y sociales es poco factible hacerlo.

Las primeras encuestas basadas en un muestreo estadístico y denominadas científicas, fueron realizadas por tres personas en Estados Unidos; George Gallup, Elmo Roper y Archibald Crosby en 1935. Estas encuestas se llevaban a cabo casa por casa utilizando procesos estadísticos que definían a quién entrevistar. Posteriormente, en Estados Unidos, y debido principalmente a costos, se migró a encuestas telefónicas. En esa época prácticamente todos los hogares de ese país tenían un teléfono y se diseñaron procesos estadísticos que permitían tener una muestra representativa. Con la introducción de teléfonos celulares y del internet muchas personas, especialmente los jóvenes, ya no tienen un teléfono fijo y es difícil localizarlos.

En México la situación es diferente. Muchas de las encuestas que se realizan son casa por casa, que, en teoría, es el mejor método para tener una muestra representativa. Sin embargo, en la realidad es prácticamente imposible hacerlo. Por ejemplo, ¿en cuántos hogares de clases media y alta ni siquiera se puede tocar la puerta debido a las restricciones para hacerlo? ¿En cuántas zonas tanto urbanas como rurales no se pueden realizar entrevistas por motivos de seguridad? Aun cuando se pueda tocar una puerta, hay que preguntarse ¿En cuántos hogares no hay nadie en casa? ¿Cuántos que abrieron la puerta aceptaron contestar la entrevista? ¿En cuántos que aceptaron la entrevista no se encuentra la persona que con base en una selección aleatoria se debería entrevistar? etc., etc.

Si se piensa en el teléfono, es claro que no se puede tener una muestra representativa de la población ya que la incidencia de tener un teléfono en casa es muy baja. Por un lado, se excluye a niveles de ingresos bajos y zonas con poca población, especialmente zonas rurales y por otro a muchas personas de nivel medio y alto, especialmente jóvenes, que tienen un celular y no tienen teléfono en casa.

Si se quiere hacer por celular hay serias limitaciones para tener una muestra representativa de las personas que tienen una credencial para votar. Lo mismo sucede por internet.

Muchos encuestadores de varias partes del mundo han realizado esfuerzos para tener una muestra representativa combinando dos o más métodos para hacer las entrevistas. Estos no han mostrado ser efectivos debido a complicaciones técnicas.

Es decir, la teoría fundamental en las que se basan las encuestas está comprometida.

El reportar un nivel de confianza y margen de error en una encuesta que no cumple con la premisa de que cada persona tiene que tener la misma oportunidad de ser elegido para contestar el cuestionario no es correcto. Incluso un reporte de la AAPOR (Asociación Americana para Estudios de Opinión Pública) de Estados Unidos considera que si una muestra no es probabilística no es adecuado reportar estimaciones.

Otro elemento que se considera al diseñar una muestra es el tamaño de esta. He leído y escuchado varios comentarios, tanto en México como en otras partes del mundo, incluso en Estados Unidos, cuestionando si el número de entrevistas que se aplican puede representar a un universo tan grande, por ejemplo 1,200 entrevistas en un universo de 89,000,000. La estadística tiene un principio en el cual establece que cuando el universo es grande, el número de entrevistas es igual si son 89,000,000 de habitantes o 300,000,000 de habitantes. El término que se usa para definir esto es denominado “universos Infinitos”. Es decir, 1,200 entrevistas tienen igual de validez en México que en Estados Unidos. En ambos casos el nivel de confianza y margen de error es igual; +/- 3% con un nivel de confianza del 95%. Si se quiere reducir el error a la mitad, (+/- 1.5%) sería necesario cuadruplicar la muestra; 4,800 entrevistas.

Esto quiere decir que, si se hacen 100 encuestas con 1,200 entrevistas en cada una, en 95 de ellas los resultados no deben de variar +/- tres puntos. La probabilidad es que en cinco de ellas la variación sea mayor. El problema es si se tienen 95 encuestas con resultados dentro del margen de error, no quiere decir que las próximas cinco tendrán un mayor margen de error. Por el contrario, si dentro de las primeras 95 encuestas, hay cinco con mayor margen de error, no quiere decir que las siguientes cinco estarán dentro del margen de error.

Una interesante anécdota al respecto es que, dado que los resultados de las encuestas de la segunda mitad del siglo XX reflejan resultados más cercanos a los de las elecciones, le preguntaron a George Gallup que cuando las encuestas suplirían a las elecciones ya que se ahorraría mucho dinero haciéndolo así. Su respuesta fue “Nunca, porque estoy seguro que la mayoría de las encuestas bien hechas van a tener resultado similar a los de las elecciones, pero estoy igualmente seguro que en algunas me voy a equivocar. Lo malo es que no se cuando va a suceder esto”.

Como se menciona en el párrafo anterior este principio sólo es válido cuando la muestra es probabilística. Esto quiere decir que la forma en que se selecciona la muestra es mucho más importante que el número de entrevistas que se aplican. Una muestra de 1,200 entrevistas con una muestra probabilística es, técnicamente, mucho más confiable que una de 30,000 entrevistas o de 1,000,000, con una muestra que no sigue estos principios básicos.

Niveles de rechazo

Los niveles de rechazo han ido en constante aumento en todas partes del mundo. En las recientes encuestas que hemos visto en México los niveles de rechazo reportados varían mucho entre empresas, lo cual estadísticamente no es congruente con los márgenes de error que reportan. En algunos casos superan el 50%, lo cual quiere decir que los resultados de esos estudios sólo representan a la mitad de las personas que tienen credencial de elector y que pudieron ser entrevistados. La pregunta es ¿qué tan representativo es el público entrevistado del total del universo en estudio?

En ciertas ocasiones algunos encuestadores utilizan una técnica estadística llamada ponderación en el caso de que la muestra del estudio difiera de las características del universo. Sin embargo, los estudiosos del tema han descubierto que es muy difícil determinar cuáles son las variables que se deben de tomar en cuenta para implementar el método de ponderación. Por ejemplo, estos analistas han detectado que en una encuesta sobre temas políticos contestan más los que tienen mayor interés y conocimiento del tema.

Otro problema es que cada encuestador utiliza diferentes variables para ponderar y su método para hacerlo, por lo que esta puede ser uno de los factores que explican las grandes diferencias en las encuestas que estamos viendo en este proceso electoral en México, ya que como se explica anteriormente, varias de ellas presentan variaciones mayores a lo esperado, estadísticamente hablando.

Se especula que las encuestas por estado en los Estados Unidos fallaron porque no tomaron en cuenta el factor educación al ponderar, lo que llevó a que esas encuestas estuvieran erradas y por ello no pudieron predecir correctamente el ganador de la elección en el colegio electoral.

Además de los errores de muestreo y los niveles de no respuesta hay diversos factores que también influyen. Algunos de ellos son:

Porcentaje que no quiere decir por quién votará o indeciso

Los porcentajes que están reportando las encuestas de gente que no quiso responder a la pregunta, contestando cosas como “el voto es secreto”, y aquellos que dicen que están indecisos varían mucho. El número de personas que realmente se encuentran en esta situación, así como su decisión final pudiera cambiar los resultados de la votación en comparación a las encuestas.

Es importante hacer notar que algunos encuestadores están asignando los indecisos de diversas maneras. Unos los eliminan y reporcentajean los números considerando sólo aquellos que sí contestaron por quién van a votar. En ocasiones este método funciona, pero en muchas otras no, dado que las personas que no dijeron porque quién van a votar pudieran tener una opinión diferente a las personas que sí contestan. Por ejemplo, hay ocasiones que ocultan su voto real porque consideran que no es socialmente aceptable decir el nombre de la persona o partido por el que van a votar, por miedo a represalias, etc. Además, los estudiosos Noelle-Neumann encontraron que en ocasiones las personas que rechazan contestar lo hacen por ocultar su voto y que estos tienden a apoyar a personas o partidos controvertidos o socialmente inaceptables. Estas personas son llamadas “votantes penosos”.

Otro método que en ocasiones utilizan los encuestadores para asignar indecisos es desarrollar un modelo que les permita hacerlo. Sin embargo, cada encuestador diseña el suyo y éste puede o no ser acertado. Lo difícil para los lectores de encuestas es conocer cuál es el modelo que diseñaron y evaluar si tiene buenas bases.

Otros encuestadores reportan los resultados incluyendo el correspondiente a los que contestaron así. Por ejemplo: Candidato “A” X%, Candidato “B” Y%, Candidato “C” Z%, No quiso contestar W%, No sabe por quién votar V%. De esta forma el lector puede hacer mejor su propia conclusión.

Porcentaje que va a votar y quiénes que respondieron la encuesta lo harán

Este tema ha generado grandes discusiones por años. Es muy difícil que los encuestadores puedan definir qué porcentaje de los electores realmente va a ir a votar y, además, cuáles de los que contestaron la encuesta lo hará. Por lo general, en las encuestas el porcentaje que dijo que va a ir a votar, e incluso el que dijo que votó en una encuesta posterior al día de la elección, tiende a ser mayor que el que realmente lo hace. Esto es principalmente debido a que es socialmente responsable decir que se va a ir a votar o que se votó. Además, su intención puede ser real al momento de contestar la encuesta, pero el día de la elección no lo hizo porque estaba cansado, estaba lloviendo, se sintió mal, pensó que para que, si ya se sabía quién iba a ganar, etc., etc.

Es decir, los resultados de la encuesta pueden variar versus el resultado de la elección debido al porcentaje que realmente votó y las preferencias de aquellos que no fueron a votar. Es el dilema del “likely voter.”

Cambios en la decisión de por quién votar

Existe la posibilidad de que algunas personas cambien su decisión de por quién votar después de haber sido entrevistados. En México no es permitido publicar encuestas varios días antes de la elección, por lo cual este cambio puede producir una diferencia entre la última encuesta y el resultado final.

Diseño del cuestionario

El diseño del cuestionario es definitivamente un elemento que puede influir de manera importante en el resultado de la encuesta. Por ejemplo, en algunas encuestas la preferencia electoral se pregunta casi al principio, mientras que en otras se hace alrededor de la mitad y en otras se pregunta después de que ya se le hicieron muchas preguntas que pudieran, o no, influir en su respuesta. También afectan aspectos como la redacción de las preguntas y la mecánica si la pregunta de por quién van a votar se hace directamente o se le da al entrevistado una boleta simulada que introduce en una “urna” después de que marcó su preferencia, (Este simulacro de votación no se puede hacer si la entrevista es telefónica o por internet), replicando su posible comportamiento el día de la elección.

Calidad de los entrevistadores

Al igual que en muchas otras industrias, la calidad, experiencia, compromiso y capacitación del personal puede influir de forma importante en los resultados de una encuesta.

Considerando el gran número de encuestas que se están aplicando en esta elección, es altamente probable que algunos encuestadores hayan tenido que recurrir a personal con nula o poca experiencia en el trabajo de campo, lo cual puede redundar en una baja calidad del estudio.

A esto hay que agregarle el nivel de supervisión que se asigne al proyecto para determinar si el entrevistador siguió todos los pasos necesarios para lograrla. Estos pasos van desde la selección del entrevistado, si leyó o no las preguntas completas, e incluso si no inventó la entrevista.

En conclusión, los estudios de opinión siempre han tenido muchos retos que enfrentar, sin embargo, actualmente esos retos se han vuelto más difíciles, especialmente el poder cumplir con el requisito de tener una muestra representativa del universo en estudio, de reducir el porcentaje de gente que no quiere contestar una encuesta, el número de personas que no quisieron contestar la pregunta y los que dicen que están indecisos.

Actualmente, en México, las encuestas tienden a indicar que el candidato a presidente de Morena tiene el mayor número de preferencias. Sin embargo, varían mucho de quién va en segundo lugar, de los porcentajes de diferencia entre cada candidato, de los que no quisieron contestar la pregunta de por quién van a votar y los indecisos. Técnicamente estas diferencias son mayores a los márgenes de error reportados, suponiendo que las muestras son aleatorias, lo cual es imposible. Lo difícil es determinar cuál o cuáles encuestas están reflejando la realidad del momento y cuáles no.

Algunas personas están diciendo que ya hay un seguro ganador de las próximas elecciones. Esto pudiera ser cierto, pero también es igualmente cierto que esto pudiera no ser.

Tomando en cuenta lo aquí escrito es recomendable darles a las encuestas su justa dimensión y tratar de determinar cuál o cuáles de ellas pueden reflejar mejor la situación real del momento, leyendo la metodología que se utilizó para las encuestas. Para ello es muy recomendable leer las encuestas en las que se reporta tanto el número de rechazos como el porcentaje de personas que dicen que no han decidido por quién votar. Estos números son los que erróneamente llaman los encuestadores “Preferencia Bruta”. Los números llamados, también erróneamente, “Preferencia efectiva”, eliminan el porcentaje de aquellos que dicen “No sé”, lo cual probablemente inflan los resultados del líder en las encuestas.

El INE establece que cualquier encuesta que se publique le debe de ser enviada y que este debe publicar la metodología utilizada y los resultados. El ver esta información puede ayudar a este análisis. Ésta se puede encontrar en el sitio del INE bajo el título Elecciones Federales Ordinarias 2017-2018 Estudios Entregados.

Ian M. Reider es uno de los primeros encuestadores mexicanos. Se dedica a realizar y estudiar encuestas desde 1969.