Abriendo las compuertas de los datos

Los datos están cambiando la lucha contra la corrupción. Dos crónicas ilustran esta realidad, una de Panamá y la otra de Brasil.

informacion

Panamá. El 3 de abril de 2016, una avalancha de artículos de prensa sobre las prácticas de evasión de impuestos de las más grandes fortunas del mundo irrumpió en los medios de comunicación.1 En una proeza coordinada por el Consorcio Internacional de Periodistas de Investigación (ICIJ), reporteros de 76 países iniciaron la publicación de una serie de artículos donde exponían las ingeniosas maneras que los ricos tienen para ocultar su fortuna de las autoridades fiscales. Los informes se basaba en una fuga masiva de datos de Mossack Fonseca, un bufete de abogados con sede en Panamá especializado en la gestión de fortunas y la “optimización fiscal”, que encubría prácticas de evasión de impuestos a escala global desde hacía casi cuatro décadas. Contenía información sobre las empresas offshore opacas, los fideicomisos y fundaciones en paraísos fiscales utilizados por los clientes del bufete para ocultar su fortuna –adquirida legalmente o no–, entre ellos carteles criminales e industrias turbias, como la venta ilegal de armas. El desglose fue consecuencia de años de investigación secreta de los periodistas con la ayuda de expertos en datos.

El tesoro comprendía 11.5 millones de documentos, o 2.6 TB de datos, unas 215,000 cuentas bancarias offshore y empresas fantasma. El ICIJ proporcionó a los periodistas los conocimientos expertos en minería de datos necesarios para que los documentos se volvieran transparentes. Empresas start-ups como Linkurious,2 obtuvieron los metadatos y ayudaron a “conectar los puntos de la trama” mediante instrumentos de visualización de datos. El almacenamiento de la información en la nube permitió que casi 400 periodistas de todo el mundo trabajaran juntos en un mismo proyecto.

Los responsables de la fuga se vieron motivados por la injusticia detrás de la desigualdad global creciente que la evasión fiscal de los más ricos reveló. “La desigualdad del ingreso es uno de los asuntos decisivos de nuestro tiempo”, escribió en el Süddeutsche Zeitung el denunciante anónimo que filtró los documentos. “Nos afecta a todos, en todo el mundo. El debate sobre su repentina aceleración ha durado años (…). Aun así, las preguntas persisten: ¿por qué? ¿Y por qué ahora? Los papeles de Panamá proporcionan una respuesta convincente a estas preguntas, a saber, la corrupción masiva y generalizada.”3 Su preocupación a propósito de la corrupción encuentra eco en jóvenes de todo el mundo: una encuesta reciente a los milennials realizada por el Foro Económico Mundial (FEM) en 181 países reveló que casi el 60% de los jóvenes ve la corrupción como el problema más serio al que se enfrentan sus países.

Volvamos ahora nuestras miradas a Brasil, donde los datos de formato abierto (open data) provocaron diversos escándalos a propósito de la evasión fiscal y de comisiones ilegales en el gigante petrolero estatal, Petrobras, que contribuyeron a la caída de la presidenta Dilma Rousseff. En medio de la ola de protestas masivas y recriminaciones en que se ha visto envuelto el país, es fácil perder de vista el estrecho argumento técnico legal esgrimido en contra de Rousseff para destituirla el 31 de agosto de 2016. Básicamente, se la declaró culpable de mover fondos entre presupuestos del gobierno, que muchos consideraban trucos contables para cubrir el verdadero estado de las finanzas públicas. La primera en detectar las irregularidades fue una organización de la sociedad civil, Contas Abertas,4 que revisó los datos presupuestarios que se volvieron públicos en el marco de las leyes brasileñas de acceso a la información y divulgados a través de dos de sus principales portales de transparencia, Orçamento Federal y el Portal da Transparência.5 Contas Abertas puso al Tribunal de Cuentas al corriente de las irregularidades, el tribunal abrió una investigación y la política siguió su curso. Paradójicamente, la transparencia instituida por el gobierno allanó el camino para desvelar el engaño urdido por el mismo gobierno.

El escándalo de los papeles de Panamá demuestra el poder del análisis de datos para revelar prácticas corruptas en un mundo inundado de terabytes y que solo requiere la capacidad informática para darle un sentido. La destitución de Rousseff ilustra cómo puede utilizarse el formato abierto para que los gobernantes rindan cuentas. Las dos historias muestran que los datos, tanto “masivos” (big data)6 como “abiertos” (open data), lideran la lucha contra la corrupción con iniciativas rápidas, basadas en evidencia y en el crowdsourcing. El formato abierto de datos puede poner ingentes cantidades de información en manos de innumerables vigías y denunciantes. Los datos masivos pueden convertir esa información en una visión, con lo cual es más fácil identificar la corrupción, seguirle la huella y predecirla. Para aprovechar todo el potencial del movimiento, especialistas en tecnología, activistas, funcionarios y ciudadanos deben redoblar sus esfuerzos para integrar el análisis de datos en la formulación de políticas y en las instituciones públicas.

Datos que pueden ocultarse en todas partes y en ninguna parte

“El sol es supuestamente el mejor desinfectante”, escribió el juez de la Corte Suprema de Estados Unidos Louis Brandeis. El impulso global para liberar el poder de los datos está generando rayos de luz. El movimiento emergente de los datos masivos es el resultado de la confluencia de transformaciones estructurales en nuestras sociedades que permiten que los activistas que trabajan con datos aprovechen información para una mayor rendición de cuentas. Estos cambios incluyen la aparición de datos masivos, el aumento paralelo del tratamiento de los datos y de las capacidades analíticas para darles sentido, y el movimiento mundial para abrir los datos del gobierno al escrutinio público. A continuación se revisarán estas tendencias.

En primer lugar, el movimiento de los datos masivos nace gracias a la aparición global de datos generados por el sector privado y por los ciudadanos individuales en su interacción diaria. En la nueva economía basada en la tecnología se están produciendo datos en cantidades sin precedentes. Los datos masivos ostentan cuatro características clave y un inconveniente. Se caracterizan por su volumen (las bases de datos son masivas), su velocidad (los nuevos datos se producen a alta frecuencia), y su variedad (los datos tienen una gama de fuentes y formatos), pero preocupa su veracidad (a menudo hay incertidumbre acerca de la precisión de los datos).7 El movimiento de datos masivos hasta ahora se ha centrado en obtener y analizar datos de los ciudadanos en la nueva economía digital, sobre todo para entenderlos mejor y focalizarlos en su calidad de consumidores. Hasta ahora, se han utilizado de una forma menos agresiva para analizar cómo funcionan los gobiernos y las empresas, lo que incluye abrir los datos corporativos. Sin embargo, en la nueva era del Estado digitalizado, esto está cambiando cada vez más. La nueva economía basada en información genera una riqueza asombrosa de nuevos datos cada día y estos datos se producen a niveles sin precedentes en todo el mundo. En 2015 había 3,500 millones de usuarios de Internet y 4,600 millones de personas que utilizaban teléfonos celulares para comunicarse y realizar transacciones. Según un análisis de 2015 del Big Data & Analysis Hub, de IBM, cada día se producen 2.5 cuatrillones de bytes de datos y el 90% de los datos existentes se ha producido en los últimos dos años. Según un informe de 2013 de McKinsey en el que analizan siete grandes sectores económicos, manipular los datos puede contribuir a liberar entre US 3 billones y US 5 billones. El mercado de datos masivos representaba US 5,000 millones en 2013 y se espera que crezca hasta más de US 50,000 millones hacia 2017, según la empresa de auditoría y consultoría PwC.8 Según declaró The Economist: “El negocio de los datos acaba de comenzar”.

En segundo lugar, el movimiento de datos masivos depende de las capacidades tecnológicas y computacionales crecientes para analizar datos en aras del bien común. Los datos masivos son generados principalmente por el sector privado y por ciudadanos individuales, mientras que los datos abiertos provienen del sector público. En este último la revolución de los datos se alimenta de la transformación digital del gobierno en una carrera global para reinventar el Estado. Un primer grupo de reformas estatales se ha centrado en mejorar el funcionamiento del gobierno mediante la actualización de las funciones de procesos administrativos (back-office). Con estas iniciativas de modernización se pretende mejorar la eficiencia de la burocracia y la prestación de servicios públicos. Los esfuerzos se basan en las tecnologías de la información y en innovaciones del gobierno electrónico, e implican automatizar y digitalizar los procesos públicos. Un segundo grupo de reformas digitales del gobierno se centra en las funciones de atención al cliente (front-office) con el fin de que el gobierno trabaje para todos los ciudadanos y, con ello, replantee la relación entre el Estado y la gente. Esto implica integrar los servicios públicos en plataformas en línea únicas para que los ciudadanos puedan obtener certificados de nacimiento o registrar propiedades mediante el uso de la web, como www.gov.uk en el Reino Unido, www.chileatiende.cl en Chile y www.tramites.gub.uy en Uruguay. A su vez, los dos conjuntos de procesos generan un flujo constante de datos aún por explotar plenamente.

La larga marcha hacia la apertura de los datos del gobierno

De manera paralela, los gobiernos están abriendo progresivamente sus datos al escrutinio público. A fines de los años sesenta surgió una primera ola de leyes relacionadas con la libertad de la información, cuyo hito fue la aprobación en 1966 de la Ley de Libertad de la Información en Estados Unidos, basada en el principio del derecho de los ciudadanos a tener acceso a la información pública. En los años noventa se puso en marcha una segunda ola, que marcó una transición hacia una divulgación más proactiva de la información del gobierno, con la generalización progresiva de los portales web de los gobiernos. Esta ola todavía está afectando a algunos países, y hay gobiernos que han adoptado esas leyes hace muy poco tiempo (Paraguay en 2014) y otros que han iniciado procedimientos para actualizarlas (Argentina). A menudo es necesaria la valentía individual de los políticos para impulsar reformas de transparencia de datos. A finales de 2013, el Presidente de Paraguay Horacio Cartes lanzó un ambicioso proceso para abrir el gobierno a través de una nueva ley de acceso a la información, y declaró: “Lo que es público debe ser público”.9

Algunos países están avanzando hacia una tercera etapa de reformas para mejorar el acceso a la información basándose en el principio más estricto de “abierto por defecto”. En 2009 el Presidente Barack Obama lanzó una ambiciosa iniciativa de gobierno abierto que exigía que los organismos federales publicaran la información del gobierno de manera proactiva a través de sitios web integrados, accesibles para el usuario, donde todos los servicios públicos estuviesen centralizados en un único portal de Internet.10 Esto incluía un compromiso para dar a conocer las bases de datos del gobierno en formato abierto. El carácter abierto de estos datos se refiere no solo a su disponibilidad pública sino también a sus “interoperabilidad”, es decir, la capacidad para integrar, combinar y triangular bases de datos con software y capacidades computacionales fácilmente disponibles.11 En mayo de 2013, el Presidente Obama también firmó una orden ejecutiva que convertía los datos abiertos y legibles por máquina en la nueva norma de la información pública. En el contexto de la lucha contra la corrupción, el verdadero valor de los datos abiertos reside en la capacidad de interconectar múltiples bases de datos para discernir patrones y exponer sospechas de corrupción.

A pesar de ser enormemente prometedora, la apertura de los datos del gobierno al escrutinio público sigue siendo un trabajo en curso. Actualmente 70 países participan en la Alianza para el Gobierno Abierto (AGA), creada en 2011, y se han comprometido a brindar acceso a sus datos públicos. En julio de 2013 los líderes del G-8 firmaron la “Carta de Datos Abiertos del G-8”, que destaca seis principios centrales de los datos abiertos. Sin embargo, el nivel de apertura de datos en todo el mundo sigue siendo decepcionante. En 2015 menos del 10% de las bases de datos de los gobiernos eran abiertas (públicas, legibles por máquina y no propietarias), de acuerdo con el Índice Global de Datos Abiertos, una iniciativa de la Fundación Conocimiento Abierto que realiza un seguimiento de los datos de gobierno abierto en 122 países. Según el Barómetro de Datos Abiertos, una encuesta global anual de la World Wide Web Foundation, el 55% de los 92 países encuestados cuenta con una iniciativa de datos abiertos desde 2015. Sin embargo, solo el 10% de los datos del gobierno se encuentra en formato abierto y la mitad de estos datos se halla en países de altos ingresos. Hay numerosas naciones que todavía tienen problemas para convertir sus datos públicos en formato abierto. Algunos están recién comenzando a digitalizar sus documentos de papel. En este caso, los gobiernos regionales y locales pueden asumir el liderazgo. Ciudades como Nueva York y Rio de Janeiro están sumándose a esta iniciativa, a menudo promoviendo innovaciones en la aplicación del análisis de datos para mejorar los servicios, realizar escrutinios del gobierno y evitar el fraude.12

Como lo ha demostrado Brasil, un ámbito crucial para aprovechar los datos abiertos con el fin de impedir la corrupción es el campo de la gestión de las finanzas públicas, que incluye los presupuestos, los impuestos y los contratos públicos. El Índice de Presupuesto Abierto del International Budget Partnership revela que existen grandes diferencias y ha habido escasos avances por parte de los gobiernos en la apertura de sus datos presupuestarios al escrutinio público, y solo 24 de los 102 países encuestados en 2015 tenían niveles suficientes de transparencia presupuestaria (una puntuación de 62 o más en una escala de 100 puntos que evalúa la disponibilidad pública de la información presupuestaria).13 Los contratos públicos constituyen un ámbito de claro riesgo para la corrupción: según el Centro para el Desarrollo Global,14 cada año los gobiernos de todo el mundo gastan alrededor de US 9.5 billones, o un 15% del producto interno bruto (PIB) global, en contratos; pero de acuerdo con el Open Contracting Partnership menos del 10% de los 120 países encuestados en el Índice de Datos Abiertos proporcionan datos de calidad, oportunos y legibles por máquina sobre las licitaciones y las adjudicaciones de los contratos públicos. El FEM15 estima que entre un 10% y un 13% de los US 7 billones que los gobiernos gastan anualmente en construcción se pierde debido a la corrupción.

El sector extractivo es otro punto clave. Según un informe reciente del Centro de Desarrollo de la Organización para la Cooperación y el Desarrollo Económicos (OCDE), uno de cada cinco casos de sobornos transnacionales se produce en sus industrias.16 La Iniciativa para la Transparencia en las Industrias Extractivas (EITI, por sus siglas en inglés), una norma global lanzada en 2003 para promover la gestión abierta y sujeta a rendición de cuentas de los recursos naturales, ha dado grandes pasos hacia la publicación de información pertinente sobre los ingresos del gobierno, las licencias y los contratos. Por ejemplo, con el apoyo del Banco Interamericano de Desarrollo (BID), Colombia lanzó MapaRegalías, un sistema basado en una web para realizar un seguimiento de la fuente y del uso de los ingresos por regalías.

Cómo conseguir que los datos hablen

Conseguir que los datos tengan un formato abierto no puede por sí solo impulsar los esfuerzos de lucha contra la corrupción. También se requiere un análisis de datos, cuya mejor descripción es la que proporciona Chris Crawford, un alumno de la Facultad de Derecho de la Universidad de Harvard, en el blog global contra la corrupción: “Un método que implica el uso de grandes cantidades de datos para desvelar correlaciones anteriormente desconocidas y que quizá sugieran relaciones causales”.17 El surgimiento del análisis de datos en las políticas públicas está impulsado por la revolución de los datos en el gobierno, es decir: el surgimiento global de formulación de políticas basadas en datos y en evidencia. Como lo subrayó un informe de la Casa Blanca en 2014 sobre datos masivos y privacidad individual, “sin sistemas de análisis, las grandes bases de datos podrían almacenarse y consultarse en su conjunto o selectivamente. Pero lo que sale sería exactamente igual a lo que entra.”18

En este contexto, resulta útil distinguir las cuatro etapas principales del análisis de datos para ilustrar su potencial en la lucha global contra la corrupción: i) el análisis descriptivo utiliza datos para detallar qué ha ocurrido al analizar complejos temas de políticas; ii) el análisis diagnóstico va un paso más allá mediante la minería y la triangulación de datos para explicar por qué se ha producido un problema específico de políticas, explicar sus causas fundamentales y descifrar tendencias estructurales subyacentes; iii) el análisis predictivo utiliza datos y algoritmos para pronosticar lo que podría ocurrir con más probabilidad, aprovechando el aprendizaje de máquinas; y iv) el análisis prescriptivo propone qué medidas deberían tomarse para que algo ocurra o para impedir que ocurra.

Hay diversas aplicaciones del análisis de datos para la lucha contra la corrupción que son especialmente prometedoras. Los esfuerzos de lucha contra la corrupción basados en crowdsourcing, particularmente a través de las aplicaciones de la telefonía celular, constituyen un potente instrumento para que los ciudadanos expongan y denuncien la corrupción en sus diversas manifestaciones.19 La telefonía celular está logrando que la información pública sea más accesible a los ciudadanos y también proporciona un canal para que los ciudadanos planteen reclamos acerca de la mala calidad de los servicios públicos o denuncien malas prácticas. En India, la aplicación “I paid a bribe” (“Yo pagué un soborno”) ayuda a detectar y (es de esperar) a disuadir de participar en prácticas corruptas, y permite que los ciudadanos informen sobre sobornos y fraudes en el trato diario con los funcionarios.20 Esta plataforma, que ha sido replicada en Pakistán y Kenia, contribuye a luchar contra lo que su fundador, Swati Ramanathan, denomina “corrupción minorista”, los pequeños sobornos en la vida cotidiana que perjudican sobre todo a los pobres.

De la misma manera, en México, un alumno de 21 años lanzó recientemente Toreado, una aplicación móvil destinada a facilitar ayuda legal a los conductores detenidos por la policía por manejar bajo la influencia de sustancias tóxicas.21 En Colombia, hay una herramienta que va un paso más allá, para utilizar los informes de los ciudadanos en investigaciones y procedimientos penales. La Secretaría de Transparencia de la Presidencia ha desarrollado una aplicación que permite que los ciudadanos informen sobre “elefantes blancos”, es decir, obras públicas inacabadas o con sobrecostos exagerados.22 Hacia finales de 2015, se habían identificado 83 “elefantes blancos” de este tipo por un valor total de casi US 500 millones, lo cual condujo a la apertura de procedimientos penales por parte de las autoridades que velan por el cumplimiento de la ley. Ninguna de las dos aplicaciones permite una interacción en ambos sentidos entre los ciudadanos y los funcionarios, ni abren los datos anónimos en bruto para que los usuarios lleven a cabo su propio análisis. Sin embargo, generan una riqueza de datos que pueden explotar los investigadores del fraude y las agencias de lucha contra la corrupción. La experiencia sugiere que estas iniciativas de lucha contra la corrupción basadas en crowdsourcing son más efectivas cuando están vinculadas o entrelazadas con instituciones de supervisión y agencias que velan por el cumplimiento de la ley.

También se están empleando técnicas de minería de datos para someter a escrutinio las finanzas públicas de manera más agresiva. La “minería de datos” normalmente se refiere a exploraciones de aprendizaje de máquinas sin una pregunta de investigación predeterminada, y procura sencillamente sumergirse en los datos para descubrir qué patrones existen. La ciudad de Nueva York se encuentra en la vanguardia de estas técnicas: en 2010, la Oficina de la Contraloría abrió el presupuesto anual de US 70,000 millones de la ciudad al escrutinio público lanzando un portal de transparencia. El objetivo de Checkbook NYC 2.0 es poner “el gasto del gobierno al alcance de los contribuyentes”. Los ciudadanos pueden descargar los datos y utilizar técnicas de análisis de los mismos para revelar patrones que podrían despertar sospechas, y de este modo se crea una sólida herramienta de disuasión. Las organizaciones de la sociedad civil (OSC) pueden utilizar estos datos abiertos para realizar escrutinios del gobierno de manera más efectiva. Por ejemplo, en Estados Unidos, www.opensecrets.org, una iniciativa del Center for Responsive Policies, realiza un seguimiento de la influencia del dinero en la política revisando los datos de la Comisión Electoral Federal para monitorear las finanzas de las campañas. De la misma manera, la Sunlight Foundation, una organización no partidista, utiliza instrumentos de tecnología cívica, datos abiertos y análisis de datos para que el gobierno sea más transparente y esté sujeto a rendición de cuentas a nivel estatal y federal.

En el área de adquisiciones de los gobiernos, los análisis de datos masivos también pueden contribuir a que se efectúen escrutinios de la eficiencia de los contratos públicos, históricamente vulnerables ante el clientelismo y las comisiones ilegales. En 2011 Eslovaquia aprobó legislación para cumplir con una mayor transparencia en los contratos públicos, y la oficina local de Transparency International utilizó el nuevo sistema de datos abiertos para denunciar graves ineficiencias en las contrataciones públicas de los hospitales. En Georgia, la oficina local de Transparency International lanzó un portal de código abierto de monitoreo y análisis de los contratos públicos, que obtiene y reelabora datos del sitio web de contratación electrónica del gobierno con el fin de permitir investigaciones sobre transacciones o patrones sospechosos, sobre todo de contratos no competitivos.23 Chequia, Hungría y Eslovenia han lanzado iniciativas similares.

El análisis del fraude está ayudando a los gobiernos a reducir la evasión y la defraudación fiscal en programas sociales mediante la detección de transacciones sospechosas. Por ejemplo, en Estados Unidos, los centros de Medicare y de servicios de Medicaid están utilizando análisis predictivos para alertar sobre probables casos de fraude en los reembolsos. El sistema de prevención del fraude contribuye a identificar a los profesionales de la salud con mayor riesgo de despilfarro, defraudación y abuso en tiempo real y ya ha interrumpido, impedido o identificado US 42,000 millones en pagos fraudulentos.24 En Brasil el organismo federal de lucha contra la corrupción utilizó análisis de fraude para comparar la lista de beneficiarios de Bolsa Família, el mayor programa de protección social del país, con la lista de propietarios de vehículos del registro federal de automóviles e identificó a miles de beneficiarios no elegibles. Posteriores investigaciones revelaron que los brasileños ricos evadían impuestos registrando de manera fraudulenta sus vehículos bajo los nombres de beneficiarios de Bolsa Família.

Debido al gran número de interacciones que existe entre los contribuyentes y el Estado y a la amenaza perenne de evasión, la administración tributaria es un terreno fértil para el análisis de la lucha contra la corrupción. Por ejemplo, la administración tributaria de Australia está utilizando datos masivos para buscar en grandes cantidades de registros con el fin de encontrar evidencia del uso de paraísos fiscales, y también recurre al emparejamiento de datos para identificar pequeños minoristas en línea que no están cumpliendo con sus obligaciones tributarias. En Luxemburgo, después del Lux-leaks, cuando un denunciante reveló datos sobre sistemas de evasión tributaria, las técnicas de análisis empleadas por el entonces comisionado de finanzas de la ciudad, David Frankel, contribuyó a afinar los objetivos de las auditorías tributarias y mejorar la eficiencia de las investigaciones de las empresas sospechosas de evadir impuestos o pagar sueldos inferiores a lo establecido.25

Tres maneras de reforzar la lucha contra la corrupción basada en datos

Como lo confirman noticias de todo el mundo, los datos constituyen una gran oportunidad para ayudar en la lucha contra la corrupción. Sin embargo, esa promesa no se cumplirá plenamente si no se le sigue prestando apoyo. Concretamente, hay tres maneras en que se puede maximizar el potencial de los datos en la lucha contra la corrupción en todo el mundo, incluso en los países en desarrollo, donde la corrupción es una plaga permanente y la recopilación de datos y el análisis suelen ser menos evolucionados.

En primer lugar, se debe mejorar la calidad y la cobertura de los datos. Las avanzadas herramientas analíticas pueden ofrecer perspectivas útiles solo en la medida en que los datos en los que se basan sean fiables y tengan una amplia cobertura. En términos de fiabilidad, el debate público sobre las iniciativas de trabajo con datos tiende a poner énfasis en la divulgación (datos abiertos) y el uso (datos masivos) a expensas de la producción. Si se pretende darles un mayor peso a los datos en la toma de decisiones, por empezar se debería cuidar más la calidad de los mismos. Los gobiernos deben ser capaces de producir, recopilar y divulgar estadísticas oficiales de alta calidad y mantener registros administrativos efectivos que generen datos oportunos y fiables. En términos de cobertura, la disponibilidad de datos y el nivel general de desarrollo económico tienden a ir de la mano. El panorama de los datos en la mayoría de los países desarrollo muestra un agudo contraste con el mundo desarrollado: el gobierno electrónico es menos evolucionado, el alfabetismo digital es menor y, en algunas zonas, la red eléctrica no es fiable o no existe. Como consecuencia, se producen menos datos y lo que se produce no se distribuye de manera tan amplia. Esto plantea numerosos riesgos relacionados con perpetuar los patrones de desigualdad y contribuir a la exclusión social. En primer lugar, las decisiones basadas sobre todo en datos pueden estar sesgadas a favor de zonas para las cuales hay datos disponibles, o sencillamente uniformadas para zonas donde no hay datos. En segundo lugar, es probable que la rendición de cuentas basada en datos sea deficiente. Los ciudadanos que no tienen acceso a Internet no podrán verificar en línea los contratos públicos ni las calificaciones de los resultados de las escuelas, ni podrán tomar decisiones. Estos riesgos subrayan la necesidad de continuar con los esfuerzos para ampliar el acceso de banda ancha y capacitar a los ciudadanos en destrezas básicas de computación y de navegación por Internet, y familiarizarlos con los instrumentos de supervisión del gobierno, como los portales de transparencia.26

El aumento de la cobertura y la apertura de los datos, particularmente en la lucha contra la corrupción, puede enfrentarse a una importante resistencia política en los países en desarrollo, sobre todo en aquellos con una capacidad institucional limitada y una autonomía restringida de los organismos públicos. Hay actores influyentes que pueden considerar que la divulgación de información tan básica como los datos del censo contraviene sus intereses. Esto fue lo que ocurrió por ejemplo en Guyana, donde las preocupaciones a propósito de las consecuencias políticas de la divulgación de los datos del censo de 2012 (que revelaban importantes cambios demográficos) antes de las elecciones presidenciales de 2015 llevaron al embargo de los datos. Información más sensible en cuanto a la lucha contra la corrupción, como las declaraciones del ingreso y de los activos y los detalles de los contratos del sector público, naturalmente encontrarán una mayor resistencia. En función del riesgo que los actores influyentes perciban en la divulgación de datos y de la fortaleza comparativa de las fuerzas políticas a favor de la apertura, puede que el impacto de los datos masivos y abiertos siga siendo limitado allí donde más se necesita.

En segundo lugar, se debe construir capacidad de análisis de datos en el gobierno. Con el fin de emplear todo el potencial de los datos masivos y abiertos en la lucha contra la corrupción, los gobiernos tienen que crear capacidad interna tanto para generar perspectivas útiles como para integrarlas en la formulación e implementación de las políticas. La capacidad técnica interna es especialmente importante para la sostenibilidad. Si bien subcontratar a terceras empresas puede ser una solución efectiva para tareas específicas, la naturaleza típicamente propietaria de los algoritmos y del software significa que una vez que esa empresa ya no está (o que aumenta los precios a niveles insostenibles), el gobierno es incapaz de actualizar, modificar o ampliar. Los gobiernos también se esfuerzan por atraer y retener a los analistas de datos, que se han convertido en un bien escaso incluso en el sector privado. Debido a la escasez general de talento, los profesionales capacitados a menudo firman con el mayor postor, que rara vez es el gobierno.

En diversos países, los laboratorios de innovación del gobierno están ayudando a abordar estos desafíos. Por un lado, proporcionan una oportunidad atractiva de empleo para los profesionales de los datos interesados en la administración pública. Por otro, las fronteras del rol de los datos masivos en el gobierno se están ampliando, en principio con el análisis descriptivo (examinar los números existentes para entender mejor el pasado), y desplazándose cada vez más hacia el análisis predictivo (utilizar las tendencias para entender el futuro) y, en algunos casos, el análisis prescriptivo (combinar pronósticos con objetivos de políticas específicos para colaborar con la toma de decisiones en el presente). Estos laboratorios pueden contribuir a vincular las denuncias del gobierno y de los sistemas de procesamiento judicial con las instituciones públicas de lucha contra la corrupción con el fin de ayudar a generar las medidas correctivas adecuadas. Los principales modelos, que se centran en incubar innovación y aprovechar datos para mejorar las políticas, son el http://mind-lab.dk de Dinamarca y el www.nesta.org.uk del Reino Unido. En América Latina, Chile (https://lab.gob.cl/el-lab), Colombia, México, Brasil y Uruguay, así como también ciudades como Buenos Aires, México, Quito y Montevideo, han creado este tipo de laboratorios.27

También hay importantes brechas en las capacidades de análisis de datos de los organismos de investigación y de procesamiento judicial, que podrían beneficiarse en gran medida de las oportunidades que ofrecen los datos masivos. Las agencias que luchan contra la corrupción, particularmente, deberían fortalecer sus capacidades de análisis creando laboratorios contra el mencionado flagelo. En Brasil, por ejemplo, la Contraloría General de la Unión creó en 2008 el Observatorio del Gasto Público (Observatório da Despesa Pública) a fin de contribuir a detectar transacciones sospechosas y disuadir de prácticas corruptas. Así, los datos de los gastos de los contratos públicos se cruzan con otras bases de datos del gobierno para identificar situaciones atípicas que, aunque no presenten evidencia de irregularidades, justifican un análisis más detallado.

Es fundamental entender que, para que haya un impacto en el diseño y en la implementación de las políticas públicas, las iniciativas de análisis de datos no pueden funcionar aisladamente. Para que cobre sentido, el análisis de datos debe integrarse en el ciclo de políticas, de modo que los funcionarios se centren en los asuntos de políticas adecuados, formulen buenas preguntas a los datos, vuelquen las respuestas en la formulación de políticas y faciliten las reformas contra la corrupción. Si bien el análisis puede aumentar la capacidad del gobierno de supervisar, y de tener una perspectiva y una prospectiva, no puede reemplazar las deliberaciones de los expertos en la formulación de políticas, ni puede mejorarlas sin un mayor nivel de integración. Como señalaba recientemente The Economist, “los algoritmos ayudan a las personas a tomar decisiones, pero no toman las decisiones en su lugar.”28 Siguiendo esta línea, las soluciones basadas en datos deben diseñarse según cada contexto particular, ya sea político, institucional, económico o social, para ser efectivas. No deberían trasplantarse mecánicamente de un lugar a otro, un problema que Matt Andrews, profesor de Harvard, denomina “mímica isomórfica”.29

También es importante reconocer que hay límites en los análisis de datos si estos no forman parte de una estrategia de reforma más amplia. El análisis de datos masivos no puede responder a todas las preguntas, y desde luego, no debería solucionar todos los problemas de las políticas. Una estrategia de lucha contra la corrupción basada en datos masivos debería definir en qué aspectos de las políticas centrarse y qué preguntas formular a los datos con el objetivo más amplio de diseñar las reformas más efectivas y abordar las causas subyacentes tras la corrupción. También se requiere eso que los profesionales de desarrollo internacional llaman una teoría del cambio –un mapa de las condiciones preliminares, las acciones, los resultados esperados y los supuestos asociados necesarios para alcanzar un determinado objetivo–, con el fin de orientar la investigación de los datos. Un problema central en este sentido es desplazarse hacia arriba por la “cadena de valor de datos”, desde un análisis en gran parte descriptivo hasta un análisis prescriptivo, que resulta más viable en términos de políticas. En un sentido más específico, el análisis de la lucha contra la corrupción debe conectarse con el sistema de integridad de un país –lo que incluye los mecanismos para efectuar reclamos y las instituciones encargadas de investigar y procesar a los culpables– con el fin de generar medidas correctivas que impidan la corrupción de raíz.

En tercer lugar, hay que lograr que el análisis de datos sea más transparente y amplíe su alcance. Cualquier instrumento que requiera un conjunto de habilidades altamente especializadas corre el riesgo de ser capturado por unos pocos elegidos, y los datos masivos no constituyen ninguna excepción. El movimiento de datos masivos tiene que conseguir “que los algoritmos rindan cuentas”,30 como exigía la periodista Julia Angwin, de ProPública, en el New York Times, y que revelen cómo se toman las decisiones: de dónde provienen los datos, qué supuestos sostienen los cálculos, qué ponderaciones se asignan a los diferentes puntos de datos y qué umbrales se aplican para identificar señales de alerta.31 Los algoritmos deben estar sujetos a controles con el fin de impedir que los datos creen sesgos o perpetúen los ya existentes. Las conclusiones de las exploraciones y extrapolaciones de datos también deben tomarse con bastante cautela, teniendo en cuenta que la correlación –independientemente de cuán sugerente sea– no establece causalidad.

Además, para ser creíbles, los esfuerzos en la lucha contra la corrupción del movimiento de datos masivos deben enfrentar de manera más agresiva los riesgos en el sector corporativo. El escándalo producido por los papeles de Panamá ha aumentado la presión en aras de una mayor transparencia fiscal y corporativa en el ámbito internacional. Diversas iniciativas start-ups han asumido este reto. La plataforma digital Open Corporates está creando una base de datos abierta de todos los beneficiarios efectivos (es decir, los verdaderos propietarios que disfrutan del ingreso de las empresas sin que su nombre aparezca necesariamente en el título de propiedad) de todas las compañías registradas en el mundo, recopilando datos que los gobiernos y las firmas han puesto a su disposición. Actualmente la base de datos incluye información sobre más de 110 millones de empresas de 115 jurisdicciones diferentes. Además, los auditores internos de las corporaciones comprometidos con la eliminación de la corrupción utilizan cada vez más el análisis de datos para investigar las transacciones en las contrataciones públicas y los modelos de pago, controlan en busca de anomalías e identifican operaciones sospechosas, como los flujos financieros ilícitos. Un informe reciente de Ernst and Young subraya la relevancia de la tecnología forense para gestionar el cumplimiento y mitigar los riesgos de fraude en las empresas privadas.32

Varios sectores económicos son particularmente vulnerables ante la corrupción y, por lo tanto, ofrecen oportunidades especiales para el movimiento de datos masivos. En el sector del petróleo, el gas y la minería, por ejemplo, la empresa consultora Open Oil33 ha lanzado un motor de búsqueda que permite tener acceso a datos corporativos clave de la minería de más de 40,000 empresas extractivas, e incluye información sobre la propiedad, los contratos y las concesiones. Estas soluciones de bases de datos están cambiando cada vez más el entorno en el que opera la industria. En el sector inmobiliario, otro ámbito de alto riesgo, se podrían adoptar nuevas medidas abriendo los registros de la propiedad para identificar a los beneficiarios reales de las propiedades de alto valor. Un reciente informe de análisis de datos de Thomson Reuters y Transparency International expone hasta qué punto la tierra y las propiedades en Londres son particularmente vulnerables como objetivos de empresas de blanqueo de dinero mediante el uso de vehículos corporativos anónimos basados en paraísos fiscales cuya información sobre estas empresas y sus verdaderos propietarios se desconoce. Según este informe, el 91% de las empresas extranjeras propietarias de más de 44,000 títulos de propiedad en Londres ejercen su propiedad a través de jurisdicciones secretas como Panamá o las Islas Vírgenes Británicas. Casi 1,000 de estas propiedades pertenecían a “personas políticamente expuestas”, es decir, personas que ocupan funciones públicas relevantes y que, por lo tanto, presentan un mayor riesgo de participación potencial en sobornos y corrupción. En ambos ejemplos, la apertura de los registros corporativos y la revelación de los beneficiarios efectivos representarían un enorme progreso.

Una mayor integridad favorecería los intereses de la comunidad empresarial, expuesta a una mayor demanda y expectativa de parte de los consumidores, los accionistas y los inversionistas.34 Como parte de su Iniciativa de Alianza Contra la Corrupción,35 el FEM está trabajando con la comunidad empresarial para promover soluciones innovadoras, digitalmente accesibles y basadas en datos para mitigar riesgos y mejorar la transparencia en las relaciones entre gobiernos y empresas.

La realización de la promesa de los datos en la lucha contra la corrupción

La revolución de los datos no ha hecho más que comenzar, como señaló John Doe, el denunciante de los papeles de Panamá.36 Los millenials exigen más del gobierno y son menos tolerantes con la corrupción.37 Los jóvenes activistas con expectativas y ansias de una mayor transparencia y rendición de cuentas del gobierno se han situado en la vanguardia del movimiento de datos masivos, que promete impulsar drásticamente la lucha global contra la corrupción. Se puede esperar que continúe la confluencia del activismo relacionado con los datos y de la lucha contra la corrupción, de la mano de ciudadanos cada vez más empoderados y gobiernos abiertos. Sin embargo, para aprovechar todo el potencial de los datos masivos e impedir que se conviertan en otra decepcionante moda pasajera, los funcionarios, activistas y ciudadanos deben exigir la plena integración de los análisis de datos en los esfuerzos de anticorrupción más amplios de parte de los países, y permanecer alertas para que no sean utilizados para vigilar a los gobernados en lugar de vigilar a los gobernantes.

Ya están emergiendo tecnologías disruptivas que ostentan un potencial aún mayor en la lucha contra la corrupción. Concretamente, la tecnología de cadena de bloques tiene diversas aplicaciones prometedoras en la lucha contra la corrupción, entre las cuales cabe citar la posibilidad de realizar seguimientos de los pagos, el asegurar registros públicos y el facilitar los contratos inteligentes. Básicamente, la cadena de bloques es un registro digital compartido donde las transacciones se registran en forma pública, se actualizan continuamente, son inalterables por una sola parte, y no tienen una autoridad central. Esto incluso podría resolver el problema clave del beneficio efectivo de las empresas fantasma para luchar contra la evasión y elusión de impuestos. Por ejemplo, los títulos de propiedad y los registros de propiedad son problemas cruciales en numerosos países en desarrollo. En Honduras solo el 14% de la población ocupa legalmente propiedades y solo se encuentra registrado con título legal el 30% de las propiedades.38 Honduras y Georgia están trabajando con start-ups para crear registros de la propiedad más transparentes y fiables utilizando tecnología de cadena de bloques.39 En términos de aplicaciones de seguimiento, Everledger, una start-up tecnológica lanzada en 2015, pretende acabar con el fraude y las falsificaciones en la industria del diamante con un sistema de certificación seguro e inalterable que utiliza tecnología de cadena de bloques. Si tiene éxito, esta innovación podría marcar el final de los tristemente célebres “diamantes de sangre”, que provienen de zonas de conflicto y son comercializados ilegalmente.

A pesar de la promesa del movimiento de datos masivos para luchar contra la corrupción, todavía quedan numerosos retos por delante. El uso inteligente de datos abiertos y masivos debería centrarse no solo en denunciar la corrupción sino en mejorar la comprensión de sus causas subyacentes e impedir su recurrencia. Los análisis en la lucha contra la corrupción no pueden existir en un vacío, deben enmarcarse en un contexto institucional estratégico que comience con información de buena calidad y que conduzca a reformas. Incluso las tecnologías más sofisticadas y las innovaciones en materia de datos no pueden impedir lo que el novelista francés Théophile Gautier describió como “la inexplicable tentación de la corrupción, hasta en las almas más honestas”. A menos que se utilice para mejorar la gobernanza y las instituciones, el análisis de datos per se no tendrá el impacto que podría tener, ni será sostenible a largo plazo.

Carlos Santiso
Jefe de la División de Capacidad Institucional del Estado del Banco Interamericano de Desarrollo (BID).

Ben Roseth
Coordinador de investigación de la División de Capacidad Institucional del Estado de la misma institución.

 

* La versión original en inglés del presente documento se ha publicado previamente en la Stanford Social Innovation Review y puede encontrarse aquí. Carlos Santiso agradece el apoyo de la Rockefeller Foundation, dado que este artículo fue escrito durante su período como investigador residente en el Bellagio Center, en agosto-septiembre de 2016. Se extiende un agradecimiento especial a los demás investigadores residentes por su inspiración y sus perspectivas novedosas, particularmente Jessica Bruder, David Carden y Donald Verrelli. Las opiniones expresadas en este documento pertenecen a los autores y no reflejan necesariamente las opiniones del Banco Interamericano de Desarrollo, de su Directorio ni de los países que sus miembros representan.


1 Véase aquí y aquí.

2 Visítese aquí.

3 Véase aquí.

4 Consúltese aquí.

5 Información disponible aquí.

6 A lo largo del documento se utilizarán la expresiones “datos masivos” para el inglés big data y “datos abiertos” o “de formato abierto” para open data.

7 Véase aquí.

8 Véase aquí.

9 Véase aquí.

10 Visítese este sitio.

11 Para más información, consúltese aquí.

12 Stephen Goldsmith and Susan Crawford. The Responsive City: Engaging Communities through Data-Smart Governance. San Francisco: Jossey-Bass 2014

13 Véase aquí.

14 Visítese aquí.

15 Consúltese este sitio.

16 Véase aquí.

17 Visítese aquí.

18 Véase este enlace.

19 Véase aquí.

20 Visítese este sitio.

21 Consúltese aquí.

22 Véase este enlace.

23 Véase este portal.

24 Visítese esta página.

25 Consúltese aquí.

26 Cathy O’Neil destaca algunos de estos riesgos en su libro más reciente Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.

27 Para un estudio reciente de los laboratorios de innovación públicos, véase este enlace.

28 Consúltese este enlace.

29 Véase la publicación de Matt Andrews, The Limits of Institutional Reform in Development (Cambridge University Press, 2013).

30 Véase aquí.

31 Consúltese aquí.

32 Visítese esta página.

33 Información disponible aquí.

34 Véase este enlace.

35 Consúltese aquí.

36 Véase “El manifiesto de John Doe”, en Süddeutsche Zeitung (Berlín, 6 de mayo 2016). Disponible aquí.

37 Visítese esta página.

38 Véase este enlace.

39 Consúltese esta página web.