Big data en los bancos centrales asiáticos
Introducción
Las fuentes de big data se están desarrollando rápidamente, y las aplicaciones para hacer uso de esta nueva información están floreciendo en paralelo. Esta tendencia, que es particularmente pronunciada en Asia, refleja principalmente el impacto de la digitalización, con el desarrollo del «internet de las cosas» y la capacidad cada vez mayor de procesar digitalmente información «tradicional», como el texto. También es una consecuencia de las grandes bases de datos que se han creado como un subproducto de las complejas operaciones que tienen lugar en las sociedades modernas. Además, han surgido grandes cantidades de datos en los ámbitos administrativo, comercial y financiero, una evolución impulsada por las importantes estrategias de recopilación de datos emprendidas después de la gran crisis financiera de 2007-09 para abordar los desafíos de información planteados por los desarrollos en el sector financiero. Ahora vivimos en la «era del big data».
Los bancos centrales no son una excepción a este panorama general (Buch (2019)). Han mostrado un creciente interés en el uso de big data en los últimos años, como ya ha documentado ampliamente el Comité Irving Fisher (IFC) sobre Estadísticas de Bancos Centrales (IFC (2017), Tissot (2017), Nymand-Andersen (2016), Mehrhoff (2019)). El trabajo relacionado con big data del banco central cubre una variedad de áreas, incluida la política monetaria y la estabilidad financiera, así como la investigación y la producción de estadísticas oficiales. Sin embargo, en contraste con el rápido ritmo de innovación observado en el sector privado, las aplicaciones de big data que respaldan el trabajo operativo de los bancos centrales se desarrollaron solo lentamente inicialmente. Esto tendía a reflejar una serie de limitaciones, como la falta de recursos adecuados, así como los desafíos intrínsecos asociados con el uso de fuentes de big data para apoyar las políticas públicas. Sin embargo, en los últimos años, el uso de big data por parte de los bancos centrales ha proliferado, especialmente entre los países asiáticos.
¿Los bancos centrales se pondrán al día y transformarán la forma en que operan para beneficiarse aún más de la revolución de la información? ¿O su uso de fuentes y aplicaciones de big data progresará solo gradualmente debido a las especificidades inherentes de sus mandatos y procesos? Para arrojar luz sobre estos temas, este documento revisa el uso de big data y aprendizaje automático en la comunidad de bancos centrales asiáticos, aprovechando una encuesta realizada en 2020 entre los miembros de la CFI. Con este fin, este documento analiza las respuestas de siete bancos centrales asiáticos, con un enfoque específico en sus proyectos de big data reportados.
El enfoque abordó las siguientes preguntas clave: ¿Qué constituye el big data para los bancos centrales y qué tan fuerte es el interés de los bancos centrales en él? ¿Han ido aumentando los bancos centrales su uso del big data y, en caso afirmativo, cuáles han sido las principales aplicaciones desarrolladas? Y, por último, ¿a qué limitaciones se enfrentan cuando se utiliza big data y cómo se pueden superar? Para abordar estos problemas, las respuestas de los bancos centrales asiáticos a la encuesta de 2021 se compararon con las de sus pares en el resto del mundo.
Este análisis descubrió cuatro ideas principales.
En primer lugar, los bancos centrales asiáticos tienen una visión integral de los grandes datos, que pueden comprender tipos muy diferentes de conjuntos de datos. En primer lugar, incluye grandes datos «no tradicionales» (o no estructurados) a menudo caracterizados por un alto volumen, velocidad y variedad y que deben procesarse utilizando tecnologías innovadoras. Sin embargo, para la gran mayoría (85%) de los encuestados en Asia, el big data también incluye grandes conjuntos de datos «tradicionales» (es decir, estructurados). Estos pueden ser el resultado de requisitos explícitos de presentación de informes establecidos por los reguladores públicos; también son a menudo subproductos «orgánicos» recopilados como resultado de actividades comerciales (por ejemplo, transacciones de pago), financieras (por ejemplo, cotizaciones de precios marcadas por tick observadas en los mercados financieros) y administrativas (por ejemplo, archivos recopilados por instituciones públicas) – estos datos a menudo se denominan «big data financieros». En contraste, solo el 60% de los bancos centrales fuera de Asia incluyen tales conjuntos de datos tradicionales en el concepto de «big data». Potencialmente, la huella relativamente grande de las grandes tecnológicas en Asia ha estimulado la discusión en la región (Cornelli et al (2020)).
En segundo lugar, el interés en big data es alto en Asia: alrededor de dos tercios (60%) de los bancos centrales de la región mencionaron que discuten ampliamente los problemas de big data, mientras que solo una minoría (42%) de sus contrapartes en el resto del mundo informan que este es el caso. Además, todos los bancos centrales asiáticos en la encuesta indicaron un nivel de interés alto a muy alto también en el nivel de política superior, mientras que este fue el caso de solo el 58% de sus contrapartes en otras regiones.
En tercer lugar, y volviendo a casos de uso concretos, el 68% de los bancos centrales asiáticos informan que se ocupan de big data para apoyar la investigación económica, las políticas de estabilidad monetaria y financiera, así como sus tareas de producción estadística. Esto es comparable a las cifras reportadas en el resto del mundo (64%). Los proyectos de big data emprendidos en este contexto suelen incluir cuatro tipos principales de aplicaciones: procesamiento del lenguaje natural (PNL), ejercicios de nowcasting (incluso para apoyar sus tareas de procesamiento estadístico), aplicaciones para extraer información sobre el estado de la economía a partir de datos financieros granulares y otras fuentes no tradicionales, así como aplicaciones suptech/regtech.
En cuarto lugar, la encuesta muestra que los bancos centrales asiáticos discuten ampliamente los nuevos desafíos planteados por el advenimiento de los grandes datos. Uno de los principales es la configuración de una infraestructura de TI confiable y de alta potencia. Si bien muchas instituciones han emprendido importantes iniciativas para desarrollar plataformas adecuadas para facilitar el almacenamiento y el procesamiento de conjuntos de datos muy grandes y complejos (IFC (2020)), el progreso ha variado en la región. Esto se debe en parte a la necesidad de contratar y capacitar al personal, lo cual es difícil debido a la oferta limitada de candidatos con las habilidades necesarias (por ejemplo, científicos de datos). Otros desafíos incluyen la base legal para el uso de datos privados y las preocupaciones de seguridad, éticas y de privacidad que esto conlleva, así como la «equidad» y precisión de los algoritmos entrenados en conjuntos de datos preclasificados y / o no representativos. Los problemas de calidad de los datos y gobernanza también son importantes, ya que gran parte de los nuevos big data recopilados como subproducto de las actividades económicas o sociales deben seleccionarse antes de que se pueda realizar un análisis estadístico adecuado (IFC (2021b)). Estos desafíos generalmente se consideran igualmente importantes entre los diferentes bancos centrales de todo el mundo. Un punto notable es que la seguridad cibernética y el desarrollo de una estrategia formal para el uso de big data son temas que parecen estar más arriba en la agenda de los bancos centrales asiáticos en comparación con sus contrapartes en otras regiones.
El resto del documento está organizado de la siguiente manera. La sección 2 proporciona una visión general de cómo los bancos centrales asiáticos definen el big data. La sección 3 ilustra en qué campos utilizan o planean utilizar big data y analiza casos de uso específicos. La sección 4 revisa los principales desafíos en el uso del aprendizaje automático y el big data. En la sección 5 se analiza cómo la cooperación entre las autoridades públicas podría relajar las limitaciones a la recopilación, el almacenamiento y el análisis de macrodatos. Concluye la sección 6.
2. ¿Cuál es la definición de big data de los bancos centrales?
La definición de big data no es única, ya que se refiere al ángulo específico de su uso. En general, el big data se puede definir en términos de volumen, velocidad y variedad (las llamadas 3Vs). La razón es que para que los datos sean «grandes», no solo deben tener un alto volumen y alta velocidad, sino que también deben venir en múltiples variedades. Sin embargo, también hay muchos puntos de vista diferentes sobre lo que define el «big data».
En la práctica, el big data puede incluir la información generada a partir de una amplia variedad de fuentes, como las redes sociales, las actividades basadas en la web, los sensores de máquinas o las operaciones financieras, administrativas o comerciales. Esta visión integral de los grandes datos se ve confirmada por los resultados de la encuesta para los bancos centrales asiáticos. Ciertamente, ningún banco central considera los datos tradicionales por sí solos como big data. Pero como se informa en el Gráfico 1, solo el 14% de los encuestados define el big data exclusivamente como grandes datos no tradicionales o no estructurados que requieren nuevas técnicas para el análisis (en contraste, casi el 40% de sus contrapartes en el resto del mundo tienen una definición tan estrecha). El 86% restante de los encuestados asiáticos también incluye conjuntos de datos tradicionales y estructurados en su definición de big data. Estos conjuntos de datos estructurados comprenden los recopilados con fines administrativos o regulatorios/de supervisión, a menudo etiquetados como «big data financiero» (Cœuré (2017), Draghi (2018)).
Sobre la base de los resultados de la encuesta, una definición exhaustiva de big data abarcaría todos los tipos de conjuntos de datos que requieren el análisis de tecnologías no estándar. La razón de esto es, en parte, que las técnicas estadísticas tradicionales enfrentan obstáculos cuando se aplican a datos no estructurados. Por ejemplo, para analizar texto escrito a mano, primero debe convertirse en datos estructurados, como se hace, por ejemplo, con los algoritmos de PNL.
Hay una variedad de fuentes de datos en bruto utilizadas por los bancos centrales asiáticos para el análisis. Estos van desde conjuntos de datos administrativos estructurados, como registros de crédito, hasta datos no tradicionales obtenidos de periódicos y portales en línea o mediante el raspado de la web. Este tipo de información, incluidos los datos producidos por la propia Internet, puede no ser necesariamente «grande», pero es compleja y no se puede analizar fácilmente con técnicas estadísticas tradicionales adaptadas a conjuntos de datos numéricos. En cambio, requiere herramientas específicas para ser limpiado y preparado adecuadamente. Sin embargo, en algunos casos es posible adquirir estos datos de proveedores privados de forma ya agregada y organizada.
Vale la pena mencionar tres ejemplos. En primer lugar, los informes de movilidad, que proporcionan tendencias agregadas de desplazamiento obtenidas a través del GPS desde teléfonos móviles y que pudieron respaldar el monitoreo del acceso de los hogares a las áreas de recreación cuando la pandemia de Covid-19 golpeó en 2020 (ver Banco de Japón (2020)). El segundo ejemplo se refiere a las búsquedas en Internet, como Google Trends, que se pueden utilizar para evaluar los desarrollos en tiempo real, por ejemplo, las expectativas sobre la evolución del mercado laboral (Doerr y Gambacorta (2020 a, b)) o las ventas de automóviles (Nymand-Andersen y Pantelidis (2018)). Una tercera fuente de información no estructurada para los bancos centrales es el texto en formato impreso, como artículos de periódicos, estados financieros de empresas, comunicados de prensa oficiales, etc.
Si bien los bancos centrales tienen una experiencia sustancial con grandes conjuntos de datos estructurados, generalmente de naturaleza financiera, solo recientemente han comenzado a explorar datos no estructurados. Como se discutió anteriormente, el análisis de datos no estructurados requiere la aplicación de herramientas específicas. A menudo son el subproducto de la actividad corporativa o de consumo y antes de ser analizados, deben limpiarse y curarse, es decir, organizarse e integrarse en las estructuras existentes.
3. ¿Cómo utilizan los bancos centrales asiáticos el big data?
Según la encuesta de IFC de 2020, los bancos centrales y las autoridades de supervisión están adoptando rápidamente el big data y el aprendizaje automático: la proporción de bancos centrales que actualmente utilizan big data ha aumentado al 80% a nivel mundial, frente a solo el 30% en 2015. Esta proporción ha aumentado del 33% al 86% cuando se mira específicamente a Asia. Además, alrededor del 60% de los bancos centrales de la región informaron que discuten ampliamente los problemas de big data, una proporción que está significativamente por encima de la observada en el resto del mundo (42%). Además, todos los encuestados asiáticos indicaron un nivel de interés alto a muy alto nivel de políticas, en comparación con solo el 58% fuera de la región.
Big Data se utiliza en una variedad de áreas, incluida la investigación, así como la política monetaria y la estabilidad financiera. Los bancos centrales asiáticos (representados por las barras rojas en el Gráfico 2) parecen usar big data en la mayoría de las áreas más que sus pares (barras azules), excepto con fines de investigación. En particular, procesan datos no tradicionales (barras más oscuras) en mayor medida para respaldar las políticas de estabilidad monetaria y financiera, incluso con fines específicos de supervisión y regulación (suptech y regtech).
Los proyectos de big data emprendidos por los bancos centrales asiáticos implican cuatro tipos principales de aplicaciones: PNL, ejercicios de nowcasting, aplicaciones para extraer información de toda la economía a partir de datos financieros granulares y otras fuentes no tradicionales, y aplicaciones suptech / regtech. En el Apéndice figura una lista de proyectos seleccionados de big data en bancos centrales asiáticos.
Un primer tipo de aplicación utiliza información textual a través de la PNL. El objetivo es generalmente convertir la inteligencia cualitativa basada en texto en formato numérico. Un ejemplo ha sido el cálculo de los llamados índices de incertidumbre de política económica (EPU) en la India para evaluar el grado de incertidumbre que enfrentan los agentes económicos (Priyaranjan y Pratap (2020)). Tales índices se construyen básicamente mediante la creación de diccionarios que permiten la definición de términos específicos que se refieren a la incertidumbre, y luego buscarlos en el texto considerado (por ejemplo, en artículos de periódicos o en sitios de Internet). Estos términos seleccionados se cuentan y agregan para proporcionar un índice sintético que refleja el grado de incertidumbre que se muestra en el documento de interés. Los índices de sentimiento se pueden calcular de esta manera, por ejemplo, para medir la probabilidad de que ocurran episodios de inestabilidad financiera.
La PNL también es útil para la evaluación de políticas. Por ejemplo, se puede cuantificar la postura de la política monetaria que se comunica al público a través de la publicación de actas de reuniones. Del mismo modo, las expectativas del mercado sobre las decisiones sobre los tipos de interés se han evaluado mediante el análisis de los comentarios del mercado antes de las reuniones de política en Indonesia (Andhika Zulen y Wibisono (2019)). Tales ejercicios se pueden actualizar regularmente, lo cual es una ventaja clave en comparación con las encuestas más tradicionales de los participantes del mercado. La información recopilada sobre las expectativas de los agentes económicos puede ser particularmente útil cuando los mercados futuros no están bien desarrollados, carecen de liquidez o están sujetos a shocks inesperados (Amstad y Tuazon (2020); Armas et al (2020)). Por el contrario, el uso reportado de datos de texto para informar las políticas de estabilidad financiera ha sido relativamente escaso hasta ahora, aunque también parece estar desarrollándose. Otras aplicaciones que utilizan el análisis de texto en los bancos centrales asiáticos han ayudado a: i) evaluar la credibilidad de la política monetaria; ii) garantizar la coherencia en la comunicación de las cuestiones de supervisión por parte de los bancos centrales a las entidades financieras; iii) mejorar la eficiencia en la compilación de estadísticas (Chansang (2019)); iv) evaluar el estado del mercado laboral (Bailliu et al (2019)) o de las condiciones comerciales (Amstad et al (2021)); (v) extraer información sobre las actividades turísticas (popularidad de los destinos de viaje y posibles temas asociados); y vi) capturar el sentimiento de las empresas o evaluar los comentarios de los empleados.
En segundo lugar, un gran y creciente número de bancos centrales apoyan su análisis económico con modelos de nowcasting basados en big data. Más del 40% de los bancos centrales asiáticos (24% en el resto del mundo) indicaron que el big data se utiliza para este propósito, especialmente para proporcionar información adicional sobre el consumo privado, las ventas industriales / minoristas, los precios minoristas / de la vivienda, los pagos y las condiciones de desempleo (Gráfico 3, panel izquierdo). Matsumura et al (2021) combinan datos GPS con información sobre coordenadas geográficas de instalaciones comerciales y públicas (como tiendas y fábricas) para examinar de cerca aquellos sectores en los que se puede aplicar la fundición para estimar (con un alto nivel de precisión y eficiencia reportado) el consumo de los hogares y la producción firme. Finalmente, los modelos nowcasting pueden ayudar a llenar vacíos estadísticos, por ejemplo, cuando las series de referencia no existen, están disponibles solo a baja frecuencia o se interrumpen repentinamente, como durante la pandemia de Covid-19 (De Beer y Tissot (2020)). Este aspecto se ha vuelto particularmente importante para los bancos centrales, lo que refleja su doble papel como productores y usuarios de estadísticas.
Por lo general, estos ejercicios de nowcasting se actualizan con frecuencia a medida que ingresan nuevos datos, y se aplican varias técnicas, por ejemplo, Lasso (Operador de contracción y Selección Mínima Absoluta), para seleccionar la combinación de variables que maximiza el pronóstico en un momento dado (Richardson et al (2019)). Una ventaja es que este enfoque no se basa en relaciones específicas asumidas ex ante (como es el caso de los modelos puente utilizados para los ejercicios «tradicionales» de nowcasting) y puede ser más adecuado para identificar puntos de inflexión, especialmente en tiempos de agitación económica (INSEE (2020)).
Una tercera categoría incluye las diversas aplicaciones desarrolladas por los bancos centrales para extraer información de toda la economía a partir de datos financieros granulares u otras fuentes no tradicionales de microdatos. Los macrodatos financieros incluyen grandes conjuntos de datos patentados y estructurados, como los de los registros de operaciones para transacciones de derivados, o los registros de crédito para préstamos o pagos individuales. Por ejemplo, los registros de los registros de operaciones han ayudado a identificar redes de exposiciones en Tailandia (Chantharat et al (2017)). Del mismo modo, la información de los registros de crédito ha apoyado la evaluación de la calidad crediticia, por ejemplo, mejorando las estimaciones de las probabilidades de incumplimiento o de incumplimiento por pérdida (Pagano y Cappelli (1993)). Y los datos de los sistemas de liquidación bruta en tiempo real han ayudado a mostrar las interconexiones banco-empresa a través de los pagos procesados.
Además, se ha prestado especial atención a la extracción de información de datos no tradicionales, como consultas de búsqueda en Internet como Google Trends, que respaldan los ejercicios de monitoreo realizados por el Banco de Tailandia (Sawaengsuksant (2019)). Otros casos de uso de fuentes no tradicionales incluyen el análisis de: (i) el consumo de electricidad para monitorear el mercado inmobiliario residencial o facturas de exportación para analizar la fortaleza del sector exportador en Malasia (Wanitthanankun y Dummee (2017)); (ii) el número de búsquedas de empleo para monitorear la evolución del mercado laboral en Tailandia (Nuprae et al (2017)); iii) datos de tráfico de usuarios de teléfonos móviles para evaluar los efectos de la COVID-19 en la movilidad y la migración (Chanthaphong y Tassanoonthornwong (2021)); iv) solicitudes de patente presentadas por empresas emergentes para estimar el impacto económico de las innovaciones de capital riesgo en Japón (Washimi (2021)); y (vi) ventas de comercio electrónico (Yezekyan (2018)).
Una cuarta categoría comprende la amplia gama de aplicaciones suptech y regtech para apoyar las tareas de micro supervisión. Esto puede cubrir múltiples áreas, como lo documentan Broeders y Prenio (2018), di Castri et al (2019), Coelho et al (2019) y Financial Stability Board (2020). En general, muchas de las solicitudes desarrolladas entre las jurisdicciones asiáticas consideradas se centran en la evaluación de riesgos a nivel microeconómico. Por ejemplo, la información a nivel de empresa recopilada de los estados financieros o los periódicos puede utilizarse para apoyar los ejercicios de alerta temprana o mejorar la calificación crediticia (mencionada por aproximadamente el 55% y el 45% de los bancos centrales asiáticos, respectivamente; Gráfico 3, panel de la derecha). Otra área importante se relaciona con la detección de fraude (casi el 30% de los casos), por ejemplo, mediante la selección de contratos de crédito en busca de términos y condiciones sospechosos para mejorar la protección del consumidor. Por último, casi un tercio de los bancos centrales asiáticos encuestados despliegan algoritmos de big data para fines de lucha contra el lavado de dinero / la financiación del terrorismo (ALD / CFT), por ejemplo, al analizar las transacciones de pago para identificar patrones sospechosos.
4. ¿Cuáles son los principales retos en el uso del big data?
Como se señaló anteriormente, los bancos centrales y las autoridades de supervisión de Asia ya utilizan ampliamente las fuentes de macrodatos y análisis, como el aprendizaje automático, con fines de investigación, en particular para informar las decisiones de política monetaria, facilitar su trabajo de recopilación estadística y apoyar sus tareas de regulación y supervisión. Sin embargo, el uso de big data plantea varios desafíos para ellos. El gráfico 4 muestra que estos temas son discutidos activamente por los bancos centrales en Asia (en rojo), especialmente en comparación con sus contrapartes en el resto del mundo (en azul). Todos los bancos centrales asiáticos considerados mencionan que tienen discusiones activas sobre una amplia gama de temas, como la disponibilidad de infraestructura de TI, cuestiones legales, de seguridad y privacidad, así como la disponibilidad y el uso estratégico de big data. Curiosamente, la ciberseguridad y el desarrollo de una estrategia formal para el uso de big data son áreas que parecen mucho más activamente discutidas en comparación con sus contrapartes en el resto del mundo.
Más específicamente, la encuesta ha destacado cinco desafíos principales para los bancos centrales asiáticos en el uso de big data. El primero es la creación de una infraestructura de TI confiable y de alta potencia (IFC (2020)). Proporcionar una potencia informática y un software adecuados implica altos costos iniciales. Muchos bancos centrales han emprendido importantes iniciativas para desarrollar plataformas de big data para facilitar el almacenamiento y el procesamiento de conjuntos de datos grandes y complejos. Un posible enfoque está representado por los llamados lagos de datos, obtenidos de la agrupación de diferentes conjuntos de datos que se seleccionan para su uso futuro. Una infraestructura de TI confiable y segura es un requisito previo no solo para el análisis de big data, sino también para prevenir ataques cibernéticos.
En segundo lugar, los bancos centrales necesitan acumular capital humano para explotar el big data. La configuración y el mantenimiento de plataformas de big data requieren un tipo específico de conjunto de habilidades, que combinen aspectos estadísticos, de TI y analíticos / matemáticos. Sin embargo, la oferta de «científicos de datos» es escasa y tienen una gran demanda (Cœuré (2020)), tanto en el sector público como en el privado. Una solución es que los bancos centrales capaciten al personal existente, pero aprender las nuevas técnicas que se necesitan puede requerir mucho tiempo y esfuerzo. Además, la experiencia muestra que estos ajustes de habilidades deben tener lugar más allá del nivel operativo, por ejemplo, los estadísticos a cargo del uso de herramientas avanzadas. Aquellos que analizan el resultado de modelos complejos también deben tener una buena comprensión de las nuevas técnicas para garantizar que las predicciones de big data no solo sean precisas, sino también representativas e «interpretables», de modo que se puedan identificar y comunicar causas o factores explicativos específicos para su uso en políticas. Otro problema es atraer y retener talento, especialmente frente a la intensa competencia del sector privado, así como de las economías avanzadas, especialmente para las jurisdicciones menos desarrolladas de Asia. Esto también puede requerir una revisión de los sistemas públicos de compensación existentes, los sistemas de carrera y las organizaciones jerárquicas internas en los bancos centrales.
Un tercer desafío son los aspectos legales y éticos para el uso de datos privados y confidenciales. Los aspectos reputacionales pueden dificultar el uso de la información procedente de Internet cuando se sabe poco sobre su exactitud y el respeto de las normas metodológicas que los bancos centrales deben cumplir, sobre todo en vista del papel clave que desempeñan en los Sistemas Estadísticos Nacionales. Por ejemplo, los indicadores basados en Internet, como las consultas de búsqueda y los mensajes en las redes sociales, pueden no ser representativos de la economía real: no todos están en Twitter, o solo un subconjunto de los precios de la canasta del IPC se puede extraer de la web. Además, varios términos y condiciones pueden restringir el uso de estos datos y ciertas formas de web-scraping son ilegales en algunas jurisdicciones. En general, los rastreadores web no pueden obtener datos de sitios que requieren autenticación.
Teniendo en cuenta los aspectos de ética y privacidad, los ciudadanos pueden sentirse incómodos con la idea de que los bancos centrales están examinando sus historiales de búsqueda, publicaciones en redes sociales o listados en plataformas de mercado. Si bien estas preocupaciones no son nuevas, la cantidad de datos producidos en un entorno en su mayoría no regulado los hace más urgentes (Jones y Tonetti (2020), Boissay et al (2020)). Ciertamente, cuando se preguntó a los consumidores estadounidenses en una encuesta sistemática en quién confían para salvaguardar sus datos personales, los encuestados informaron que confían menos en las grandes tecnológicas (Armantier et al (2021)). De hecho, tenían mucha más confianza en las instituciones financieras tradicionales, seguidas por las agencias gubernamentales y las fintech. Patrones similares están presentes en los países asiáticos (Chen et al (2021)).5 Sin embargo, garantizar la privacidad contra la intrusión injustificada no solo por parte de actores comerciales sino también por parte del gobierno tiene los atributos de un derecho básico. Por estas razones, la cuestión de la gobernanza de los datos se ha convertido en una preocupación clave de política pública (IFC (2021b)).
Un cuarto desafío es la «equidad algorítmica». Esta consideración puede ser menos relevante para algunas tareas (por ejemplo, nowcasting), pero puede ser muy importante para otras (por ejemplo, evaluar la idoneidad de las aplicaciones regtech) y, en general, cualquier aplicación de aprendizaje automático que afecte a las personas tendría que estar sujeta a validaciones de equidad (McCarthy (2019)). Un problema principal es que los algoritmos a menudo se entrenan en conjuntos de datos preclasificados que pueden estar sujetos a sesgos (conocidos o desconocidos), incluso relacionados con el género y la etnia.6 Además, la relación que parece existir entre los datos no estructurados y un determinado fenómeno puede deteriorarse inesperadamente cuando llega información adicional (por ejemplo, la incorporación de información nueva y «fuera de la muestra»). El fracaso de Google Flu Trends proporciona un buen ejemplo de estos peligros, ya que inicialmente se pretendía proporcionar estimaciones de la actividad de la influenza basadas en consultas de la Búsqueda de Google, pero se suspendió a mediados de la década de 2010 (Lazer et al (2014)).
Finalmente, los problemas de calidad de los datos también son significativos, ya que gran parte de los nuevos big data recopilados como un subproducto de las actividades económicas o sociales deben ser curados antes de que se pueda realizar un análisis estadístico adecuado. Esto contrasta con las fuentes tradicionales de estadísticas oficiales que están diseñadas para un propósito específico, por ejemplo, encuestas y censos. Los principales desafíos incluyen la limpieza de datos (por ejemplo, para fuentes como periódicos, redes sociales o registros financieros de big data), muestreo y representatividad (por ejemplo, en el caso de búsquedas de Google o sitios web de empleo) y hacer coincidir nuevos datos con fuentes existentes, como lo documentó Siksamat (2021) en el caso de Tailandia.
5. Is there a role for policy cooperation?
La cooperación podría fomentar el uso de macrodatos por parte de los bancos centrales, en particular mediante la recopilación y exhibición de proyectos exitosos y facilitando el intercambio de experiencias. Por ejemplo, el desarrollo de discusiones técnicas entre instituciones se considera una buena manera de desarrollar el conjunto de habilidades necesarias entre el personal y desarrollar herramientas y algoritmos de TI relevantes que se adapten mejor a las necesidades de los bancos centrales.
De cara al futuro, un área prometedora para la colaboración entre los bancos centrales de Asia podría ser en los datos de pagos globales. Más del 85% de los bancos centrales asiáticos informaron de un uso activo de datos de pago de alta frecuencia en sus instituciones, con un enfoque principal en el tipo de instrumentos, las contrapartes involucradas o ambos. Esta ratio es mucho más alta en comparación con otros bancos centrales del resto del mundo (alrededor del 65%; Gráfico 5). Además, todos los bancos centrales asiáticos expresaron interés en contribuir a un estudio piloto sobre datos de pago (gráfico 6, panel de la izquierda), especialmente para desarrollar ejercicios de supervisión con un enfoque en la interconexión en el sistema financiero. Esto contrasta con sus contrapartes en el resto del mundo, donde el interés en el uso de datos de pago se limita principalmente a fines de nowcasting (panel de la derecha).
Las instituciones financieras internacionales pueden fomentar la cooperación en torno al big data. Por ejemplo, pueden ayudar a desarrollar conocimiento interno de big data, ayudando a reducir la dependencia de los bancos centrales de los proveedores de servicios de big data, que pueden ser costosos y conllevar riesgos legales y operativos significativos. De hecho, la CFI ha estado apoyando activamente dicho intercambio de experiencias a nivel mundial, y se están desarrollando varias iniciativas complementarias en la región asiática, por ejemplo, entre los bancos centrales de la EMEAP.7
Los organismos internacionales también pueden facilitar la innovación promoviendo soluciones e iniciativas tecnológicas para mejorar la infraestructura estadística mundial. En este sentido, el BIS Innovation Hub ha identificado como prioridades estratégicas, entre otras, la supervisión efectiva (incluyendo regtech/suptech) y la banca/finanzas abiertas que podrían beneficiarse de recurrir a fuentes y herramientas de big data. Actualmente está desarrollando su programa de trabajo en estos campos, con miras a producir pruebas de concepto (PoC) que puedan beneficiar a la comunidad de bancos centrales.
Los proyectos iniciales en el campo de particular relevancia para los bancos centrales asiáticos incluyen Ellipse, dirigido por el Centro del Centro de Singapur, y Genesis (Centro de Hong Kong). Ellipse es un PoC que tiene como objetivo demostrar las funcionalidades y la viabilidad de una plataforma integrada de datos y análisis regulatorios que puede (i) reducir las cargas de cumplimiento impuestas a las instituciones financieras al alejarse de las solicitudes de informes regulatorios basadas en plantillas; (ii) estar más cerca del «tiempo real» y ser relevante para los eventos actuales para respaldar los juicios y acciones de supervisión, tanto a nivel local como global; iii) apoyar un movimiento hacia nuevas arquitecturas habilitadas digitalmente para reemplazar los conceptos y procesos tradicionales de recopilación de datos; y (iv) permitir la información predictiva y la alerta temprana mediante la integración de análisis de big data. Volviendo a Genesis, este proyecto explora el «arte verde de lo posible» a través de la combinación de blockchain, contratos inteligentes, activos digitales e Internet de las cosas. La visión subyacente es que un inversor puede descargar una aplicación para invertir en bonos del gobierno, de modo que los ingresos se puedan utilizar para desarrollar un proyecto verde. A lo largo de la vida útil del bono, el inversor podría no solo ver los intereses acumulados, sino también rastrear en tiempo real cuánta energía limpia se está generando y la consiguiente reducción de las emisiones de CO2 vinculadas a la inversión individual.
Conclusión
El mundo está cambiando y también lo está la forma en que se mide. Este documento proporciona una visión general del uso de big data en la comunidad de bancos centrales asiáticos. Aprovecha una encuesta realizada en 2020 entre los miembros de la CFI. Se analizaron las respuestas específicas de siete bancos centrales asiáticos y se compararon con las de otros bancos centrales del resto del mundo. El panorama general sugiere que, mientras que los bancos centrales de otras regiones ven desafíos y oportunidades similares en el uso de big data, los ubicados en Asia tienen características muy distintivas.
En primer lugar, los bancos centrales asiáticos definen el big data de una manera abarcadora que incluye no solo datos no estructurados y no tradicionales, sino también conjuntos de datos estructurados en mayor medida en comparación con otras regiones. En segundo lugar, el interés en los macrodatos parece más alto en Asia, incluso a nivel de políticas de alto nivel. En tercer lugar, una gran mayoría de los bancos centrales asiáticos informan que se ocupan de big data para apoyar la investigación económica, las políticas de estabilidad monetaria y financiera, así como sus tareas de producción estadística, una proporción que está ligeramente por encima de la situación reportada en otras regiones. Los proyectos de big data relacionados se desarrollan principalmente en las áreas de PNL, nowcasting, aplicaciones para extraer información de toda la economía y soluciones suptech / regtech. En cuarto lugar, el advenimiento del big data plantea nuevos desafíos, como la confiabilidad de las infraestructuras de TI, los aspectos legales en torno a la privacidad, la equidad algorítmica y la calidad de los datos. Curiosamente, existe un interés algo mayor entre los bancos centrales asiáticos por analizar estos temas, con temas como la seguridad cibernética y el desarrollo de una estrategia formal para el uso de big data que ocupan un lugar particularmente importante en sus agendas.
Los bancos centrales asiáticos (y otros) están dispuestos a unir fuerzas para cosechar los beneficios de los grandes datos, según muestra la encuesta de IFC. Las instituciones financieras internacionales pueden apoyar estos enfoques cooperativos.8 Pueden facilitar la innovación mediante la promoción de soluciones tecnológicas para armonizar los estándares y procesos de datos entre jurisdicciones, y ya se han puesto en marcha importantes proyectos en Asia.