Publicado el 19 de noviembre de 2021

Hay más lecturas recomendadas de nuestros colegas de XBRL US esta semana, que exploran las propiedades y los beneficios de los estándares de datos exitosos para los reguladores. XBRL US ha escrito en respuesta a una solicitud de información (RFI) en nombre del Consejo de Chief Data Officer (CDO) gubernamental, desarrollando parte de este material en una infografía altamente informativa.
El CDO Council busca mejorar la gestión, el uso, la protección, la difusión y la generación de datos en la toma de decisiones y las operaciones del gobierno de EE. UU. XBRL US insta a la adopción de estándares de datos para respaldar esta misión y, para lograr el máximo impacto, la implementación de un estándar único en las agencias federales relevantes en forma de XBRL.
Como se explica en la infografía, un estándar de datos eficaz debe ser abierto, no propietario y de uso generalizado. También debería ofrecer una solución a largo plazo que pueda adaptarse fácilmente con el tiempo, y debería basarse en un único modelo de datos documentado en una taxonomía legible por máquina. Los resultados para los reguladores incluyen datos de alta calidad que son legibles por máquina, automatizables y oportunos; la capacidad de combinar y analizar múltiples conjuntos de datos; menores costos a lo largo de la cadena de valor de los informes; y reducción de la carga de informes. Las soluciones a corto plazo, como el uso de hojas de cálculo para la recopilación de datos o el desarrollo de sistemas únicos, pueden parecer más fáciles, pero son mucho menos útiles y más costosas a largo plazo.
La carta también examina en detalle útil cómo los estándares de datos pueden contribuir en áreas específicas de interés para el CDO Council, particularmente los inventarios de datos y el intercambio de datos, y cómo XBRL puede facilitar el acceso a los datos. Los informes XBRL, explica, “son inequívocamente legibles por máquina; Los datos transportados en formato XBRL se pueden leer directamente de máquina a máquina sin necesidad de interpretación o extracción manual. Debido a que XBRL es un estándar ampliamente utilizado, las herramientas que funcionan con una implementación funcionarán con cualquier otro programa XBRL, manteniendo el costo de análisis bajo y permitiendo la combinación de datos».
En respuesta a la pregunta «¿Cómo llegamos allí?» XBRL US dice «Ya estamos allí». XBRL se utiliza en todo el mundo.
¿Necesita responder a una solicitud de información local en su país? ¿Busca formas de convencer a los responsables políticos o reguladores con los que interactúa de que los estándares reducen los costos, mejoran la competencia, amplían la innovación y satisfacen sus necesidades de datos de alta calidad? ¿Que los estándares superan a reinventar la rueda todos los días? Quizás usted es un legislador o un regulador. De cualquier manera, vale la pena leer estas nuevas piezas de XBRL US.
Noviembre 15, 2021
Oficina de Soluciones Compartidas y Mejora del Rendimiento (OSSPI)
A quien corresponda:
RE: RFI en nombre del Consejo Federal de Directores de Datos, Expediente No. 2021
Agradecemos la oportunidad de hacer aportaciones a la misión del Consejo de Oficiales Jefes de Datos (CDO) y enfoque. Apoyamos la visión del Consejo de mejorar el logro de la misión del gobierno y aumentar los beneficios para la Nación a través de la mejora en la gestión, uso, protección, difusión y generación de datos en la toma de decisiones y operaciones gubernamentales.
Soy el CEO de XBRL US, una organización de estándares de datos sin fines de lucro. Nuestra misión es mejorar la eficiencia y la calidad de los informes en los ESTADOS UNIDOS mediante la promoción de la adopción de negocios y estándares de datos gubernamentales. Una mejor presentación de informes conduce a una mayor transparencia y rendición de cuentas, y mejora la capacidad de los organismos gubernamentales para establecer políticas útiles. Mejores informes promueven mejoras de eficiencia que ahorran dinero y tiempo para aquellos que informan, recopilan y usan datos.
Los miembros de XBRL US incluyen empresas públicas, firmas de contabilidad, software, datos y proveedores de servicios, así como otras organizaciones sin fines de lucro y de estándares. XBRL US es una jurisdicción de XBRL International1, el consorcio sin fines de lucro responsable de desarrollar y mantener la especificación técnica eXtensible Business Reporting Language (XBRL), que es gratuita y abierta estándar de datos ampliamente utilizado en todo el mundo para la presentación de informes por parte de empresas públicas y privadas, así como como entidades gubernamentales.
Esta carta recomienda la adopción de normas de datos para apoyar la misión del Consejo y para abordar las secciones de la RFI adoptar un estándar de datos único en todas las agencias federales. Instamos al Consejo a que aproveche las normas de datos abiertas y no propietarias para maximizar el valor de recopiló datos y redujo el costo de la presentación de informes, la recopilación y el uso de datos. El estándar que nosotros utilizamos, Soporte, eXtensible Business Reporting Language (XBRL) ha sido adoptado por ochenta reguladores en todo el mundo y se utiliza hoy en día en 184 programas de recopilación de datos gubernamentales.
Las agencias federales en los Estados Unidos que requieren informes en XBRL incluyen el Securities and Exchange Comisión (SEC), la Corporación Federal de Seguros de Depósitos (FDIC) y la Federal De Energía Comisión Reguladora (FERC). Los programas eficaces de recopilación de datos normativos se centran en los resultados velando por que las normas adoptadas sean:

Cuando los reguladores gubernamentales implementan programas efectivos de estándares de datos, obtienen resultados:
● Datos legibles por máquina, automatizables y oportunos
● Datos de alta calidad, verificados aún más por comprobaciones universales de integridad de datos
● Capacidad para mezclar múltiples conjuntos de datos
● Reducción de costos para entidades de informes, recopiladores de datos y usuarios
● Reducción de la carga de informes (elimina la duplicación, aumenta la verificación de datos), desafortunadamente, a menudo vemos que los reguladores bien intencionados adoptan atajos que pueden hacer que el inicial el proceso de implementación es más fácil y limita el cambio para las entidades de informes y los recopiladores de datos, pero no produce los resultados deseados. De hecho, estos enfoques son sustancialmente más costosos a largo plazo:
● Recopilación de datos en hojas de cálculo. No se puede automatizar. Requiere revisión manual, corte y pega. Resultados en mala calidad de los datos, falta de puntualidad.
● Desarrollo de un único sistema o producto. Bloquea el regulador en un solo proveedor. Caro para cambiar los requisitos de presentación de informes.
● Construcción de un esquema personalizado. Requiere que el mercado cree herramientas personalizadas para crear, recopilar y utilizar datos. Costoso cambiar los requisitos de informes.
Recomendaciones sobre la Sección 3: Inventarios de datos
¿Cómo se encuentran los datos federales?
Los datos federales se publican en diferentes formatos, con varios niveles de accesibilidad, como se muestra en la figura «espectro de automatización» a continuación. Los datos de un archivo de imagen o un archivo PDF no son legibles por máquina, y, por lo tanto, el consumo de datos incrustados en estos archivos no se puede automatizar. El Federal Audit Clearinghouse recopila hoy decenas de miles de archivos PDF de Informe Único de Auditoría anualmente, que tienen hasta varios cientos de páginas de longitud. Estas presentaciones son resistentes a los datos estandarizados extracción y típicamente requieren revisión humana. Del mismo modo, ciertas partes del Informe único de auditoría están disponibles en archivos de texto grandes delimitados por tabulaciones. Si bien los archivos de texto proporcionan un nivel de automatización ligeramente superior, cada archivo debe extraerse de los archivos zip y los datos de ellos manualmente interpretado revisando filas y columnas antes de que pueda comenzar el análisis.
Las descargas de CSV o Excel son mejores que los archivos de texto en términos de automatización, pero aún requieren revisión manual antes de usar. La Agencia de Protección Ambiental (EPA) elabora datos de emisiones de las instalaciones disponible en hojas de cálculo descargables. Estos son datos muy valiosos y complejos, pero para usarlos requieren una revisión cruzada de otras hojas de cálculo que contienen datos de la empresa matriz y, de nuevo, manual interpretación de encabezados de fila y columna para comprender los datos reportados.
Los archivos XML personalizados, aunque son legibles por máquina, requieren la creación de aplicaciones personalizadas para informar, extraer y analizar datos. Estas aplicaciones personalizadas solo se pueden usar para eso único conjunto de datos personalizado.
Los archivos XBRL estandarizados, sin embargo, son inequívocamente legibles por máquina; datos transportados en El formato XBRL se puede leer directamente de máquina a máquina sin necesidad de interpretación manual o extracción. Debido a que XBRL es un estándar ampliamente utilizado, las herramientas que funcionan con una sola implementación trabajará con cualquier otro programa XBRL, manteniendo el costo de análisis bajo y permitiendo la mezcla de datos. Como se mencionó anteriormente, se requiere el formato XBRL para los datos financieros informados por empresas públicas a la SEC, bancos a la FDIC y empresas de servicios públicos que reportan a la FERC. Herramientas que trabajan con datos de la SEC, también funcionan con datos de FERC y FDIC. Una oportunidad mayor de mercado fomenta la competencia.
Debido a que una gran cantidad de datos federales hoy en día se publican en diferentes formatos, las agencias editoriales a menudo mantienen sus propios silos de datos, lo que limita la capacidad de mezclar información y acceder a información conjunta y enriquecida de datos.
¿Cómo pueden los inventarios de datos respaldar mejor la forma en que identifica los datos federales que son valiosos para su propio caso de uso? ¿Cómo podrían las plataformas existentes apoyar mejor el acceso a los datos federales?
Los inventarios de datos deben poder buscarse de manera estandarizada y permitir la búsqueda en todos los países. Por ejemplo, un usuario puede desear identificar todos los casos de informes de una particular empresa en todas las agencias; o puede buscar en todos los almacenes de datos que contienen información sobre impuestos y obligaciones de las empresas.
Los inventarios de datos deben proporcionar suficientes meta datos explicativos para permitir una gran granularidad de búsqueda, para permitir a los usuarios buscar en todas las agencias, entidades y tipos de datos, automáticamente, sin necesidad de búsqueda manual.
¿Cuál es la mejor implementación de un inventario de datos que has visto? ¿Cuáles son los
características que lo hicieron tan exitoso?
El programa de la SEC recopila y publica las finanzas de las empresas públicas en formato XBRL cada trimestre. Hacen que las fuentes RSS estén disponibles para cualquier persona que desee extraer los datos disponibles gratuitamente. Debido a la naturaleza consistente de estos datos, los agregadores de datos extraen y almacenan los datos tan pronto como tal como lo publica la SEC; y servir los datos a los usuarios a los pocos minutos de su recepción por la SEC.
Mi organización, con un personal de cuatro personas, mantiene nuestra propia base de datos de datos financieros de la SEC con actualizaciones continuas y facilidad de acceso debido a la naturaleza estructurada del contenido. Un beneficio importante para la SEC es que simplemente publican los archivos legibles por máquina. No hay necesidad de herramientas adicionales de manipulación, extracción o consulta para que los datos sean accesibles para el público. Debido a que los datos son tan fáciles de usar, el mercado se encarga de eso para el regulador.
Hasta la fecha, los inventarios se han basado en el trabajo manual para generar y mantener metadatos. ¿Qué Las prácticas recomendadas y las herramientas están disponibles para automatizar y reducir la carga de trabajo manual asociado con inventarios?
Una taxonomía es un diccionario digital de términos que sirve como modelo de datos único para lo que necesita ser reportado. Incrustados en la taxonomía hay metadatos asociados con cada concepto reportado. Por ejemplo, ingresos tendría un tipo de datos monetarios, un tipo de período de duración y un tipo de período de duración asociado definición. Las aplicaciones hacen referencia a la taxonomía para preparar informes, recopilar datos y extraer y analizar datos. También se puede utilizar como la fuente del inventario de datos porque la taxonomía describe lo que se permite informar.
Recomendaciones sobre la Sección 4: Intercambio de datos
¿Qué mejores prácticas podrían utilizar los organismos estadísticos y los organismos no estadísticos para ser mejor socio?
El intercambio de datos entre agencias es fundamental para el funcionamiento eficiente del gobierno y el entorno de políticas. La gestión de datos debe permitir el acceso automatizado a datos interinstitucionales y entre entidades con las garantías de seguridad adecuadas.
El uso compartido de datos se habilita cuando la estructura de datos es la misma entre las entidades de informes. Hoy, por ejemplo, los servicios públicos, las instituciones bancarias y las empresas públicas informan en formato XBRL. Muy diferentes datos reportados siguiendo diferentes pautas contables, porque la estructura subyacente de los datos es la misma, la misma herramienta utilizada para extraer datos SEC, también se puede utilizar para datos de la FDIC y la FERC. Informar en una sola estructura significa que el comercio y el código abierto todas las herramientas pueden competir para preparar, recopilar, extraer y analizar datos, lo que reduce los costos para todos implicado. Mantener la misma estructura para los datos permite una vinculación consistente entre las agencias. El intercambio de datos también se facilita al simplificar el uso de identificadores. Por ejemplo, nuestra organización, XBRL US, es una pequeña organización sin fines de lucro, y, sin embargo, tenemos siete identificadores separados, cada uno para un diferente propósito:
LEI – 9845008D4851D6A7M390
EIN – 20-5592157
UEI – NMBAWP3BM235
CAGE – 55WS6
DUNS – 801992293
CIK – 00892090141
CID – In Process
La capacidad de rastrear una entidad y comprender su relación con otras entidades es fundamental para evaluar la inversión y el riesgo empresarial. Es por eso que recomendamos encarecidamente que el Consejo CDO exigir la adopción del Identificador de Personas Jurídicas (IPJ) para todas las entidades informantes. El IPJ es cada vez más comúnmente utilizado en todo el mundo y estamos viendo un uso creciente en los Estados Unidos también. A diferencia de los números DUNS, los INI son libremente redistribuibles.
¿Cómo puede el gobierno federal comprometerse con los proveedores de datos del sector privado de una manera que maximiza la capacidad de utilizar los datos o derivados de datos en múltiples agencias? ¿Cómo podríamos lograr esto al tiempo que garantizamos un modelo de negocio viable para los proveedores de datos?
Los agregadores de datos y los proveedores de análisis prefieren el acceso a datos estructurados y legibles por máquina porque es significativamente más fácil (y menos costoso) de procesar. Como señaló Morningstar en un video reciente4, «Extraer datos de un documento HTML toma al menos 20 minutos, de un buen PDF de calidad, tarda alrededor de 30 minutos, de una imagen alrededor de 50 minutos. Datos extraídos de un archivo XBRL se puede extraer en 1 a 2 segundos… nos permite centrarnos en una mejor analítica más bien que raspar datos de documentos».
Los menores costos de procesamiento para los proveedores de datos se traducen en menores costos para los inversores, analistas, agencias gubernamentales y otros usuarios de datos. Cuantos más datos estén disponibles en formato XBRL estructurado, menos costoso se vuelve para todas las partes involucradas.
Recomendaciones sobre la Sección 6: Ética y Equidad
¿Cómo podemos aprovechar la Ética Federal de Datos para mejorar la confianza y la transparencia?
Los datos oportunos y de alta integridad son fundamentales para ayudar a la ética y la equidad en la toma de decisiones. Para las Agencias Federales, cumplir con estos estándares, es necesario acceso a alta calidad, información oportuna (no años desactualizados) para tomar las decisiones correctas. Los datos de buena calidad proporcionan transparencia y rendición de cuentas al público.
Recomendaciones sobre la Sección 7: Tecnología
¿Qué marcos deberían utilizar los organismos para evaluar su infraestructura de datos existente y para modernizar la tecnología con capacidades que rompen los silos de datos organizacionales y
garantizar que los mejores datos disponibles estén disponibles?
Un marco de estándares de datos estructurados para toda la agencia es el mejor enfoque para desglosar los silos de datos, fomentar la interoperabilidad y garantizar la disponibilidad de conjuntos de datos coherentes y de alta calidad que pueden compartirse entre las agencias y ponerse a disposición del público.
Un programa de estándares de datos de buena calidad proporciona el marco necesario para aprovechar otras tecnologías, como el aprendizaje automático y las plataformas de Inteligencia Artificial. Los datos estructurados son un ingrediente necesario para impulsar resultados útiles de estas tecnologías. Los datos adecuados al estándar también permiten la vinculación de datos a través de gráficos.
¿Cómo llegamos allí?
Ya estamos allí.
Los estándares de datos estructurados han resuelto los problemas de intercambio de datos, inventarios y mantenimiento equidad y madurez, en cientos de programas en todo el mundo. La prueba está ahí. Para poner estos programas exitosos en su lugar requieren líderes de opinión que tengan la visión de promulgar un cambio que conduce a una solución a largo plazo. El Consejo CDO puede ser ese agente de cambio. Instamos a los miembros del Consejo debe considerar los muchos programas regulatorios efectivos en todo el mundo, incluidos estos en los Estados Unidos:
● 6.000 empresas públicas y numerosas empresas de gestión de inversiones que informan
trimestral y anualmente a la SEC
● 5,000 bancos reportando a la FDIC
● Seiscientas empresas públicas que reportan a la FERC
Estamos interesados en programar una convocatoria de seguimiento con las diversas comisiones del Consejo para abordar estos problemas y responder a cualquier pregunta que pueda tener.