Por qué la estandarización es crucial para la calidad de los datos de identidad del IPJ


Con datos de todo el mundo, es crucial que la Fundación Global Legal Entity Identifier (GLEIF) trabaje con estándares de datos para garantizar que el Legal Entity Identifier (LEI) sea confiable en todo el mundo.

La GLEIF publicó recientemente un documento explicativo que resume la importancia de la estandarización para garantizar que el IPJ consista en datos de identidad de calidad.

El LEI es un identificador único asignado a las personas jurídicas que participan en transacciones financieras a nivel mundial. El sistema LEI se creó como resultado de la crisis financiera de 2008 para aumentar la transparencia y la rendición de cuentas en los mercados financieros al proporcionar un identificador único y estándar para cada entidad legal involucrada en transacciones financieras, con muchas iniciativas que ahora amplían su alcance a empresas de todo tipo.

Para la GLEIF, la estandarización de los datos es crucial porque permite el intercambio eficiente y preciso de información de identidad comercial, sin importar dónde resida o haga negocios la empresa. GLEIF armoniza los datos recopilados mediante el uso de estándares globales para datos de identidad, como datos de referencia conectados al IPJ. Los datos LEI se recopilan de varias fuentes a nivel mundial, pero para mantener la coherencia en una base de datos global, la estandarización es clave.

Los datos estandarizados garantizan la confiabilidad y la comparabilidad entre diferentes jurisdicciones, industrias y organizaciones. El uso de formatos de datos comunes garantiza que los datos en el Sistema LEI sean consistentes, precisos y actualizados. Esto mejora la calidad de los datos y facilita el uso y la confianza de las partes interesadas.


La calidad de los datos requiere acciones proactivas

Gestión proactiva

A fin de dar soporte a las organizaciones emisoras de IPJ, la GLEIF proporciona el procedimiento apropiado y obligatorio junto con una interfaz técnica para que los emisores de IPJ puedan evaluar de forma proactiva la calidad de los datos de un IPJ y los datos de referencia relacionados. Esto incluye una comprobación de duplicados específica. Los registros de IPJ deben comprobarse de uno en uno utilizando las API de servicios web automatizados: Comprobación previa de la gobernanza de los datos y Comprobación de duplicados.

Comprobación previa de la gobernanza de los datos

Los emisores de IPJ están obligados a enviar todos los registros de IPJ recién emitidos y actualizados al servicio de comprobación previa de la GLEIF antes de cargarlos en el depósito global. El servicio de comprobación previa aplica las mismas comprobaciones de la calidad de los datos que también se llevan a cabo diariamente para los registros de IPJ ya publicados. Según los resultados de la comprobación previa, los emisores de IPJ pueden corregir los posibles problemas de calidad de los datos antes de que estas incoherencias entren en el conjunto de datos públicos. Además del resultado de la comprobación, el solicitante también recibe una explicación, lo que facilita una solución específica y rápida del problema notificado.

El uso obligatorio del servicio por parte de las organizaciones emisoras de IPJ apoya el proceso de mejora continua, elevando el nivel de calidad y aumentando el nivel de madurez de los datos en el Sistema Global del IPJ.

Comprobación de duplicados

Para evitar registros de datos duplicados, los códigos de IPJ recién solicitados y los datos de referencia correspondientes se comparan con todos los demás registros del Depósito Global del IPJ, así como con los registros de IPJ que se han enviados al servicio de comprobación de duplicados por otros emisores de IPJ, pero que aún no se han emitido. Por lo tanto, incluso si dos emisores de IPJ distintos han sido contactados por la misma persona jurídica, los emisores de IPJ identificarán posibles duplicados y podrán coordinarse con sus clientes y entre sí. En última instancia, este procedimiento evita la introducción de duplicados en el sistema.

El proceso de identificación de duplicados tiene en cuenta varios elementos de datos del registro del IPJ y puede dividirse en preprocesamiento, algoritmo central y posprocesamiento.

Durante el preprocesamiento, los datos se preparan para los siguientes pasos; por ejemplo, se identifican los llamados tokens débiles y se les presta atención. Un ejemplo típico de token débil es la forma jurídica de la persona jurídica, que puede ser parte del nombre de la persona jurídica. A continuación, las formas jurídicas podrían normalizarse y armonizarse para garantizar los mejores resultados posibles en las siguientes fases del proceso.

El motor principal del servicio de comprobación de duplicados consiste en una comprobación de singularidad y exclusividad, que combina algoritmos de última generación para la comparación de cadenas difusas (por ejemplo, distancia Levenshtein, similitud coseno, distancia Monge-Elkan).

En la fase de posprocesamiento, el servicio de comprobación de duplicados reduce el número de falsos positivos mediante comprobaciones adicionales y un tratamiento especial de los elementos de datos secundarios (por ejemplo, la jurisdicción legal o la categoría de la persona).

La calidad de los datos empieza por la estandarización

Esquema XML

Los Formatos de Archivo de Datos Comunes (CDF) definen la forma en que las organizaciones emisoras de IPJ notifican sus datos de referencia de IPJ en una forma y estructura estandarizadas. Su objetivo es evitar el incumplimiento de los formatos definidos. Cada formato de comunicación se define en un detallado documento de especificaciones (definición de esquema XML (XSD)) que impone una calidad de los datos mínima. Un archivo que no supere la validación XSD no puede incluirse en los Archivos Concatenados ni en la Copia de Oro de los archivos y los Archivos Delta.

Esquemas XML

Los esquemas describen formalmente la estructura de cada documento XML completo y definen cada elemento de datos, sus atributos asociados, los valores enumerados y las listas de códigos asociadas. Las definiciones del esquema XML garantizan el suministro de datos uniformes y válidos de acuerdo con los Formatos de Archivo de Datos Comunes (CDF) por parte de todas las organizaciones emisoras de IPJ.

Además, las especificaciones XSD permiten a los desarrolladores comprender la estructura de los datos y validar el formato de cada elemento de datos. Esto garantiza que el usuario de los datos consuma datos armonizados de alta calidad, independientemente del emisor de IPJ individual.

Solo se puede gestionar lo que se mide

Comprobaciones de la Calidad de los Datos

Tras mantener un estrecho diálogo con el Comité de Supervisión Regulatoria (CSR) de IPJ y con las organizaciones emisoras de IPJ, la GLEIF ha definido un grupo de criterios de calidad mensurables a fin de aclarar el concepto de la calidad de los datos con respecto a la población de IPJ. Para ello, se han usado los estándares desarrollados por la Organización Internacional de Normalización. Al establecer unos criterios de calidad definidos, la GLEIF ha creado una referencia transparente y objetiva para valorar el nivel de la calidad de los datos dentro del Sistema Global del IPJ.

Las Comprobaciones de la Calidad de los Datos de la GLEIF garantizan que los datos de referencia proporcionados cumplen con las actuales Reglas de Transición y Validación de Estado en el Sistema Global del IPJ. Estas comprobaciones se han definido basándose en los Formatos de Archivo de Datos Comunes (CDF).

Cada Comprobación de la Calidad de los Datos se caracteriza por un nivel de madurez, criterio de calidad, intención y descripción formalizada que contiene la precondición y la condición.

Este conjunto de comprobaciones constituye la llamada Configuración de Normas. Cada comprobación es del tipo «Si X, entonces Y», donde X se describe como una precondición de comprobación e Y es la condición de comprobación. Si un registro, relación o excepción no cumple la precondición de comprobación, esta comprobación es «no aplicable». Si cumple la precondición, pasa a condición y el valor no cumple Y, la comprobación se considera un «fallo»; de lo contrario, la comprobación se considera «superada».

  • Intención
    La intención está escrita en un lenguaje sencillo y resume el propósito de una determinada comprobación de la calidad de los datos.
  • Precondición
    No todas las comprobaciones de la calidad de datos son aplicables a todos los registros del IPJ. Por ejemplo, algunas comprobaciones de la calidad de datos solo son aplicables a las entidades de fondos o a entidades activas. La precondición de cada comprobación filtra los registros del IPJ que no son aplicables para una comprobación determinada.
  • Condición
    En cada comprobación de la calidad de los datos se aplican ciertas condiciones de fallo inequívocas. La condición solo se aplica a los registros del IPJ que han superado la precondición de una determinada comprobación de la calidad de los datos.

Las comprobaciones de la calidad de los datos también pueden agruparse en categorías, según su naturaleza y tipo de medición. Por ejemplo, las meta comprobaciones se centran en los criterios de oportunidad, actualidad y accesibilidad, mientras que las comprobaciones de formato se aplican sobre todo a través de los Formatos de Archivo de Datos Comunes y el esquema XML incrustado. Las comprobaciones de registro se aplican a los elementos de campos obligatorios y opcionales y abarcan comprobaciones de formato y plausibilidad (por ejemplo, rangos de valores).

Para definir la calidad general de los datos del Sistema Global del IPJ, la GLEIF utiliza un modelo de madurez que evalúa los criterios de calidad definidos. En función del tipo de comprobaciones relacionadas con las diferentes categorías, cada comprobación se asigna a un nivel de madurez. Los niveles de madurez Excelente y Esperado solo pueden alcanzarse si todos los niveles inferiores están completamente asegurados.

Criterios de calidad de los datos

Al establecer unos criterios de calidad definidos, la GLEIF ha creado una referencia transparente y objetiva para valorar el nivel de la calidad de los datos dentro del Sistema Global del IPJ.



Deja una respuesta