Un informe reciente revela que la calidad de los datos es ahora el principal factor que limita la adopción de la inteligencia artificial generativa (GenAI) en todas las industrias. Desde la aparición de GenAI, particularmente con el lanzamiento de ChatGPT en 2022, las empresas han estado ansiosas por explorar su potencial para diversos casos de uso. Sin embargo, el camino desde la experimentación hasta la implementación a gran escala se ha visto obstaculizado por desafíos relacionados con la calidad de los datos.
Inicialmente, la adopción de GenAI enfrentó obstáculos debido a la disponibilidad limitada de aplicaciones listas para usar y la falta de experiencia entre los usuarios. Sin embargo, con los avances tecnológicos, las empresas ahora tienen acceso a una variedad de modelos de lenguajes grandes (LLM) y plataformas de software fáciles de usar, lo que hace que GenAI sea más accesible que nunca.
A medida que entramos en 2024, hay un cambio notable hacia el lanzamiento de GenAI en soluciones de producción para satisfacer las necesidades de los clientes y mejorar las funciones de cara al cliente. La capacidad de GenAI para resumir grandes cantidades de texto sin formato y generar contenido creativo ha captado la atención de los medios, los inversores y las empresas por igual.
A pesar del progreso en la tecnología GenAI, la calidad de los datos sigue siendo un desafío importante. El informe destaca cómo la imprevisibilidad de los conocimientos de GenAI y la velocidad, escala y complejidad sin precedentes a la que consume datos exigen un nuevo enfoque para la gobernanza de datos. Los métodos tradicionales de gestión de datos ya no son suficientes para garantizar la precisión y confiabilidad de los conocimientos generados por GenAI.
Para abordar los desafíos de calidad de los datos asociados con la adopción de GenAI, Forrester recomienda a las empresas que adopten un enfoque holístico que combine experiencia técnica con conocimiento del dominio.
Aquí en XBRL International, estamos alentando a nuestro ecosistema global de reguladores, proveedores de software, la profesión contable y una amplia variedad de usuarios a combinar la tecnología de inteligencia artificial con conjuntos de datos estructurados. Nuestros propios experimentos demuestran resultados positivos (con mayor precisión y mejores resultados) cuando utilizamos conjuntos de datos estructurados con IA. Sólo hemos arañado la superficie, pero está claro que la capacidad de interrogar grandes cantidades de informes estructurados preparados en XBRL (usando un lenguaje sencillo) está a la vuelta de la esquina. XBRL obliga a los elaboradores de informes a proporcionar datos estructurados y metadatos sofisticados. Esta combinación es una especie de mina de oro de la IA y debería mejorar enormemente la calidad de los datos.
Juntas, estas tecnologías podrían desbloquear capacidades analíticas innovadoras.
La calidad de los datos es ahora el factor principal que limita la adopción de GenAI Cuando la inteligencia artificial generativa (GenAI) saltó a la fama con el lanzamiento de ChatGPT en 2022, los usuarios empresariales con conocimientos técnicos rápidamente comenzaron a experimentar. En ese momento, las herramientas existentes estaban limitadas a un conjunto bastante selecto de casos de uso y la confiabilidad era baja. Con pocas aplicaciones GenAI listas para usar disponibles, la falta de conocimientos fue el principal impedimento para buscar soluciones GenAI, especialmente para casos comerciales más especializados.
La tecnología central para GenAI basada en texto es el modelo de lenguaje grande (LLM). La complejidad y los recursos necesarios para crear un LLM los ponen fuera del alcance de la mayoría de las empresas. Hoy en día, las empresas que buscan implementar casos de uso de GenAI tienen una selección de LLM existentes disponibles para usar y personalizar. La barrera de entrada ha quedado al alcance de casi cualquier equipo tecnológico maduro. Para las empresas que carecen de las habilidades o la ambición de trabajar directamente con LLM, las plataformas de software en prácticamente todas las funciones comerciales ahora ofrecen funciones GenAI listas para usar para el uso diario, con poca o ninguna habilidad especializada requerida.
Si 2023 fue el año de la experimentación con Gen AI, 2024 se perfila como el año para lanzar GenAI en soluciones de producción para atender a los clientes y desempeñar funciones de cara al cliente. La capacidad de resumir grandes cantidades de datos no estructurados y generar contenido creativo (incluido texto, imágenes e incluso videos) resulta intrigante para los responsables de ingresos y el equipo ejecutivo en general.
El denominador común es la calidad de los datos.
Muchas cosas pueden salir mal entre la solicitud del usuario, la interpretación de la pregunta, cómo se genera la respuesta y cómo se comunica la respuesta al usuario. Independientemente del camino técnico que siga su empresa, el principal factor limitante al que se enfrentará hoy es la calidad de sus datos. El viejo dicho «basura entra, basura sale» es aún más cierto para GenAI. GenAI ejerce una presión sin precedentes sobre sus capacidades de gobernanza de datos por varias razones:
- GenAI consume datos a un nuevo nivel de velocidad, escala y complejidad. Los equipos de datos y operaciones que gestionan casos de uso empresarial tradicionales se centran en seleccionar y limpiar conjuntos de datos definidos. GenAI consume datos estructurados y no estructurados, lo que permite el acceso a la generación de conocimientos a una velocidad y escala nunca antes vistas, incluidos tipos de datos que la mayoría de las empresas no gestionan activamente.
- GenAI utiliza datos para generar conocimientos de forma impredecible. Los equipos de medición y análisis están acostumbrados a controlar las puertas de enlace a través de las cuales los usuarios finales consultan los datos disponibles. La información se entrega a través de informes y paneles, cada uno de los cuales ofrece una experiencia seleccionada con un alcance limitado. GenAI otorga acceso a un vasto repositorio de datos y realizará saltos intuitivos para respaldar las consultas de los usuarios. Los equipos de gestión de datos ya no pueden predecir qué datos deben limpiarse para brindar información precisa porque ya no controlan qué preguntas se hacen.
- La seguridad, la privacidad y el consentimiento requieren nuevos procesos que no existen hoy en día. La gestión de la seguridad y la privacidad de los datos en los casos de uso empresarial tradicionales depende del control de los datos de origen. Los datos que violan los estándares de cumplimiento se eliminan y la seguridad de los datos depende de que los usuarios aprobados controlen el acceso a conjuntos de datos específicos. Los modelos GenAI no se basan en consultas activas de datos de origen para cumplir con las solicitudes. Una vez que se han ingerido los datos de entrenamiento, los equipos de datos ya no pueden controlar fácilmente qué usuarios pueden acceder a qué elementos de datos. La seguridad y el cumplimiento dependen de conocer el nivel de acceso adecuado de cada usuario final. Ningún estándar actual que vincule los modelos GenAI con sus datos de origen crea nuevos niveles de incertidumbre y riesgo. En la encuesta AI Pulse mencionada anteriormente, las preocupaciones sobre la privacidad y la seguridad de los datos se consideran las barreras más importantes para la adopción de GenAI por parte de las empresas B2B.
Los desafíos de datos para GenAI exigen un enfoque diferente a la calidad de los datos
La gestión de la calidad de los datos para los casos de uso de GenAI exige un conjunto diferente de habilidades por parte de los equipos de operaciones. También requiere volver a capacitar a los equipos para gestionar nuevos conceptos. En un nivel alto, este cambio de mentalidad tiene algunos temas clave:
- Los equipos de operaciones deben estar más estrechamente alineados con los recursos tecnológicos. Esta asociación de habilidades técnicas y conocimientos comerciales es fundamental para generar respuestas confiables desde cualquier herramienta GenAI.
- Las funciones de administrador de datos deben ampliar su capacidad para proporcionar experiencia en el dominio, asumiendo nuevos roles como árbitros de la generación de conocimientos precisos.
- La gestión de datos debe pasar de la limpieza y el control de conjuntos de datos discretos a la curación activa y continua de conversaciones, tanto rápidas como de respuesta.
La calidad de los datos es ahora el factor principal que limita la adopción de GenAI
Cuando la inteligencia artificial generativa (GenAI) saltó a la fama con el lanzamiento de ChatGPT en 2022, los usuarios empresariales con conocimientos técnicos rápidamente comenzaron a experimentar. En ese momento, las herramientas existentes estaban limitadas a un conjunto bastante selecto de casos de uso y la confiabilidad era baja. Con pocas aplicaciones GenAI listas para usar disponibles, la falta de conocimientos fue el principal impedimento para buscar soluciones GenAI, especialmente para casos comerciales más especializados.
La tecnología central para GenAI basada en texto es el modelo de lenguaje grande (LLM). La complejidad y los recursos necesarios para crear un LLM los colocan fuera del alcance de la mayoría de las empresas. Hoy en día, las empresas que buscan implementar casos de uso de GenAI tienen una selección de LLM existentes disponibles para usar y personalizar. La barrera de entrada ha quedado al alcance de casi cualquier equipo tecnológico maduro. Para las empresas que carecen de las habilidades o la ambición de trabajar directamente con LLM, las plataformas de software en casi todas las funciones comerciales ahora ofrecen funciones GenAI listas para usar para uso diario, con poca o ninguna habilidad especializada requerida.
Si 2023 fue el año de la experimentación con GenAI, 2024 se perfila como el año para lanzar GenAI en soluciones de producción para atender a los clientes y desempeñar funciones de cara al cliente. La capacidad de resumir grandes cantidades de datos no estructurados y generar contenido creativo (incluido texto, imágenes e incluso videos) resulta intrigante para los responsables de ingresos y el equipo ejecutivo en general. La Encuesta de pulso de inteligencia artificial de Forrester de septiembre de 2023 mostró que el 70 % de las empresas de nivel empresarial* ya están utilizando GenAI y otro 20 % está explorando su uso.
El denominador común es la calidad de los datos
Muchas cosas pueden salir mal entre la solicitud del usuario, la interpretación de la pregunta, cómo se genera la respuesta y cómo se comunica la respuesta al usuario. Independientemente del camino técnico que siga su empresa, el principal factor limitante al que se enfrentará hoy es la calidad de sus propios datos. El viejo dicho “basura entra, basura sale” es aún más cierto para la GenAI. GenAI ejerce una presión sin precedentes sobre sus capacidades de gobernanza de datos por varias razones:
- GenAI consume datos a un nuevo nivel de velocidad, escala y complejidad. Los equipos de datos y operaciones que gestionan casos de uso empresarial tradicionales se centran en seleccionar y limpiar conjuntos de datos definidos. GenAI consume datos estructurados y no estructurados por igual, lo que permite el acceso a la generación de conocimientos a una velocidad y escala nunca antes vistas, incluidos tipos de datos que la mayoría de las empresas no gestionan activamente.
- GenAI utiliza datos para generar conocimientos de forma impredecible. Los equipos de medición y análisis están acostumbrados a controlar las puertas de enlace a través de las cuales los usuarios finales consultan los datos disponibles. La información se entrega a través de informes y paneles, cada uno de los cuales ofrece una experiencia seleccionada con un alcance limitado. GenAI otorga acceso a un vasto repositorio de datos y realizará saltos intuitivos para respaldar las consultas de los usuarios. Los equipos de gestión de datos ya no pueden predecir qué datos deben limpiarse para brindar información precisa porque ya no controlan qué preguntas se hacen.
- La seguridad, la privacidad y el consentimiento requieren nuevos procesos que no existen hoy en día. La gestión de la seguridad y la privacidad de los datos en los casos de uso empresarial tradicionales depende del control de los datos de origen. Los datos que violan los estándares de cumplimiento se eliminan y la seguridad de los datos depende del control del acceso a conjuntos de datos específicos por parte de usuarios aprobados. Los modelos GenAI no se basan en consultas activas de datos de origen para cumplir con las solicitudes. Una vez que se han ingerido los datos de entrenamiento, los equipos de datos ya no pueden controlar fácilmente qué usuarios pueden acceder a qué elementos de datos. La seguridad y el cumplimiento dependen de conocer el nivel de acceso adecuado de cada usuario final. Sin un estándar actual que vincule los modelos GenAI con sus datos de origen, esto crea nuevos niveles de incertidumbre y riesgo. En la encuesta AI Pulse mencionada anteriormente, las preocupaciones sobre la privacidad y la seguridad de los datos se consideran la mayor barrera para la adopción de GenAI por parte de empresas B2B.
Los desafíos de datos para GenAI exigen un enfoque diferente de la calidad de los datos
La gestión de la calidad de los datos para casos de uso de GenAI exige un conjunto diferente de habilidades por parte de los equipos de operaciones. También requiere volver a capacitar a los equipos para gestionar nuevos conceptos. En un nivel alto, este cambio de mentalidad tiene algunos temas clave:
- Los equipos de operaciones deben estar más estrechamente alineados con los recursos tecnológicos. Esta asociación de habilidades técnicas y conocimientos comerciales es fundamental para generar respuestas confiables desde cualquier herramienta GenAI.
- Las funciones de administrador de datos deben ampliar su capacidad para proporcionar experiencia en el dominio, asumiendo nuevos roles como árbitros de la generación de conocimientos precisos.
- La gestión de datos debe pasar de la limpieza y el control de conjuntos de datos discretos a la curación activa y continua de conversaciones, tanto rápidas como de respuesta.
Cada uno de estos temas y varios otros se explorarán más profundamente en la próxima presentación en la cumbre B2B de Norteamérica en Austin, Texas. La presentación “¿La calidad de los datos se está interponiendo en el camino de la confianza en GenAI?” será una de varias sesiones centradas en ayudar a los asistentes a preparar sus empresas para los cambios masivos que GenAI ya está impulsando. También está disponible para que los asistentes programen debates individuales y pueden solicitar sesiones de orientación sobre estos temas u otros similares en cualquier momento.