El mayor obstáculo de la Inteligencia Artificial
Los avances de la Inteligencia Artificial podrían quedarse en el tintero, si las empresas no gestionan con cuidado el acceso a los datos durante todo el ciclo de desarrollo y producción.
Un importante hospital norteamericano tenía interés en el potencial de un sistema habilitado por Inteligencia Artificial (IA) que mejoraría la atención al paciente.
Al planear la transición del concepto a la construcción de un prototipo, descubrió que los datos para construir y operar el sistema estaban dispersos en 20 sistemas heredados. Así que su recuperación sería un proceso demasiado complejo. El proyecto tuvo que descartarse.
La analítica avanzada y la Inteligencia Artificial prometen generar conocimientos que ayudarán a las organizaciones a mantenerse competitivas. Su capacidad para conseguirlo depende, en gran medida, de la disponibilidad de buenos datos, pero a veces simplemente no cuentan con ellos.
Hace poco, estudiamos cómo las empresas gestionan las iniciativas de Inteligencia Artificial: desde la investigación y desarrollo (I&D) hasta su producción. Esto sirvió para determinar cuáles son los problemas que surgen durante ese proceso.
IA que dibuja: Descubre las plataformas que puedes utilizar para darle un empujón a tu creatividad
Nuestra investigación se basa en entrevistas con líderes e informantes clave en IA de seis empresas norteamericanas, de diferentes tamaños y que operan en distintas industrias.
Un hallazgo clave es que, aunque muchos se fijan en la precisión y la integridad de los datos para determinar su calidad, el acceso a ellos sería un reto más grande para implementar la IA en una empresa.
Más importante aún, descubrimos que se suele tratar la accesibilidad como un asunto exclusivo de TI. Pero nuestro análisis revela que es un problema de gestión, agravado por errores conceptuales sobre la naturaleza y el papel de la accesibilidad a los datos en la Inteligencia Artificial.
La accesibilidad a los datos no es una cualidad en sí, se trata de disponer de los elementos necesarios para que las máquinas los extraigan. Aunque las empresas cuenta con miles de datos, el acceso a ellos sigue siendo un reto. Éste se agrava en el contexto del desarrollo y las operaciones de Inteligencia Artificial por dos razones interrelacionadas.
Primero, los programas de IA generalmente involucran a diversos grupos de partes interesadas con opiniones divergentes respecto a la accesibilidad. En segundo lugar, un ciclo de vida típico del desarrollo de Inteligencia Artificial tiende a debilitar la importancia del acceso.
Usa a la Inteligencia Artificial para promover la diversidad en tu empresa
Divergencia de las partes interesadas sobre la accesibilidad de datos
El meollo del asunto se encuentra en el hecho de que las iniciativas de IA involucran a grupos de actores muy diferentes que tienen intereses, puntos de vista e influencias variadas sobre la naturaleza y el papel del acceso a los datos.
Por ejemplo, los líderes empresariales suelen participar al principio y al final del proceso, ayudando a definir los casos de uso de IA y sacando el mejor provecho del producto final. Pero tienden a obviar la obtención de datos.
“Las empresas siempre piensan que los tienen [los datos que necesitan]”, aseguró el vicepresidente de distribución de una consultoría de Inteligencia Artificial. “Quieren empezar al momento y nosotros abrimos la caja de Pandora”, señaló, riendo. “Extraemos PDF, hojas de cálculo, luego necesitamos recopilar todo y simplemente [aplicar el reconocimiento óptico de caracteres y] procesarlo. Nunca es fácil”.
Mientras tanto, los científicos de datos que desarrollan, prueban y mantienen modelos, y los asesores científicos que pueden trabajar con ellos, se centran principalmente en obtener los datos necesarios para desarrollar modelos. Al igual que los otros actores, su interés en la accesibilidad es bajo.
Los ingenieros que construyen la infraestructura necesaria para generar los datos que utilizarán los modelos están preocupados, hasta cierto punto, por este tema.
Pero por lo general asumen, a veces erróneamente, que el acceso a los datos extraídos de los sistemas operativos para el desarrollo de prototipos también es fácil.
La accesibilidad es un problema más grave para los ingenieros de software, que son responsables de integrar la IA en un producto o servicio que deba obtener datos en un entorno de producción.
Cómo incluir un chat de Inteligencia Artificial en tu negocio
Y aunque el equipo de TI rara vez se consideran clave en las iniciativas de Inteligencia Artificial, apoyan la infraestructura tecnológica requerida por estas (incluidos los datos).
Su trabajo ayuda a hacer cumplir las políticas de seguridad, y los mecanismos de gobernanza que protegen los activos tecnológicos y los datos.
Cada una de estas partes interesadas tiene un papel importante que desempeñar, pero al mismo tiempo, su visión sobre la accesibilidad se limita a sus responsabilidades inmediatas.
Por ejemplo, el líder de IA de una gran institución financiera nos dijo que su equipo necesita obtener grandes cantidades de datos de los sistemas operativos. Sin embargo, muchos de esos sistemas se ejecutan en mainframes y nunca se crearon para admitir los requisitos de acceso a datos y, al mismo tiempo, admitir operaciones regulares.
Cuando el personal de TI, cuya responsabilidad es mantener esos sistemas funcionando, se entera de cuáles son los requisitos de acceso a los datos para Inteligencia Artificial, se muestra menos receptivo.
Una vez, nos contó el mismo líder, la respuesta fue:
“No quiero que geeks novatos vengan y recuperen 15 terabytes de datos por día, porque el sistema va a colapsar”.
Los brujos del mañana con la Inteligencia Artificial
El ciclo de vida de la Inteligencia Artificial disminuye la importancia de la accesibilidad
Además de la diversidad de intereses, el ciclo de vida típico de las iniciativas de Inteligencia Artificial obliga a los equipos a centrarse en el desarrollo y las pruebas rápidas de modelos, por lo que se postergan importantes discusiones sobre la accesibilidad, sobre todo aquellas relacionadas con la implementación real de la tecnología.
Durante este proceso, el acceso a los datos pasa de estar separado a estar conectado a las estructuras, los mecanismos y la infraestructura tecnológica de gestión de datos corporativa.
Aunado a lo anterior, la participación de las partes interesadas clave cambia a lo largo de las fases de desarrollo. Para comprender por qué la accesibilidad a los datos se pasa por alto con tanta frecuencia, debemos examinar las cinco fases del ciclo de vida de la IA. Con este fin, analizamos las seis empresas que comprende nuestro estudio.
FASE 1: Ideación
Sirve como filtro para identificar posibles casos de negocio de alto nivel. Muchas conversaciones durante esta fase ocurren entre gerentes, consultores de negocios y asesores científicos (que veces también son académicos de tiempo completo).
El objetivo es crear un espacio de encuentro para los negocios y la ciencia. Los casos resultantes deben parecer prometedores y factibles.
En las consultorías de IA, este primer paso sirve para enseñarles a los clientes el potencial de esta herramienta. Durante esta fase, el énfasis está en la existencia de datos más que en el acceso a ellos. Las discusiones giran en torno a los objetivos comerciales y la aplicación de modelos para abordar los problemas actuales de la empresa.
FASE 2: Proyecto
No todos los casos generados durante la fase de ideación serán seleccionados para su pronta implementación, pues suele haber prioridades, limitaciones de recursos o falta de valor potencial que lo impiden. Durante esta segunda fase, se genera un caso de implementación completo.
Esto incluye detalles como objetivos comerciales claros y medibles, un plan de acción que describa técnicas específicas de IA y lo datos que deberían estar disponibles para alimentar el modelo.
En esta fase, la accesibilidad todavía se evalúa únicamente en función de la existencia de datos, porque el objetivo es llegar a la siguiente fase, que es construir un prototipo funcional. De manera velada, las partes interesadas suponen que los datos están ahí y con eso basta, porque permite que el proyecto avance.
FASE 3: Prueba de concepto
Durante la fase de prueba de concepto, los científicos de datos crean uno o más modelos para implementar los casos de uso acordados. La mayor parte del trabajo está encaminado en crear, programar y probar modelos una y otra vez para medir su rendimiento relativo entre ellos, y ver si la IA realmente cumple con las expectativas o aporta algo nuevo.
Los datos se extraen de los sistemas fuente y los ingenieros de datos los transforman para que cumplan con los requisitos de formato y precisión de los modelos en construcción.
Aunque, en última instancia, la solución puede entregarse a través de una aplicación con una interfaz de usuario o estar integrada dentro de los procesos comerciales de la empresa (para modificar un proceso de solicitud de crédito en un banco, por ejemplo), la fase de prueba de concepto no suele enfocarse en ellos de momento.
De manera similar, los equipos se concentran en obtener los datos para avanzar en su trabajo a corto plazo, sin tener en cuenta cómo se accederá a ellos una vez que la IA entre en producción.
FASE 4: Producto mínimo viable
Cuando un modelo de prueba refleja valor suficiente, se refina hasta convertirlo en un producto mínimo viable (PMV). En este punto, los científicos e ingenieros ceden el proyecto a los ingenieros de software, pues es cosa de tiempo que la Inteligencia Artificial abandone el laboratorio y se implemente al interior de la empresa para integrarse con otros sistemas de producción, si es el caso.
Una consecuencia involuntaria de la atención hiperconcentrada en el desarrollo de modelos de las fases anteriores es que las consideraciones relacionadas con la accesibilidad pasan a segundo plano.
Cuando los ingenieros de software y el personal de TI se involucran más en las especificaciones y la integración del nuevo modelo, surgen cuestiones sobre el acceso de datos que podrían revelar una necesidad de planificación y trabajo más minuciosos.
FASE 5: Producción
En esta última fase, el PMV refinado se lanza a producción y ahora debe alimentarse con datos obtenidos directamente de los sistemas de producción. Quizá sea necesario extraer los datos de varios sistemas y manipularlos para generar entradas útiles, y que el modelo funcione.
Ya sea que esto suceda en tiempo real o en intervalos (por ejemplo, para calibrar y probar un modelo varias veces) aquí es donde surgen los problemas reales relacionados con la integración de Inteligencia Artificial, sobre todo respecto a la infraestructura de datos de la compañía.
Si los datos no pueden ser proporcionados, extraídos e integrados por sistemas autónomos al volumen o velocidad requeridos (debido a sistemas heredados, por ejemplo), la IA puede perder todo su valor potencial.
Derechos de imagen post mortem y la urgencia de legislar a la Inteligencia Artificial
Referencias
- R. Kimball and M. Ross, The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed. (Indianapolis: John Wiley & Sons, 2013).
- R. Hughes, Agile Data Warehousing Project Management: Business Intelligence Systems Using Scrum, (Waltham, Massachusetts: Morgan Kaufmann, 2013); and K. Collier, Agile Analytics: A Value-Driven Approach to Business Intelligence and Data Warehousing (Boston: Addison-Wesley, 2011).
- R.Y. Wang and D.M. Strong, Beyond Accuracy: What Data Quality Means to Data Consumers, Journal of Management Information Systems 12, no. 4 (spring 1996): 5-33; L.L. Pipino, Y.W. Lee, and R.Y. Wang, Data Quality Assessment, Communications of the ACM 45, no. 4 (April 2002): 211-218; and
- B. Baesens, R. Bapna, J.R. Marsden, et al., Transformational Issues of Big Data and Analytics in Networked Business, MIS Quarterly 40, no. 4 (December 2016): 807-818.