Nuestros sitios
Ver edición digital Título de la edición actual
Continúa leyendo:
Los proyectos de IA de Pepsico
Comparte
Compartir

El mayor obstáculo de la Inteligencia Artificial

Mit Sloan 29 Jun 2021
El mayor obstáculo de la Inteligencia Artificial

Los avances de la inteligencia artificial (IA) podrían quedarse en el tintero, si las empresas no gestionan con cuidado el acceso a los datos durante todo el ciclo de desarrollo y producción.

Por Gregory Vial, Jinglu Jiang, Tanya Giannelia y Ann-Frances Cameron


Un importante hospital norteamericano tenía interés en el potencial de un sistema habilitado por Inteligencia Artificial (IA) que mejoraría la atención al paciente.

Al planear la transición del concepto a la construcción de un prototipo, descubrió que los datos para construir y operar el sistema estaban dispersos en 20 sistemas heredados. Así que su recuperación sería un proceso demasiado complejo. El proyecto tuvo que descartarse.

La analítica avanzada y la Inteligencia Artificial prometen generar conocimientos que ayudarán a las organizaciones a mantenerse competitivas. Su capacidad para conseguirlo depende, en gran medida, de la disponibilidad de buenos datos, pero a veces simplemente no cuentan con ellos.

Hace poco, estudiamos cómo las empresas gestionan las iniciativas de Inteligencia Artificial: desde la investigación y desarrollo (I&D) hasta su producción. Esto sirvió para determinar cuáles son los problemas que surgen durante ese proceso.

Nuestra investigación se basa en entrevistas con líderes e informantes clave en IA de seis empresas norteamericanas, de diferentes tamaños y que operan en distintas industrias.

Un hallazgo clave es que, aunque muchos se fijan en la precisión y la integridad de los datos para determinar su calidad, el acceso a ellos sería un reto más grande para implementar la IA en una empresa.

Más importante aún, descubrimos que se suele tratar la accesibilidad como un asunto exclusivo de TI. Pero nuestro análisis revela que es un problema de gestión, agravado por errores conceptuales sobre la naturaleza y el papel de la accesibilidad a los datos en la Inteligencia Artificial.

También lee: Diversidad e IA

La accesibilidad a los datos no es una cualidad en sí, se trata de disponer de los elementos necesarios para que las máquinas los extraigan. Aunque las empresas cuenta con miles de datos, el acceso a ellos sigue siendo un reto. Éste se agrava en el contexto del desarrollo y las operaciones de Inteligencia Artificial por dos razones interrelacionadas.

Primero, los programas de IA generalmente involucran a diversos grupos de partes interesadas con opiniones divergentes respecto a la accesibilidad. En segundo lugar, un ciclo de vida típico del desarrollo de Inteligencia Artificial tiende a debilitar la importancia del acceso.

Divergencia de las partes interesadas sobre la accesibilidad de datos

El meollo del asunto se encuentra en el hecho de que las iniciativas de IA involucran a grupos de actores muy diferentes que tienen intereses, puntos de vista e influencias variadas sobre la naturaleza y el papel del acceso a los datos.

Por ejemplo, los líderes empresariales suelen participar al principio y al final del proceso, ayudando a definir los casos de uso de IA y sacando el mejor provecho del producto final. Pero tienden a obviar la obtención de datos.

“Las empresas siempre piensan que los tienen [los datos que necesitan]”, aseguró el vicepresidente de distribución de una consultoría de Inteligencia Artificial. “Quieren empezar al momento y nosotros abrimos la caja de Pandora”, señaló, riendo. “Extraemos PDF, hojas de cálculo, luego necesitamos recopilar todo y simplemente [aplicar el reconocimiento óptico de caracteres y] procesarlo. Nunca es fácil”.

Mientras tanto, los científicos de datos que desarrollan, prueban y mantienen modelos, y los asesores científicos que pueden trabajar con ellos, se centran principalmente en obtener los datos necesarios para desarrollar modelos. Al igual que los otros actores, su interés en la accesibilidad es bajo.

Los ingenieros que construyen la infraestructura necesaria para generar los datos que utilizarán los modelos están preocupados, hasta cierto punto, por este tema.

Pero por lo general asumen, a veces erróneamente, que el acceso a los datos extraídos de los sistemas operativos para el desarrollo de prototipos también es fácil.

También lee: Adopting AI: el futuro de la IA en los negocios

La accesibilidad es un problema más grave para los ingenieros de software, que son responsables de integrar la IA en un producto o servicio que deba obtener datos en un entorno de producción.

Y aunque el equipo de TI rara vez se consideran clave en las iniciativas de Inteligencia Artificial, apoyan la infraestructura tecnológica requerida por estas (incluidos los datos).

Su trabajo ayuda a hacer cumplir las políticas de seguridad, y los mecanismos de gobernanza que protegen los activos tecnológicos y los datos.

Cada una de estas partes interesadas tiene un papel importante que desempeñar, pero al mismo tiempo, su visión sobre la accesibilidad se limita a sus responsabilidades inmediatas.

Por ejemplo, el líder de IA de una gran institución financiera nos dijo que su equipo necesita obtener grandes cantidades de datos de los sistemas operativos. Sin embargo, muchos de esos sistemas se ejecutan en mainframes y nunca se crearon para admitir los requisitos de acceso a datos y, al mismo tiempo, admitir operaciones regulares.

Cuando el personal de TI, cuya responsabilidad es mantener esos sistemas funcionando, se entera de cuáles son los requisitos de acceso a los datos para Inteligencia Artificial, se muestra menos receptivo.

Una vez, nos contó el mismo líder, la respuesta fue: “No quiero que geeks novatos vengan y recuperen 15 terabytes de datos por día, porque el sistema va a colapsar”.

El ciclo de vida de la Inteligencia Artificial disminuye la importancia de la accesibilidad

Además de la diversidad de intereses, el ciclo de vida típico de las iniciativas de Inteligencia Artificial obliga a los equipos a centrarse en el desarrollo y las pruebas rápidas de modelos, por lo que se postergan importantes discusiones sobre la accesibilidad, sobre todo aquellas relacionadas con la implementación real de la tecnología.

Durante este proceso, el acceso a los datos pasa de estar separado a estar conectado a las estructuras, los mecanismos y la infraestructura tecnológica de gestión de datos corporativa.

Aunado a lo anterior, la participación de las partes interesadas clave cambia a lo largo de las fases de desarrollo. Para comprender por qué la accesibilidad a los datos se pasa por alto con tanta frecuencia, debemos examinar las cinco fases del ciclo de vida de la IA. Con este fin, analizamos las seis empresas que comprende nuestro estudio.

FASE 1: Ideación.

Sirve como filtro para identificar posibles casos de negocio de alto nivel. Muchas conversaciones durante esta fase ocurren entre gerentes, consultores de negocios y asesores científicos (que veces también son académicos de tiempo completo).

El objetivo es crear un espacio de encuentro para los negocios y la ciencia. Los casos resultantes deben parecer prometedores y factibles.

En las consultorías de IA, este primer paso sirve para enseñarles a los clientes el potencial de esta herramienta. Durante esta fase, el énfasis está en la existencia de datos más que en el acceso a ellos. Las discusiones giran en torno a los objetivos comerciales y la aplicación de modelos para abordar los problemas actuales de la empresa.

FASE 2: Proyecto

No todos los casos generados durante la fase de ideación serán seleccionados para su pronta implementación, pues suele haber prioridades, limitaciones de recursos o falta de valor potencial que lo impiden. Durante esta segunda fase, se genera un caso de implementación completo.

Esto incluye detalles como objetivos comerciales claros y medibles, un plan de acción que describa técnicas específicas de IA y lo datos que deberían estar disponibles para alimentar el modelo.

En esta fase, la accesibilidad todavía se evalúa únicamente en función de la existencia de datos, porque el objetivo es llegar a la siguiente fase, que es construir un prototipo funcional. De manera velada, las partes interesadas suponen que los datos están ahí y con eso basta, porque permite que el proyecto avance.

FASE 3: Prueba de concepto

Durante la fase de prueba de concepto, los científicos de datos crean uno o más modelos para implementar los casos de uso acordados. La mayor parte del trabajo está encaminado en crear, programar y probar modelos una y otra vez para medir su rendimiento relativo entre ellos, y ver si la IA realmente cumple con las expectativas o aporta algo nuevo.

Los datos se extraen de los sistemas fuente y los ingenieros de datos los transforman para que cumplan con los requisitos de formato y precisión de los modelos en construcción.

Aunque, en última instancia, la solución puede entregarse a través de una aplicación con una interfaz de usuario o estar integrada dentro de los procesos comerciales de la empresa (para modificar un proceso de solicitud de crédito en un banco, por ejemplo), la fase de prueba de concepto no suele enfocarse en ellos de momento.

De manera similar, los equipos se concentran en obtener los datos para avanzar en su trabajo a corto plazo, sin tener en cuenta cómo se accederá a ellos una vez que la IA entre en producción.

FASE 4: producto mínimo viable

Cuando un modelo de prueba refleja valor suficiente, se refina hasta convertirlo en un producto mínimo viable (PMV). En este punto, los científicos e ingenieros ceden el proyecto a los ingenieros de software, pues es cosa de tiempo que la Inteligencia Artificial abandone el laboratorio y se implemente al interior de la empresa para integrarse con otros sistemas de producción, si es el caso.

Una consecuencia involuntaria de la atención hiperconcentrada en el desarrollo de modelos de las fases anteriores es que las consideraciones relacionadas con la accesibilidad pasan a segundo plano.

Cuando los ingenieros de software y el personal de TI  se involucran más en las especificaciones y la integración del nuevo modelo, surgen cuestiones sobre el acceso de datos que podrían revelar una necesidad de planificación y trabajo más minuciosos.

FASE 5: Producción

En esta última fase, el PMV refinado se lanza a producción y ahora debe alimentarse con datos obtenidos directamente de los sistemas de producción. Quizá sea necesario extraer los datos de varios sistemas y manipularlos para generar entradas útiles, y que el modelo funcione.

Ya sea que esto suceda en tiempo real o en intervalos (por ejemplo, para calibrar y probar un modelo varias veces) aquí es donde surgen los problemas reales relacionados con la integración de Inteligencia Artificial, sobre todo respecto a la infraestructura de datos de la compañía.

Si los datos no pueden ser proporcionados, extraídos e integrados por sistemas autónomos al volumen o velocidad requeridos (debido a sistemas heredados, por ejemplo), la IA puede perder todo su valor potencial.

Sobre los autores

  • Gregory Vial es profesor asistente de TI en HEC Montréal.
  • Jinglu Jiang es profesor asistente de sistemas de información gerencial en la Universidad de Binghamton.
  • Tanya Gaannelia es doctoranda de tecnologías de la información en HEC Montréal.
  • Ann-Frances Camerones profesora asociada de TI en HEC Montréal.

Referencias

LEE MÁS CONTENIDO
¿QUÉ TEMA TE INTERESA?