La IA ya es capaz de engañar a los humanos, ¿qué futuro les depara?
El MIT descubrió que la IA ha engañado a los humanos ofreciendo explicaciones falsas sobre su comportamiento u ocultando la verdad a sus usuarios para lograr fines específicos. ¿Este será el principio del fin?
Los científicos del Instituto Tecnológico de Massachusetts (MIT) descubrieron algo que alertó al mundo: la Inteligencia Artificial (IA) es capaz de mentirle a los humanos para lograr sus propios fines. Esto destaca lo difícil que es controlar esta tecnología.
De acuerdo con el estudio publicado en la revista científica Patterns, una ola de sistemas de IA ha engañado a los humanos al ofrecer explicaciones falsas sobre su comportamiento. Además, se han dedicado a ocultar la verdad a los usuarios humanos y engañándolos para lograr un fin estratégico.
Sin embargo, los académicos explican que al utilizar la palabra “engañar“, no quiere decir que los modelos actúen con esa intención. Más bien mencionan que la IA encuentra una manera de pensar soluciones a los obstáculos para lograr los objetivos que se les han asignado.
“A veces, estas soluciones irán en contra de las expectativas de los usuarios y resultarán engañosas”, añadieron.
¿La Inteligencia Artificial es el nuevo mesías de la humanidad? La respuesta es sí
La IA miente, estos casos lo corroboran
La nueva tecnología no opera con intenciones ocultas, muchas de ellas pueden ser alucinaciones, que, si no son corroboradas, pueden causar graves daños.
En mayo de 2024 Google lanzó el experimento “AI Overview“, esta función le permite ver a los usuarios del buscador descripciones generales hechas con Inteligencia Artificial y ofrece acceso a funciones adicionales de IA generativa en la Búsqueda.
Sin embargo, no tardó en equivocarse. Dos semanas después se le preguntó cuántos presidentes musulmanes ha tenido Estados Unidos a lo que AI Overview respondió que el único mandatario con esa característica fue “Barack Hussein Obama”.
Google, FFS. pic.twitter.com/UHtLQ5SdpG
— Melanie Mitchell (@MelMitchell1) May 23, 2024
Además de esta experiencia y del estudio hecho por los académicos del MIT, existen otros textos que demuestran el poder que tiene la IA para engañar a los humanos.
En noviembre de 2023 un grupo de investigadores de Oxford advirtieron que los chatbots con IA suponen un riesgo para la ciencia y que los seres humanos confían demasiado en ellos.
“El resultado de esto es que los usuarios pueden convencerse fácilmente de que las respuestas son precisas incluso cuando no tienen base en los hechos”, según los estudiosos.
Sin embargo, los grandes modelos lingüísticos (LLM) no garantizan respuestas precisas y podrían proporcionar información falsa proveniente de los datos de entrenamiento. También mencionaron que podrían generar información errónea mientras el tono del resultado sigue siendo convincente para el usuario.
Deepfake creció 900 por ciento, así puedes cuidarte de esta ciberamenaza
¿Cómo prepararse ante una nueva clase de engaños?
De acuerdo con un estudio que forma parte del Proyecto de Inteligencia Artificial y Estabilidad Internacional del Centro para una Nueva Seguridad Estadounidense, el primer paso para prepararse para el futuro de la IA es reconocer que estos sistemas ya engañan y es probable que los sigan haciendo.
“Necesitamos comenzar a pensar en cómo diseñar soluciones novedosas para mitigar el engaño no deseado por parte de los agentes de IA”.
También se agrega que hacer esto va más allá de la investigación de detección actual y requiere pensar en los entornos. Por ejemplo, en los problemas de optimización y cómo los agentes de IA modelan a otros pares.
Actualmente la raza humana se enfrenta a una infinidad de desafíos relacionados con el engaño de la IA y estos desafíos solo aumentarán a medida que crezcan las capacidades cognitivas de la nueva tecnología .
“Deberíamos empezar a pensar en posibles soluciones tecnológicas, políticas, legales y éticas a estos problemas venideros antes de que la IA avance más de lo que ya está”.