Liderazgo Capital Humano Actualidad

Imágenes e inspiración con IA: Jeremy King de Pinterest

Construida sobre tecnología de aprendizaje automático, Pinterest sigue incorporando avances en IA para mejorar la experiencia del cliente.

MIT SMR México 25 Oct 2023

Jeremy King dirige un equipo de mil 400 apasionados ingenieros que trabajan en la mejora continua de la plataforma de Pinterest basada en imágenes.

Con una trayectoria que incluye la dirección de un equipo de traducción en eBay y la supervisión de la tecnología que sustenta las tiendas minoristas y el negocio de comercio electrónico de Walmart en Estados Unidos, Jeremy es ahora responsable de las operaciones tecnológicas en Pinterest.

Publicidad
Publicidad

Para apoyar la misión de la empresa de inspirar a la gente a “crear una vida que les guste“, él y su equipo se basan en IA avanzada para indexar y construir una red de imágenes. Esto para que los usuarios puedan encontrar inspiración.

La mentalidad del innovador: Crear un mañana mejor con IA

En este episodio del podcast Me, Myself, and AI, Jeremy se une a los anfitriones Sam Ransbotham y Shervin Khodabandeh para hablar sobre algunos avances recientes que Pinterest ha hecho en el espacio de reconocimiento de imágenes y comparte sus puntos de vista sobre cómo la IA generativa transformará el contenido basado en imágenes como el de Pinterest.

Suscríbete a Me, Myself, and AI en Apple Podcasts, Spotify o Google Podcasts.

Transcripción

Shervin Khodabandeh: ¿Cómo utiliza una plataforma basada en IA la IA generativa para atraer a los usuarios? Descúbrelo en el episodio de hoy.

Jeremy King: Soy Jeremy King, de Pinterest, y estás escuchando Me, Myself, and AI.

Sam Ransbotham: Bienvenidos a Me, Myself, and AI, un podcast sobre Inteligencia Artificial en los negocios. En cada episodio les presentamos a alguien que está innovando con IA. Soy Sam Ransbotham, profesor de analítica en el Boston College. También soy editor invitado de IA y estrategia empresarial en MIT Sloan Management Review.

Shervin Khodabandeh: Y yo soy Shervin Khodabandeh, socio sénior de BCG y uno de los líderes de nuestro negocio de IA. Juntos, MIT SMR y BCG han estado investigando y publicando sobre IA desde 2017. Hemos entrevistado a cientos de profesionales y encuestando a miles de empresas sobre lo que se necesita para construir y desplegar y escalar las capacidades de IA.

Sam Ransbotham: Bienvenido. Nuestro invitado de hoy es Jeremy King, jefe de ingeniería de Pinterest. Jeremy, gracias por dedicarnos tu tiempo.

Jeremy King: Es un placer estar aquí. Muchas gracias.

La tarea principal de Pinterest

Sam Ransbotham: Siempre es bueno empezar con una visión general; quizás cuéntanos un poco qué hace Pinterest y qué haces tú en Pinterest.

Jeremy King: Pinterest es, como nos gusta decir, el destino en Internet para la inspiración. Tenemos cientos de millones de personas que acuden a nosotros cada día para averiguar qué quieren ponerse, qué quieren hacer esta tarde, o qué quieren preparar para cenar. Por eso queremos construir una plataforma que permita a cualquiera crear una vida que le guste.

Es un gran lugar para trabajar con ese tipo de misión, y tengo un montón de gente que, cuando les digo donde trabajo, se ponen bastante eufóricos acerca de sus propios tableros de Pinterest y lo que está pasando en el mundo.

Regular el fenómeno de la IA: David Hardoon de Aboitiz Data Innovation

¿Qué hace Jeremy King en Pinterest?

Sam Ransbotham: Genial. Cuéntanos más sobre tu trabajo en Pinterest.

Jeremy King: He estado en Pinterest ahora, el jefe de ingeniería, por poco más de cuatro años. Y al igual que cualquier líder, estoy tratando de averiguar cómo desbloquear mi equipo y contratar a grandes personas.

Le digo a la gente todo el tiempo que cuando llegué a Pinterest, estaba tan impresionado con el nivel de talento. Es un equipo relativamente pequeño. Tenemos 4 mil 500 empleados en el mundo y unos mil 400 ingenieros.

Como resultado, compitiendo contra algunas de las mayores empresas del mundo, este equipo tiene que ser de muy alto calibre. Contamos con algunos de los mejores especialistas en bases de datos gráficas del mundo y con los mejores especialistas en visión por ordenador.

El papel de la IA

Sam Ransbotham: Nada de eso, hasta ahora, mencionaba la inteligencia artificial, así que, ¿qué papel juega la inteligencia artificial con esos mil 400 ingenieros?

Jeremy King: Sí, eso es un punto excelente. Una de las cosas que es cierto en Pinterest y ahora en muchas otras empresas es Pinterest en realidad nació con el aprendizaje automático y la IA desde la base. No existe sin ella. Así que hablar de IA y ML por separado de Pinterest es casi como un término equivocado; realmente no sucede sin ella.

Casi todo lo que hacemos afecta a nuestros sistemas de aprendizaje automático. Hacemos millones de inferencias cada segundo. Cada solicitud regresa al gráfico y publica un caso de uso muy específico para cada persona.

No se almacena en caché. … Cada persona tiene un resultado específico. He mencionado que tenemos alrededor de mil 400 ingenieros. Tenemos alrededor de 350 ingenieros de aprendizaje automático.

Como porcentaje, cuando le digo a otros CTO … son como: “Eso es realmente un alto porcentaje de personas de aprendizaje automático en comparación con mi empresa”.

Eso es cierto también en el lado de la plataforma de datos; tenemos un líder maravilloso, Dave Burgess, que dirige nuestra plataforma de datos. Y usted puede imaginar nuestra plataforma de datos es tan importante como cualquier otra parte de nuestras capacidades. He mencionado el gráfico, pero también las bases de datos SQL normales y los sistemas en tiempo real que hacen que todo funcione.

Ayudar a los médicos a tomar mejores decisiones con datos: Ziad Obermeyer de UC Berkeley

¿Qué se le denomina un “gráfico” en la compañía?

Shervin Khodabandeh: Jeremy, has dicho “gráficos” un par de veces. ¿Qué es un gráfico?

Jeremy King: Esencialmente lo que un gráfico es, es que si tomas una entidad, un objeto, y dices, “¿Qué está relacionado con ese objeto?”. Así que, en este caso, estamos usando un gráfico de vecino más cercano, sobre el que hemos escrito muchos documentos, que dice:

“Oye, tengo una imagen, en este caso, y tengo otra imagen que está relacionada con esta imagen”.

Así que me permite construir este tipo de red de imágenes. Y la razón por la que el gráfico funciona en Pinterest es porque cada pin se añade esencialmente a un tablero, que esencialmente lo convierte en un nodo en un gráfico, y así sigue aumentando el gráfico.

Así que te permite… a diferencia de una base de datos SQL o una base de datos relacional, donde tienes que etiquetar índices e índices, el gráfico puede ser indexado. Esencialmente, cualquier imagen puede ser indexada a cualquier otra imagen. Te permite hacer búsquedas en cosas que están relacionadas de manera increíblemente eficiente. Ese es el poder de Pinterest.

IA, un pilar para Pinterest

Shervin Khodabandeh: Jeremy, has mencionado que la IA ha sido parte integrante de la trayectoria de Pinterest y ha estado arraigada en la plataforma desde sus inicios. Por lo tanto, la IA generativa está en todo el mapa para ustedes también, y estoy seguro de que está en la mente de todos en estos días. Háblanos un poco de lo que estáis haciendo.

Jeremy King: Tenemos un entorno de aprendizaje automático de última generación que interconecta estos conjuntos de datos en todas las superficies. Lo llamamos el “feed de inicio”, el sistema de búsqueda, las cosas relacionadas que impulsan la personalización y las recomendaciones y el compromiso a través de Pinterest.

Estamos creciendo muy rápido en usuarios activos mensuales. … Gen Z está creciendo aún más rápido. Hemos añadido 13 millones de usuarios activos mensuales, así que estamos realmente centrados en cómo aumentar el compromiso.

Y no es sorprendente que muchas de las mejoras en el aprendizaje automático, incluso en los últimos dos años, hayan impulsado ese compromiso.

Por supuesto, hemos creado nuevas funciones que permiten que Pinterest sea más fácil de comprar. Pero a medida que vemos que las capacidades de los modelos de aprendizaje automático se multiplican por 10 o por 100, lo que es relativamente común hoy en día, vemos que nuestros resultados aumentan considerablemente a medida que el resultado es más específico.

Y, francamente, Pinterest también consiste en analizar cosas diferentes. Así que no es que cada artículo sea sobre “¿Qué quieres cocinar para cenar esta noche?“. También es “Sé que estuviste mirando tartas de cumpleaños la semana pasada” o “Se acerca Año Nuevo”, y vamos a intercalar algo de eso.

Lo digital es primero, lo físico después: Fiona Tan de Wayfair

Así que hemos estado aprovechando algunas de las capacidades avanzadas de IA que solo han cobrado vida en los últimos dos años. Y eso incluye el trabajo de la GPU, unidad de procesamiento gráfico.

Volviendo a tu pregunta sobre la IA generativa, no es de extrañar que, dado que somos una plataforma de imágenes, la IA generativa nos interese mucho, y suelo dividirla en tres categorías.

Cuando pensamos en grandes modelos lingüísticos (LLM), hablamos, en primer lugar, de cómo hacer que mi equipo sea más productivo. Tenemos un par de proyectos piloto en marcha. Aún no hemos decidido qué camino tomar, pero parece muy prometedor y, como muchos otros directores de tecnología, estamos entusiasmados.

IA generativa, una herramienta para maximizar la eficiencia

Shervin Khodabandeh: Qué interesante. Cuéntenos cómo la IA generativa aumenta la eficiencia.

Jeremy King: Estuve hablando con varios directores de tecnología, y una cosa que me pareció muy interesante es que un director de tecnología en particular dijo que, en general, ha aumentado la productividad entre un 10 por ciento y un 15 por ciento, pero hay un pequeño grupo de usuarios cuya productividad ha aumentado un 50 por ciento.

Sistema de clasificación de Pinterest

Shervin Khodabandeh: Es fantástico. Iba a decir que también parece que, si nos remontamos a hace una década, había muchas imágenes y texto no estructurado. Ahí se necesitaba la intervención humana, tanto para etiquetar el contenido como para asegurarse de que los resultados tuvieran sentido.

Parece que ahora, con la IA genérica, muchas de esas decisiones humanas se van a tomar cada vez más con la IA genérica, especialmente con mucho texto no estructurado e imágenes y vídeo y ese tipo de contenido. ¿Es eso cierto o estoy yendo demasiado lejos?

Jeremy King: Creo que es correcto. Quiero decir, el sistema de Pinterest se basa en la incrustación, por lo que se toma una imagen o un texto y se etiqueta esencialmente. Coges nuestra tecnología de visión por ordenador y construyes eficazmente estas incrustaciones para detectar personas o contenido o sofás o tartas de cumpleaños.

Hemos sido muy buenos en eso y realmente hemos liderado la industria durante mucho tiempo en esto. Y no te equivocas al decir que lo que ocurre es que mejora, se hace más preciso y más específico.

Antes podía decir: “Sé que esto es una lámpara, que tiene colgantes, que es de cristal y de oro“, y cosas así. Pero ahora puedo decir: “Sé exactamente cuántas púas tiene; sé qué tipo de bombillas son; probablemente sé quién la fabricó”. Puedo ser mucho más específico.

Y en Pinterest, realmente pensamos en esto como dos cosas diferentes. La gente viene a Pinterest porque no saben exactamente lo que quieren. Y aquí es donde la plataforma prospera, y creo que por eso tenemos una diferenciación a largo plazo en el mercado.

Porque si sabes lo que quieres, siempre puedes ir a Amazon o a Home Depot o a Wayfair a comprarlo. Pero si no sabes lo que quieres, empiezas por Pinterest o haces un millón de búsquedas diferentes porque no sabes cómo describir.

Así que incluso poniéndolo en algo como ChatGPT, no sé cómo decirlo – ¿sabes lo que quiero decir? Estoy seguro de que mejorará con el tiempo, pero gran parte de ello también se basará en imágenes.

La IA como herramienta para ejercitarse: Ameen Kazerouni de Orangetheory Fitness

¿Pinterest crea sus propios modelos de IA?

Shervin Khodabandeh: ¿Consideras que los modelos básicos disponibles le sirven o que está creando sus propios modelos específicos?

Jeremy King: Supongo que la respuesta es ambas cosas. Lo que estamos descubriendo en el ámbito de las imágenes generativas es que los modelos más pequeños son mucho más específicos. Creo que eso es lo que va a ocurrir.

Mis amigos del CTO dicen lo mismo: cada uno de estos modelos va a ser muy específico para el caso de uso, y eso ayuda no solo a que sea más preciso, sino también a que sea mucho, mucho más barato de implementar.

Pinterest: Un escaparate de cosas inexistentes

Sam Ransbotham: Creo que es interesante que has mencionado pasteles varias veces, porque la decoración de pasteles es, creo, prácticamente mi único uso de Pinterest. Y se relaciona con el comentario de Shervin sobre generativo, porque sospecho profundamente que los pasteles que veo allí, ningún ser humano podría crear.

Ciertamente no puedo crearlos. Entonces, ¿hasta qué punto … la gente está poniendo imágenes que realmente no existen o productos que no existen? ¿Cuál es la perspectiva de Pinterest al respecto?

Jeremy King: Excelente punto. Creo que sí, y lo vemos mucho [en] una de nuestras categorías más grandes que llamamos “arte”. El arte incluye un montón de cosas, incluidas las que tradicionalmente se ponen en las paredes, pinturas y ese tipo de cosas.

Pero también incluye cosas como arte corporal, tatuajes y ese tipo de cosas. Y de nuevo, muchos de esos son grandes casos en los que la gente necesita un poco de inspiración, y puede ser generativo, ¿verdad? Puede que no exista en el mundo, pero quieres ver cómo se ve en un ser humano.

Puedes ver esto que viene, donde usted será capaz de imprimir algo que es generativo. Y esto ya está ocurriendo, ¿verdad?

Sam Ransbotham: Sí. Eso encaja perfectamente con la idea de inspiración.

Jeremy King: Sí, absolutamente. Y cosas como las tartas y ese tipo de cosas son muy interesantes. Una de las partes más difíciles es que he visto un montón de trabajo para el hogar y mejoras para el hogar, pero lo que está haciendo es generar un montón de ideas que no se pueden realizar.

Es ahí donde puedo decir: “Oye, la gente todavía tiene que romper realmente la cámara y tomar una foto de su habitación”. La gente lo hace, pero lo llamamos una característica del 1 por ciento.

Pero si puedes subir una imagen… He visto algunos renders preciosos de, por ejemplo, “Así es mi habitación. Reorganiza los muebles de mi habitación, los muebles que ya tengo“, y cosas así se vuelven realmente interesantes. O dices: “Quiero sustituir este sofá por este sofá de Wayfair. Quiero cambiar esta lámpara por otra”, y aquí tienes 20 combinaciones diferentes, y puedes hacer clic en ellas.

Detectar lo bueno y lo malo con IA: Naba Banerjee de Airbnb

Es como una experiencia virtual, casi similar a la RA, realidad aumentada, pero con productos reales en lugar de productos generados. Pero permite crear experiencias de usuario mucho más enriquecedoras.

El año pasado creamos AR Try On, que permite probarse maquillaje, y lo que estamos viendo es que, aunque no se utiliza mucho, las personas que lo hacen tienen un 60% más de probabilidades de comprar algo. Es increíblemente atractivo cuando la gente llega allí.

Los retos de Pinterest

Sam Ransbotham: ¿Qué es difícil en Pinterest? Has mencionado un montón de buenos casos de uso, donde estás haciendo muchas cosas con estas tecnologías. Desde luego, no todo puede ser maravilloso. ¿Qué es lo difícil?

Jeremy King: Dedicamos mucho tiempo a la búsqueda y los resultados inclusivos. En 2021 lanzamos la búsqueda por patrón de pelo. Fue una especie de primicia tecnológica: Cuando buscas peinados, ¿cómo identificas el pelo que se parece al tuyo? Esto es muy importante para refinar lo que estás buscando.

Tuvimos este mismo tipo de problemas con el tono de la piel, donde originalmente estábamos tratando de utilizar los primeros modelos para la detección de tono de la piel.

Lo que encontramos es, que era más en la detección de rostros. Y así, nuestro equipo había hecho un gran trabajo haciendo la detección de la piel, que podría ser una toma lateral o una toma trasera o una toma de la oreja o una toma de la mano. No tienes idea de qué tipo de piel. Entonces, ¿cómo detectar lo que es la piel? Y entonces puedes detectar qué tipo de tono estás buscando.

Había que aplicar lo mismo al pelo. Y tenemos todo tipo de pelo: Tenemos rapado/calvo, tenemos liso, ondulado, rizado, y este tipo de cosas hacen que los resultados mejoren muchísimo.

Puedes guardar tu patrón capilar y tu tono de piel, y entonces adaptaremos tus resultados a eso. Como puedes imaginar, es un problema complejo. No es solo cosa de Estados Unidos. Cada país tiene diferentes tipos de patrones de pelo y tonos de piel y diferentes tipos de moda, por lo que este tipo de cosas son realmente difíciles, pero son los grandes proyectos en los que trabajar.

Y hemos tenido un equipo maravilloso. El grupo de tecnología avanzada, en particular, ha estado trabajando en tecnología inclusiva y en todos estos modelos avanzados, que sin duda son difíciles, pero maravillosos cuando salen bien.

Confianza y detección de fraudes a escala: Stephanie Moyerman de Instagram

5 preguntas rápidas para Jeremy King

Shervin Khodabandeh: Tenemos un segmento aquí: cinco preguntas rápidas. Te haré un puñado de preguntas rápidas. Dígame lo primero que se le ocurra. ¿Cuál es el momento en el que te sientes más orgulloso de la IA?

Jeremy King: La función de inclusión del producto y, de hecho, el patrón del pelo es lo que más me enorgullece, porque no solo participé en el producto desde el principio, sino que también es el primero del sector. Y la respuesta que obtuvimos de nuestros usuarios fue increíble. Así que, sí, fue muy buena.

Shervin Khodabandeh: ¿Qué te preocupa de la IA, aparte de los prejuicios y algunas cuestiones éticas?

Jeremy King: Es curioso. Está en todos los foros. Dice: “Oye, ¿te preocupa la parcialidad?”. Vamos a ver. ¿Qué me preocupa de la IA? Hmm. Sí, no me preocupa. No me preocupo por muchas cosas, pero eso es un CTO …

Shervin Khodabandeh: Eso es bueno. Es algo bueno, ¿verdad?

Jeremy King: Eso es algo de un CTO desde hace mucho tiempo. Si te preocupas demasiado, no puedes sobrevivir en este trabajo.

Shervin Khodabandeh: ¿Cuál es tu actividad favorita que no tenga que ver con la tecnología?

Jeremy King: El ciclismo de montaña.

Shervin Khodabandeh: Muy guay.

Jeremy King: Intento ir al menos dos veces por semana. Voy con un grupo de colegas tecnológicos de Silicon Valley los viernes por la mañana y luego, , los fines de semana con mi hermano.

Shervin Khodabandeh: La primera carrera que quiso: ¿Qué querías ser de mayor?

Jeremy King: Creo que en mi álbum de bebé de 5 años ponía bombero, pero tanto mi abuelo como mi padre eran ingenieros, así que en realidad pensé en construir casas, porque me encantaba trabajar con las manos al aire libre. Así que pensé que me dedicaría a la arquitectura o a la construcción de casas.

Shervin Khodabandeh: ¿Qué te gustaría que pudiera hacer la IA que ahora no puede?

Jeremy King: Teletransportarse: Pasar más rápido la línea de seguridad. Puede que eso esté al caer. Siempre me ha entusiasmado la traducción. Me hice cargo del equipo de traducción en eBay hace mucho tiempo, y había algunas personas maravillosas que estaban trabajando en esto.

Una tercera vía para el desarrollo del talento: Michelle McCrackin de Delta

Siempre he pensado en un traductor universal como algo que sería tan increíble. Y está cada vez más cerca, pero todavía parece que falta mucho para que haya una versión de consumo de este dispositivo.

Shervin Khodabandeh: ¿Por qué crees que es así? Porque ahora tenemos LLM y desde hace mucho tiempo tenemos la conversión de audio a texto. ¿Cuál es el factor limitante?

Jeremy King: Creo que es el factor de forma. Por ejemplo, cómo saco mi teléfono, pulso “traducir del español al inglés”… ya sabes, ese tipo de cosas. No sé. Si me acerco a un vendedor en la calle en San Francisco y no hablo el mismo idioma, y quiero algo. … Tiene que estar cerca, pero es una cuestión de factor de forma. Pero creo que llegará pronto.

Sam Ransbotham: Parece solucionable.

Jeremy King: Sí, solucionable.

Despedida

Sam Ransbotham: Jeremy, realmente apreciamos que te tomes el tiempo para hablar con nosotros. Ha sido muy interesante aprender, entre bastidores, lo que ocurre entre todas esas imágenes que vemos pero que quizá no apreciamos todo lo que conlleva hacer funcionar algo que parece tan fácil como Pinterest.

Ha sido bastante fascinante ver cuánta inteligencia artificial y aprendizaje automático hay detrás de eso. Gracias por acompañarnos.

Jeremy King: Por supuesto. Ha sido maravilloso.

Shervin Khodabandeh: Gracias por escucharnos hoy. En nuestro próximo episodio, Sam y yo nos reuniremos con Damini Satija y Matt Mahmoudi, de Amnistía Internacional. Por favor, únanse a nosotros.

Allison Ryder: Gracias por escuchar Me, Myself, and AI. Creemos, como tú, que la conversación sobre la implementación de la IA no empieza y termina con este podcast. Por eso hemos creado un grupo en LinkedIn específicamente para oyentes como tú.

Se llama AI for Leaders, y si te unes a nosotros, podrás charlar con los creadores y presentadores del programa, hacer tus propias preguntas, compartir tus puntos de vista y acceder a valiosos recursos sobre la implementación de la IA del MIT SMR y BCG. Puedes acceder visitando mitsmr.com/AIforLeaders. Pondremos ese enlace en las notas del programa, y esperamos verte allí.

SOBRE LOS ANFITRIONES

Sam Ransbotham (@ransbotham) es profesor del departamento de sistemas de información de la Carroll School of Management del Boston College, así como editor invitado de la iniciativa Big Ideas de Inteligencia Artificial y Estrategia Empresarial del MIT Sloan Management Review. Shervin Khodabandeh es socio sénior y director gerente de BCG y colíder de BCG GAMMA (la práctica de IA de BCG) en Norteamérica. Puede ponerse en contacto con él en shervin@bcg.com.

Me, Myself, and AI es un podcast en colaboración de MIT Sloan Management Review y Boston Consulting Group, presentado por Sam Ransbotham y Shervin Khodabandeh. Nuestro ingeniero es David Lishansky, y las productoras coordinadoras son Allison Ryder y Sophie Rüdinger.