IBM lleva más de 100 años en la vanguardia tecnológica: su reto ahora pasa por ganar la batalla de la IA

IBM lleva más de 100 años en la vanguardia tecnológica: su reto ahora pasa por ganar la batalla de la IA

9 comentarios Facebook Twitter Flipboard E-mail
Mikel Diez Ibm

Pocas personas pueden ofrecernos una mejor visión de lo que está pasando en la vanguardia de la tecnología que Mikel Diez, 'Head of Innovation' de IBM. Durante el Mobile World Congress tuvimos la oportunidad de hablar con él y preguntarle por los dos temas más candentes del momento, que además son su especialidad: la inteligencia artificial y la computación cuántica.

Desde IBM presumen de que son una empresa puntera en estos dos sectores. Una centenaria compañía que ha estado detrás de muchas de las innovaciones del siglo XX y busca hacerlo en las dos que ya están marcando el siglo XXI.

Tengo la entrevista dividida claramente en dos bloques y quería preguntarte por cuál empezamos. De entre la IA y la computación cuántica; ¿cuál crees que es el que más va a marcar el devenir? ¿En qué tecnología deberíamos focalizarnos?

En IBM hace cuatro o cinco años tomamos la decisión como compañía de dedicarnos a tres grandes pilares. Cloud híbrido, esto de que ni todo allí ni todo aquí, sino donde se necesiten las cosas. Segundo pilar, inteligencia artificial. Y tercer pilar, la computación cuántica. Esto como por el ángulo nuestro.

"La inteligencia artificial lleva en nuestro ADN varias décadas".

Por otro lado, esto es lo del huevo y la gallina. La inteligencia artificial, ChatGPT, etc... se han escrito ríos de tinta. Hemos abierto el grifo de una manguera muy determinada y estamos viendo lo que puede impactar en la sociedad. Pero bueno, la inteligencia artificial lleva en nuestro ADN varias décadas. Y luego aparece la computación cuántica por el hecho de que tiene pinta que con la clásica no nos va a ser suficiente.

Cuando dices que luego aparece, ¿cómo marcas esa línea temporal?

Digo luego de una manera más evidente y más comercial. Llevamos haciendo investigación en computación cuántica seguramente dos décadas. Solo que desde 2016 que pusimos la primera máquina cuántica en cloud, es cuando hemos empezado a hacer evidente... ¿el concepto de TRL conoces?

No, ¿qué significan esas siglas?

TRL es 'Technology Readiness Level'. Es una especificación de si la tecnología es muy incipiente, emergente o es más aplicada. Si por ejemplo todavía todo está en laboratorio, eso significa que tiene un TRL muy bajito.

Empezamos a hacer TRL muy bajos, en los 2000, con la computación cuántica. Sin embargo, y ahora viene un poco cómo hilamos todo esto a la vez, una cosa contribuye a la otra.

La computación cuántica fundamentalmente viene para intentar ayudar en tres grandes sentidos. Una es la simulación de sistemas naturales porque, aunque creamos otra cosa, toda en la naturaleza cuando bajamos de subátomos es cuántica. La otra línea que sirve es la inteligencia artificial. Y la otra es la optimización, que no deja de ser una disciplina de inteligencia artificial.

Por no abrir demasiados mensajes, pero si consideramos que la computación clásica, como se la va a llamar, el cero y el uno, nos permite todo lo que nos está permitiendo la inteligencia artificial... la cuestión está en que estamos ya saturando la capacidad de ese procesador que tú tienes en ese móvil o el que tenemos en las grandes máquinas de supercomputación.

Inteligencia artificial

Quedémonos pues con lo más cercano. ¿Cómo se sitúa IBM en la carrera por la IA?

Lo que hacemos son algoritmos para diferentes naturalezas. Y la cosa está que la inteligencia artificial ha pivotado del famoso machine learning estadístico a las redes neuronales. En las redes neuronales fundamentalmente lo que tratamos es de optimizar los trillones y trillones de parámetros. Llega un momento en que un computador no es capaz de hacer esa optimización de forma fácil. Y esa es una de las aplicabilidades donde la cuántica puede ayudar. La otra es la de algoritmos que manejan una nube exponencialmente enorme de combinaciones.

Uno de los factores para describir los modelos de IA es el número de parámetros. ¿Hasta qué punto es relevante?

Es relevantísimo, porque los parámetros no dejan de ser pequeños valores que colocamos en estas gigantescas redes generativas donde haciendo trillones de pasadas los optimizamos con las de números. Si colocas menos número de parámetros significa que tienes menos posibilidad de entrenar al sistema.

Y más allá de estos parámetros, ¿hay algún otro factor numérico que determine la calidad de un modelo?

Sí, la precisión.

¿Cómo la medís?

La precisión tiene varios factores. Hay diferentes KPIs, pero fundamentalmente la idea es cuántos falsos positivos dices que dices y cuántos falsos negativos no dices. Esto es lo que hace que cuando alguien le prescribe un tema de quimioterapia, ten cuidado con el falso positivo porque te estropea el cuerpo. O cuando alguien dices que no puedes darle un crédito, cuidado porque ese falso negativo lo estropea.

Nosotros estamos basados en lo que llamamos modelos fundacionales. ¿Y sabes cuáles son los modelos fundacionales por excelencia? El que ha publicado OpenAI con ChatGPT o el que ha publicado Google con Bard. Pero hay una diferencia con la que nosotros convivimos, nos dedicamos al B2B y no al B2C.

¿No tenéis algún programa de inteligencia artificial enfocado al consumidor? Algo al estilo ChatGPT que el usuario pueda toquetear.

Somos B2B ('business to business') total. Nosotros somos una empresa B2B y lo hemos sido desde hace 112 años. No vamos a hacer B2C, es una estrategia de compañía. Ahora, lo que sí hacemos es inteligencia artificial para Enterprise.

Si queremos hacer, por ejemplo, un fantástico buscador para una compañía de aerolíneas, el matiz está en que no empezamos desde cero. Si queremos hacer un buscador español, necesitamos traer preconstruido todo un modelo fundacional que ya reconozca el lenguaje. Luego hacemos la conversación y tenemos que personalizarlo en lo que se necesite.

IBM tiene entonces esa capacidad para ofrecer un buscador a una aerolínea.

Ofrecemos buscadores, ofrecemos modelos conversacionales, ofrecemos reconocimiento visual...

¿Y en comparación con lo que ahora ofrece Microsoft con Bing?

Bueno, la diferencia está en que nosotros no hacemos un buscador general. A nosotros nos llega una petrolera y nos dice, necesito que me hagas un buscador para que la gente que está haciendo sismografía pueda preguntar a un sistema por proyectos que hemos hecho en las últimas tres décadas y que le pueda contestar a ese sismólogo. Eso seguramente no lo encuentras en Bing. Si te vas con Bing, o a Google, encuentras otro tipo de respuestas. Esa es la diferencia.

Vela es vuestro supercomputador dedicado a la inteligencia artificial. ¿En qué se diferencia de un supercomputador al uso?

Tu recordarás aquello de las CPUs y GPUs. Del salto de los procesadores de propósito general a las GPUs, con capacidad de producto matricial, porque las imágenes se escribían en matrices. El salto que hemos dado lo llamamos AIU ('Artificial Intelligence Unity'). Dentro del chip se añaden capacidades de álgebra lineal. Están embebidas en el procesador. Consume cuatro veces menos y nos permite llevar este procesamiento para la IA al famoso perímetro. A la nube.

¿Consume la IA en exceso? En comparación con el desarrollo de la computación cuántica, ¿qué requiere de más recursos por parte de IBM?

Bueno, no voy a entrar en números, pero desde el punto de vista de recursos, primero, son recursos distintos. Hay mucha ciencia, mucha más ciencia en la computación cuántica. En términos de paradigmas muy concretos, físicos, etc. En inteligencia artificial ya hemos ido democratizando el talento que hace falta.

Sobre recursos que consumen... hay un parámetro que para mí es interesante, que tiene que ver con sostenibilidad. El centro de computación del BSC, que es el centro de computación de Barcelona donde tenemos mucho hardware allí, consume en el orden de megavatios. La última máquina cuántica de los 433 cúbits consume del orden de los kilovatios.

¿Comparativamente es muy difícil de equiparar? A nivel de procesamiento o de capacidad.

No hay una escala para que puedas comparar. Es distinto. Pero bueno, sí que nos lleva a ese punto de... por ejemplo, hemos hecho un chip de 5 nanómetros que consume un 75% menos que los chips actuales que podemos tener en las memorias. Es decir, que este tipo de cosas te permiten abordar problemas que están a nivel mundial.

Recientemente Sam Altman (CEO de OpenAI) ha escrito sobre el concepto de AGI (Artificial General Intelligence). ¿Qué opinas de este concepto? ¿Cómo ves el debate?

El AGI lo hemos perseguido siempre desde Blade Runner, Star Trek, etc... Siempre además cuando nos preguntaban a los que trabajábamos, siempre decíamos, eso ahí a la derecha por 2030 o 2040. No sabíamos. Y por otro lado, la inteligencia narrow (ANI), la pequeñita, es la que tenemos. Lo que ocurre es que ahora, algo como estos modelos conversacionales, hacen pensar que hay algo que sabe de todo. Y para mí el matiz está en lo del saber. Y lo estamos viendo con ChatGPT, que una cosa es que tiene una respuesta y otra cosa es que la respuesta sea correcta.

Para mí el matiz está en lo del saber. Y lo estamos viendo con ChatGPT; una cosa es que tenga una respuesta y otra cosa es que esa respuesta sea correcta.

Primero, me parece un ejercicio valiente, hacer una inteligencia general, porque esto siempre nos permite el famoso salto adelante. Pero otra cosa que me parece muy interesante que dice Altman, que es el tema de qué ética le vamos a aplicar. Qué es lo que va a permitir que... Mira, yo te doy todo lo que dice este modelo conversacional, pero la ética que hay detrás es... No sé si la ha entrenado con todo o con menos, no sé si la ha entrenado con la ética y el propósito que yo esperaba, no sé si se estoy conociendo al proveedor de los datos que me dio para entrenar. Lo que me parece más interesante es la ética.

¿Cómo gestionáis la ética internamente en IBM?

Tenemos un framework desde hace cuatro años, es nuestro AI Ethics, donde tenemos tres grandes principios. Lo primero, consideramos que la inteligencia artificial tiene que servir para aumentar la inteligencia, no para sustituirla, y esto es otro gran debate. Los datos con los que entrenan pertenecen a sus creadores, no a quien crea el modelo, y tercero, hay que darle a esto siempre un propósito, no vale hacer simplemente inteligencia artificial. Entonces, eso luego tiene un decálogo, y luego tenemos un montón de herramientas tecnológicas para si quieres que te diga si tu modelo tiene un sesgo, tenemos 11 tipos de sesgo.

En la Unión Europea están intentando conocer cómo regular inteligencia artificial. ¿Cuál sería tu propuesta? Si te contactase alguien para saber tu opinión como experto, ¿cuáles crees que deberían ser los puntos donde la regulación debería enfocarse?

Nuestro principal concepto es explicabilidad y transparencia. No es sencillo explicar una red neuronal, pero igual no es necesario explicar la red neuronal, sino  cuál es la explicabilidad que le tenemos que dar, a cómo este modelo va a responder.

Otro proyecto vuestro es Debater. ¿Acabará teniendo la IA un criterio de autoridad? ¿Se acabará confiando en la inteligencia artificial, solo por el hecho de serlo? En contraposición a que lo diga un humano.

Eso es lo que recorremos en nuestra ética de IA, concretamente en la explicabilidad. Porque la explicabilidad incluye el que un humano explique por qué toma esa decisión.

¿Y quiénes son esos humanos?

Bueno, son dos tipos. Uno, los científicos de datos que construyen el modelo, y lo que nosotros llamamos el experto en el problema, que es el que explica por qué el modelo matemático funciona así.

¿De IBM?

Nosotros trabajamos conjuntamente con nuestros clientes que tienen consultores externos, y que trabajan con nuestros consultores.

Computación cuántica

Pasemos al otro gran tema. Vuestro roadmap actual es que en 2026, esperáis un procesador cuántico de más de 10.000 cúbits, pero dejando de lado esta carrera. ¿Esperáis también tener ordenadores cuánticos con corrección de errores?

Bueno, no es que los esperemos, ya los tenemos. Hay que pensar que las máquinas cuánticas que tenemos ahora se llaman NISQ, y la N es de 'noise' (ruido). Es decir, que nosotros cuando empezamos a diseñar estas máquinas, sabíamos que tenían errores, y lo que hacemos es trabajar en errores. Ahora mismo tenemos una tasa de error de 10 a la menos 3, o sea, por cada mil operaciones con un cúbit, una es error. Lo que ya venimos desde hace más de dos años trabajando es, dos líneas, mitigar el error y corregirlo. Y lo hacemos con inteligencia artificial.

Vosotros estáis centrado en superconductores, pero también hay otras tecnologías como trampas de iones, átomos neutros... ¿Trabajáis en ellas o no las veis para el desarrollo de ordenadores cuánticos?

Nuestro foco es con superconductores. Yo creo que hay varias razones. Una de ellas es que la historia de IBM en la semiconducción está más que demostrada. Eso nos ha dado muchísima investigación en superconductores. Y por otro lado, porque nuestra inversión está dedicada ahí, y se están viendo los esfuerzos. Aceleramos más rápido basado en superconductores que no en fotones o iones.

Hablando del roadmap, ¿estáis cumpliendo plazos o aceleráis?

Aceleramos. De hecho, ya cuando arrancamos hablábamos de volumen de cúbits. Y ahora hablamos de coser microprocesadores en comunicación cuántica para acelerar el roadmap.

El roadmap de la computación cuántica se está acelerando. 

¿Es posible realmente aplicar la computación cuántica a problemas actuales clásicos?

Lo estamos haciendo.

¿Cómo qué? Dime un ejemplo.

Por ejemplo, ¿cómo utilizamos la recogida de residuos en una ciudad con camiones de vehículos? Cuando haces eso, que es el famoso problema que se llama TSP, 'Traveling Salesman Problem', cuando haces eso para más de 20 camiones y más de 20 rutas, no es posible. Esto lo estamos haciendo ya para compañías navieras. O estamos optimizando el portfolio de inversiones de un banco para ver su riesgo. O estamos haciendo quantum machine learning para trabajar en el reconocimiento de patrones.

¿La batalla de la computación cuántica es solo entre Estados Unidos y China? ¿Cómo ves a España en todo esto?

A nivel geopolítico no entramos en este tipo de planteamientos. Sí, está claro que hay anuncios, hay artículos, hay regulación científica. Nosotros seguimos el rondo que tenemos previsto. No trabajamos solamente en Estados Unidos. De hecho, formamos parte de comisiones de trabajo en Europa. Pero también lo más relevante es que en España, concretamente en la diputación de Vizcaya, trabajan ya con nosotros casi tres años, en un ecosistema de computación cuántica donde usan nuestra flota más de 20 máquinas. Y las están usando startups, universidades, corporates, avanzando experimentalmente en problemas industriales.

Desde la Secretaría de Estado se ha lanzado la iniciativa Quantum Spain. ¿Cómo la valoras?

Bueno, es una iniciativa que me parece razonable. Que la votan y la depositan fundamentalmente en el BSC. Y en la que están haciendo cosas. Yo creo que en su momento anunciaron que en dos años conseguirían 20 cúbits (30 cúbits en 2025). Y bueno, es un ejercicio de decisión.

¿Qué habilidades consideras esenciales para trabajar en Inteligencia Artificial y Computación Cuántica?

El talento es algo de lo que estamos muy preocupados porque en la empresa tecnológica somos sensibles a la escasez de talento en ciertas áreas. En Inteligencia Artificial para mí hay dos grandes roles: el ingeniero de datos, que los coge, los limpia y los hace disponibles; y el científico de datos, que es capaz de aplicar algoritmos. En Computación Cuántica están los físicos de diferentes naturalezas que son capaces de controlar la implementación de cúbits. Y a su vez los científicos de datos cuánticos que entienden la cuántica para hacer algoritmos distintos.

¿Cómo ves la situación en España de esas capacidades? ¿Crees que las universidades están dando una buena formación para crear esos científicos de datos?

Hay espacio de mejora. Hay suficiente espacio de mejora. De hecho, nosotros estamos trabajando ya con universidades tanto en grados como en post-grados, para incorporar asignaturas relacionadas con Computación Cuántica. Y por cierto, las universidades no son ajenas. Ellas entienden que hay que provocar un cambio para este tipo de cosas.

¿Es una cuestión de recursos? ¿Es una cuestión de estrategia?

Yo creo que la estrategia la tienen definida, pero para los entes académicos, los recursos, cuanto más mejor.

El trabajo de IBM

Una pregunta sobre tu día a día. ¿Qué significa ser 'Head of Innovation'?

Fundamentalmente mi trabajo es ver cómo conseguimos transferir todo lo que hace IBM Research, desde la organización de Quantum, a los mercados. Yo trabajo con los equipos de Quantum de Estados Unidos y los que ya tenemos en España, porque los tenemos; trabajo con los equipos de Research en aquello que llamamos simulación de emergencia. Cosas que pueden no ser productizadas ya, pero que empiezan a ser activos.

¿Cuántas personas hay dedicadas de IBM en España a IA y a computación cuántica?

No puedo darte datos, pero en el área de consultoría y de tecnología hay centenares de personas dedicadas a esto. Entre las dos disciplinas. Y luego tenemos equipos mixtos, que pertenecen a Research, pero que están ubicados en España.

Toca el salto al vacío. La predicción de aquí a cinco años en IA, y la predicción de aquí a cinco años en computación cuántica.

Yo creo que prácticamente todas las compañías tecnológicas estamos considerando cinco años como el medio o largo plazo. De hecho, cuando empezamos con la computación cuántica, que se decía que íbamos a tener 20 qubits en 20 años, ya hemos creado esto. Y en inteligencia artificial igual.

En los próximos dos o tres años, nosotros creemos que lo que puede haber va a ser ventaja cuántica. Y en inteligencia artificial, yo creo que lo vemos cada día. Por lo  que pensar en cinco años está bien para tener un horizonte de esta, pero...

¿Se dejará de hablar en cinco años de IA como ya se deja, o debería dejarse, de hablar de digitalización?

Acuérdate que somos expertos en decir 3.0, 4.0, 5.0... Lo que sí que es cierto es que la inteligencia artificial cada vez se permea y se lo democratiza más.  Ahora hablas de inteligencia artificial y te dicen ChatGPT. Hace cinco años hablabas de inteligencia artificial, y te decían ¿Blade Runner? ¿la nueva?. Los horizontes se acortan. Y eso lo demuestra que las cantidades de inversión que se hacen en I+D+I en tecnología cuántica e investigación de la inteligencia artificial suben. El año pasado hemos estado en 33 billion en inversión de computación cuántica. El año anterior no llegaba a 10.

El año pasado también hubo un boom con el blockchain. ¿Puede ser que la IA y la computación cuántica estén en un pico y luego no sea tanto?

En innovación hay una curva que es el Hype de Gartner, que siempre hace así y luego sube. La cuestión es dónde estamos. La inteligencia artificial está subiendo, e  incluso ya está en la meseta de la inversión. En la computación cuántica ya ha subido el hype, ha bajado y estamos empezando a ver la curva.

Comentarios cerrados
Inicio