La nueva herramienta de inteligencia artificial de Google está causando furor.
NotebookLM, el asistente de IA del gigante tecnológico, ha presentado hace poco una función llamada «resúmenes de audio» (del inglés, Audio Overviews). Utilizando esta herramienta, los usuarios pueden darle información al asistente de inteligencia artificial y este genera un debate «en profundidad», similar a un pódcast, conducido por dos presentadores cuyas voces también han sido creadas por IA.
Puedes utilizar varios formatos, como enlaces a páginas web y a vídeos YouTube, archivos en PDF, notas de audio, Docs o Presentaciones de Google… incluso texto sin formato. Una vez que tengas tu pódcast personalizado generado por inteligencia artificial, también puedes descargar el resumen de audio y subirlo a NotebookLM para obtener una transcripción.
Aunque no sea un nombre tan conocido como ChatGPT, NotebookLM es un asistente de investigación y redacción basado en IA que resume fuentes, genera guías de estudio y documentos informativos, y comprueba tu trabajo.
La nueva función de esta herramienta ha creado una gran expectación en internet, donde se experimenta con la creación de pódcast a la carta. Algunos usuarios ya se han referido a la función como «alucinante» y otros están compartiendo sus propios resúmenes de audio, que van desde pódcast en los que los presentadores «se dan cuenta» de que son una inteligencia artificial hasta pódcast de true crime basados en documentos judiciales reales:
Tras el entusiasmo que ha suscitado esta nueva función, Raiza Martin, jefa de producto de NotebookLM, ya ha compartido sus planes de futuro.
«Tras ese momento inicial de entusiasmo, la gente quiere influir en el contenido», ha expresado Martin a través de una publicación de X (la red social anteriormente conocida como Twitter). «Tiene sentido: ahora quieren poder controlar el formato, la longitud, los personajes, las voces, los idiomas… Llevo la cuenta y estamos trabajando en ello (algunos llegarán mucho más rápido que otros)».
El impacto de los resúmenes de audio ya ha generado al menos la aparición de un competidor. Se trata de un rival de código abierto que ha asegurado haber creado una herramienta similar, llamada Open NotebookLM, en una sola tarde. Sin embargo, esta tendría más limitaciones que la versión de Google.
Con todo el revuelo que ha generado el último experimento de Google en materia de IA, me decidí a probar los resúmenes de audio de NotebookLM, tratando de generar unos cuantos pódcast sobre distintos temas, como las redes neuronales o el drama que ha afrontado OpenAI (la desarrolladora de ChatGPT). Estas son mis conclusiones.
Las voces son realistas y entretenidas
Tras haber probado recientemente el modo de voz avanzado de ChatGPT, pensé que había escuchado lo mejor que la inteligencia artificial puede ofrecer a los consumidores en términos de interacción por voz.
Para mi sorpresa, los pódcast generados por NotebookLM superan todo lo que había escuchado hasta ahora en cuanto a calidad de voz de la IA. No solo las voces suenan reales, sino que la forma en que los presentadores generados por inteligencia artificial interactúan y bromean entre sí imita el estilo y la estructura de un pódcast real.
Por ejemplo, cuando los presentadores hablaban de la trayectoria del cofundador de OpenAI, Ilya Sutskever, en su antigua empresa (dimitió meses después del regreso de Sam Altman como CEO), uno de los presentadores dijo: «Menudo salseo, cuéntame más». Se alejó de la voz rígida y robótica que espero oír en los contenidos generados por IA y aportó el toque entretenido que se espera en un pódcast.
Los presentadores también plantearon preguntas legítimas sobre el tema en cuestión e intercambiaron respuestas reflexivas y relacionadas con la información planteada. Es como escuchar una conversación realista con dos presentadores expertos, solo que puedes personalizarla según tus intereses, lo cual cambia completamente las reglas del juego.
La calidad de la información es sólida
Cada uno de los pódcast que generé ofrecía una visión precisa de la información que le proporcionaba y no detecté ninguna imprecisión.
Aun así, como cualquier herramienta de inteligencia artificial, los resúmenes de audio de Google no son perfectos. La firma de Mountain View indica en la parte inferior de la pantalla que «NotebookLM en ocasiones puede dar respuestas inexactas», por lo que se recomienda verificar «los hechos de forma independiente».
Teniendo esto en cuenta, probablemente no lo utilizaría como única fuente para informarme sobre un tema con el que no estoy familiarizada en absoluto y me parece buena idea investigar por tu cuenta, especialmente si se dice algo que parece fuera de lugar o inexacto.
Como ávida oyente de pódcast, la herramienta me ha sorprendido gratamente. Con tantos prototipos de IA saliendo al mercado, es raro que me sorprenda una herramienta con la que realmente se pueda trastear hoy en día.
Los resúmenes de audio probablemente sean la herramienta de inteligencia artificial que más me ha gustado de las que he probado hasta ahora, una función que muestra las innovadoras formas en las que la IA realmente puede utilizarse en nuestra vida cotidiana.