Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI LANGUAGE MODELS & AGENTS 🧠

NOTEBOOKLM Google ha anunciado dos importantes actualizaciones en NotebookLM: las Video Overviews ya están disponibles en más de 80 idiomas y las Audio Overviews se han mejorado para ofrecer resúmenes más completos y detallados en todos los idiomas soportados. Como sabes, estas funciones generan presentaciones en vídeo o audio que sintetizan el contenido de los cuadernos, ayudando a estudiantes, investigadores o curiosos a entender rápidamente conceptos clave sin tener que revisar largas fuentes de información. Con esta ampliación, NotebookLM refuerza su papel como herramienta de apoyo al aprendizaje y la creación en múltiples lenguas. Por si te interesa, aquí está nuestro audio overview en castellano de los 34 boletines que IA-AI Newsletter ha publicado en 2025.

IA-AI IMAGE 🎞️

GOOGLE NANO BANANA Google ha lanzado Gemini 2.5 Flash Image. Probado de forma anónima bajo el divertido nombre “nano-banana” y superando a competidores como ChatGPT —que suele distorsionar facciones en sus ajustes—, se trata de un sistema multimodal que revoluciona la edición de imágenes. Aunque ChatGPT lidera con 600 millones de usuarios mensuales frente a los 350 millones de Gemini, Google apuesta por esta innovación para recortar distancias y desafiar tanto a OpenAI como a Adobe en un mercado multimillonario. Lo que permite o debes saber:

  • Generar imágenes a partir de prompts: puedes crear imágenes realistas y de alta calidad a partir de tus descripciones.

  • Editar imágenes de forma conversacional: puedes pedirle que haga cambios en una imagen usando lenguaje natural, como "cambia el fondo" o "haz que la persona sonría”, “borrar las personas”, “difumina el fondo”…

  • Mantener la consistencia del personaje: permite generar imágenes del mismo personaje en diferentes escenas y poses.

  • Combinar imágenes: puedes darle varias imágenes para que las fusione en una nueva creación (al menos hasta 13).

  • Con razonamiento multimodal y conocimiento del mundo, genera detalles contextuales más realistas, como añadir vegetación apropiada en un paisaje.

  • Todas las creaciones incluyen marcas de agua y metadatos SynthID para reforzar la seguridad.

  • Disponible en Gemini app, en AIStudio, Vertex AI… Por otro lado, la adopción ha sido inmediata en todas las plataformas: OpenRouter, fal.ai, Krea, ComfyUI… incluso Adobe lo integró en Firefly y Adobe Express.

  • Comparado con ChatGPT es muy rápido.

  • Nos ha gustado especialmente el uso de indicaciones en la propia imagen y que nos muestra este usuario en X. ¡Funciona!

  • O este otro donde nano-banana crea lo que se ve desde un punto de vista en Google Maps.

Nuestra impresión: muy buena. Mágico en muchas ocasiones. En muchos aspectos supera a Chagpt. Por ejemplo le pedimos que hiciera una imagen de un plato cocinado con varios ingredientes y lo clavó. Chatgpt se quedó muy lejos. Por otro lado, encontramos que la resolución de la imágenes era menor que las generadas con Chatgpt y al igual que este, también sufre de momentos “ahora no” (ahora no me da la gana hacer lo que me pides, aunque lo haya hecho antes y aunque insistas).

IMAGE CREDITS: GEMINI 2:5 FLASH IMAGE (AKA NANO-BANANA)

IA-AI VIDEO 🎬

HIGGSFIELD PRESENTA MINI APPS Más de 2000 aplicaciones Nano Banana, ilimitado y gratis por un año para suscriptores. 🧵 X

WAN VIDEO + AUDIO! Wan Video ha presentado Wan-S2V, un nuevo modelo de IA que convierte una imagen y un archivo de audio en un vídeo donde la persona se mueve y habla sincronizada con la voz. Disponible en GitHub y Hugging Face (pruébalo aquí), la herramienta permite generar fácilmente animaciones realistas a partir de una foto estática, combinando voz e imagen en un solo proceso.

GOOGLE VIDS Google ha potenciado su app Google Vids con IA generativa para transformar fotos en vídeos cortos mediante Veo 3, superando ya el millón de usuarios activos mensuales. La herramienta, integrada en Workspace, añade además avatares con IA para narrar guiones y un sistema automático que elimina pausas y muletillas en grabaciones, con próximas funciones como cancelación de ruido y nuevos formatos de vídeo. El editor básico se ofrece gratis a todos los usuarios de Google, mientras que las funciones avanzadas están disponibles para clientes Business, Enterprise, AI Pro, Ultra y Education. Petapixel

GEMINI te permite generar al día 3 vídeos Veo 3 en el plan Pro.

KREA REALTIME VIDEO Krea tiene una lista de espera para su nueva función Realtime Video, que permitirá a los usuarios crear y editar vídeos usando pintura en lienzo, texto o imágenes en vivo desde la webcam, manteniendo consistencia en los resultados.

IMAGE CREDITS: KREA. REALTIME VIDEO

IA-AI AUDIO/MUSIC 🎶

VIBEVOICE: MODELO DE TEXTO A VOZ DE CÓDIGO ABIERTO DE VANGUARDIA Microsoft ha lanzado VibeVoice, un modelo de texto a voz de código abierto capaz de generar hasta 90 minutos de audio conversacional con hasta cuatro voces diferentes, manteniendo las características únicas de cada hablante. Con solo 1.500 millones de parámetros, el sistema produce audio con calidad de pódcast, incorpora Qwen2.5 para lograr diálogos naturales y mejora la compresión de datos de audio hasta 80 veces, lo que permite ejecutarlo en dispositivos de consumo. Además, integra avisos de “generado por IA” y marcas de agua invisibles para verificar la autenticidad del contenido. Esta combinación de realismo, eficiencia y apertura convierte a VibeVoice en un avance destacado para la creación de pódcasts, audiolibros o presentaciones desde dispositivos comunes.

MAI-VOICE-1 es el nuevo modelo de generación de voz de Microsoft que produce audio natural, expresivo y de alta fidelidad en menos de un segundo por minuto usando una sola GPU. Integrado en servicios como Copilot Daily y Podcasts y disponible en Copilot Labs, permite narraciones dinámicas, meditaciones guiadas y asistentes virtuales, ajustando estilo, emotividad y ritmo. Su eficiencia lo hace accesible para usuarios y empresas, y convierte textos o scripts en voz casi instantáneamente, estando ya presente en productos de Microsoft con expansión prevista. De momento, solo en inglés.

HUNYUANVIDEO-FOLEY es un nuevo framework open-source de Text-Video-to-Audio que genera audio de alta fidelidad para vídeo, cine y videojuegos, alineando sonido y visuales de forma precisa. Entrenado con 100.000 horas de datos multimodales y usando la arquitectura MMDiT y el Audio VAE con pérdida REPA, produce efectos sonoros ricos y estables, desde elementos principales hasta detalles de fondo, superando a otros modelos open-source en calidad, coherencia semántica y temporal. X

CONVIÉRTETE EN EL PRÓXIMO ÍDOLO GLOBAL DE LA IA Higgsfield AI Records ha lanzado el primer sello musical impulsado por inteligencia artificial que crea ídolos virtuales a partir de rostros reales enviados por usuarios, y ya está negociando contratos millonarios —entre ellos, uno valorado en USD 50 millones y otro de USD 1 millón con la firma de moda Fendi—, posicionándose como pionero en un nuevo modelo de entretenimiento digital basado en herramientas generativas avanzadas. X

IMAGE CREDITS: HIGGSFIELD AI RECORDS: “You don’t need talent anymore. Your face is enough.” 😵‍💫

IA-AI UX/UI 👩‍💻

VIBEFLOW convierte tus prompts en aplicaciones web full-stack (las que abarcan tanto el frontend como el backend) mediante flujos visuales similares a n8n, la herramienta de automatización sin código para conectar apps y servicios, que puedes ver y editar directamente.

IA-AI TOOLS 🛠️

GEMINI CO-DRAWING. CON UN 6 Y UN 4, AQUÍ TIENES TU RETRATO Google ha presentado Co-drawing, una aplicación experimental incluida en su plataforma AI Studio. Co-drawing permite a varias personas dibujar y crear imágenes juntas en tiempo real, integrando la inteligencia artificial generativa de la familia Gemini. Esta app destaca por facilitar la creatividad grupal y el prototipado rápido, ayudando a transformar simples ideas en ilustraciones inteligentes de manera colaborativa.

CO-DRAWING EN ACCIÓN

Pero si quieres ver una herramienta curiosa, dale una hojeada a Draw a Fish 🐠. Dibuja un pez y envíalo a nadar. X

IA-AI ADOBE A

NANO BANANA EN FIREFLY Y ADOBE EXPRESS Adobe ha incorporado Gemini 2.5 Flash Image a Firefly y Adobe Express, mejorando la generación de imágenes a partir de texto y facilitando todo el proceso creativo, desde crear gráficos estilizados hasta animarlos, redimensionarlos, añadir textos y publicarlos. Este modelo de Google promete mayor consistencia, conocimiento contextual y rendimiento frente a los modelos internos de Firefly, y se suma a otros modelos de socios como OpenAI, Runway o Ideogram, ofreciendo más flexibilidad a los usuarios. Sus aplicaciones van desde modificar recursos de campañas para marketing hasta prototipar productos para diseño.

IA-AI GOOGLE G

GOOGLE TRANSLATE Google ha incorporado nuevas funciones experimentales con IA en Google Translate para mejorar el aprendizaje y la comunicación en tiempo real. La app estrena un modo de práctica de idiomas que adapta ejercicios de escucha y conversación al nivel y objetivos del usuario, en un movimiento que la enfrenta directamente a Duolingo. Disponible en beta para Android e iOS, arranca con inglés, español, francés y portugués. Además, Translate añade traducción en vivo más natural en más de 70 idiomas, capaz de reconocer pausas, acentos e intonaciones incluso en entornos ruidosos. Estas mejoras, activas de momento en EE.UU., India y México, se apoyan en los modelos Gemini de Google, que refuerzan la calidad y velocidad de traducción en un servicio usado cada día para traducir alrededor de un billón de palabras.

MUSEO HARLEY-DAVIDSON Nunca está de más pasarse por Google Labs. Entre otras muchas cosas ahora mismo puedes explorar las fotografías de archivo de la colección del Museo Harley-Davidson que han cobrado vida con la ayuda de Veo y Gemini de Google Arts & Culture, en una página con un planteamiento visual y de navegación muy original.

IA-AI META ♾️

META SE ALÍA CON MIDJOURNEY para potenciar la estética en sus modelos de IA
Meta ha anunciado una colaboración con Midjourney para integrar su reconocida estética en futuros modelos y productos de inteligencia artificial. La alianza, destacada por Alexandr Wang, director de IA de Meta, busca reforzar herramientas como Imagine, Movie Gen y Dino V3. Por su parte, David Holz recalcó que Midjourney seguirá siendo un laboratorio independiente, sin inversores externos y respaldado por su comunidad. Tras el reciente lanzamiento de su primer modelo de vídeo generativo, Midjourney aportará a Meta un sello visual único y difícil de replicar, en un movimiento que marca un giro hacia colaboraciones externas en la estrategia de IA de la compañía. X

ARTISTA @_CVIAI

PERFIL DEL ARTISTA

VÍDEOS

IA-AI ROBOTICS 🤖

ESCALERAS, ¡ya las suben!

MANOS ROBÓTICAS evolucionan.

IA-AI INTERESTING NEWS 🗞️

LISTA TIME100 AI 2025 La revista TIME publicó la lista TIME100 AI 2025, destacando a las 100 personas más influyentes y decisivas en el mundo de la inteligencia artificial, incluyendo directores ejecutivos, investigadores, artistas y líderes de opinión. Solo 16 personas repiten respecto a ediciones anteriores, dato que refleja la rápida evolución del sector.

TOP 100 GENAI CONSUMER APPS Andreessen Horowitz publicó la quinta edición de su lista ‘Top 100 GenAI Consumer Apps’, que muestra a ChatGPT como líder absoluto, con Gemini en segundo lugar alcanzando alrededor del 12% de su tráfico web. Google suma además AI Studio en el top 10, NotebookLM en el puesto 13 y Labs en el 39. Grok se consolida en el cuarto lugar en web y el 23 en móvil, impulsado por la llegada de Grok 4 y sus avatares de IA. En el terreno móvil, 22 de las 50 apps más destacadas fueron desarrolladas en China, aunque solo tres tienen su principal base de usuarios en ese país. El fenómeno del ‘vibe coding’ también gana fuerza: Lovable debutó en el puesto 22, Replit y Cursor entraron en la lista, y Bolt quedó en la Brink List. Si entras, miras los listados y conoces la mayoría, lo estás haciendo bien.

LAS NUEVAS ALL STARS

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.💃🕺🏻🙏 ¿Nos ayudas? Comparte IA-AI Newsletter con quien creas que le puede interesar.🤓

IA-AI Newsletter Team

FOTOGRAMA DEL 👉 VIDEOLAB DE LA SEMANA 👈 GENERADO CON VEO 3

NUESTROS PATROCINADORES

Utiliza el chat de nuestro cuaderno NotebookLM para encontrar cualquier tema tratado durante 2025 en nuestros boletines

Si quieres leer boletines o informes anteriores los puedes encontrar aquí

Definiciones de términos relacionados con la IA-AI en Diccionario IA-AI (A-K) / (L-Z)

¿Quieres patrocinarnos? Ponte en contacto: [email protected]

Seguir leyendo

No posts found