✨IA-AI W51/2025

Inteligencia Artificial - Artificial Intelligence

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI LANGUAGE MODELS & AGENTS 🧠

APLICACIONES EN CHATGPT Como vimos la semana pasada con las apps de Adobe, OpenAI ha comenzado a aceptar aplicaciones de terceros para su uso directo dentro de ChatGPT, que, una vez aprobadas, aparecen en un nuevo App Directory / Aplicaciones accesible desde la barra lateral o desde chatgpt.com/apps, y pueden activarse durante las conversaciones. Todas las apps pasarán por un proceso de revisión antes de publicarse e irán desplegándose e integrándose. Este movimiento transforma a ChatGPT en una auténtica plataforma de aplicaciones, más allá de un simple chatbot, ampliando su ecosistema para desarrolladores y usuarios, aunque también plantea interrogantes sobre la gestión de datos y el papel de OpenAI como procesador de la información intercambiada a través de estas apps. VENTUREBEAT

CHATGPT CON NUEVO MODELO DE IMAGEN OpenAI ha lanzado GPT Image 1.5, una nueva versión de su modelo de generación de imágenes que mejora de forma clara la edición precisa, la fidelidad al encargo y la velocidad de trabajo. El modelo permite añadir, eliminar, combinar o modificar elementos sin alterar la esencia de la imagen original, mantiene correctamente la composición y la apariencia de personas, y por fin renderiza texto pequeño y denso con buena legibilidad, como titulares o maquetaciones tipo prensa. Además, sigue instrucciones complejas con exactitud —por ejemplo, generar cuadrículas reales con múltiples objetos bien colocados—, aplica transformaciones creativas como estilos cinematográficos o campañas publicitarias sin perder detalles clave y acelera el proceso hasta cuatro veces respecto a la versión anterior, facilitando la iteración rápida sin tiempos de espera. GUIDES

OpenAI acompaña el modelo con una nueva interfaz de Imágenes integrada en la barra lateral de ChatGPT, que incluye filtros predefinidos, prompts en tendencia y cargas puntuales de likeness, facilitando la creación y la iteración visual sin fricción, especialmente para diseñadores y creadores de contenido.

En cuanto al rendimiento, los benchmarks independientes refuerzan su posición. Con datos del 17/12/25, Image 1.5 lidera el ranking de text-to-image de Artificial Analysis y encabeza también LM Arena en edición de imagen. La combinación de mayor resolución, velocidad de trabajo, control preciso y resultados consistentes lo convierten en una herramienta muy sólida para flujos profesionales reales de diseño, comunicación y creatividad visual.

Credit images: OpenAI

GEMINI 3 FLASH Google reordena su tablero de IA con el lanzamiento global de Gemini 3 Flash y lo ha convertido en su nuevo modelo predeterminado y gratuito, una decisión que redefine su estrategia. Para entender la jugada, es clave distinguir las piezas: mientras Gemini 3 Pro se mantiene como el "hermano mayor" diseñado para el razonamiento profundo y complejo (donde "pensar más" justifica ese segundo extra de latencia), Flash irrumpe sacrificando muy poco de esa inteligencia para ganar velocidad extrema y escalabilidad.

Con este movimiento, Google lleva la "inteligencia de frontera" al uso masivo. Gemini 3 Flash mantiene la base multimodal y lógica de la versión 3, pero con un coste tan bajo y una respuesta tan rápida que lo hacen ideal para el día a día, flujos de agentes autónomos y la búsqueda con IA. Ya disponible en todo el ecosistema de Google, el mensaje es contundente: la potencia bruta ya no está reñida con la velocidad. Nos acercamos a una era de inteligencia tan barata y accesible que cambia nuestra forma de trabajar, transformando nuestro rol de "ejecutores" a directores capaces de guiar y evaluar a estos veloces asistentes.

Credit Image: Google

NOTEBOOKLM introduce Data Tables, que permiten organizar información dispersa en tablas estructuradas y listas para exportar a Google Sheets. Se pueden usar para transformar transcripciones de reuniones en listas de tareas categorizadas, comparar competidores por precios y estrategias, resumir resultados de ensayos clínicos, crear tablas de estudio de eventos históricos o planificar viajes comparando destinos y costes. Esta función está ya disponible para usuarios Pro y Ultra, y próximamente para todos los usuarios.

Credit Image: Google

MISTRAL HA LANZADO OCR 3, un modelo de lectura de documentos que convierte notas manuscritas, formularios escaneados y tablas en texto limpio y estructurado, y que afirma situarse como líder en los principales benchmarks de OCR. La herramienta está orientada a la extracción fiable de texto e imágenes desde documentos complejos, reforzando la posición de Mistral en modelos especializados para tareas documentales.

Credit image: Mistral AI

IA-AI VIBE-CODING 🧠💻

OPAL EN GEMINI Google está integrando Opal, su herramienta de vibe-coding para crear mini aplicaciones con IA, directamente en la versión web de Gemini, donde pasa a estar disponible desde el gestor de Gems. Los Gems son versiones personalizadas de Gemini orientadas a tareas concretas, como aprendizaje, ideación, orientación profesional, programación o edición. Con Opal, los usuarios pueden describir en lenguaje natural la app que quieren crear y el sistema utiliza distintos modelos de Gemini para generarla, ofreciendo además un editor visual que convierte los prompts en una secuencia de pasos editable, sin necesidad de escribir código. Para configuraciones más avanzadas, se puede acceder al editor avanzado en opal.google.com, y las mini apps creadas pueden reutilizarse. TECHCRUNCH

IA-AI IMAGE 🎞️

BLACK FOREST LABS LANZÓ FLUX.2 [MAX], el nuevo modelo de imagen de gama alta de la startup, que incorpora capacidades de edición mejoradas y la posibilidad de crear imágenes a partir de datos web en tiempo real.

CON QWEN LLEGAN LAS CAPAS Qwen-Image-Layered ya está disponible como modelo totalmente open source y permite la descomposición nativa de imágenes en capas editables, al estilo de Photoshop. Genera capas RGBA, (A de Alpha), físicamente separadas y realmente manipulables, con una estructura controlada por prompt que permite definir entre 3 y 10 capas, desde composiciones generales hasta detalles finos. Además, admite una descomposición infinita, creando capas dentro de capas a cualquier nivel de profundidad, lo que lo convierte en una herramienta especialmente relevante para flujos de trabajo creativos, retoque avanzado y experimentación con edición de imágenes asistida por IA. x

Credit image: QWEN

IA-AI COMFYUI c

BIBLIOTECA DE PLANTILLAS Entre las actualizaciones de esta semana destacan las mejoras en sus bibliotecas de plantillas, diseñadas para ideas creativas y tareas reales, no solo experimentos de modelos. Estos flujos de trabajo de código abierto funcionan en Comfy Cloud y ComfyUI local.

Credit images: Comfy Org

IA-AI VIDEO 🎬

RAY3 MODIFY Luma ha lanzado Ray3 Modify, su nuevo flujo de vídeo‑a‑vídeo dentro de Dream Machine, que da un paso importante hacia flujos híbridos de rodaje real + IA más controlables en producción. Ray3 Modify permite partir de un vídeo existente y transformarlo con controles de fotogramas inicial y final, preservando el movimiento, el timing y buena parte de la emoción de la actuación original, mientras se reimaginan el entorno, el vestuario o el estilo visual. Su gran novedad es la integración de referencias de personaje y controles de continuidad, que permiten mantener la identidad y el aspecto de un personaje a lo largo de un clip y de distintos planos, algo clave para campañas y series de piezas. El modelo está orientado a equipos que necesitan más fiabilidad y consistencia a escala, y ya está disponible dentro de Dream Machine para suscriptores de Luma.

WAN 2.6 es el nuevo modelo multimodal nativo de Alibaba para generación de imagen y video, capaz de crear hasta 15 segundos de video en 1080p con múltiples planos conectados, continuidad visual, audio sincronizado y movimientos labiales coherentes, a partir de texto, imágenes o un video de referencia. A diferencia de otros modelos, trata el video como una secuencia de escenas, lo que le permite mantener consistencia de personajes, movimiento y sonido a lo largo del tiempo, además de integrar diálogo, ambientación y ritmo de cámara de forma conjunta. Incluye funciones como texto a video, imagen a video, guía por video de referencia, generación multi-plano y audio integrado.

ADOBE Y RUNWAY han anunciado una colaboración plurianual para integrar la tecnología de vídeo generativo de Runway directamente en el ecosistema creativo de Adobe. El acuerdo permitirá a los usuarios de Firefly generar vídeo a partir de texto con el modelo Gen-4.5 de Runway y continuar el trabajo de edición de forma nativa en Premiere Pro y After Effects. Adobe ofrecerá acceso anticipado a los modelos más avanzados de Runway, empezando por Gen-4.5, con el objetivo de desarrollar nuevas capacidades de IA pensadas específicamente para flujos de trabajo de vídeo profesionales y acelerar la adopción de la generación de vídeo con IA en entornos creativos reales.

FIREFLY VIDEO MODEL Adobe está actualizando Firefly con un nuevo editor de vídeo que permite realizar ediciones precisas mediante prompts de texto, sin necesidad de regenerar todo el clip, incorporando además una vista de línea de tiempo para ajustar fotogramas, sonido y otros elementos. La actualización añade modelos de terceros como FLUX.2 de Black Forest Labs para imágenes y Astra de Topaz Labs para escalar vídeo hasta 1080p y 4K, junto a mejoras como edición de color, elementos y ángulos de cámara, y funciones avanzadas basadas tanto en el modelo Aleph de Runway como en el propio Firefly Video. Tras una beta privada iniciada en octubre, el nuevo editor se despliega ahora para todos los usuarios. TECHCRUNCH

IA-AI AUDIO/MUSIC 🎶

META HA PRESENTADO SAM AUDIO como un nuevo modelo de segmentación de sonido que extiende la filosofía de “Segment Anything” al dominio del audio.  Es un modelo multimodal pensado para aislar sonidos concretos de mezclas complejas usando instrucciones muy intuitivas para creadores.

Credit image: Meta

IA-AI TOOLS 🛠️

HALFTONES El design engineer Daniel Petho, ha creado y perfeccionado un emulador CMYK de halftones o tramas de semitono, apto para imágenes y vídeos. Mira cómo funciona en x y/o pruébalo libremente aquí.

Credit image: IA-AI Newsletter

IA-AI GOOGLE / GOOGLE LABS G🧪

40 HELPFUL AI TIPS FROM 2025 Este artículo destaca 40 consejos útiles sobre IA de 2025, mostrando nuevas funciones y capacidades en diversos productos de Google. Estos consejos abarcan una amplia gama de áreas, como la investigación, el aprendizaje, la planificación de viajes, la creatividad y la productividad.

IA-AI ROBOTS & BEYOND 🤖

ROBOTS HUMANOIDES: INVERSIÓN Y DUDAS Varias fuentes destacan la creciente inversión y los retos de los robots humanoides. Según NYTimes, China ha destinado más de 5.000 millones de dólares en 2025 a startups de robótica humanoide, impulsando la industria aunque muchos robots aún tienen utilidad limitada y enfrentan dificultades en entornos impredecibles. Por otro lado, también en NYTimes, Rodney Brooks, pionero de la robótica moderna (Roomba…), advierte desde Silicon Valley que la apuesta por robots humanoides generalistas probablemente fracasará, ya que la tecnología actual no puede garantizar destreza, equilibrio ni juicio humano, y sugiere que la obsesión por la forma humanoide desvía recursos de robots más prácticos y especializados.

IA-AI INTERESTING NEWS 🗞️

SLOP, PALABRITA DEL AÑO Merriam-Webster, la editorial estadounidense responsable de algunos de los diccionarios de inglés más usados y una autoridad histórica en el estudio del lenguaje, eligió slop como palabra del año, definiéndola como contenido digital de baja calidad generado masivamente por inteligencia artificial. Con esta elección señalan el hartazgo social ante la avalancha de imágenes, vídeos y textos mediocres que inundan las pantallas y subrayan que, para mucha gente, el impacto más visible de la IA en 2025 no son los grandes modelos o avances técnicos, sino el ruido constante de contenido automatizado producido a escala.

Nuestra pequeña contribución ;)

SABER DIRIGIR LA IA COTIZA AL ALZA Lejos de devaluar el trabajo humano, una investigación de Vanguard señala que la accesibilidad a la inteligencia artificial está impulsando los salarios, registrando un aumento del 3,8 % en los roles expuestos a esta tecnología frente al 0,7 % en el resto durante los últimos dos años: esto confirma que el valor futuro residirá en la capacidad de auditar y dirigir estos motores más que en la mera ejecución bruta.

PREDICCIONES Y/O CONCLUSIONES Según datos recientes de la Universidad de Stanford, el entusiasmo por la IA podría dar paso a una fase de evaluación crítica hacia 2026, al evidenciarse más costes que beneficios reales. Los investigadores señalan la desaparición de empleos de nivel inicial, una caída en la transparencia de las grandes tecnológicas y riesgos sociales mal gestionados, como el fracaso de algunos bots de salud mental. A esto se suma la preocupación por el impacto ambiental no declarado y la reacción de algunos países, que impulsan la “soberanía de la IA” para proteger sus datos. En conjunto, la IA empieza a percibirse menos como una promesa mágica y más como una tecnología útil pero limitada, cuya expansión exige regulación, normas éticas claras y cooperación entre gobiernos y empresas.

BURBUJA Geoffrey Hinton, el científico informático ampliamente conocido como el "Padrino de la IA”, advierte que se avecina una burbuja de IA no porque la tecnología vaya a fallar, sino porque las empresas están subestimando drásticamente el caos social que desencadenará el desplazamiento laboral impulsado por la IA. PERPLEXITY

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.💃🕺🏻🙏 ¿Nos ayudas? Comparte IA-AI Newsletter con quien creas que le puede interesar.🤓

IA-AI Newsletter Team

FOTOGRAMA CREADO CON NANO BANANA PRO DEL 👉 VIDEOLAB DE LA SEMANA 👈 CREADO CON KLING

NUESTROS PATROCINADORES

Utiliza el chat de nuestro cuaderno NotebookLM para encontrar cualquier tema tratado durante 2025 en nuestros boletines. Si quieres leer boletines o informes anteriores los puedes encontrar aquí. Definiciones de términos relacionados con la IA-AI en Diccionario IA-AI (A-K) / (L-Z). ¿Quieres patrocinarnos? Ponte en contacto: [email protected]