✨IA-AI W48/2025

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI LANGUAGE MODELS & AGENTS 🧠

ASISTENTE DE COMPRAS EN CHATGPT OpenAI presenta Shopping Research, una nueva función de ChatGPT que investiga productos por ti, generando guías de compra personalizadas basadas en tus preferencias, tus aclaraciones y tu memoria activada. Permite describir lo que buscas, formula preguntas útiles, consulta información actualizada de fuentes fiables y devuelve comparativas detalladas con precios, disponibilidad, diferencias y alternativas. Funciona especialmente bien en categorías complejas como electrónica, belleza, hogar y deporte, y está disponible en móvil y web para usuarios iniciados sesión en todos los planes, con uso casi ilimitado durante las fiestas. La herramienta integra un modelo GPT-5 mini entrenado específicamente para tareas de compra, mantiene la privacidad de las conversaciones y solo usa resultados orgánicos, aunque puede cometer —y comete— errores en detalles como precios o stock.

Credit images: OpenAI

CON GEMINI TAMBIÉN PODRÁS IR DE TIENDAS Google está implementando nuevas funciones de compra con IA que permiten buscar productos con descripciones naturales, recibir comparaciones e información actualizada y verificar stock en tiendas cercanas. Todo se basa en el Shopping Graph, la gran base de datos de Google que reúne precios, disponibilidad y reseñas de más de 50.000 millones de productos. También incorpora compras automáticas cuando un artículo baja al precio indicado. Estas novedades empiezan a desplegarse en EE.UU. ^{_{BLOG GOOGLE}}

ANTHROPIC HA LANZADO CLAUDE OPUS 4.5, su nuevo modelo insignia que supera en muchos benchmarks a Gemini 3 y GPT-5.1, especialmente en tareas de programación y agentes. Es el primero en superar el 80 por ciento en SWE-Bench Verified, rinde mejor en uso de herramientas y razonamiento, y es más difícil de vulnerar. Introduce mejoras de eficiencia con un nuevo parámetro de esfuerzo, permite conversaciones ilimitadas y reduce su precio un 66 por ciento respecto a Opus 4.1. También añade Claude Code en escritorio y más integraciones. Aunque destaque en programación es adecuado para todo tipo de usuarios. ^_X

HUNYUANOCR de Tencent es un modelo open-source SOTA de visión-lenguaje diseñado para OCR avanzado y comprensión documental, capaz de detectar, reconocer, estructurar y traducir texto directamente desde imágenes y vídeo en un único pipeline. Interpreta documentos impresos, manuscritos o escenas complejas, organiza el contenido en el orden correcto de lectura, entiende tablas y fórmulas, y permite extraer información estructurada como campos de facturas o formularios. Además, integra traducción automática en hasta 14 idiomas manteniendo el formato visual original, lo que lo hace adecuado para digitalización documental, reconocimiento en tiempo real y automatización en entornos empresariales.

QWEN3 MAX Alibaba ha logrado un fuerte impulso con el relanzamiento de su app Qwen, que superó los 10 millones de descargas en su primera semana y se situó entre las aplicaciones de IA de mayor crecimiento en China. El éxito combina la potencia de la nueva familia de modelos Qwen3 con funciones de asistente generalista, generación de texto e imagen, cámara, voz, automatización de tareas y herramientas para productividad, lo que marca un giro de Alibaba hacia la IA de consumo masivo. Las acciones de la compañía subieron más de un 5 % tras el anuncio, y varios analistas ven en Qwen el primer producto chino con capacidad real para competir con ChatGPT en adopción diaria, en un mercado donde las alternativas occidentales no operan y la demanda de asistentes locales es creciente.

IA-AI IMAGE 🎞️

FLUX 2 Black Forest Labs ha lanzado Flux.2, una nueva familia de modelos de imagen que destaca especialmente por sus capacidades multirreferencia, permitiendo a los creativos mantener la consistencia de personajes y estilos utilizando hasta diez imágenes de entrada. Esta actualización combina un mejor manejo de texto e imagen con relaciones espaciales avanzadas para lograr iluminación y físicas más realistas, alcanzando resoluciones de hasta 4MP y mejorando notablemente la integración de tipografía para infografías y maquetas de interfaz. Con versiones que van desde el acceso API hasta opciones de peso abierto, Flux.2 se presenta como una alternativa más económica y accesible que sus competidores directos, ideal para flujos de trabajo de producción complejos. Pronto en los mejores cines y lo puedes probar gratis en Flux Playground. La familia FLUX.2 completa es la siguiente:

FLUX.2 [pro] ofrece la máxima calidad de imagen con velocidad y coste optimizados.
FLUX.2 [flex] añade control total sobre parámetros como pasos y guidance, ideal para texto y detalles finos.
FLUX.2 [dev] es un modelo abierto de 32B, hoy el más potente en su categoría para generación y edición, disponible en Hugging Face y usable en GPUs de consumo gracias a implementaciones optimizadas.
FLUX.2 [klein], aún por lanzar, será un modelo Apache 2.0 destilado y más ligero, pero con muchas de las capacidades del modelo base.
FLUX.2-VAE actúa como el codificador latente común para toda la familia, optimizando la relación entre calidad, compresión y aprendizaje.

Generación de diseños con pasos variables: FLUX.2 [flex] proporciona un parámetro de "pasos", que compensa la precisión tipográfica con la latencia. De izquierda a derecha: 20 pasos, 50 pasos. Credit images: Black Forest Labs.

NANO BANANA PRO. CREAR MATERIAL DIDÁCTICO EN SEGUNDOS. Ve a Gemini —o donde puedas usar Nano Banana Pro—, activa el modo imagen con razonamiento 3 Pro y escríbele prompts de este estilo adaptados a lo que necesites:

FICHAS PARA APRENDER IDIOMAS “Crea una imagen de una escena detallada de una calle de una ciudad y etiqueta las palabras de todos los objetos del siguiente modo: primera línea: palabra en inglés; segunda línea: símbolo fonético (formato AFI del Alfabeto Fonético Internacional); tercera línea: traducción al castellano. Formato apaisado 16:9”

ILUSTRACIONES BOTÁNICAS “Ilustración anatómica vintage de la planta de menta completa en estilo botánico victoriano (raíces, tallo, hojas y flor), centrado sobre fondo de lámina científica envejecida. Incluir 4–5 ampliaciones anatómicas con etiquetas manuscritas en español (minúscula con primera letra capitalizada). Composición horizontal 16:9 con “Menta” como título centrado arriba.”

NANO BANANA PRO Guía visual de prompting recomendada.

IA-AI CREATIVE SUITES 🏨🎞️🎬

FAL Resumen de los últimos modelos incorporados:

FLUX.2 (Black Forest Labs) Nuevo modelo SOTA en generación de escenas consistentes, personajes hiperrealistas y control preciso del color.

FLUX.2 [dev]: Rápido, flexible, orientado a experimentación; soporte completo de LoRA; desde 0,012 $/MP. Compatible con entrenamiento LORA.
FLUX.2 [pro]: Máxima fidelidad y coherencia; pensado para producción; desde 0,03 $/MP.
FLUX.2 [flex]: Control total con pasos ajustables y guidance; tipografía y texto mejorados; desde 0,06 $/MP.

Google DeepMind – Nano Banana Pro Edición y generación comercial de alto nivel. Ideal para fotografía de producto, anuncios, composiciones con hasta 10 referencias y salida hasta 4K. Precio: 0,15 $/imagen.

Bria – FIBO Modelo de edición estructurada con control vía JSON para resultados limpios y reproducibles. Precio: 0,04 $/imagen.

ImagineArt 1.5 Generación estilizada y realista para pósters, anuncios y concept art. Precio: 0,03 $/imagen.

SAM 3 Modelo base unificado para segmentación en imágenes y vídeo. Detección y seguimiento con texto, puntos, cajas o máscaras. Precio: 0,005 $/request.

Credit images: fal

IA-AI GOOGLE LABS G🧪

GENTYPE Crea, perfecciona y descarga alfabetos únicos generados por IA.

Credit image: GoogleLabs

IA-AI FEATURED TALENT AND VIDEOS 🎨

MASAKI MIZUNO El director y artista de VFX Masaki (Khaki, VFX Direction & Design Company) presentó un corto experimental creado con un pipeline híbrido donde el CG controla herramientas de IA modificadas para generar alucinaciones visuales a partir de metraje real. Explora el “ruido” como estética contemporánea, aplicando distorsiones urbanas mediante animaciones de vértices creadas en Blender y procesadas en ComfyUI con un add-on propio, usando el modelo Wan 2.1 ATI para deformar imágenes en movimiento tras reconstruir la cámara en 3D y rotoscopiar manualmente a los personajes. También entrenó una LoRA para sustituir cuerpos completos del bailarín Toyotaka, combinó captura de movimiento con MOVE AI y reemplazo de personajes en ComfyUI, e incorporó un experimento de relighting con la herramienta open source de NVIDIA cosmos-transfer1-diffusion-renderer, que anticipa un futuro donde cualquier vídeo podrá ser re-iluminado por IA. Vale la pena verlo en el siguiente enlace ^_STASHMEDIA

MASAKI MIZUNO IMPULSA LA IA CON CG EN EL CORTOMETRAJE “WAVE” (1′57)

IA-AI KEY CONCEPTS 🤓

LOS MODELOS FRONTERA: MÁS ALLÁ DEL ESTADO DEL ARTE

Cuando las grandes compañías de IA anuncian un nuevo hito, hablan de “State of the Art” (SOTA) y “Modelo Frontera de Referencia” (Benchmark-Topping Frontier Model). No son exactamente lo mismo, pero van de la mano: el SOTA es quien tiene las mejores notas ahora mismo; el Modelo Frontera de Referencia es el que arrasa en casi todos los exámenes y abre capacidades que antes eran imposibles.

La palabra “frontera” significa literalmente que el modelo está haciendo cosas que hace un año eran ciencia ficción. Por ejemplo: razonar paso a paso durante minutos, entender imágenes + texto + audio a la vez, recordar conversaciones de cientos de páginas o inventar código creativo que realmente funciona. Estas habilidades no se programan; simplemente “emergen” cuando el modelo es gigantesco y se entrena con cantidades brutales de datos.

Un Modelo Frontera es aquel que tiene estas capacidades nuevas y, además, lidera casi todos los rankings (eso es el “Benchmark-Topping”). Ejemplos claros hoy (noviembre 2025): GPT-5.1 de OpenAI, Gemini 3 Ultra de Google y Claude 4.5 Opus de Anthropic. Son los únicos que combinan las dos cosas: estar en la cima absoluta de los benchmarks (SOTA) y poder hacer tareas creativas o técnicas que los demás ni se acercan.

La parte “de Referencia” es sencilla: el modelo tiene que ser el número 1 o co-líder en la mayoría de los exámenes oficiales. Eso lo convierte automáticamente en SOTA. La diferencia clave: ser SOTA = ganar en algunos tests; ser Modelo Frontera de Referencia = ganar casi todos a la vez y tener esas capacidades nuevas.

En la práctica, hoy solo 3–4 modelos lo consiguen. Para ti como creador eso significa resultados más buenos, más rápidos y con menos errores de cualquier tipo. Estos modelos son el techo actual de la IA. Usarlos es la forma más rápida de llevar tus ideas creativas al siguiente nivel. Mantente atento, porque este techo sube cada pocos meses.

LE PEDIMOS AL MODELO FRONTERA DE REFERENCIA GEMINI 3 QUE NOS ILUSTRARA EL IA-AI KEY CONCEPT

IA-AI ROBOTS & BEYOND 🤖

ESTE ROBOT LO QUEREMOS TOD@S El robot doméstico aprendió a lavar los platos y demás tareas siguiendo 10 millones de rutinas familiares reales. 🧵 (X)
JUGANDO AL BALONCESTO Ha de mejorar, pero no por esto nos deja de sorprender.

IA-AI INTERESTING NEWS 🗞️

MISIÓN GÉNESIS Estados Unidos ha lanzado “Misión Génesis”, un megaproyecto de la administración Trump que pretende convertir la IA en el nuevo motor de la ciencia y la geopolítica: el Departamento de Energía coordinará una plataforma nacional de modelos fundacionales científicos y supercomputación para exprimir los gigantescos repositorios de datos públicos en biotecnología, energía, clima, materiales y semiconductores, con la promesa de comprimir años de investigación en días y reforzar la ventaja estratégica de EE. UU. frente a China, pero también levantando críticas por el posible efecto “Proyecto Manhattan” de una carrera acelerada, centralizada y poco transparente en IA avanzada. ^_YAHOO

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.💃🕺🏻🙏 ¿Nos ayudas? Comparte IA-AI Newsletter con quien creas que le puede interesar.🤓

IA-AI Newsletter Team

🎞️ IMAGEN: NANO BANANA PRO EN GEMINI APP. 🎬🔈VÍDEO: KLING AI 👉 VIDEOLAB DE LA SEMANA 👈

NUESTROS PATROCINADORES

ESPECIALISTAS APPLE

Utiliza el chat de nuestro cuaderno NotebookLM para encontrar cualquier tema tratado durante 2025 en nuestros boletines. Si quieres leer boletines o informes anteriores los puedes encontrar aquí. Definiciones de términos relacionados con la IA-AI en Diccionario IA-AI (A-K) / (L-Z). ¿Quieres patrocinarnos? Ponte en contacto: [email protected]