✨IA-AI W47/2025

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI LANGUAGE MODELS & AGENTS 🧠

CHATGPT

Incorpora un modo de grabación que permite registrar y resumir reuniones directamente desde la aplicación de escritorio para macOS, una alternativa útil para equipos con restricciones de privacidad o que no pueden usar herramientas como Fireflies u Otter. Solo hay que abrir la app, iniciar sesión con una cuenta de pago y pulsar “Record” durante la reunión. El sistema graba en segundo plano y, al detener la sesión, genera un resumen estructurado con puntos clave, tareas y seguimientos recomendados. Además, es posible interactuar con la transcripción para pedir formatos específicos, extraer riesgos o aclarar dudas. La ventaja principal es que elimina la necesidad de añadir bots externos en cada videollamada. ^_NOOTA.
ChatGPT habilita los chats grupales para hasta 20 participantes en todos los planes, permitiendo colaborar en un hilo compartido con privacidad preservada; cada vez que se añade gente se genera una nueva conversación y se puede mencionar al modelo para intervenir cuando sea necesario, reforzando su papel como plataforma colaborativa.

GROK 4.1 es la nueva versión del modelo de xAI, con mejoras en creatividad, empatía y tono conversacional, y con el mayor nivel de inteligencia emocional entre los sistemas evaluados; reduce las alucinaciones del 12 % al 4 %, disminuye un 66 % los errores fácticos, y en pruebas de usuarios en LM Arena, con su nombre en clave “quasarflux”, se situó como el modelo preferido, destacando también en escritura creativa, donde queda justo por detrás de GPT 5.1.

GEMINI 3, LA ERA DE GEMINI Google presenta Gemini 3 como el modelo más inteligente que te ayuda a convertir cualquier idea en realidad. Y es así. Combina comprensión multimodal, razonamiento profundo y capacidad de interpretar contexto, matices e intención con menor esfuerzo en el prompting, pasando de procesar información a "leer el ambiente". Está disponible en el buscador, la app oficial, AI Studio y la nueva plataforma Google Antigravity, y ofrece Gemini 3 Pro en vista previa para asistir en aprendizaje y creación, así como el modo Gemini 3 Deep Think, un razonamiento mejorado que se desplegará próximamente para suscriptores Ultra tras la fase de pruebas de seguridad, potenciando la creatividad y la interactividad en el trabajo con IA. Lo podríamos calificar como una revolución visual. Pero empecemos viendo el siguiente vídeo para ayudar a entender.

Más allá de los números y puntuaciones record, Gemini 3 Pro aporta profundidad y matices a cada interacción, ofreciendo respuestas directas y útiles que sustituyen los clichés por análisis reales. Se comporta como un colaborador intelectual capaz de ofrecer nuevas formas de comprender información y expresarse, desde explicar conceptos científicos complejos mediante visualizaciones generadas por código hasta participar en procesos creativos y de ideación. Necesitamos otro vídeo para entender esto. En el que sigue se muestra como Gemini 3 puede codificar una visualización del flujo de plasma en un tokamak (reactor nuclear) y escribir un poema que capture la física de la fusión. 🤓🤯

Gemini 3 potencia el aprendizaje al integrar razonamiento avanzado, visión, comprensión espacial, capacidad multilingüe y un contexto de hasta un millón de tokens, permitiendo asimilar información en texto, imagen, vídeo, audio o código. Puede traducir recetas manuscritas para crear un recetario familiar, transformar artículos académicos o vídeos largos en materiales interactivos como tarjetas o visualizaciones, e incluso analizar grabaciones deportivas para señalar áreas de mejora y generar planes de entrenamiento personalizados.

AI Mode en Search incorpora Gemini 3 para generar, en tiempo real, interfaces visuales inmersivas, herramientas interactivas y simulaciones basadas directamente en cada consulta, lo que permite comprender mejor la información web mediante experiencias generativas mucho más ricas y dinámicas.

Con Gemini 3, puedes crear interfaces web y aplicaciones más ricas e interactivas.

Gemini 3 combina mejor razonamiento y uso de herramientas para ejecutar tareas complejas de principio a fin bajo tu supervisión, como reservar servicios u organizar el correo; estas capacidades ya pueden probarse en la app mediante Gemini Agent para suscriptores de Google AI Ultra y se ampliarán a más productos.

GOOGLE ANTIGRAVITY es una nueva plataforma de desarrollo centrada en agentes que, usando el razonamiento y la capacidad de herramientas de Gemini 3, permite que los agentes actúen como socios autónomos capaces de planificar y ejecutar tareas completas dentro del editor, terminal y navegador, incorporando además el modelo Gemini 2.5 Computer Use para control del navegador y el modelo de edición de imagen Nano Banana.

Credit Image: Google

IA-AI IMAGE 🎞️ ESPECIAL NANO BANANA PRO 🙌

LLEGA NANO BANANA PRO (GEMINI 3 PRO IMAGE) UNA LOCURA

PROMPT UTILIZADO: “Elimina la palabra Pro y escribe con el mismo estilo de plátanos el texto “IA-AI Newsletter” pero ocupando el 90% de la anchura de la imagen y manteniendo el fondo de colores actual.” 🔼 Image Credit: Google

INFOGRAFÍAS Nano Banana Pro utiliza el razonamiento avanzado de Gemini 3 para materializar cualquier concepto, permitiendo transformar notas manuscritas en diagramas, diseñar prototipos o generar infografías educativas enriquecidas con contexto; además, su conexión con la base de conocimientos de Google Search facilita la visualización de datos en tiempo real, como información meteorológica o deportiva. Ejemplos:

◀️ Infografía paso a paso para preparar té de cardamomo, que demuestra la capacidad de visualizar recetas e información práctica. Prompt: Crea una infografía que muestre cómo preparar té de cardamomo. ▶️ Información meteorológica en tiempo real a través de Search Grounding con petición de crear una infografía estilo pop-art. Image Credits: Google

TEXTO Nano Banana Pro aprovecha la capacidad de Gemini 3 para integrar texto legible y preciso directamente en las imágenes, gestionando desde eslóganes cortos hasta párrafos extensos con un control superior sobre texturas y tipografías: esta mejora facilita la creación de maquetas o carteles complejos e incluye funciones de razonamiento multilingüe para generar, localizar y traducir textos dentro de los propios diseños. Ejemplos:

◀️ Boceto en blanco y negro del storyboard que muestra un plano general, un plano medio, un primer plano y un plano subjetivo para una escena de película. Prompt: Crea un storyboard para esta escena. ▶️ Caligrafía inspirada en el significado, que muestra la capacidad de generar texto expresivo con una amplia variedad de estilos y fuentes. Prompt: Crea 8 logotipos minimalistas, cada uno con una palabra expresiva, y haz que las letras transmitan un mensaje o sonido visualmente para expresar el significado de dicha palabra de forma impactante. Composición: Representación vectorial plana de todos los logotipos en negro sobre un fondo blanco. Image Credits: Google

◀️ Concepto para una campaña de bebidas que muestra la traducción y reproducción precisas de texto en inglés al coreano. Prompt: Traducir todo el texto en inglés de las tres latas amarillas y azules al coreano, manteniendo el resto del texto igual. ▶️ Diseño gráfico con la palabra «TYPOGRAPHY» y una textura retro de serigrafía. Prompt: Diseño vibrante y llamativo de «TYPOGRAPHY» sobre un fondo texturizado color hueso. Las letras son gruesas, robustas y muy compactas, creando un efecto 3D con capas superpuestas de azul brillante y rosa intenso, cada una con un patrón de puntos de semitono, evocando la estética de la tipografía retro. Relación de aspecto 16:9. Image Credits: Google

CONSISTENCIA. QUIÉN DA MÁS?! Nano Banana Pro eleva la fidelidad visual permitiendo fusionar hasta 14 imágenes de referencia y preservar la consistencia de hasta cinco personas distintas en una misma composición (tela!): esta capacidad facilita transformar bocetos en productos o planos en estructuras 3D fotorrealistas, garantizando además la coherencia estética necesaria para mantener la identidad de marca en cualquier proyecto creativo. Ejemplos:

◀️ Mantener la coherencia de hasta 14 elementos, incluidos varios personajes, en una composición compleja. Prompt: Plano medio de los 14 personajes esponjosos sentados muy juntos, lado a lado, en un sofá de tela beige desgastada y en el suelo. Todos miran hacia adelante, viendo un televisor vintage con caja de madera colocado sobre una mesa baja de madera frente al sofá. La habitación está tenuemente iluminada, con luz cálida que entra por una ventana a la izquierda y el resplandor del televisor que ilumina las caras y las texturas esponjosas de las criaturas. El fondo muestra una sala de estar acogedora y ligeramente desordenada, con una alfombra trenzada, una estantería con libros antiguos y elementos rústicos de cocina al fondo. El ambiente general es cálido, acogedor y divertido. ▶️ Crear escenas de estilo de vida combinando múltiples elementos. Prompt: Combina estas imágenes en una sola imagen cinematográfica bien organizada en formato 16:9 y cambia el vestido del maniquí por el vestido de la imagen. Image Credits: Google

CONTROLES CREATIVOS CON CALIDAD DE ESTUDIO Nano Banana Pro incorpora controles creativos avanzados que permiten editar de forma localizada cualquier parte de una imagen, ajustar ángulos de cámara, modificar el enfoque, aplicar gradaciones de color complejas y transformar la iluminación de la escena, como pasar de día a noche o generar un efecto bokeh. Las creaciones pueden exportarse en varios formatos y en resoluciones 2K y 4K, listas tanto para redes sociales como para impresión. Ejemplos:

◀️ Oscurece o ilumina una parte de tu imagen con controles de iluminación para lograr efectos dramáticos específicos. Prompt: Genera una imagen con un intenso efecto de claroscuro. El hombre debe conservar sus rasgos y expresión originales. Introduce una luz dura y direccional que parezca provenir de arriba y ligeramente desde la izquierda, proyectando sombras profundas y definidas sobre el rostro. Solo pequeñas franjas de luz deben iluminar los ojos y los pómulos; el resto de la cara debe quedar en sombra profunda. ▶️ Resalta los detalles de tu composición ajustando la profundidad de campo o el punto focal (por ejemplo, enfocando las flores). Prompt: Enfoca las flores. Image Credits: Google

CÓMO PUEDES PROBARLO HOY En todos lo productos y servicios de Google ya puedes elegir entre el Nano Banana original, pensado para ediciones rápidas y divertidas, o Nano Banana Pro, diseñado para composiciones complejas que requieren máxima calidad y resultados visualmente más sofisticados.

Está llegando globalmente a la app de Gemini al seleccionar “Crear imágenes” con el modelo “Thinking”.
Los usuarios del nivel gratuito tendrán un número limitado de usos, tras lo cual volverán al modelo Nano Banana original.
Los suscriptores de Google AI Plus, Pro y Ultra reciben cuotas más altas.
En el modo de IA de Search, Nano Banana Pro está disponible en EE. UU. para suscriptores de Google AI Pro y Ultra.
En NotebookLM, también está disponible globalmente para suscriptores.
Comienza a llegar a la API de Gemini y Google AI Studio, así como a Google Antigravity para crear maquetas y diseños de UX más complejos.
Empieza a desplegarse para suscriptores de Google AI Ultra en Flow, la herramienta de creación cinematográfica con IA.

Otros recursos: Complete Developer Tutorial for Nano Banana Pro para AIStudio en X

IDENTIFICA SI UNA IMAGEN FUE CREADA POR LA IA DE GOOGLE Google cree que es fundamental saber si una imagen fue creada con IA y estamos completamente de acuerdo. Por este motivo ahora han incorporado en la app de Gemini una función que permite verificar si una imagen fue generada con sus herramientas de IA: basta con subirla y preguntar, gracias al sistema de marcas de agua imperceptibles SynthID que Google incrusta en todos sus contenidos generados y que no hay que confundir con el logotipo de la estrella de cuatro puntas. Más adelante lo ampliarán con la verificación an audio y vídeo. _{^{BLOG GOOGLE}}

IA-AI CREATIVE SUITES 🏨🎞️🎬

ELEVENLABS HA LANZADO IMAGE&VIDEO (BETA), una nueva solución que integra en una única plataforma todo el flujo de creación audiovisual con modelos líderes como Veo, Sora, Kling, Wan, Seedance, Nanobanana, Flux Kontext o Seedream. La herramienta permite generar imágenes y vídeos, usarlos como storyboards o material base, combinarlos en secuencias, aplicar upscaling y añadir lipsync con voces de ElevenLabs; además, los proyectos pueden pasarse a Studio para incorporar locuciones expresivas, música y efectos, gestionar la línea de tiempo y exportar piezas listas para publicación. Pensado para creadores, cineastas, equipos de marketing y educadores, este lanzamiento refuerza la ambición de la compañía de ofrecer un entorno multimodal completo donde visuales y sonido puedan producirse y refinarse de forma integrada. Video Full Tutorial (7′25″)

Credit Image: ElevenLabs

GOOGLE NANO BANANA PRO ya está implementado en la mayoría de las Creative Suites: FreePik, LetzAI, ComfyUI, Leonardo, Adobe (Photoshop y Firefly), Krea…

IA-AI META ♾️

META evaluará a sus empleados según su “impacto impulsado por IA” a partir de 2026, convirtiendo la adopción efectiva de estas herramientas en un factor directo en el rendimiento y las compensaciones. El memo interno de Janelle Gale señala que en 2025 no habrá métricas individuales de uso, aunque sí se reconocerán resultados excepcionales logrados gracias a la IA, tanto a nivel individual como de equipo. Esta política se suma a cambios recientes como permitir IA en entrevistas de código, el juego interno “Level Up” para incentivar su adopción y la introducción del “AI Performance Assistant” para redactar evaluaciones, con soporte de herramientas como Metamate o Gemini. La decisión se alinea con la presión creciente en Big Tech —Microsoft, Google y Amazon ya consideran el uso de IA como obligatorio— y consolida un modelo corporativo “AI-native” donde no integrar estas tecnologías supone quedar atrás profesionalmente. _{^{BUSINESS INSIDER}}

META HA PRESENTADO SAM 3 y SAM 3D, dos nuevos modelos de visión por computador de código abierto que permiten segmentar y reconstruir elementos en 3D mediante descripciones de texto detalladas, superando así las limitaciones de las etiquetas fijas tradicionales. Mientras que SAM 3 perfecciona la identificación de objetos complejos, SAM 3D es capaz de generar escenas y figuras humanas tridimensionales a partir de una única fotografía; ambas herramientas ya pueden probarse gratuitamente en el nuevo Segment Anything Playground y pronto se integrarán en funciones de edición creativa y realidad aumentada de la compañía. ^_X

IA-AI MICROSOFT 🏢

MICROSOFT acaba de presentar en Ignite 2025 Agent 365, el panel de control definitivo para gobernar el caos de agentes IA que inunda las empresas: desde los creados por TI hasta los shadow agents que cualquier empleado monta por su cuenta con herramientas online. Esta nueva plataforma descubre automáticamente todos los agentes en circulación, los registra, aplica controles de acceso basados en riesgo (igual que a los humanos), monitoriza en tiempo real qué datos tocan y cómo se conectan entre sí, y los protege con el mismo nivel enterprise que Defender, Entra y Purview dan a los empleados. Además, Microsoft lanzó ejemplos concretos ya disponibles: un Sales Development Agent autónomo que prospecta, personaliza y hace follow-up 24/7 sin dormir; agentes especializados en Word, Excel y PowerPoint dentro de Copilot Chat que crean documentos completos a partir de simples preguntas; y 12 nuevos agentes de Security Copilot para automatizar triaje de alertas y remediación. Como guinda, Anthropic entra oficialmente en Azure: Claude 4.5 Sonnet, Haiku y Opus ya están disponibles, convirtiendo a Microsoft en el único proveedor cloud que aloja tanto a OpenAI como a Anthropic. En resumen, el mensaje es claro: las empresas ya no pueden permitirse una selva de agentes sin control, y Agent 365 es la herramienta que transforma esa jungla en una fuerza laboral robótica segura, visible y gobernada.

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.💃🕺🏻🙏 ¿Nos ayudas? Comparte IA-AI Newsletter con quien creas que le puede interesar.🤓

IA-AI Newsletter Team

✨IMAGEN OBTENIDA CON NANO BANANA PRO POR FIREFLY. 👉 VIDEOLAB DE LA SEMANA 👈 GENERADO CON VEO 3.1 EN FIREFLY

NUESTROS PATROCINADORES

ESPECIALISTAS APPLE

Utiliza el chat de nuestro cuaderno NotebookLM para encontrar cualquier tema tratado durante 2025 en nuestros boletines. Si quieres leer boletines o informes anteriores los puedes encontrar aquí. Definiciones de términos relacionados con la IA-AI en Diccionario IA-AI (A-K) / (L-Z). ¿Quieres patrocinarnos? Ponte en contacto: [email protected]

✨IA-AI W47/2025

IA-AI LANGUAGE MODELS & AGENTS 🧠

IA-AI IMAGE 🎞️ ESPECIAL NANO BANANA PRO 🙌

IA-AI CREATIVE SUITES 🏨🎞️🎬

IA-AI META ♾️

IA-AI MICROSOFT 🏢

=

Seguir leyendo

IA-AI Newsletter

Home