- IA-AI Newsletter
- Posts
- ✨IA-AI W10/2025
✨IA-AI W10/2025
Inteligencia Artificial - Artificial Intelligence

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET
Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!
IA-AI LANGUAGE MODELS & AGENTS
CHATGPT: POR SI NO LO SABES
Los consejos sobre cómo obtener las mejores respuestas de los LLMs, como ChatGPT —aunque aplicables a muchos otros modelos—, abundan. Pero un amplio estudio/paper de Wharton aporta conclusiones inesperadas… y subraya lo mucho que aún desconocemos…
La consistencia es un problema importante: los modelos de IA (GPT-4o y GPT-4o mini) dieron respuestas diferentes a las mismas preguntas cuando se les preguntó 100 veces. Esto muestra una falta de fiabilidad en la precisión de sus respuestas.
El formato de la pregunta influye mucho: dar instrucciones claras sobre cómo estructurar la respuesta mejora significativamente el rendimiento de la IA.
La cortesía tiene efectos impredecibles: usar palabras educadas como “por favor” mejora algunas respuestas, pero empeora otras. Lo mismo pasa con un tono más autoritario.
Los estándares de precisión son difíciles de cumplir: si necesitas que la IA acierte el 100% de las veces, estás en problemas. En un cuestionario de nivel doctoral, los modelos solo superaron en 4,5 y 5 puntos porcentuales el resultado de una suposición aleatoria.
El contexto es clave: el efecto de la cortesía y la estructura varía mucho según la pregunta. No hay una fórmula universal para hacer prompts efectivos.
Para trabajos críticos, es mejor la intervención humana: dado el nivel de inconsistencia, se recomienda hacer la misma pregunta varias veces y seleccionar la mejor respuesta. También es esencial revisar manualmente lo que produce la IA antes de usarlo.
En resumen: no existe un método único y perfecto para interactuar con modelos de IA. La supervisión y edición humana siguen siendo esenciales para garantizar resultados fiables y de calidad.
QWEN DE ALIBABA LANZA QWQ-32B Alibaba lanza QwQ-32B, un modelo de IA-AI que iguala a rivales más grandes como Deepseek-R1 con un tamaño 20 veces menor y un costo 90% inferior, gracias al aprendizaje por refuerzo. Pruébalo aquí o descargando el código abierto ya disponible.
MISTRAL OCR (Reconocimiento Óptico de Caracteres) Mistral AI presenta Mistral OCR, una API de nueva generación para extraer texto, analizar y estructurar documentos complejos con una precisión y velocidad sin precedentes (2000 páginas/minuto). Supera a Google Document AI, Azure OCR y GPT-4o en la extracción de texto, imágenes, tablas y ecuaciones. Desbloquear la información atrapada en documentos complejos es crucial. Mistral OCR potencia industrias con grandes archivos (análisis financiero, legal, preservación histórica), transformando datos estáticos en conocimiento dinámico para la IA-AI.
MANUS, EL AGENTE TOTALMENTE AUTÓNOMO La startup china Manus presenta el primer agente de IA totalmente autónomo, capaz de realizar tareas reales (selección de CVs, investigación, etc.) de forma independiente y superando a ChatGPT y Gemini en pruebas de rendimiento. Demuestra habilidades como navegación web y programación. Aunque actualmente es de acceso limitado, se planea liberar su código. Esto marca un avance hacia flujos de trabajo de IA más complejos y autónomos y en este videodemo te harás más a la idea.
PERPLEXITY REVOLUCIONA X CON SU BOT @ASKPERPLEXITY Perplexity está causando sensación con su nuevo bot de X: @AskPerplexity. Este bot permite a los usuarios obtener respuestas instantáneas dentro de cualquier conversación de X simplemente mencionándolo (@AskPerplexity) junto con una pregunta. En menos de un minuto, el bot responde con un nuevo tweet. Es una idea brillantemente simple: información al instante, integrada directamente en el flujo de X. Lo hemos probado y funciona a la perfección. La herramienta ya ha generado más de 12 millones de impresiones orgánicas en una semana, demostrando su utilidad y popularidad. Es una forma increíblemente conveniente de obtener información sin interrumpir la conversación. A Grok y a Elon quizás no les gusta tanto.

IA-AI IMAGE
FREEPIK Combina lo mejor de la fotografía y la ilustración con el estilo #illustratedphoto. Para ello deberás disponer de un plan de pago para acceder a los estilos Premium y crear este estilo de imágenes.

Fuente: Freepik
GROK Aunque a nivel profesional es posible que las imágenes obtenidas por la IA-AI de X se queden cortas de resolución, ya debemos contar con Grok para obtener buenas ideas e iterar con ellas. Puedes editar la imagen chateando con ella, cambiar la iluminación, agregar objetos e incluso agregar texto. En X o descargando su app.

IA-AI ViDEO
SORA El generador de video de OpenAI ya está disponible en Europa con una cuenta de pago (ver detalles). Por otro lado, OpenAI planea integrarlo directamente en ChatGPT, desarrollar una app móvil dedicada y mejorar sus capacidades de generación de imágenes. Aunque Sora generó mucha expectación, su lanzamiento fue decepcionante y ahora necesita mejoras enormes para competir con alternativas como Veo 2 de Google y Kling. La integración con ChatGPT busca aumentar su visibilidad y utilidad. TechCrunch Estos son los detalles:
ChatGPT Plus ($20/mes) Hasta 50 videos (1000 créditos), videos relaxed limitados resolución de hasta 720p y 10 segundos de duración.
ChatGPT Pro ($200/mes) Hasta 500 videos (10.000 créditos), videos relaxed ilimitados, resolución de hasta 1080p, 20 segundos de duración y 5 generaciones simultáneas. Descarga sin marca de agua.

Todo sobre Sora en https://openai.com/sora/
REFRAMEANYTHING Un AI Reframe que permite cambiar el encuadre de cualquier vídeo. Ideal para publicar contenido en plataformas sociales.

Fuente: opus.pro/ai-reframe
LUMA DREAM MACHINE Ahora con su modelo Ray2, tienes control frame a frame con Keyframes para transiciones perfectas y transformaciones mágicas. Con Extend, puedes alargar tus vídeos para ver qué pasa después y crear historias más largas. Y con Loop, para crear movimiento infinito. Además, han añadido Ray2 Flash, un nuevo modelo 3 veces más rápido y 3 veces más barato. Flash te da casi la misma calidad y capacidades top de Ray en texto a vídeo, imagen a vídeo, audio y control, pero a toda velocidad y más económico. Así que ahora puedes crear más, más rápido y sin límites.
RUNWAY PRESENTA RESTYLE La nueva herramienta de Runway permite cambiar radicalmente el estilo de imágenes generadas por IA (colores, texturas, estética) sin necesidad de regenerarlas. Ofrece control y flexibilidad a los creadores, ahorrando tiempo y uniendo la creatividad de la IA con la dirección artística humana.

Fuente: RunwayML
HEDRA Character-3 es el nuevo y potente modelo de IA-AI que transforma imágenes estáticas en videos realistas de alta calidad y en cualquier estilo. Character-3 permite animar fotos, dibujos o incluso animales con movimiento de cuerpo completo y expresiones realistas, todo controlado mediante texto. Además, Hedra Studio integra todas las herramientas necesarias (generación de video, imágenes 4K, voces en off con IA) en una sola plataforma, simplificando la creación de contenido y eliminando la necesidad de múltiples suscripciones. Con créditos mensuales gratuitos. X
IA-AI AUDIO/MUSIC
DIFFRHYTHM Te permite generar canciones completas de 4 minutos y con voces en solo 10 segundos. Increíblemente rápido y vergonzosamente simple. Demo en Huggingface space.
LALAL.AI es una avanzada herramienta de separación de audio basada en IA-AI que permite extraer con precisión vocales, instrumentos específicos (batería, bajo, piano, guitarras y sintetizadores) de cualquier archivo de audio o video sin pérdida de calidad. Esta tecnología, que utiliza redes neuronales como Perseus con enfoque basado en transformadores, está dirigida principalmente a productores musicales, DJs, músicos, estudiantes de música y entusiastas del karaoke que necesitan aislar componentes específicos de grabaciones para remezclado, aprendizaje, práctica instrumental o creación de pistas de acompañamiento. La plataforma ofrece características avanzadas como eliminación de eco y procesamiento mejorado, con un modelo de negocio flexible basado en minutos de procesamiento que incluye desde una opción gratuita limitada hasta paquetes premium para uso profesional, permitiendo entrar en procesos que antes requerían equipamiento de estudio profesional. Vídeo

Fuente: Lalal.ai
SESAME Prepárate para repensar las voces de IA. Sesame, fundada por el cofundador de Oculus, ha presentado una revolucionaria tecnología de voz con IA que realmente suena humana. A diferencia de los típicos asistentes robóticos, el "Modelo de Voz Conversacional" de Sesame comprende el contexto emocional, utiliza pausas naturales e incluso ajusta su tono, creando una interacción hablada verdaderamente atractiva y creíble. ¡De forma impresionante, en pruebas a ciegas, la gente a menudo no pudo distinguir a Sesame de voces humanas reales! Con planes para liberar código abierto de componentes, el avance de Sesame podría finalmente acortar la brecha hacia interfaces de voz naturales, haciendo que hablar con nuestros dispositivos sea tan fluido como hablar entre nosotros. Solo en inglés y bastante impresionante. Demo prueba
IA-AI 3D/RENDER
VIZCOM Tanto si eres nuevo en Vizcom como si buscas mejorar tus habilidades, este video tutorial cubre todos los fundamentos que necesitas para comenzar a crear conceptos de diseño de alta fidelidad, utilizando las funciones más nuevas, como renderizado en tiempo real, eliminación de fondo, mejora, nuevas paletas y más.

Fuente: Vizcom
IA-AI GOOGLE
GOOGLE SHOPPING Nuevas herramientas de compra de IA-AI que ayudan a visualizar ropa y productos de belleza. De momento solo en EE.UU.

Fuente: blog.Google
IA-AI FEATURED ARTISTS AND VIDEOS
Artista destacado de la semana: @madpencil_
Vídeos destacados de la semana:
ZELENSKI / TRUMP Seguro que ya habrás visto algún meme de su histórico/ lamentable encuentro/show en La Casa Blanca. Cuanta razón podemos leer en algunos comentarios de este post: “La historia ha sido escrita por los ganadores hasta ahora. En los próximos años será escrita por la IA” y “Los historiadores lo van a tener difícil en el futuro”
A LOVE LETTER TO LA ¡OMG! 🙌 Para todo lo que estés haciendo y flipa con esta obra maestra psicodélica. ¡Es una fusión BRUTAL de técnicas clásicas y generativas que crean un universo visualmente IMPRESIONANTE y con sentido! Escrito y dirigido por Paul Trillo, con original Art de Paul Flores para el artista musical Cuco –y ¡qué música!–, producido por asteriafilmco y con la participación de Microsoft. El cómo se hizo, da muchas pistas hacia donde debemos ir.

Fotograma de “Cuco–A Love Letter to LA” 🙌
IA-AI KEY CONCEPTS
RAG (RETRIEVAL-AUGMENTED GENERATION)
Últimamente cuando se habla de los últimos modelos de lenguaje, se escucha mucho este término. ¿Pero qué es RAG y en qué consiste? RAG es una técnica IA-AI que combina dos elementos:
Recuperación (Retrieval) Buscar información relevante en una gran base de datos (como una colección de documentos, una base de conocimiento, o incluso la web). Esto es como tener un bibliotecario que busca los documentos que mejor responden a una pregunta.
Generación (Generation) Usar un modelo de lenguaje grande (LLM, como GPT-3, GPT-4, Gemini, etc.) para generar una respuesta nueva y coherente, basándose en la información recuperada. Es como si el LLM "leyera" los documentos encontrados por el bibliotecario y luego escribiera un resumen o una respuesta original.
Para qué sirve RAG se usa para mejorar la calidad y precisión de las respuestas generadas por los LLMs. Los LLMs son muy buenos para generar texto fluido, pero a veces "alucinan" (inventan información) o dan respuestas desactualizadas. Al anclarlos a una base de datos de información real, RAG:
Reduce las alucinaciones.
Proporciona respuestas más precisas y basadas en hechos.
Permite acceder a información más actualizada que la que el LLM tenía en su entrenamiento original.
Permite generar respuestas mas concisas y de mayor calidad.
Ejemplo de aplicación RAG Imagina que preguntas: "¿Cuál es la última regulación sobre emisiones de carbono en la Unión Europea?".
Recuperación El sistema RAG buscaría en una base de datos de documentos legales de la UE los documentos más relevantes sobre regulaciones de emisiones.
Generación El LLM tomaría esos documentos y generaría una respuesta concisa y actualizada, explicando la regulación. No se limitaría a la información que "recordaba" de su entrenamiento (que podría estar desactualizada).
IA-AI INTERESTING NEWS
ROBOTS 🤖 No me hagas daño de UNITREE G1
ARTÍCULO EN HUFFINGTONPOST Deepfakes y porno digital falso: el uso de la IA para atacar a mujeres políticas, activistas y periodistas. El artículo habla sobre el preocupante aumento de los deepfakes pornográficos usados para atacar a mujeres políticas, activistas y periodistas. Destaca que el 98% de los vídeos deepfake son pornográficos y el 99% de las víctimas son mujeres. Estas imágenes manipuladas buscan humillar, desacreditar y silenciar a las mujeres, afectando su participación en la política y el periodismo. También se subraya la necesidad de regulaciones para combatir esta forma de violencia digital.
=
👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.💃🕺🏻🙏 ¿Nos ayudas? Comparte IA-AI Newsletter con quien creas que le puede interesar.🤓
IA-AI Newsletter Team

✨Se filtran imágenes de la fiesta del primer aniversario de IA-AI Newsletter 👉 Incluso corre un vídeo por X creado con Sora 👈
Si quieres leer boletines o informes anteriores los puedes encontrar aquí
Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI
¿Quieres patrocinarnos? Ponte en contacto: [email protected]
Los boletines contienen algunos artículos solo visibles para suscriptores del
