IA-AI W40/2024

Inteligencia Artificial - Artificial Intelligence

7 de octubre de 2024 • Estimated Reading Time: 14 minutos

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI Virtual Assistants (LLMs) / Chatbots

ChatGPT

Nueva Función de Atajos

ChatGPT ahora ofrece atajos que te permiten acceder a la generación de imágenes (DALL-E), búsqueda web y razonamiento avanzado (GPT-4) directamente dentro de un chat, sin necesidad de empezar uno nuevo. Cómo funciona:

Escribe "/" en el campo de entrada del chat.
Elige entre:
- "/Retrata [descripción]" para generar imágenes.
- "/Busca [consulta]" para buscar en la web (Consejo: añade "último" o un año específico a tu consulta para obtener resultados más relevantes).
- "/Razona [tarea]" para razonamiento complejo y resolución de problemas.

A tener en cuenta que de momento la aparición de este menú falla bastante tanto en versión escritorio como en versión móvil. Según OpenAI, en breve lo solucionarán.

ChatGPT-4o with canvas

Canvas es una nueva interfaz para trabajar en ChatGPT para escribir y/o codificar proyectos en una ventana separada (como Claude Artifacts). Disponible en beta para usuarios de ChatGPT Plus y Team, y en unos días para usuarios Enterprise, Edu y gratuitos, Canvas facilita la edición de texto y código con opciones como ajustar longitud, nivel de lectura y restaurar versiones anteriores del trabajo, mejorando el contexto y control sobre el proyecto. Sin duda, otro nivel.

Fuente: Openai.com

2. Copilot

Copilot de Microsoft ha anunciado Copilot Vision para su navegador Edge, lo que permite a Copilot ver páginas web en tu pantalla y hablar con él sobre ellas. vídeo demo

IA-AI Image

1. Flux 🙌💯

Llega la actualización Flux Pro V1.1 para volver a revolucionarlo todo con su realismo ya indistinguible de la realidad. Flux1.1 Pro puede crear imágenes con resolución 2K (2048×1080). Solo criticable la falta de foco en muchos casos. Puedes probarlo en Fal, Replicate, Poe, together.AI y Freepick. Algunos ejemplos en este hilo 🧵.

Imagen creada con flux pro 1.1 en Replicate

2. Runware 🙌💯

En el tiempo que pestañeas, Runware te proporciona a partir de tus prompts, imágenes ultrarrápidas. Además dicen que utilizan energías renovables para ello. Puedes generar hasta 10000 imágenes de forma gratuita. O 16000 imágenes con flux por 10€ entre otros modelos y planes. Sin duda, para probar.

IA-AI Spaces Hugging Face

Expression Editor 🙌💯

En este space podrás editar fácilmente las expresiones faciales de cualquier retrato. Puedes hacer que sonría, cambiar la dirección de los ojos, ladear o bajar la cabeza, ¡todo! La parte negativa es que adquiere algo de desenfoque. Igualmente, muy útil.

A la izquierda la imagen original. A la derecha el resultarlo de modificar sus rasgos faciales con Expression Editor

IA-AI Video

1. Pika

Hacía meses que no hablábamos de Pika. Ya dijimos el otro día que en herramientas IA, hay tantas que temporalmente te enamoras de unas y olvidas las otras que hasta entonces habían ocupado tu corazón. Ahora Pika se ha actualizado a la versión 1.5 y tiene pinta de ser nuestro próximo juguete preferido.

Con movimientos más realistas, big screen shots: tipos de tomas cinematográficas que harán que parezca que sabes lo que haces según dicen ellos mismos, como Bullet Time, Vertigo, Dolly Left, Crane Down; Pikaffects alucinantes (inflate, melt, explode, squish, crush, cake-icky) que rompen las leyes de la física; nuevos movimientos, desde correr hasta andar en patineta, volar y mucho más. Mejor mira su vídeo demo.

Fuente: pika.art

2. Kling 🙌💯

La sincronización de labios en Kling ya está disponible y está completamente integrada en los modelos Kling 1.0 y Kling 1.5. El audio lo has de subir tu, con tu voz, canciones o audios generados con otras aplicaciones. Además, ahora puedes compartir tus obras maestras en la nueva sección Community. Con ello puedes ganar 666 créditos. ¡Mira este hilo con varios ejemplos🧵o nuestro vídeo lab de la semana.

IA-AI 3D Render

Viztober: 31 Days of Design Discovery

Vizcom ha organizado sus 31 días. Es una pena que lo comunicaran tan tarde. Aún así, es una oportunidad para que te animes a probar esta aplicación o al menos ir siguiendo los trabajos diarios que la comunidad está creando con un tema concreto por día. Igual lo siguiente te anima:

Participar una vez = 1 mes Pro GRATIS. Completar los 31 días = 1 año Pro GRATIS

IA-AI UX/UI

Sketch 🙌💯

Sketch ha presentado Smart Animate, una función que agrega movimiento y transiciones a tus prototipos y diseños de una manera fácil y ágil. Mira este buen ejemplo.

IA-AI Tools

Prompt Llama

Prompt Llama recopila prompts de texto a imagen de alta calidad para que pruebes el rendimiento de diferentes modelos con los mismos prompts. Además, su página de distintos modelos es un buen recopilador de los más importantes e incluso de algunos de los cuales no habíamos oído hablar nunca.

IA-AI Google

GoogleLens

Google Lens ahora te permite buscar usando consultas de vídeo y voz. Puedes usar un video corto de tu entorno o puedes usar tu voz para hacer preguntas sobre lo que estás viendo. theverge

IA-AI Meta

Movie Gen

Meta ha presentado Movie Gen, una innovadora IA que genera vídeos en alta definición de hasta 16 segundos a partir de texto, superando a competidores como Runway y OpenAI. Movie Gen no solo crea vídeos, sino que también genera audio, permite modificar elementos específicos de un vídeo existente mediante instrucciones de texto y puede animar imágenes estáticas, manteniendo un realismo impresionante. Meta planea integrar esta herramienta en Instagram en 2025. vídeo demo

IA-AI Microsoft

Paint & Photos

Microsoft está integrando la magia de la IA-AI generativa en Paint y Photos para los usuarios de Copilot Plus PCs. Las nuevas funciones de Relleno Generativo y Borrado Generativo en Paint, inspiradas en Photoshop, permiten añadir o eliminar elementos de las imágenes con un simple pincel y descripciones de texto. La aplicación Fotos también se beneficia con la herramienta Borrado Generativo y una función de Súper Resolución que mejora la escala de imágenes hasta 8 veces su resolución original, todo impulsado por IA en el dispositivo. Estas actualizaciones buscan facilitar la edición de imágenes y hacerla más accesible, reduciendo la dependencia de software especializado, es decir, Adobe Photoshop. the verge

IA-AI Featured Artist

olko_koko.ai
View more on Instagram

IA-AI Claves para entender (14)

Dos enfoques para la generación de imágenes: GANs vs. Modelos de Difusión

Las Redes Generativas Adversariales (GANs - Generative Adversarial Networks) y los modelos de difusión son dos técnicas de Inteligencia Artificial que han revolucionado la generación de imágenes sintéticas. Ambas permiten crear imágenes realistas y novedosas, pero difieren en su enfoque y en sus propiedades.

GANs: el juego del gato y el ratón

Las GANs se basan en una dinámica de competencia entre dos redes neuronales: un generador que intenta crear imágenes falsas y un discriminador que intenta distinguir entre imágenes reales y falsas. Este juego del gato y el ratón" fuerza al generador a mejorar continuamente sus capacidades para engañar al discriminador, lo que resulta en la generación de imágenes cada vez más realistas.

Ejemplos de aplicaciones donde las GANs han demostrado un gran potencial incluyen la generación de rostros humanos fotorrealistas increíblemente detallados (como los utilizados en ThisPersonDoesNotExist.com –cada replay generará un rostro diferente–), la creación de deepfakes que manipulan videos de manera convincente para mostrar a personas reales haciendo o diciendo cosas que nunca hicieron, y la generación de imágenes de alta resolución con un nivel de realismo que puede ser difícil de distinguir de las fotografías reales. Sin embargo, el entrenamiento de las GANs puede ser complejo e inestable, requiriendo un ajuste fino de los parámetros para evitar problemas como el colapso de modo, donde el generador produce una variedad limitada de salidas.

Modelos de Difusión: pintando con ruido

Los modelos de difusión, por otro lado, adoptan un enfoque diferente. Imaginemos que rociamos una imagen con spray de pintura hasta que desaparece bajo el ruido. Los modelos de difusión aprenden a revertir este proceso, despintando el ruido paso a paso hasta revelar una imagen coherente.

Este entrenamiento en dos etapas, donde primero se añade ruido y luego se elimina, permite al modelo aprender las características de las imágenes reales a partir del ruido. Como resultado, pueden generar imágenes realistas y diversas de cualquier tipo, desde rostros y paisajes hasta objetos y escenas complejas.

Ejemplos de aplicaciones de los modelos de difusión incluyen la generación de imágenes a partir de texto (como DALL-E 2, Stable Diffusion…), la creación de variaciones de imágenes existentes (como cambiar la expresión facial de una persona) y la restauración de imágenes dañadas. Además, su entrenamiento es generalmente más estable y sencillo que el de las GANs.

Actualmente los dos sistemes ya generan imágenes de alta calidad pero los modelos de difusión ofrecen mayor estabilidad y versatilidad, abriendo un abanico de posibilidades en áreas como el arte, el diseño y la publicidad. La elección del mejor modelo dependerá de la aplicación específica y de los recursos disponibles.

IA-AI Interesting News

1. Robótica 🤖

Esta semana nos ha llamado la atención este robot que sube escaleras. Utilizando aprendizaje por refuerzo, el robot se adapta a diferentes tipos de escaleras y ha demostrado una tasa de éxito del 90% en ángulos de 70 a 90 grados, subiendo 232 veces más rápido que otros sistemas. Este avance amplía las posibilidades de los robots cuadrúpedos en entornos industriales.

2. Cuando los robots tomen todos nuestros trabajos, recuerda a los luditas ⚙️

Este es el título de un interesante artículo en inglés que hemos leído en smithsonianmag. ¿Un robot viene por tu trabajo?

“…el 47% de todos los trabajos en Estados Unidos serán automatizados "en una década o dos"

“…solo una minoría, los altamente calificados, creativos y afortunados, tendrán trabajos lucrativos, que estarán mucho mejor pagados que el resto.”

El artículo explora el movimiento ludita del siglo XIX, donde los trabajadores textiles se rebelaron contra la automatización que destruía sus empleos. Se compara esta situación con la actual, donde la inteligencia artificial y la robótica amenazan con desplazar a millones de trabajadores. El autor analiza las posibles consecuencias sociales y económicas de esta nueva ola de automatización, incluyendo el aumento de la desigualdad y la necesidad de políticas que ayuden a los trabajadores a adaptarse a la nueva realidad laboral. Se plantea la pregunta de si veremos nuevas formas de protesta social, similares a las de los luditas, en respuesta a la automatización masiva.

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes. 💃🕺🏻

IA-AI Newsletter Team

Imagen creada con Midjourney. 👉 Vídeo lab de la semana creado a partir de la imagen estática con Kling AI y su nueva función de sincronización de labios, que permite añadir voz, está vez generada en elevenlabs, y sincronizarla automáticamente con los labios del personaje.

Si quieres leer boletines o informes anteriores los puedes encontrar aquí

Si tienes prisa, te recomendamos al menos leer los puntos indicados con 🙌💯

Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI

Gracias por leer IA-AI Newsletter. Lo mejor de la semana en creatividad IA-AI.

Vigila la bandeja del correo basura, ¡no nos gusta estar ahí!