IA-AI W37/2024

Inteligencia Artificial - Artificial Intelligence

16 de septiembre de 2024 • Estimated Reading Time: 15 minutos

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI Virtual Assistants (LLMs) / Chatbots

1. ChatGPT 🙌💯

Pensar antes de responder

OpenAI lanza su nueva serie de modelos de IA-AI, o1, hasta ahora conocido como Project Strawberry/Q*. Estos nuevos modelos mejorados utilizan el aprendizaje por refuerzo y se han diseñado para que antes de responder piensen o dediquen un tiempo a estudiar mejor la respuesta, lo que los hace aún mejores para manejar tareas complejas, problemas difíciles y temas avanzados como ciencias, codificación y matemáticas.

Por poner un ejemplo, este modelo resolvió el 83 % de los problemas de los exámenes de calificación de la Olimpiada Internacional de Matemáticas, en comparación con el 13 % de GPT-4o –actual modelo–. OpenAI o1 ya está disponible en ChatGPT para todos los usuarios de Plus y Team, y para los desarrolladores que utilizan la API en el nivel 5.

A tener en cuenta los límites de mensajes (mejor que los 2000$ al mes que comentábamos la semana pasada) y características de los dos nuevos modelos:

o1-preview, 30 mensajes/semana, es potente y utiliza un amplio conocimiento general para resolver problemas complejos.
o1-mini, 50 mensajes/semana, 80% más barato y de 3 a 5 veces más rápido, ideal para tareas de codificación, matemáticas y ciencias.

Pensar antes de responder, ¿es ya razonar? No, solo procesa predicciones y puedes verlas –mientras pasan los interminables 30, 60 o incluso 120 segundos– haciendo clic en el menú desplegable. Mucho más en OpenAI, aunque ahí no leerás un suceso algo inquietante.

Imagen: OpenAI

Prompt / Consejo de la semana

Aunque estos modelos son muy buenos para el razonamiento, no reemplazan a GPT-4o, que sigue siendo mejor para tareas que requieren imágenes, llamadas a funciones o respuestas rápidas con fechas, biografías, curiosidades, etc. Si necesitas un razonamiento profundo y puedes aceptar tiempos de respuesta más largos, los modelos o1 son una excelente opción.

Pero ten en cuenta que la manera ideal de promptear es distinta. Consulta esta información de OpenAI. Entre otras cosas, mantén simple el prompt, usa títulos de sección, <etiquetas XML> o "comillas" para organizar secciones separadas, e incluye solo lo realmente importante para responder al problema, incluyendo documentación abreviada.

2. Mistral

La startup francesa Mistral Al ha lanzado Pixtral 12B, su primer modelo multimodal capaz de procesar tanto texto como imágenes. Este modelo de 12 mil millones de parámetros permite a la compañía seguir compitiendo con los modelos multimodales establecidos por gigantes tecnológicos como OpenAl. Está disponible para su descarga a través de GitHub y Hugging Face bajo una licencia Apache 2.0, lo que permite un uso sin restricciones y un ajuste fino.

IA-AI Image

1. Midjourney

Nos ha gustado este post en Reddit en el que recopilan los parámetros que se emplean en Midjourney pero de una manera concisa y ágil de consultar.

2. Latent Navigation Space

Latent Navigation es un espacio de Hugging Face en el que puedes generar transiciones suaves entre imágenes generadas por IA-AI que utiliza incrustaciones de texto CLIP y Flux.1 schnell. Para ello primero introduce un prompt como podría ser “A cat on the roof” y luego en directions 1 y 2, añade dos términos más o menos opuestos, como podrían ser Winter y Summer. Experimenta con los demás valores y tendrás como resultado una transición muy suave entre varias imágenes. No siempre funciona a la perfección, pero cuando lo hace, obtienes en segundos lo que de otra manera tardarías bastante más. Aquí puedes ver dos ejemplos que hemos creado.

Para usarlo deberás darte de alta en Hugging Face. En principio tienes varios intentos gratuitos. A partir del tercero o cuarto te advertirá que debes pagar para continuar, pero si dejas pasar unos minutos, volverás a a tener oportunidades.

IA-AI Video

1. ‘Follow-Your-Canvas’ Paper

El innovador método ‘Follow-Your-Canvas’ está revolucionando la forma en que vamos a expandir los vídeos más allá de sus marcos originales. Esta técnica, basada en un enfoque de difusión, supera las limitaciones de los métodos tradicionales al permitir la generación de vídeos a resoluciones mucho más altas sin depender de la memoria GPU. El proceso distribuye las tareas en ventanas espaciales que luego se fusionan sin problemas, manteniendo la coherencia espacial y temporal.

Lo más destacable de "Follow-Your-Canvas" es su capacidad para expandir vídeos a gran escala, por ejemplo, de 512x512 a 1152x2048, lo que representa un aumento de 9 veces en el área total de píxeles. Este incremento significativo en resolución permite obtener imágenes mucho más detalladas y nítidas. Además de lograr los mejores resultados cuantitativos en diversas configuraciones, este método produce contenido de alta calidad y estéticamente agradable. Su potencial para transformar la creación de contenido de vídeo es significativo, especialmente en producciones a gran escala donde la resolución y la calidad son fundamentales.

2. RunwayML Gen-3 Alpha 🙌💯

Gen-3 Alpha Video to Video ya está disponible en la web para todos los planes de pago. Para usar Video to Video, simplemente carga tu video de entrada, indica la dirección estética que desees o elije entre una colección de estilos preestablecidos. No te pierdas este hilo de X con varios ejemplos impresionantes, aunque este quizás es el que abre más la mente de cara a las posibilidades que se avecinan a partir de solo una referencia.

IA-AI 3D Render

Playbook

Esta herramienta merece que le des una oportunidad. Proporciona un motor de difusión que permite crear y administrar escenas 3D para desarrollar fácilmente entornos inmersivos y experiencias visuales. Puedes probarla con 300 créditos gratuitos.

Imagen creada y renderizada con Playbook en segundos

IA-AI Animation

Cartwheel

Cartwheel es una plataforma de texto a animación que permite a los usuarios animar personajes simplemente escribiendo. Casos de uso: producción de vídeo, desarrollo de juegos, contenido para redes sociales, proyectos de realidad aumentada y realidad virtual, publicidad y desarrollo de aplicaciones. Digna de testear pero en fase beta y con lista de espera.

Imagen: https://getcartwheel.com

IA-AI Tools

Verse

Con Verse puedes crear tus collages directamente desde un dispositivo móvil como páginas landing interactivas, enlaces en biografías, invitaciones a fiestas y moodboards. Todos los proyectos funcionan como sitios web y son accesibles desde cualquier dispositivo.

Imagen: https://verse.surf

IA-AI Adobe

Adobe Firefly Video Model 🙌💯

Adobe acaba de previsualizar su modelo de vídeo Firefly IA-AI con el que podremos cambiar ángulos de la cámara, extender escenas y generar b-roll fácilmente. Saldrá antes de que acabe el año pero puedes apuntarte a su waitlist para ser de los primeros en probar la versión beta. Deberás disponer de un ID de Adobe para disfrutarlo. Destacan tres funciones:

Text to Video con opciones para controles de cámara e imágenes de referencia.
Image to Video transforma imágenes fijas o ilustraciones en clips en movimiento.
Generative Extend, para la versión beta de Premiere Pro y que puede añadir imágenes para cubrir huecos y/o ampliar tomas.

Mucha más información y vídeos de ejemplo que no puedes perderte en el blog de Adobe.

IA-AI Featured Artist

yzavoku
View more on Instagram

IA-AI Claves para entender (11)

Transformers y el nacimiento de GPT

En la historia de la Inteligencia Artificial, existen momentos que marcan un antes y un después. Uno de ellos se gestó en 2017, casi inadvertido para el gran público, con la publicación del artículo ‘Attention is all you need’. Investigadores de la Universidad de Toronto, financiados por Google, emulaban con este título, inspirado en una canción de los Beatles, la revolución que estaban a punto de desatar. El artículo presentaba una nueva arquitectura de redes neuronales llamada Transformers, capaz de procesar el lenguaje de una forma radicalmente distinta, dando un salto de calidad en su comprensión.

En el contexto de la inteligencia artificial, específicamente en el procesamiento del lenguaje natural (PLN), un transformer es un tipo de arquitectura de red neuronal que se ha vuelto dominante en los últimos años. Los Transformers se basan en un mecanismo llamado ‘atención’ que les permite considerar el contexto completo de la información, similar a como lo hacemos los humanos al leer o escuchar. Esta capacidad de procesar información en paralelo y comprender las relaciones entre las palabras, en lugar de analizarlas una por una como las redes neuronales recurrentes tradicionales, marcó una diferencia significativa. Su objetivo inicial era mejorar la traducción automática, pero ni sus autores ni Google fueron capaces en ese momento de vislumbrar el impacto descomunal que tendría esta innovación en el futuro de la IA.

Mientras el mundo académico digería las implicaciones de los transformers, una startup llamada OpenAI, fundada por Ilya Sutskever, Greg Brockman, Wojciech Zaremba, Andrej Karpathy, John Schulman, Elon Musk y Sam Altman, intuyó su potencial transformador. Fue Ilya Sutskever quien, fascinado por las posibilidades de los transformers, llevó a cabo un experimento crucial. Utilizó una red neuronal generativa preentrenada basada en esta arquitectura, dando origen a GPT (Generative Pre-trained Transformer).

El proceso de entrenamiento de GPT se basaba en una idea aparentemente simple pero tremendamente efectiva: se le presentaba al modelo una frase, se eliminaba una palabra y se le pedía que la completara. Este proceso, repetido millones de veces con enormes cantidades de texto, permitía a GPT aprender las complejas relaciones entre las palabras y la estructura del lenguaje. La clave de su éxito residía en el algoritmo de atención de los transformers, que permitía al modelo enfocar su ‘atención’ en las partes más relevantes de la información para realizar la tarea.

Este avance supuso un punto de inflexión, abriendo la puerta a una nueva era en la generación de texto y el desarrollo de la inteligencia artificial. Sin embargo, el camino no ha estado exento de controversias. OpenAI, inicialmente concebida como una fundación sin ánimo de lucro, evolucionó a una empresa con fines comerciales. Este cambio llevó a Elon Musk a desligarse del proyecto debido a desavenencias sobre la dirección que estaba tomando la empresa, incluyendo posibles conflictos de interés con sus otras compañías que también estaban desarrollando IA, y discrepancias sobre la estrategia de comercialización de la tecnología.

Curiosamente, hace unos meses, el propio Sutskever también abandonó OpenAI para fundar su propia empresa dedicada a la investigación y desarrollo de una Inteligencia Artificial segura, reflejando las crecientes preocupaciones éticas en este campo en rápida evolución.

¿Quizás quien dio el empujón definitivo a la IA-AI será el único que pueda salvarnos en el futuro de película que nos espera?

IA-AI Interesting News

1. Messi 🕺

Si quieres reírte un buen rato, mira este post de Instagram donde aparece Messi de una forma distinta a la que estamos habituados.

2. Mesa de café que anda 🪚

El ingeniero holandés Giliam de Carpentier ha desarrollado el Carpentopod, una mesa de café de madera que camina de manera inalámbrica, gracias a un mecanismo de patas optimizado con IA-AI mediante algoritmos evolutivos. Esta mesa innovadora tiene 12 patas de bambú laminado, controladas por dos motores y un software diseñado a medida, y se maneja con un mando Nunchuck modificado. Este proyecto ejemplifica cómo los creadores están fusionando la inteligencia artificial, la artesanía tradicional y las técnicas de fabricación modernas para realizar proyectos únicos que combinan arte, ingeniería y diseño de muebles, señalando el inicio de una nueva era en la optimización del diseño con IA, incluso para sistemas mecánicos aparentemente sencillos. Observa aquí todo el proceso de creación y su vídeo final de demostración.

3. Apple 🍎

Y hemos de hablar de Apple y su última presentación. Como siempre, lo mejor es la información de primera mano. Aquí puedes ver la gala entera y la información desglosada. La Apple Intelligence, próximamente en beta para el iPhone 16 y 15 Pro. Pero lo mejor sin duda es la noticia de que los AirPods Pro 2 vendrán con la funcionalidad de audífono impulsada por IA. Todos tenemos abuelos, padres y conocidos que gastaron en su día verdaderas fortunas en diminutos audífonos y que nunca funcionaron a la perfección. ¡Cómo podía valer una cosa tan pequeña como una motocicleta nueva! Parece que esto se acabó.

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes. 💃🕺🏻

IA-AI Newsletter

Esta semana hemos liberado a Will Smith de comer más espaguetis. Las paellas le han encantado. 👉 Vídeo creado con Minimax de Hailuo AI.

Si quieres leer boletines o informes anteriores los puedes encontrar aquí

Si tienes prisa, te recomendamos al menos leer los puntos indicados con 🙌💯

Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI

Gracias por leer IA-AI Newsletter. Lo mejor de la semana en creatividad IA-AI.

Suscríbete gratis para recibir nuevas publicaciones y apoyar nuestro trabajo.

Vigila la bandeja del correo basura, ¡no nos gusta estar ahí!