✨IA-AI W52/2024

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI Virtual Assistants (LLMs) / Chatbots

Gemini 2.0 Flash Thinking

Google ha lanzado Gemini 2.0 Flash Thinking, una inteligencia artificial que no solo resuelve problemas complejos de matemáticas, física o programación, sino que además te explica los procesos paso a paso, ¡lo cual es oro para la creatividad!

Imagina que Google está construyendo un robot nuevo muy avanzado (Gemini 2.0 experimental). Una de las cosas más interesantes que le están enseñando a hacer a este robot es pensar las cosas por pasos para resolver problemas difíciles (Flash Thinking experimental). Así, "Gemini 2.0 experimental" es el robot entero en pruebas, y "Flash Thinking" es una de las habilidades especiales que están probando en ese robot.

Como es experimental y enfocada a desarrolladores solo la puedes probar en Google AI Studio y Vertex AI. Pero imagina poder entender a fondo por qué una composición fotográfica funciona, o por qué una paleta de colores genera cierta emoción. Flash Thinking te ayuda a comprender las bases y los principios detrás de conceptos visuales, analizando desde la teoría del color hasta la armonía en el diseño, y mostrándote el razonamiento detrás de cada elemento. Esta herramienta te permite explorar nuevas vías creativas al entender la lógica subyacente de diferentes estilos y técnicas. Mientras compite con otras IA avanzadas de razonamiento como o1 y o3 de OpenAI, Gemini 2.0 se convierte en un aliado para profundizar tu comprensión y potenciar tu innovación. Ejemplos en campos creativos:

Para Diseñadores Gráficos Imagina que estás luchando con el diseño de un logo. Le pides a Gemini 2.0 que analice logos exitosos en tu sector. En lugar de solo mostrarte ejemplos, te explicaría paso a paso por qué ciertos colores, tipografías o formas funcionan mejor para transmitir determinados mensajes o evocar ciertas sensaciones. Podrías entender la psicología del color aplicada al branding de una manera mucho más profunda.
Para Fotógrafos ¿Te has preguntado alguna vez por qué una foto con cierta composición genera más impacto? Con Flash Thinking podrías analizar fotografías icónicas y obtener una explicación detallada sobre cómo la regla de los tercios, el uso del espacio negativo o la dirección de la luz contribuyen a su efectividad. La IA te mostraría el razonamiento detrás de estas técnicas, ayudándote a aplicarlas de forma más consciente y creativa en tu propio trabajo.
Para Ilustradores Si estás experimentando con un nuevo estilo, podrías pedirle a Gemini 2.0 que analice obras de artistas que te inspiran. La IA te explicaría el proceso de construcción de la imagen, desde la anatomía hasta la teoría del color y las técnicas de sombreado, revelando los principios que hacen que el estilo sea único y efectivo.

IA-AI Models in Hugging Face Spaces & Replicate & +

FLUX Style Shaping

En Hugging Face, el space flux style shaping te permite crear visuales definiendo la estructura con una imagen y aplicando el estilo de otra.

IA-AI Video

Kling 1.6

Es una locura lo que puedes hacer en estos días con una sola imagen. Las posibilidades del modelo 1.6 de Kling en modo de imagen a vídeo están alcanzando límites inimaginables hace unos meses. Observa los ejemplos en su web.

IA-AI Audio / Music

Octave

OCTAVE, de Hume AI, es un modelo de lenguaje y voz que genera voces y personalidades completas a partir de indicaciones breves. Puede emular características como género, edad, acento, estilo vocal y roles específicos (como "terapeuta gentil"), combinando control de voz y generación de lenguaje. Ofrece interacciones empáticas en tiempo real, clonación de voces desde grabaciones tan breves como 5 segundos y múltiples personajes simultáneos, ideal para experiencias personalizadas. Los ejemplos que encontrarás en su web son impresionantes. Actualmente, está disponible para socios seleccionados.

IA-AI Google

Whisk

La nueva herramienta de IA de Google, Whisk, revoluciona la generación de imágenes al permitir a los usuarios crear visuales mediante el uso de imágenes existentes como indicaciones, en lugar de solo texto. Basada en el modelo Imagen 3, Whisk analiza las imágenes subidas por el usuario para capturar sujetos, escenas y estilos, creando un prompt sintetizado que guía la generación de múltiples variaciones. Este enfoque intuitivo e iterativo fomenta la exploración visual y la creación matizada, permitiendo a los usuarios refinar los resultados mediante la edición de indicaciones textuales y la experimentación con diferentes imágenes de entrada. Disponible a través de Google Labs en los EE. UU. o VPNs (ver “Opera” más abajo).

Bastó una primera prueba para que se abriera ante nosotros un panorama creativo lleno de posibilidades inexploradas. Una experiencia muy recomendable.

IA-AI Tools

Cómo navegar desde EE. UU. con la VPN gratuita de Opera

¿Sabías que puedes simular tu ubicación en Estados Unidos al navegar por internet sin necesidad de instalar software adicional? El navegador Opera integra una VPN gratuita que te permite hacerlo de forma sencilla y que al menos sugiere más seguridad que otras opciones.

En IA-AI Newsletter, hemos probado esta funcionalidad y confirmamos su efectividad en la mayoría de los casos, aunque existen excepciones que podrían estar relacionadas con el sistema operativo, entre otros factores. Si te interesa experimentarla, te ofrecemos una guía rápida:

Configura la VPN de Opera en minutos para simular tu conexión desde EE. UU.

Comienza descargando Opera
Navega a la configuración Abre Opera y busca la sección de "Ajustes" o "Configuración".
Activa la magia de la VPN Dentro de los ajustes en los 3 puntitos verticales, localiza el botón "VPN" y simplemente actívalo.
Elige tu destino virtual Ves a “Configuración” haces clic en "VPN" y selecciona "Americas” o “Estados Unidos" –según versiones– como tu país de conexión.

¡Y eso es todo! Ahora podrás navegar por internet como si estuvieras ubicado en Estados Unidos.

IA-AI Featured Artist and Videos

Artista destacado de la semana: virtual girl in a virtual world @trishacode

Vídeos destacados de la semana:

una breve historia de la IA, de poco más de un minuto en Reddit, de la misma virtual girl recomendada arriba.
uno más de The Dor Brothers en Reddit.
uno más de @guerrillavisual en Instagram.
Luis Di Lascio, uno de los creadores del vídeo “A ti también te salvaríamos” de Open Arms, nos cuenta en LinkedIn que herramientas utilizaron.

IA-AI Key Concepts

Modelos de Mundo, cómo las IAs comprenden y predicen la realidad

Los modelos de mundo son una pieza fundamental para que las inteligencias artificiales puedan entender y actuar en su entorno. En esencia, un modelo de mundo es una representación interna de cómo funciona el entorno que rodea a una IA. Estos modelos pueden variar desde mapas simples para navegación hasta simulaciones más complejas que incorporan leyes de la física, reglas sociales o incluso patrones de comportamiento humano. Estas representaciones se construyen utilizando diferentes enfoques, desde reglas explícitas, como en sistemas expertos más antiguos, hasta algoritmos de deep learning que aprenden de grandes volúmenes de datos para crear simulaciones precisas.

Un ejemplo cotidiano de un modelo de mundo sencillo es el que utiliza un robot aspirador. Este dispositivo construye un mapa del espacio que debe limpiar, identificando obstáculos y planificando rutas eficientes. Sin este modelo interno, el robot se movería al azar, perdiendo eficacia y consumiendo más energía. Ahora bien, cuando hablamos de sistemas más avanzados, como los utilizados en los coches autónomos, los modelos de mundo deben ser mucho más detallados, incorporando información sobre la ubicación de peatones, otros vehículos y semáforos, además de predecir posibles movimientos futuros. Aquí, el deep learning juega un papel clave al procesar datos visuales y mejorar la capacidad de predicción del vehículo.

En el caso de los generadores de contenido visual, como los modelos de IA que crean videos, los modelos de mundo pueden incluir principios de física para garantizar que los objetos se comporten de manera realista. El deep learning permite integrar estas leyes en las simulaciones, logrando que aspectos como la gravedad, la fricción o las colisiones se representen con un alto grado de fidelidad en los modelos generativos. Por ejemplo, si en un video generado por IA se muestra una pelota cayendo, el modelo de mundo debe incluir una representación de la gravedad para que la pelota caiga con una aceleración adecuada y rebote al impactar en el suelo, según las propiedades del material. Este tipo de simulaciones se benefician de la capacidad del deep learning para integrar datos físicos en los modelos generativos.

Estos modelos no solo son útiles para la simulación, sino también para la toma de decisiones. Una IA que juega al ajedrez, por ejemplo, tiene un modelo de mundo que representa el tablero, las piezas y las reglas del juego, lo que le permite anticipar movimientos futuros y evaluar estrategias. Los avances en redes neuronales profundas han potenciado la capacidad de estas IA para analizar millones de posibles jugadas en tiempo real, identificando patrones y optimizando decisiones con un nivel de precisión que supera al de los jugadores humanos. Del mismo modo, una IA utilizada en la planificación logística puede simular escenarios posibles para optimizar rutas o minimizar costos. También podemos encontrar modelos de mundo en sistemas de procesamiento del lenguaje natural, donde la IA aprende a entender el contexto de un texto y en sistemas de análisis de datos que crean modelos predictivos para hacer proyecciones a futuro.

En resumen, los modelos de mundo son representaciones internas que permiten a la IA interactuar eficazmente con su entorno, predecir, planificar y adaptarse a situaciones complejas. Estos modelos son clave en diversas aplicaciones, pero es importante recordar que tienen limitaciones y pueden estar sesgados.

IA-AI Interesting News

Robots 🤖

El fabricante de Unitree B2-W advierte: “Por favor, utilice siempre los robots de forma segura y amigable.” Será dífícil convivir con ellos en una gran ciudad. Escaparte, aún lo será más.

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes. 💃🕺🏻

IA-AI Newsletter Team

Imagen creada con Krea a partir del prompt generado en Whisk de GoogleLabs 👉 VideoLab de la semana creado con Kling y LumaLabs. Lip Sync con Kling.

Si quieres leer boletines o informes anteriores los puedes encontrar aquí

Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI

¿Quieres patrocinarnos? Ponte en contacto: [email protected]

Los boletines contienen algunos artículos solo visibles para suscriptores del

IA-AI Intelligence Club