- IA-AI Newsletter
- Posts
- IA-AI W33/2024
IA-AI W33/2024
Inteligencia Artificial - Artificial Intelligence

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes
Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!
IA-AI Virtual Assistants (LLMs) / Chatbots
1. ChatGPT
Prompt / Consejo de la semana
Llega septiembre y esta vez sí o sí vamos a intentar por ejemplo perder peso. O planificar mejor nuestras comidas y administrar mejor nuestro valioso tiempo para tenerlas listas. Pon a prueba el siguiente prompt y observa todas las sugerencias que te propone –aunque siempre salga la comida que no te gusta–.
"Actúa como un nutricionista experto. Crea un plan de comidas para 7 días que incluya desayuno, comida, cena y dos tentempiés saludables diarios. El plan debe:
Estar diseñado para [indica tu objetivo: perder 0.5 kg por semana/mantener peso/ganar 0.3 kg de masa muscular por semana], considerando el balance calórico necesario.
Incluir recetas fáciles y rápidas de preparar, ajustadas a porciones para [número de personas], ideales para personas ocupadas.
Utilizar ingredientes de temporada, de bajo costo y fácilmente disponibles en supermercados de [tu país o región].
Incluir alternativas específicas para personas con intolerancias o preferencias dietéticas comunes [sin gluten, vegetariano, sin lactosa, vegano, etc.].
Incluir una lista de la compra semanal con todos los ingredientes necesarios, desglosada por categorías.
Ofrecer consejos detallados para la preparación anticipada de comidas durante el fin de semana, incluyendo ejemplos de qué platos preparar y cómo almacenarlos adecuadamente.
Además, proporciona 3 consejos prácticos para mantener una alimentación saludable durante la jornada laboral, incluyendo cómo evitar tentempiés poco saludables, cómo planificar y llevar la comida al trabajo, y estrategias para mantener la hidratación adecuada."
2. Gemini 1.5 Pro "Experimental"
Gemini 1.5 Pro "Experimental" superó recientemente tanto a GPT-4 como a Claude 3.5 Sonnet en el LMSYS Chatbot Arena. Ahora está disponible para probar de forma gratuita en Google AI Studio. Selecciona el modelo en el panel de la derecha y ajusta el valor de la temperatura entre 0 y 2. Utiliza valores más altos para respuestas más creativas, y valores más bajos para respuestas más deterministas.
3. Gemini Live llega para revolucionar tu asistencia personal
Gemini, el asistente impulsado por IA de Google, da un gran paso adelante con el lanzamiento de Gemini Live para suscriptores Advanced en Android (vídeo promo). Esta nueva funcionalidad permite conversaciones fluidas e intuitivas con Gemini, como si tuvieras un compañero siempre disponible. Las novedades más importantes:
Conversaciones naturales con Gemini Live: interactúa con Gemini como si hablaras con una persona, incluso interrumpiéndolo o retomando la conversación más tarde.
Manos libres: usa Gemini Live mientras conduces o realizas otras tareas, incluso con el teléfono bloqueado.
Integración mejorada con apps de Google: Gemini se conecta con apps como Keep, Tasks, YouTube Music y pronto Calendario, facilitando tareas como crear listas de la compra, generar playlists o programar recordatorios.
Experiencia optimizada en Android: Gemini se integra profundamente en Android, permitiendo interactuar con el contenido en pantalla y arrastrar elementos a otras aplicaciones.
Nuevas voces y mayor velocidad: elige entre 10 voces diferentes para personalizar la experiencia y disfruta de respuestas más rápidas gracias a la integración de modelos como Gemini 1.5 Flash.
Google continúa trabajando en la mejora de Gemini, con el objetivo de convertirlo en el asistente definitivo. Próximamente se esperan integraciones con Google Home, Phone y Messages, además de la expansión a iOS y más idiomas durante las próximas semanas. Blog Google
4. Grok-2
xAI lanza Grok-2 y ya está disponible en versión beta para usuarios premium de X. Grok-2 y su versión reducida, Grok-2 mini, muestran avances significativos en razonamiento, uso de herramientas y rendimiento, superando también a GPT-4 de OpenAI y Claude 3.5 de Anthropic en diversos benchmarks. Sin duda, un gran debut. Además, Grok-2 puede generar y publicar imágenes directamente en X (miedo nos da) gracias a la integración con Flux.1 de Black Forest Lab. Este lanzamiento posiciona a xAI como un competidor importante en el panorama de la IA, impulsado por su nuevo y grandioso Supercluster en Memphis (donde pueden crear en un mes lo que otros tardan tres meses) y el acceso a la vasta cantidad de datos de entrenamiento en tiempo real de X. La API empresarial de Grok-2 está prevista para finales de este mes, lo que promete ampliar aún más su impacto en el desarrollo de aplicaciones de IA.
IA-AI Image
1. Midjourney 🙌💯
Midjourney ha lanzado su nuevo editor web, una nueva característica que centraliza todas las funciones de edición en una sola interfaz. Ahora, a partir de una imagen generada, los usuarios pueden realizar inpainting, panning, zoom o reencuadre en general, cambio de relación de aspecto, borrado de zonas e incluso modificar el prompt original. Esta potente funcionalidad promete impulsar la adopción de la plataforma web Alpha de Midjourney, ofreciendo una alternativa más atractiva que la interacción a través de Discord. Mira aquí cómo funciona.
2. Imagen 3
Google DeepMind ha presentado Imagen 3, un nuevo modelo de IA de generación de imágenes de texto a imagen que, según evaluaciones, supera a otros modelos de vanguardia como DALL-E 3, Midjourney v6 y Stable Diffusion 3. Imagen 3 destaca en la creación de imágenes realistas y de alta calidad a partir de indicaciones complejas, aunque todavía presenta dificultades con tareas que requieren razonamiento numérico o comprensión de la escala. El modelo está disponible para pruebas a través de ImageFX para testers que en principio tienen un contrato de confidencialidad 🤫 y Vertex AI. Google DeepMind ha publicado un paper que detalla su desarrollo y las medidas tomadas para abordar los problemas de seguridad y representación.
3. FLUX.1 & Nice to meet LoRA
En el mundo de la Inteligencia Artificial, entrenar un modelo desde cero puede ser costoso y demandar mucho tiempo. Aquí es donde entra LoRA (Low-Rank Adaptation), una técnica innovadora que permite personalizar modelos de IA pre-entrenados sin necesidad de modificarlos directamente.
Imagina que tienes un modelo de IA que genera imágenes, pero quieres que genere imágenes con un estilo artístico específico, o con tu rostro o el de cualquier otro personaje. En lugar de entrenar un nuevo modelo desde cero, LoRA te permite inyectar este nuevo estilo al modelo existente a través de pequeñas capas de información adicionales.
LoRA funciona añadiendo capas de peso de bajo rango al modelo original. Estas capas aprenden la información específica que quieres añadir, como el estilo anime en nuestro ejemplo, sin alterar el conocimiento base del modelo original. Beneficios de usar LoRA:
Ahorro de recursos: entrenamiento más rápido y con menor consumo de memoria.
Flexibilidad: puedes aplicar diferentes adaptaciones LoRA al mismo modelo base.
Facilidad de uso: comparte y distribuye fácilmente las adaptaciones LoRA.
LoRA se utiliza en diversas aplicaciones, como:
Generación de imágenes personalizadas: crea imágenes con estilos artísticos específicos o características únicas.
Chatbots especializados: adapta modelos de lenguaje para dominios específicos, como atención al cliente o medicina.
Mejora de la traducción automática: ajusta modelos de traducción para pares de idiomas específicos.
LoRA permite a usuarios y desarrolladores adaptar modelos pre-entrenados a sus necesidades específicas, abriendo un abanico de posibilidades en la creación de aplicaciones innovadoras.
Entonces, ¿cómo se relacionan Flux y LoRA?
Flux: Es un modelo de difusión de texto a imagen de código abierto, similar a Stable Diffusion. Se enfoca en la generación de imágenes de alta calidad y ofrece un buen equilibrio entre velocidad y rendimiento.
LoRA (Low-Rank Adaptation): como ya hemos dicho, es una técnica para adaptar modelos pre-entrenados de forma eficiente, añadiendo capas de bajo rango.
Modelo base: es el modelo original sobre el cual se aplican las adaptaciones LoRA. En el caso de usar LoRA con Flux, el modelo base sería el modelo de Flux pre-entrenado.
Flux se utiliza como base para aplicar las adaptaciones LoRA. Es decir, se toma el modelo pre-entrenado de Flux y se le añaden las capas LoRA para personalizarlo según las necesidades del usuario. Por ejemplo, se podría usar LoRA para que Flux genere imágenes con un estilo artístico específico, como ha hecho este usuario con la estética de un tarot.
Imagina que Flux es un coche base con buenas prestaciones. LoRA sería como un kit de personalización que te permite añadirle características específicas, como un alerón, llantas deportivas o un nuevo sistema de sonido, sin tener que construir un coche completamente nuevo.
Recuerda que LoRA es una técnica muy versátil, y su aplicación en la generación de imágenes es solo una de sus muchas posibilidades. La mejor forma de entender su funcionamiento es experimentar con diferentes modelos y adaptaciones. ¿Quieres hacerlo?:
fal.ai deberás abonar 10$. Sube un mínimo de diez imágenes
Pero entrenar LoRAs es un mundo. Con este tutorial que encontramos en YouTube puedes empezar a entender la complejidad y dar el paso.
IA-AI Video
1. RunwayML Gen3 Alpha Turbo 🙌💯
Runway ML ha lanzado Gen-3 Alpha Turbo, una nueva versión de su modelo de generación de vídeo IA-AI que es 7 veces más rápido y cuesta la mitad que el anterior Gen-3 Alpha. Ahora puedes crear un vídeo de 10 segundos a partir de una sola imagen en solo 15 segundos.
Por otro lado, los vídeos musicales ya destacan. Este usuario de Reddit creó con runwayml Gen-3 este vídeo en solo 9 horas. Letra: ChatGpt, canción: Suno e imágenes: Midjourney y ComfyUI.
2. Kling
Aunque los vídeos IA-AI absurdos y locos también destacan. Y si quieres perder 11 minutos de tu vida no dudes en mirar los vídeos incalificables de @aiordieshow
3. Luma Dream Machine 1.5 🙌💯
Luma AI Dream Machine 1.5 se implementará pronto. Si ya alucinamos con la función de añadir texto en imágenes estáticas en muchas aplicaciones, text-to-video 1.5 lo logra en los vídeos sin partir de una imagen, con solo un prompt, escribiendo los textos a incluir entre comillas. Algunos ya lo están testeando con grandes resultados.
IA-AI Audio/Music
ElevenStudios
ElevenLabs, la empresa especializada en clonar voces y generar voces de IA -AI para texto a voz, ha lanzado ElevenStudios, un servicio de doblaje de IA totalmente administrado para vídeos y podcasts. Este nuevo servicio permite a los creadores ampliar su audiencia global traduciendo su contenido a múltiples idiomas utilizando voces de IA que imitan el tono y el ritmo del hablante original. El proceso, que se apoya en expertos en doblaje bilingüe para asegurar la calidad y fidelidad del mensaje, ya está siendo utilizado por creadores reconocidos como 20VC, Colin & Samir, Drew Binsky y Ali Abdaal, entre otros. Con este lanzamiento, ElevenLabs se posiciona como una solución de vanguardia para la traducción y el doblaje de contenido audiovisual, facilitando el acceso a audiencias internacionales.
IA-AI Tools
1. Renovate AI
Renovate AI es una revolucionaria aplicación que utiliza IA-AI para ayudar a los usuarios a inspirarse, visualizar y planificar la renovación de su espacio interior o exterior sin esfuerzo. Ideal par interioristas, diseñadores de espacios o incluso cualquier persona que tenga que renovar un espacio.
2. DeepBrain AI Studios
DeepBrain AI Studios se centra en la creación de vídeos basados en IA-AI con avatares realistas, perfectos para vídeos profesionales y educativos.
IA-AI Google
1. Toma notas para mí
Google está lanzando la nueva función Take notes for me, impulsada por su IA-AI Gemini para su plataforma de videollamadas Google Meet. Esta nueva característica permitirá a los usuarios centrarse en la reuniones mientras la IA captura automáticamente los puntos clave. ¿Pasará a la historia lo de tomar notas? Ya veremos cómo es de fiable pero auguramos que sí. De momento aquí tienes lo que necesitas saber:
La función está impulsada por la IA Gemini de Google y estará disponible para los clientes de Google Workspace con complementos específicos.
"Toma notas por mí" forma parte del complemento de reuniones y mensajería de IA de Google, que cuesta unos $10 por usuario/mes en los planes de Google Workspace.
Cómo siempre, los administradores pueden configurar la disponibilidad de la función a través de la consola de administración de Google Workspace.
2. Pixel Studio
La nueva aplicación Pixel Studio impulsada por IA-AI de Google, que debuta en los teléfonos Pixel 9, transforma las descripciones de texto en imágenes impresionantes, lo que te permite crear obras maestras con solo un mensaje. Esta aplicación, similar a la próxima Image Playground de Apple, utiliza el modelo de texto a imagen Imagen 3 de Google y la IA en el dispositivo para agregar o eliminar elementos, cambiar estilos y convertir incluso los garabatos más simples en imágenes vibrantes. Mientras Apple se esfuerza por alcanzarlo, Google ya está estableciendo un nuevo estándar en la creación de arte con IA. The verge
IA-AI Featured Artist
IA-AI Claves para entender (7)
El invierno de la IA: períodos de desencanto y resurgimiento
La historia de la IA-AI ha sido una montaña rusa de expectativas y realidades, marcada por períodos de gran entusiasmo seguidos por etapas de desencanto y escepticismo. Estos ciclos de auge y caída en el campo de la IA se conocen comúnmente como ‘veranos’ e ‘inviernos’ de la IA.
El término ‘invierno de la IA’ se acuñó en 1984 por investigadores como Marvin Minsky (otro padre de la IA) y Roger Schank, inspirados en la frase ‘invierno nuclear’. Se utiliza para describir períodos de reducción drástica en el interés y la financiación de la investigación en IA.
El primer invierno de la IA
El primer invierno significativo de la IA comenzó a finales de los años 60 y se extendió hasta mediados de los 80. Este período estuvo marcado por varios eventos clave. Tres de los más destacados fueron:
El informe ALPAC de 1966: El proyecto ALPAC (Automatic Language Processing Advisory Committee) del gobierno estadounidense, iniciado en 1964 con grandes expectativas, concluyó que la traducción automática era más lenta, menos precisa y el doble de cara que la traducción humana. Este fracaso llevó a un recorte drástico en la financiación de la IA, especialmente en el procesamiento del lenguaje natural.
El informe Lighthill de 1973: Sir James Lighthill, un matemático respetado pero sin experiencia en IA, criticó duramente el campo en el Reino Unido, argumentando que la IA había fallado en cumplir sus ‘grandiosas promesas’. Este informe tuvo un efecto dominó, llevando a recortes de financiación en Europa y EE.UU.
La publicación en 1969 de ‘Perceptrons’, el trabajo fundamental del análisis de las redes neuronales: Marvin Minsky y Seymour Papert demostraron en este libro que los perceptrones (un tipo temprano de red neuronal) eran muy limitados, capaces de aprender solo funciones extremadamente simples. Esto contribuyó a desinflar el interés por los modelos bottom-up y, en particular, por las redes neuronales.
Durante este invierno, la escasa capacidad de computación de las máquinas impedía procesar grandes cantidades de datos, algo indispensable para entrenar modelos complejos capaces de abordar problemas reales.
El resurgimiento y el segundo invierno
A principios de los 80, el interés por la IA comenzó a aumentar nuevamente. Los sistemas expertos, pertenecientes al enfoque simbólico-lógico, tuvieron un éxito apreciable en el mercado. En 1985, el gasto en sistemas de IA en las empresas alcanzó los miles de millones de dólares.
Sin embargo, este resurgimiento fue de corta duración. En 1987 comenzó el segundo invierno de la IA, que alcanzaría su momento más oscuro en 1990. Las limitaciones de los sistemas expertos y las expectativas no cumplidas llevaron a una nueva ola de desencanto.
El resurgir del conexionismo
A pesar de los inviernos, la comunidad científica siguió avanzando. Un hito importante fue el uso del algoritmo de backpropagation por parte de David Rumelhart, Geoffrey Hinton y Ronald Williams en 1986. Este algoritmo permitió entrenar redes neuronales más complejas, capaces de modelar problemas no lineales que el simple perceptrón no podía resolver.
Desde mediados de los años 90 hasta hoy, se ha producido un avance muy significativo en las técnicas de aprendizaje estadístico por ordenador basadas en datos (statistical machine learning). Tres factores han confluido para instalar a la IA en una ‘primavera perpetua’:
El acceso a cantidades ingentes de datos (Big Data).
La disponibilidad de procesadores muy potentes a bajo coste.
El desarrollo de redes neuronales profundas y complejas (deep learning).
El éxito de los métodos de deep learning ha producido un fuerte resurgir de la corriente de pensamiento bottom-up y, en particular, del conexionismo dentro de la IA. Esto se refleja en el premio Turing otorgado en 2019 a Yoshua Bengio, Geoffrey Hinton y Yann LeCun, pioneros del deep learning.
A pesar de estos avances, los expertos advierten que aún quedan desafíos por resolver, como la incorporación de semántica y razonamiento en el procesamiento del lenguaje natural, el modelado de la incertidumbre, y el desarrollo de sistemas de aprendizaje que puedan aprender constantemente a corto, medio y largo plazo, como lo hacen los sistemas inteligentes biológicos.
La historia de la IA nos enseña la importancia de mantener expectativas realistas y un enfoque equilibrado. Aunque la IA ha demostrado ser una tecnología transformadora, su desarrollo requiere tiempo, paciencia y una comprensión clara de sus capacidades y limitaciones actuales.
Parece imposible hablar de un próximo invierno a día de hoy pero hay voces que previenen de una posible burbuja económica de la IA y parece que las inversiones millonarias empiezan a frenarse significativamente. No siempre es primavera.
IA-AI Interesting News
1. Clones digitales ¿La inmortalidad ya no es solo ciencia ficción? 👯♀️
¿Te imaginas poder conversar con tus seres queridos fallecidos o contar con un asesor experto disponible 24/7? La creación de clones digitales está acercando esta realidad a nuestro presente.
Dara Ladjevardian, CEO de Delphi, ha dado un gran paso en esta dirección al desarrollar un clon digital de sí mismo. Esta réplica virtual es capaz de mantener conversaciones coherentes, compartir conocimientos y responder preguntas de manera similar a como lo haría el propio Ladjevardian. Pero, ¿cómo es posible esto? La tecnología detrás de estos clones se basa en el aprendizaje automático. Al alimentar a un modelo de IA con una gran cantidad de datos sobre una persona, como textos, videos y conversaciones, es posible crear una representación digital que imite su forma de pensar y hablar.
Las posibilidades son infinitas:
Preservación de la memoria: los clones digitales podrían permitirnos mantener viva la memoria de nuestros seres queridos fallecidos, creando un legado digital que perdure en el tiempo.
Educación personalizada: los expertos podrían crear clones digitales para impartir clases personalizadas a estudiantes de todo el mundo. ¿Te imaginas poder asistir a clases de Einstein?
Asistencia virtual: los clones digitales podrían servir como asistentes virtuales altamente personalizados, ayudándonos en nuestras tareas diarias.
Por supuesto no hay IAs sin riesgos:
Privacidad: ¿Cómo se protegerá la privacidad de los datos utilizados para crear los clones digitales?
Identidad: ¿Hasta qué punto un clon digital puede considerarse una representación auténtica de una persona?
Manipulación: ¿Podrían los clones digitales ser utilizados para difundir información falsa o manipular a las personas?
La creación de clones digitales es un campo en constante evolución. En boletines anteriores ya hemos hablado de otros casos. A medida que la tecnología avanza, es fundamental establecer marcos regulatorios que garanticen el uso responsable y ético de esta poderosa herramienta.
¿Qué opinas tú? ¿Estás listo para un futuro en el que convivamos con versiones digitales de familiares, expertos o famosos? No te pierdas la entrevista en directo en TV FOX Business al CEO de Delphi y a su clon.
2. Inteligencia adictiva 🤤
¿Sabías que un análisis de un millón de registros de interacción de ChatGPT revela que el segundo uso más popular de la IA es el juego de rol sexual?
Un buen artículo de MIT Technology Review aborda la necesidad de prepararnos para la ‘inteligencia adictiva’ refiriéndose al potencial de la IA-AI para volverse adictiva debido a su capacidad para adaptar y personalizar contenidos que capturan la atención de los usuarios. Destaca que, a medida que la IA se integra más en nuestras vidas, es crucial desarrollar estrategias para mitigar sus efectos adictivos, similar a como se ha hecho con las redes sociales y los videojuegos. La preocupación radica en el impacto social y psicológico que esto podría tener.
Pero el punto que más preocupa es la voz, ¿nos extraña?. OpenAI advierte que los usuarios podrían engancharse emocionalmente a su modo de voz. WIRED
Y en su control de seguridad, el equipo de OpenAI se dio cuenta de que ChatGPT puede clonar involuntariamente la voz del usuario en su respuesta. Reddit
3. Replika 💍
Si has leído el anterior punto, aquí vas a notar a la vez una fuerte conexión y contraste. Eugenia Kuyda, fundadora y CEO de Replika afirma en una larga entrevista en The Verge que está bien si nos terminamos casando con chatbots de IA-AI. Replika ofrece avatares que puedes personalizar para que sean tu amigo, terapeuta o incluso tu cita. Puedes interactuar con ellos a través de un chatbot, videollamadas y realidad virtual o aumentada.
La idea de Replika surgió de una tragedia personal: hace casi una década, un amigo de Eugenia murió, y ella usó sus conversaciones por correo y mensajes de texto para crear un chatbot que lo ‘resucitara’. Esto fue antes del auge de los modelos de lenguaje grandes (LLM), y hablan sobre cómo esta tecnología hace posibles estos compañeros y cuáles son sus límites. Eugenia dice que el objetivo de Replika no es reemplazar a los humanos, sino crear una nueva categoría de relación con un compañero de IA que siempre esté ahí para ti.
Actualmente, millones de personas usan Replika para charlas casuales, salud mental, coaching de vida e incluso romance. El año pasado, Replika eliminó la capacidad de intercambiar mensajes eróticos con sus bots, pero la función se reinstaló rápidamente después de que algunos usuarios informaron crisis de salud mental debido al cambio.😳
4. 700 riesgos ⚠️
Investigadores del prestigioso MIT ha lanzado una base de datos que identifica más de 700 riesgos potenciales de la IA-AI incluyendo problemas de privacidad, discriminación y desinformación. Este ‘repositorio de riesgos’ revela que los sistemas de IA son responsables de más peligros que los humanos y que la mayoría surgen después de su implementación. La base de datos destaca la necesidad de una supervisión continua y señala que incluso los marcos de seguridad actuales ignoran un 30% de los riesgos, especialmente en áreas como la interacción humano-computadora y la desinformación.
5. Vishing, la estafa 📞
Vishing es la estafa que consiste en recibir llamadas que emulan la voz de familiares pidiendo ayuda. En El País te cuentan los detalles para protegerte de esta nueva amenaza.
=
👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes.
IA-AI Newsletter

FLUX.1 sigue destacando en la comprensión de textos dentro de las inferencias, y los vídeos a partir de imágenes estáticas, no dejan indiferente a nadie. 👉 Vídeo animado con Kling.
Si quieres leer boletines o informes anteriores los puedes encontrar aquí
Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI
Gracias por leer IA-AI Newsletter. Lo mejor de la semana en creatividad IA-AI.
Suscríbete gratis para recibir nuevas publicaciones y apoyar nuestro trabajo.
Vigila la bandeja del correo basura, ¡no nos gusta estar ahí!