✨IA-AI W47/2024

Inteligencia Artificial - Artificial Intelligence

Inteligencia Artificial - Artificial Intelligence · El boletín informativo que llega los lunes a las 00:01 CET

Las noticias más relevantes de los últimos 7 días recopiladas y analizadas por y para creativos entusiastas de la Inteligencia Artificial - Artificial Intelligence ¡Tira del hilo, tira del link!

IA-AI Virtual Assistants (LLMs) / Chatbots

1. ChatGPT: por si no lo sabes

  1. Advanced Voice ya se está implementando en la versión web de escritorio chatgpt.com para todos los usuarios de pago. Según sistema y navegador puede tardar unos días más. Así como en la versión móvil es muy útil para anotar ideas que se te ocurren mientras caminas o conduces, la versión escritorio puede ayudarte a redactar documentos en plan manos libres por poner un ejemplo.

  2. Ahora OpenAI está considerando crear un navegador para competir con Google. reuters

2. Gemini-Exp-1114 y Gemini-Exp-1121

Gemini-Exp-1121 de Google ha superado a GPT-4 en pruebas de rendimiento, destacando en matemáticas, programación y escritura creativa. Como siempre, esta ventaja es provisional, ya que se está probando una nueva versión de GPT-4. Además existen preocupaciones sobre la seguridad de Gemini. Puedes probarlo en AI Studio seleccionando el modelo 1121 a tu derecha. La semana empezó con el 1114 y en cuatro días hemos tenido que modificar este artículo.

3. Pixtral Large de Mistral

Mistral AI lanza Pixtral Large, un modelo de IA de 124 mil millones de parámetros, gratuito y de código abierto. Este modelo multimodal puede procesar imágenes con Flux1.1, entender documentos, generar arte, buscar en la web y programar en tiempo real. La plataforma Le Chat, donde se aloja, también incluye nuevas funciones como lienzo para código, análisis de PDF, generación de imágenes y creación de agentes. Gratis de momento.

4. Gemini

Google Gemini implementa para usuarios Advanced, memoria para recordar información y guardar contexto proporcionado por el usuario anteriormente. Gemini la llama "Información guardada". Está no se utiliza como entrenamiento según Google y la idea es llegar poco a poco a la memoria infinita. X

De hecho, OpenAI y Microsoft también están trabajando hacia una memoria infinita y parece que van mucho más avanzados. Lo veremos el próximo año.

5. Claude. “RIP” Powerpoint

En X nos enseñan cómo convertir pdfs a presentaciones ppt con Claude.

IA-AI Image

1. Ideogram 🙌💯

¿Sabías que Ideogram Canvas es la herramienta definitiva para la colocación de productos? En este tutorial paso a paso, aprenderás cómo crear ubicaciones de productos con calidad profesional utilizando su función Magic Fill.

2. Flux.1 Tools

Black Forest Labs acaba de lanzar FLUX.1 Tools, un conjunto de modelos IA-AI diseñados para mejorar y agregar control a su modelo base de texto a imagen FLUX.1. Consta de cuatro características principales disponibles tanto en las versiones de acceso abierto [dev] como profesional [pro]:

  • FLUX.1 Fill: modelos de última generación para relleno y extensión de imágenes (inpainting y outpainting), que permiten la edición y expansión de imágenes reales y generadas a partir de una descripción de texto y una máscara binaria

  • FLUX.1 Depth y FLUX.1 Canny: el condicionamiento estructural (Canny/profundidad) permite control preciso en transformaciones de imagen, manteniendo la estructura para editar y retexturizar

  • FLUX.1 Redux: permite mezclar y recrear imágenes de entrada e indicaciones de texto con salidas de 4 megapíxeles de alta calidad

Se implementarán durante los próximos días en fal.ai, Replicate, Together.ai, Freepik, krea.ai … y lo seguiremos de cerca.

FLUX.1 Fill inpainting

IA-AI Models in Hugging Face Spaces & Replicate & +

1. akhaliq / anychat

Puedes probar los más importantes LLMs en este space llamado Anychat, incluso las últimas versiones de pago de ChatGpt –actualmente llamado GPT 4o-2024-11-20–aunque no pagues. Ideal para comparar resultados. ¡También podrás crear imágenes con Flux!

2. InstantX's FLUX.1-dev-IP-Adapter

Sube una imagen como referencia y pídele que haga algo parecido.

IA-AI Video

1. Freepik

Ahora en Freepik puedes crear tus propios vídeos a partir de prompts o imágenes eligiendo entre cuatro modelos diferentes: Runway, LumaLabs, Mochi, o Minimax.

2. HeyGen. Actualizaciones 🙌💯

HeyGen te permite generar vídeos de ti mismo o avatares virtuales con cualquier atuendo y fondo a partir de simples indicaciones de texto, además de añadir movimiento realista a los fondos. También han mejorado su traducción de vídeo con mejor calidad de sonido y lanzado un grabador de pantalla con IA que integra avatares en tus grabaciones. Estas novedades permiten crear contenido audiovisual de forma más rápida, económica y creativa pero es que además, con la recién salida app HeyGen para iOS, puedes crear avatares fotográficos, avatares de video, traducir tus videos a más de 175 idiomas 🤯 y compartir tu historia con el mundo, todo desde la palma de tu mano. De lo mejor en este campo.

3. Descript 🙌💯

Desconocido para muchos pero de los más usados en el mundo, Descript es un editor de vídeo intuitivo con el que puedes crear y editar vídeos, traducirlos, seleccionar los clips que tienen más probabilidades en convertirse virales, eliminar tus emmms, cambiar los fondos, transcribir y añadir subtítulos, crear podcasts…

4. Kling

La nueva actualización de Kling 1.5 ahora soporta Motion Brush y Camera Movement en el Modo Profesional.

5. Runway 🙌💯

Runway acaba de lanzar Expand Video y poco a poco estará disponible para todo el mundo. Puede ser un gran recurso en muchas ocasiones.

6. LumaLabs 

Estemos atentos a lumalabs. Lo van a petar en las próximas horas o días.

IA-AI Audio/Music

Spotify en apuros

Spotify se enfrenta a una oleada de contenido basura generado por IA que suplanta a artistas legítimos y desvía sus regalías. Estafadores utilizan algoritmos para crear música falsa, a menudo bajo nombres de bandas que imitan a artistas reales, y la suben a través de distribuidores que no verifican adecuadamente la autenticidad. Estos álbumes fraudulentos, a veces indistinguibles a simple vista pero de baja calidad musical, inundan las páginas de artistas legítimos, confundiendo a los fans y robando las ganancias que deberían ir a los creadores originales. La situación se agrava por la dificultad de filtrar este contenido y plantea un desafío significativo para la plataforma y la industria musical en general. theverge

IA-AI Google

Generador de imágenes en Google Docs

Google Workspace está añadiendo un generador de imágenes con IA-AI, impulsado por Gemini, directamente en Google Docs. Esta función, similar a la de Microsoft Office, permite a los usuarios con cuentas Workspace de pago crear imágenes rápidamente en sus documentos. Se accede a través de Insert > Image > Help me create an image y utiliza el generador Imagen 3 de Google para producir imágenes con mejor detalle y calidad. La implementación se hará progresivamente hasta mediados de diciembre. theverge

IA-AI Microsoft

1. Copilot Actions & Copilot Agents

Microsoft lanza Copilot Actions y Copilot Agents. Las acciones automatizan tareas repetitivas, como recopilar actualizaciones semanales mientras que los agentes actúan como trabajadores especializados para trabajos más complejos. microsoft

2. Interpreter in Teams 🙌💯

Microsoft revoluciona Teams con clonación de voz para traducción en tiempo real y permitirá a los usuarios de Teams clonar su voz para hablar en reuniones en nueve idiomas diferentes, incluso si no los dominan. La herramienta Interpreter traducirá el discurso en tiempo real y lo reproducirá con la voz clonada del usuario, ofreciendo una experiencia más personal y atractiva.

La IA-AI de Microsoft analizará muestras de voz del usuario y creará una réplica digital que podrá hablar en inglés, francés, alemán, italiano, japonés, coreano, portugués, chino mandarín y español. Saldrá a la luz a principios de 2025 para suscriptores de Microsoft 365 y aseguran que no se almacenan datos biométricos y que la función se puede desactivar. techcrunch

Artista destacado de la semana: @bennettwaisbren

IA-AI Key Concepts (21)

Procesamiento del Lenguaje Natural* (PLN). Más allá de los chatbots

Imagínate poder hablar con tu computadora en un lenguaje natural, como lo harías con un amigo, y que ella te entienda y responda de forma coherente. Eso es precisamente lo que el Procesamiento del Lenguaje Natural (PLN) busca lograr. Aunque los chatbots como ChatGPT son una de las aplicaciones más visibles del PLN, esta rama de la inteligencia artificial va mucho más allá de la simple generación de texto. El PLN es la ciencia que permite a las máquinas comprender, interpretar y generar lenguaje humano, abriendo un abanico de posibilidades fascinantes.

En el corazón del PLN se encuentran algoritmos complejos y modelos de aprendizaje profundo que analizan las estructuras gramaticales, el significado semántico y el contexto del lenguaje. A diferencia de los primeros sistemas que se basaban en reglas predefinidas, el PLN moderno utiliza técnicas de machine learning para aprender de grandes cantidades de datos textuales, permitiendo a las máquinas identificar patrones, entender matices del lenguaje y adaptarse a diferentes estilos de comunicación. Un ejemplo claro es la traducción automática, donde el PLN no solo traduce palabras, sino que intenta capturar el significado y la intención del texto original.

La traducción automática es solo un ejemplo del poder del PLN. Los sistemas actuales, aunque todavía imperfectos, han mejorado enormemente gracias a los avances en redes neuronales, siendo capaces de traducir textos completos manteniendo un grado significativo de precisión y fluidez. Pero el PLN no se limita a la traducción; también juega un papel crucial en el análisis de sentimiento, una técnica que permite a las empresas entender la opinión pública sobre sus productos o servicios a partir de comentarios en redes sociales, reseñas de productos y otros textos. Imagina poder analizar miles de tweets para determinar si los usuarios están hablando positivamente o negativamente sobre el lanzamiento de un nuevo producto. Esto es posible gracias al PLN, que puede identificar las emociones y opiniones expresadas en el lenguaje escrito.

Además, el PLN permite resumir grandes volúmenes de texto de manera eficiente, extrayendo la información más relevante y presentándola de forma concisa. Esta capacidad es invaluable en campos como el periodismo y la investigación, donde se requiere procesar grandes cantidades de información rápidamente. Los asistentes virtuales, como Siri o Google Assistant, también se benefician del PLN, ya que les permite entender y responder a nuestras preguntas y comandos de voz de manera más natural e intuitiva. A diferencia de los chatbots que se centran en la conversación, estos asistentes utilizan el PLN para realizar tareas específicas, como configurar una alarma, buscar información o controlar dispositivos domésticos inteligentes.

El impacto del PLN se extiende a campos tan diversos como la educación, la atención al cliente y la medicina. En educación, el PLN puede personalizar el aprendizaje adaptando el contenido y el ritmo de enseñanza a las necesidades individuales de cada estudiante. En la atención al cliente, los sistemas de PLN pueden automatizar respuestas a preguntas frecuentes, liberando a los agentes humanos para que se concentren en problemas más complejos. En medicina, el PLN puede analizar informes médicos y ayudar a los profesionales a identificar patrones y tomar decisiones más informadas. Estas son solo algunas de las muchas aplicaciones que demuestran el potencial transformador del PLN.

Sin embargo, a pesar de los avances impresionantes, el PLN aún enfrenta desafíos significativos. La ambigüedad del lenguaje humano, el uso de sarcasmo, las expresiones idiomáticas y las diferencias culturales son solo algunos de los obstáculos que los sistemas de PLN deben superar para alcanzar una comprensión verdaderamente humana. A medida que la tecnología avanza, podemos esperar ver sistemas de PLN cada vez más sofisticados que sean capaces de entender y generar lenguaje con mayor precisión y naturalidad. El futuro del PLN promete una interacción más fluida y natural entre humanos y máquinas, cambiando la forma en que nos comunicamos y accedemos a la información.

*en inglés NLP (Natural Language Processing)

IA-AI Interesting News

1. La que se avecina

Aquí somos amigos de la IA-AI pero somos conscientes de la que se avecina. En el mercado laboral, millones de puestos de trabajo van a desaparecer de la noche a la mañana. Uno de los afectados compartió en Reddit cómo todo su equipo acababa de ser despedido, reemplazado por IA.

2. Informe del Estado de la IA Generativa en la Empresa

¿Quiénes están ganando en la carrera de la IA? Un estudio con 600 líderes de IT en EE.UU. revela las tendencias clave. Informe largo y completo.

3. The Dor Brothers

Y terminamos con un vídeo IA-AI de sátira política =por calificarlos de alguna manera– generado por The Dor Brothers. Puedes ver muchos más en su cuenta de X.

=

👋🏻 Y esto ha sido todo. Si te ha parecido interesante, nos vemos el próximo lunes. 💃🕺🏻

IA-AI Newsletter Team

Nos hemos comprado un coche IA-AI. Krea + Runway 👉 VideoLab de la semana.

Si quieres leer boletines o informes anteriores los puedes encontrar aquí

Si tienes prisa, te recomendamos al menos leer los puntos indicados con  🙌💯

Y recuerda que siempre puedes consultar definiciones de términos relacionados con la IA-AI en nuestro pequeño y modesto Diccionario IA-AI

Los boletines contienen artículos solo visibles para suscriptores del