Amazon anuncia Nova, sus nuevos modelos de IA multimodales

Tal y como se rumoreaba, el evento re:Invent de AWS ha traído novedades importantes en materia de inteligencia artificial generativa. Amazon ha anunciado Nova, su nueva familia de modelos fundacionales con capacidades multimodales, y también ha presentado Nova Canvas y Nova Reels, dos modelos dedicados a la creación de imágenes y vídeos a partir de texto.

El catálogo de Amazon Nova se compone de cuatro modelos de IA fundacionales: Micro, Lite, Pro y Premier. Los tres primeros ya se encuentran disponibles a través de la plataforma Amazon Bedrock, mientras que el último aún está en etapa de entrenamiento. No obstante, la empresa aspira a lanzarlo a comienzos del próximo año.

Amazon Nova Micro solamente funciona con texto como método de entrada y salida, mientras que las variantes más potentes permiten trabajar, además, con fotos y vídeos. La firma que dirige Andy Jassy busca ofrecer soluciones que se adapten a las distintas necesidades de los usuarios, a costes razonables.

Estas son las características más destacadas de las nuevas IA de Amazon:

  • Amazon Nova Micro: como indicamos previamente, funciona solo con texto como método de entrada y de salida. De acuerdo con la compañía, esto le permite operar con la menor latencia posible y a muy bajo coste. Ofrece soporte para más de 200 idiomas y su extensión de contexto máxima es de 128.000 tokens. Está pensada principalmente para labores de traducción, generación de resúmenes y programación, entre otras posibilidades.
  • Amazon Nova Lite: a diferencia del anterior, no se limita al texto como método de entrada, pues también soporta el uso de imágenes y vídeos. Sin embargo, sí ofrece respuestas solamente en formato de texto. Soporta más de 200 idiomas y puede procesar instrucciones de hasta 300.000 tokens. Amazon lo define como una IA multimodal de bajo coste, con capacidades especialmente pensadas para labores de aprendizaje automático para transferir conocimiento de un modelo grande a otro más pequeño.
  • Amazon Nova Pro: es la opción más potente de las tres que están disponibles desde hoy. También puede procesar instrucciones de hasta 300.000 tokens, pero destaca por su velocidad y precisión. De acuerdo con Amazon, funciona extremadamente bien en el análisis de documentos financieros, así como en la creación de resúmenes de vídeos, el desarrollo de software y el razonamiento matemático.
  • Amazon Nova Premier: este será el modelo fundacional más avanzado de la compañía, con capacidades enfocadas en tareas de razonamiento complejo. No obstante, no se han brindado demasiados detalles al respecto. Se espera que debute en los primeros meses de 2025.

Nova Canvas y Nova Reels: Amazon redobla esfuerzos en la creación de imágenes y vídeos

YouTube videoYouTube video

Más allá de los nuevos modelos fundacionales, Amazon ha presentado otros dos modelos generativos dedicados a la creación de imágenes y vídeos a partir de texto: Nova Canvas y Nova Reels, respectivamente.

El primero promete generar imágenes de calidad profesional a través de prompts de hasta 1.024 caracteres de extensión. Además, incluye múltiples herramientas integradas para la eliminación de fondos y el ajuste del esquema de colores, entre otras posibilidades de edición. Una de sus limitaciones es que, por ahora, solamente funciona en inglés.

Ver fuente

Related Post