así es su nueva IA superpotente

Nvidia acaba de dar un contundente golpe en la mesa que ha debido resonar en las oficinas de Meta, Google y OpenAI. La compañía se ha adentrado de lleno en el mundo de la IA con un nuevo modelo de lenguaje llamado NVLM. De hecho, se acaba de presentar y las primeras pruebas ya lo posicionan como un claro competidor en las grandes ligas de la inteligencia artificial.

NVLM 1.0 es el conjunto de modelos de lenguaje que ha lanzado Nvidia, y en el que destaca NVLM-D-72B, una IA capaz de gestionar 72.000 millones de parámetros y que ha desmotrado un rendimiento increíble que ya rivaliza con GPT-4o, Llama 3-V-70B y Gemini 1.5 Pro.

En las primeras comparativas, NVLM-D ha dejado bastante claro que tiene un rendimiento excepcional en visión, texto y solución de problemas matemáticos. De hecho, para ser una primera versión, está muy a la par de los resultados de GTP-4o o Claude 3.5, dos modelos de lenguaje masivos muy consolidados en la industria.

NVLM-D, la joya de Nvidia que ya empieza a pulirse

En su puesta en marcha, Nvidia ha destacado el impresionante rendimiento y la buena adaptabilidad de NVLM-D-72B a las entradas visuales y al texto complejo. La compañía ha puesto mucho énfasis en su percepción de las imágenes, la alta capacidad para resolver problemas basados en la visión e incluso, su buen desempeño a la hora de comprender memes.

De hecho, es verdaderamente interesante ver los resultados de la primera prueba comparativa con los grandes reyes de la industria. No solo se acerca peligrosamente a modelos como GPT-4o o Claude 3.5, sino que en algunos escenarios concretos es capaz de superarlos.

El mejor ejemplo es su desempeño con las tareas de texto. Mientras que otros modelos se están centrando en la visión y la resolución de problemas complejos, NVLM-D sigue poniendo el foco en la compresión avanzada del lenguaje, lo que le ha permitido superar a los grandes y situarse como una referencia en su primer día de vida.

Ver fuente

Related Post