Microsoft se ha sumado a Meta y anunció que abrirá el código fuente de su IA más potente. El gigante tecnológico liberó Phi-4, su modelo de lenguaje de 14.000 millones de parámetros, ofreciéndolo en Hugging Face bajo una licencia de código abierto. Microsoft indicó que este paso beneficiará a la comunidad de investigación y desarrollo de IA.
De acuerdo con Venture Beat, varios desarrolladores de Microsoft anunciaron a través de su cuenta de X la disponibilidad de Phi-4 como modelo de código abierto. La liberación incluye los pesos (weights), el componente crucial de los modelos de lenguaje de gran tamaño que determina cómo se procesa la información y se generan los resultados.
Esto es fundamental para la verdadera disponibilidad de código abierto, permitiendo que terceros puedan personalizar y adaptar el modelo para aplicaciones específicas. La restricción anterior a Azure AI Foundry limitaba el acceso a las capacidades del modelo, ofreciéndolo principalmente bajo un acuerdo de licencia de investigación.
«Nos sorprendió mucho la respuesta al lanzamiento de Phi-4», dijo Shital Shah, ingeniero principal de investigación de inteligencia artificial de Microsoft, en X. “Mucha gente nos había pedido que lanzáramos los pesos. [U]nos incluso subieron pesos pirateados a HuggingFace… Bueno, no esperes más. ¡Hoy lanzamos el modelo oficial de Phi-4 en HuggingFace! ¡Con licencia MIT!».
Phi-4 es de código abierto y sin restricciones, según Microsoft
La liberación del código fuente de Phi-4 permite una utilización más amplia del modelo. Los desarrolladores pueden integrarlo en proyectos y ajustarlo para sus aplicaciones sin requerir grandes recursos computacionales o permiso explícito de Microsoft. Anteriormente, el modelo estaba restringido a la plataforma Azure AI Foundry.
Phi-4 se distingue por su rendimiento en tareas de razonamiento y lógica, logrando resultados notables en pruebas de referencia frente a sus competidores. Según los benchmarks, la IA de Microsoft ha superado a Gemini Pro y GPT-4o mini en razonamiento matemático y muestra un rendimiento sólido en HumanEval, un punto de referencia para la programación asistida por IA.
Microsoft afirma que durante el entrenamiento se emplearon procesos de seguridad y alineación, incluyendo el ajuste fino supervisado y la optimización de preferencias directas, para asegurar un rendimiento robusto y abordar las preocupaciones sobre la equidad y la confiabilidad.
El rendimiento de Phi-4 demuestra que los modelos más pequeños y bien diseñados pueden lograr resultados comparables o superiores en áreas específicas. Esta eficiencia se traduce en menores costos computacionales y un menor consumo de energía, lo que podría democratizar el acceso a la IA.
Además de Phi-4, Microsoft trabaja en una IA pensada para ejecutarse en los ordenadores Copilot+PC. A diferencia de su hermano mayor, Phi-Silica es un SLM que se integrará en todos los PC de esta categoría, incluidos los Surface Pro y Surface Laptop. Esta IA de 3.300 millones de parámetros está pensada para sacarle provecho a los chips Snapdragon X Elite de Qualcomm.