Microsoft presenta Phi-3, un modelo compacto de inteligencia artificial que funciona perfectamente en un dispositivo inesperado: el iPhone 15
Introducción
El auge de la inteligencia artificial (IA) generativa ha llevado a la creación de modelos como ChatGPT, eficaces pero que requieren potentes servidores en la nube para su funcionamiento. Microsoft está trabajando en cambiar esta dependencia con el desarrollo de Phi-3, su último modelo ligero de IA que no necesita de la nube para operar.
Phi-3 Mini, un modelo de IA ligero y potente
Microsoft ha presentado recientemente el Phi-3 Mini, la nueva iteración con 3.8 billones de parámetros de su modelo de IA ligero. Aunque reducir el número de parámetros suele afectar la eficiencia de un chatbot, la compañía afirma que Phi-3 es más eficiente que su predecesor Phi-2 y proporciona respuestas similares a un modelo 10 veces más grande.
Más versiones de Phi-3 en el futuro
Phi-3 Mini no es el único modelo ligero en desarrollo por Microsoft. La compañía planea lanzar dos versiones más, Phi-3 Small (7B) y Phi-3 Medium (14B), aumentando así la capacidad y potencia de estos modelos. Sin embargo, aún está por verse qué aplicaciones y usos específicos tendrán.
Phi-3 en comparación con ChatGPT
Eric Boyd, vicepresidente de Microsoft Azure AI Platform, señaló en una entrevista con The Verge, que Phi-3 es tan eficiente como modelos de lenguaje como GPT-3.5, lo que significa que puede funcionar de manera similar a ChatGPT pero en un tamaño más pequeño.
Phi-3, diseñado para dispositivos móviles y otras aplicaciones
El objetivo principal de Phi-3 es demostrar que es posible desarrollar un modelo de IA lo suficientemente pequeño como para ser ejecutado en dispositivos móviles, sin sacrificar el rendimiento y la experiencia del usuario. Además, Phi-3 es compatible con otros dispositivos, como pequeños servidores, PCs y portátiles.
Pruebas de Phi-3 en iPhone
Investigadores de Microsoft probaron Phi-3 Mini en un iPhone equipado con un procesador A16 Bionic, logrando una fluidez de 12 tokens por segundo. Aunque esta cifra no es excepcional, es notable considerando que se trata de un smartphone.
Competidores en el mercado de modelos ligeros de IA
Microsoft no está sola en este campo: otros modelos ligeros de IA como Gemini Nano, Google Gemma 2B y 7B, Claude 3 Haiku y Llama 3 8B de Meta también están ganando terreno en el mercado.
Entrenamiento de Phi-3: inspirado en cuentos infantiles
El proceso de aprendizaje de Phi-3 fue inspirado por la forma en que los niños aprenden a través de cuentos. Los investigadores utilizaron palabras simples y estructuras sencillas para entrenar al modelo, aunque tuvieron que recurrir a un modelo de lenguaje más avanzado para generar «libros infantiles» debido a la falta de material disponible.
Phi-3, más allá de sus predecesores
A diferencia de Phi-1 y Phi-2, que se centraban en la programación y el razonamiento respectivamente, Phi-3 combina ambas habilidades y mejora su desempeño. Aunque no puede competir con modelos como GPT-4, Phi-3 es una herramienta útil para operar con subconjuntos de datos internos y consumir menos recursos.
Pros y contras de utilizar Phi-3
Microsoft plantea a Phi-3 como una alternativa a los modelos más ambiciosos y precisos que requieren un mayor consumo energético. Aunque Phi-3 no ofrece respuestas tan precisas o completas como estos modelos, su eficiencia y capacidad de funcionar sin depender de la nube lo convierten en una solución viable para ciertos casos de uso y escenarios.