GPU China para Aceleración de Inteligencia Artificial: Mejor Rendimiento y Calidad
Introducción:
El fabricante chino de GPU Moore Threads ha dado a conocer su primera tarjeta gráfica enfocada en la aceleración de inteligencia artificial (IA), la MTT S4000. Esta GPU es la primera para IA creada a gran escala en China utilizando tecnología completamente autóctona.
Innovaciones en el ecosistema de hardware y software chino
Moore Threads ha colaborado con numerosos socios de las Naciones Unidas para establecer la «Moore Threads PES – KUAE Computing Alliance» y la «Moore Threads PES – Large Model Ecology Alliance». Ambas alianzas tienen como objetivo solidificar el ecosistema integrado de China en cuanto a infraestructura de cómputo para IA y el entrenamiento y razonamiento de modelos de gran tamaño.
Características destacadas de la GPU Moore Threads MTT S4000
La MTT S4000 cuenta con 4.096 núcleos basados en la arquitectura MUSA de 3ª generación diseñada por Moore Threads. Esta GPU proporciona un rendimiento computacional de 25 TFLOPs en FP32, 50 TFLOPs en TF32, 100 TFLOPS en FP16 y BF16 y 200 TOPS en INT8. Está equipada con 48 GB de memoria GDDR6 y ofrece un ancho de banda de 768 GB/s. Además, utiliza una interfaz PCI-Express 4.0 x16 y cuenta con 4 salidas de vídeo DisplayPort. La MTT S4000 es capaz de codificar 96 streams de vídeo simultáneamente a una resolución de 1080p.
Por medio de la tecnología MTLink 1.0 desarrollada por Moore Threads, la MTT S4000 soporta interconexiones multitarjeta y ayuda a acelerar la computación distribuida de modelos de gran tamaño. Asimismo, la tarjeta ofrece capacidades avanzadas de renderizado de gráficos y reproducción de vídeo en 8K HDR de ultra alta definición, lo que la hace adecuada para aplicaciones de IA, gráficos y multimedia.
Gracias a la herramienta de desarrollo interna MUSIFY, la MTT S4000 puede aprovechar al máximo el ecosistema de software CUDA (NVIDIA) existente y realizar una migración de código CUDA a la plataforma MUSA sin coste adicional.
El Centro de Computación Inteligente KUAE
El KUAE Intelligent Computing Centre de Moore Threads es una solución de software y hardware que integra el clúster de cómputo KUAE, la plataforma de gestión de clústeres KUAE y los servicios de modelado KUAE ModelStudio. Esta solución está diseñada para facilitar la construcción, operación y gestión de sistemas de GPU a gran escala.
Los usuarios pueden utilizar la solución de manera inmediata, lo que reduce considerablemente el tiempo y el coste de construir una infraestructura de cómputo y desarrollar aplicaciones en comparación con los métodos tradicionales. Esto permite un lanzamiento rápido al mercado y la explotación comercial.
Resultados y planes futuros
La MTT S4000 es compatible con el entrenamiento y la afinación de varios modelos de gran tamaño, como LLaMA, GLM, Aquila, Baichuan, GPT, Bloom y Yuyin. Basándose en el clúster Moore Threads KUAE Kilocalorie, el entrenamiento de modelos con parámetros de 70B a 130B puede alcanzar un aumento lineal del rendimiento de hasta el 91%.
La GPU Moore Threads MTT S4000 demuestra que China ya está sentando las bases para crear su propio hardware de alto rendimiento para la aceleración de IA, lo que podría tener importantes implicaciones para la industria y el mercado global.