Microsoft lanza el chip Maia 200 para optimizar la inferencia AI
Microsoft ha anunciado el lanzamiento de su nuevo chip, el Maia 200, diseñado específicamente para optimizar el proceso de inferencia en inteligencia artificial (AI). Esta nueva unidad de procesamiento sigue al Maia 100, lanzado en 2023, y se presenta como una herramienta clave para escalar operaciones en el ámbito de la AI.
El Maia 200 cuenta con más de 100 mil millones de transistores, ofreciendo más de 10 petaflops en precisión de 4 bits y aproximadamente 5 petaflops de rendimiento en 8 bits, lo que representa un aumento significativo en comparación con su antecesor.
El término inferencia se refiere al proceso de ejecutar un modelo entrenado, contraste con la computación necesaria para entrenarlo. A medida que las empresas de AI evolucionan, los costos de inferencia se han vuelto cada vez más relevantes, provocando un interés renovado en optimizar este proceso.
Con el lanzamiento del Maia 200, Microsoft espera contribuir a la optimización de las empresas de AI, mejorando su eficiencia y reduciendo el consumo de energía. La compañía afirmó que un solo nodo del Maia 200 puede manejar los modelos más grandes de la actualidad con margen para futuros desarrollos más complejos.
Este nuevo chip también forma parte de una tendencia creciente entre las grandes empresas tecnológicas, que buscan diseñar sus propios chips para disminuir la dependencia de Nvidia, un proveedor fundamental de GPUs. Empresas como Google y Amazon han desarrollado chips como el TPU y Trainium, respectivamente, para diversificar sus capacidades y reducir costos.
Microsoft ha resaltado que el Maia 200 ofrece un rendimiento de 3 veces superior en FP4 en comparación con los chips de tercera generación de Amazon Trainium, y un rendimiento en FP8 por encima del de la séptima generación del TPU de Google.
El chip ya está en funcionamiento, apoyando los modelos de AI del equipo de Superintelligence de Microsoft y facilitando las operaciones de su chatbot Copilot. La compañía también ha invitado a desarrolladores, académicos y laboratorios de AI de vanguardia a utilizar el kit de desarrollo de software del Maia 200 en sus proyectos.

