Xiaomi sorprende con una reducción de precios de su API MiMo-V2.5 hasta un 98%

Xiaomi sorprende con una reducción de precios de su API MiMo-V2.5 hasta un 98%

Xiaomi ha anunciado recientemente una reducción permanente en los precios de sus APIs de la serie MiMo-V2.5. Estas reducciones representan un cambio significativo respecto al precio original de las API, alcanzando rebajas de hasta el 99%. Xiaomi ha simplificado también el modelo de precios, eliminando las diferencias entre las longitudes de la ventana de contexto. Los nuevos precios entraron en vigor a nivel mundial a medianoche del 27 de mayo, hora de Pekín.

La última caída de precios afecta tanto a las versiones MiMo-V2.5 como MiMo-V2.5 Pro. Específicamente, el costo por caché de entrada de la MiMo-V2.5 Pro se ha reducido a 0,025 yuanes por millón de tokens (aproximadamente 0,003 euros), lo que representa una reducción del 99%. Por otro lado, el precio para la MiMo-V2.5 ha bajado a 0,02 yuanes por millón de tokens (unos 0,0025 euros), logrando una reducción del 98%. En cuanto a los precios de salida, la MiMo-V2.5 Pro ahora cuesta 6 yuanes por millón de tokens (alrededor de 0,77 euros), mientras que la MiMo-V2.5 tiene un precio de 2 yuanes por millón de tokens (aproximadamente 0,26 euros), alcanzando reducciones máximas del 86% y 93%, respectivamente.

Además de las atractivas reducciones en los precios de las API, Xiaomi ha perfeccionado significativamente su sistema de facturación del Token Plan. El renovado Token Plan ofrece un uso incrementado, entre 5 y 8 veces más, sin costo adicional e introduce el concepto de Créditos para unas reglas de facturación más claras y comprensibles. Esta renovación se atribuye a las continuas mejoras de Xiaomi en su sistema de inferencia, llevadas a cabo por su equipo técnico.

Avances técnicos impulsados por Xiaomi

Detrás de estos avances se encuentra la completa integración de la tecnología SWA (Sliding Window Attention) a través de su sistema SGLang HiCache. Esta mejora ha reducido la carga de transferencia de datos entre sistemas de almacenamiento de múltiples niveles, incluidos GPU, CPU y SSD, a aproximadamente una séptima parte de los niveles anteriores. Al mismo tiempo, la cantidad de tokens cacheables ha aumentado casi cinco veces, resultando en mejoras notables en las tasas de aciertos de caché y la eficiencia de inferencia. Optimización adicional, como el paralelismo experto mejorado y las estrategias de longitud de entrada en cubos, han fortalecido aún más la capacidad de procesamiento de entrada en entornos de clúster, todo mientras se reduce el costo por token sin comprometer la calidad del servicio.

Fuente

La entrada Xiaomi sorprende con una reducción de precios de su API MiMo-V2.5 hasta un 98% se publicó primero en Domótica en Casa.

Eduardo Ruiz

Informático de vocación, apasionado de la tecnología y blogger desde hace mucho tiempo, escribo de lo que me entretiene y disfruto con ello. Si deseas seguirme, usa el rss del blog o en mi perfil de .