Xiaomi MiMo UltraSpeed supera los 1000 tokens por segundo en GPUs estándar

Por: Carmen Ruiz | hoy dia, 10:33
Xiaomi MiMo UltraSpeed supera los 1000 tokens por segundo en GPUs estándar

Xiaomi ha presentado el modo UltraSpeed para su modelo de IA MiMo-V2.5-Pro, capaz de superar los 1000 tokens por segundo en un modelo de un billón de parámetros usando GPUs de uso general —sin chips especializados—. Para ponerlo en contexto: GPT-4 ronda los 68 tokens por segundo y Gemini Flash llega a unos 192. Si las cifras se confirman de forma independiente, representa un salto considerable en la velocidad de inferencia a coste asumible.

La tecnología detrás del récord

El salto de rendimiento se consigue combinando tres técnicas: cuantización FP4 aplicada a las capas expertas del modelo, un sistema de decodificación especulativa llamado DFlash, y el motor de ejecución TileRT, desarrollado junto a la empresa del mismo nombre. El resultado es un pico de hasta 1200 tokens por segundo sostenido en nodos de ocho GPUs estándar. El predecesor, MiMo-V2-Flash, lanzado en diciembre de 2025, alcanzaba unos 150 tokens por segundo; UltraSpeed es aproximadamente 6,7 veces más rápido, según el anuncio oficial Xiaomi MiMo.

Xiaomi también ha publicado el checkpoint FP4-DFlash en Hugging Face y los módulos TileRT en GitHub, lo que permite a cualquier equipo técnico replicar y probar el sistema por su cuenta.

Disponibilidad y precio en España

Aquí llega la letra pequeña. El periodo de prueba va del 9 al 23 de junio de 2026, y el acceso no es libre: hay que solicitar aprobación a través de xiaomimimo.com, con prioridad para desarrolladores y empresas con casos de uso concretos. Los aprobados obtendrán dos semanas de acceso gratuito, pero con restricciones: máximo 10 solicitudes en cola por cuenta al día, sesiones limitadas a 30 minutos y desconexión automática tras 5 minutos de inactividad.

Una vez pasado el periodo de prueba, usar UltraSpeed vía API costará el triple que la tarifa estándar de MiMo-V2.5-Pro. No hay precios publicados en euros ni ningún acuerdo con distribuidores en España —ni Amazon.es, ni MediaMarkt, ni Telefónica mencionan el servicio—, según el análisis de Gizmochina. Tampoco hay declaración pública sobre dónde se almacenan los datos ni sobre el cumplimiento de la normativa española (LSSI-CE) o del RGPD europeo.

¿Merece la pena esperarlo?

Para la mayoría de desarrolladores en España, la respuesta inmediata es: todavía no. Alternativas como Mistral tienen presencia activa en el mercado europeo, DeepSeek ofrece modelos de código abierto a bajo coste y Groq lleva tiempo empujando en velocidad de inferencia, aunque con hardware propietario. UltraSpeed es técnicamente ambicioso, pero sin precios locales, sin socio distribuidor y con acceso cerrado al trial, su impacto real en el ecosistema español queda pendiente de concretar.