Google lanza Gemma 4 12B: IA multimodal gratuita que funciona en tu portátil
Google acaba de lanzar Gemma 4 12B, un modelo de inteligencia artificial multimodal de código abierto que funciona directamente en portátiles con 16 GB de memoria unificada o de vídeo. El modelo, disponible desde el 3 de junio de 2026, alcanza un rendimiento comparable al de sistemas con 26.000 millones de parámetros sin depender de servidores en la nube. Para cualquiera que trabaje con IA y quiera mantener sus datos fuera de servicios externos, esto cambia el cálculo.
Sin encoders, sin complicaciones
La arquitectura de Gemma 4 12B elimina los módulos separados que los modelos anteriores usaban para procesar imágenes y audio. En lugar de eso, integra esas señales directamente en el modelo de lenguaje principal: las imágenes se manejan mediante transformaciones matriciales ligeras y el audio se proyecta directamente al espacio de tokens de texto. El resultado es un sistema más compacto que, según confirma el Blog Oficial Google, rinde casi igual que modelos del doble de tamaño, ocupando menos de la mitad de memoria.
Con cuantización de 4 bits es posible ejecutarlo incluso en equipos con 8 GB de RAM, lo que amplía considerablemente el rango de hardware compatible. La ventana de contexto es de 256.000 tokens y el modelo soporta más de 140 idiomas, incluido el español.

Inferencia local, datos en casa
El modelo incorpora Multi-Token Prediction (MTP), una técnica que reduce la latencia al generar varias palabras a la vez en lugar de una sola. Esto es especialmente útil para flujos de trabajo agénticos, donde la IA ejecuta tareas encadenadas como asistente, no solo genera texto puntual.
La licencia Apache 2.0 permite uso comercial sin restricciones de patentes, algo que los desarrolladores independientes y startups valorarán frente a modelos propietarios. La descarga es gratuita en Hugging Face y Kaggle, sin restricciones geográficas. Según el Google AI Edge Blog, también hay aplicaciones nativas para macOS que permiten ejecutarlo sin configuración adicional.
No hay disponibilidad anunciada en plataformas como Amazon.es, PcComponentes o MediaMarkt: se trata de un modelo para desarrolladores, no de un producto de consumo directo. La familia Gemma acumula ya más de 150 millones de descargas, según Google.
¿Qué significa para el mercado español?
Los servicios de IA que facturan por inferencia en la nube —incluyendo los apoyados en AWS o Azure— se enfrentan a una alternativa gratuita y funcional para casos de uso de tamaño medio. Modelos locales como Labellerr Fine-Tuning Guide muestran que el ajuste fino es posible sin necesidad de encoders congelados, lo que da más flexibilidad a equipos técnicos que quieran personalizar el modelo para sectores como el legal, el sanitario o el educativo en español.