Gemini recibe una poderosa actualización con edición de imágenes generativa

Por: Anry Sergeev | Actualizado 27.08.2025, 10:56

Análisis en profundidad de Gemini: un collage de resultados

Collage con los resultados del trabajo de Gemini. Fuente: Google

Google ha anunciado una gran actualización de sus herramientas de edición de imágenes en la aplicación Gemini. Desarrollado por el equipo de DeepMind, el nuevo modelo ya ha recibido las calificaciones más altas en las pruebas iniciales y está disponible para todos los usuarios de Gemini. El modelo permite crear y modificar fotos de manera que las personas o animales representados sigan siendo reconocibles y naturales.

Lugar	Modelo	Puntuación	IC 95% (±)	Votos	Organización	Licencia
1	gemini-2.5-flash-image-preview (nano-banana)	1362	±2	2 521 035	Google.	Propietario
2	flux-1-kontext-max	1191	±3	357 196	Black Forest Labs	Propietario
3	flux-1-kontext-pro	1174	±2	2 015 530	Black Forest Labs	Propietario
3	gpt-image-1	1170	±3	1 026 399	OpenAI	Propietario
5	flux-1-kontext-dev	1152	±3	1 584 400	Black Forest Labs	Propietario
6	qwen-image-edit	1145	±2	1 585 904	Alibaba	Apache 2.0
6	seededit-3.0	1142	±4	1 285 080	Bytedance	Propietario
8	gemini-2.0-flash-preview-image-generation	1093	±3	1 700 785	Google	Propietario
9	bagel	1044	±5	12 774	Bytedance	Apache 2.0
10	step1x-edit	1017	±4	138 399	StepFun	Apache 2.0

Fuente: lmarena.ai

Qué ha cambiado

La nueva versión de Gemini funciona con un enfoque en la autenticidad. Anteriormente, la inteligencia artificial podía "reformar" rasgos faciales o cambiar la apariencia durante la edición, pero ahora el sistema minimiza tales desviaciones. Esto significa que los amigos en las fotos se verán como amigos, y las mascotas se verán como mascotas, incluso después de cambiar su peinado, ropa o entorno.

Gemini ha aprendido a

transferir personas u objetos a un entorno diferente sin perder el reconocimiento;
agregar o reemplazar cosas y muebles en una foto mientras deja otros elementos sin cambios;
aplicar el estilo de una parte de la imagen a otra (por ejemplo, el color de las flores en la ropa);
combinar fotos para crear escenas completamente nuevas.

Un ejemplo de cambiar los roles de un personaje

Un ejemplo de cambio de roles de un personaje. Ilustración: Google

Ejemplos de uso

Fotos familiares: si alguien parpadea, el algoritmo ajustará solo la expresión facial.
Mascotas: un perro con un nuevo collar seguirá siendo la misma mascota, no una "nueva raza".
Experimentos de moda: puedes probar diferentes ropas o zapatos directamente en la foto.
Renovación y diseño: es fácil imaginar cómo se verá una habitación con nuevos muebles o color de pared.
Escenas fantásticas: amigos del patio trasero pueden encontrarse en París o en Marte - y seguir siendo reconocibles.

Un ejemplo de mezcla de dos imágenes. Ilustración: Google

Por qué es importante

Google posiciona el Gemini actualizado como una herramienta para un nuevo nivel de personalización y narración visual. El modelo abre oportunidades para la creatividad, comunicación en línea y trabajo profesional con contenido visual - desde la creación de álbumes familiares hasta campañas publicitarias.

Un ejemplo de una combinación de diseño. Ilustración: Google

Según los desarrolladores, todos los cálculos se realizan manteniendo la privacidad del usuario, y la actualización es solo el primer paso hacia funciones de edición aún más flexibles.

Fuente: Google

Anuncios Inteligencia artificial