Gemini recibe una poderosa actualización con edición de imágenes generativa
Google ha anunciado una gran actualización de sus herramientas de edición de imágenes en la aplicación Gemini. Desarrollado por el equipo de DeepMind, el nuevo modelo ya ha recibido las calificaciones más altas en las pruebas iniciales y está disponible para todos los usuarios de Gemini. El modelo permite crear y modificar fotos de manera que las personas o animales representados sigan siendo reconocibles y naturales.
Lugar | Modelo | Puntuación | IC 95% (±) | Votos | Organización | Licencia |
---|---|---|---|---|---|---|
1 | gemini-2.5-flash-image-preview (nano-banana) | 1362 | ±2 | 2 521 035 | Google. | Propietario |
2 | flux-1-kontext-max | 1191 | ±3 | 357 196 | Black Forest Labs | Propietario |
3 | flux-1-kontext-pro | 1174 | ±2 | 2 015 530 | Black Forest Labs | Propietario |
3 | gpt-image-1 | 1170 | ±3 | 1 026 399 | OpenAI | Propietario |
5 | flux-1-kontext-dev | 1152 | ±3 | 1 584 400 | Black Forest Labs | Propietario |
6 | qwen-image-edit | 1145 | ±2 | 1 585 904 | Alibaba | Apache 2.0 |
6 | seededit-3.0 | 1142 | ±4 | 1 285 080 | Bytedance | Propietario |
8 | gemini-2.0-flash-preview-image-generation | 1093 | ±3 | 1 700 785 | Propietario | |
9 | bagel | 1044 | ±5 | 12 774 | Bytedance | Apache 2.0 |
10 | step1x-edit | 1017 | ±4 | 138 399 | StepFun | Apache 2.0 |
Fuente: lmarena.ai
Qué ha cambiado
La nueva versión de Gemini funciona con un enfoque en la autenticidad. Anteriormente, la inteligencia artificial podía "reformar" rasgos faciales o cambiar la apariencia durante la edición, pero ahora el sistema minimiza tales desviaciones. Esto significa que los amigos en las fotos se verán como amigos, y las mascotas se verán como mascotas, incluso después de cambiar su peinado, ropa o entorno.
Gemini ha aprendido a
- transferir personas u objetos a un entorno diferente sin perder el reconocimiento;
- agregar o reemplazar cosas y muebles en una foto mientras deja otros elementos sin cambios;
- aplicar el estilo de una parte de la imagen a otra (por ejemplo, el color de las flores en la ropa);
- combinar fotos para crear escenas completamente nuevas.
Un ejemplo de cambio de roles de un personaje. Ilustración: Google
Ejemplos de uso
- Fotos familiares: si alguien parpadea, el algoritmo ajustará solo la expresión facial.
- Mascotas: un perro con un nuevo collar seguirá siendo la misma mascota, no una "nueva raza".
- Experimentos de moda: puedes probar diferentes ropas o zapatos directamente en la foto.
- Renovación y diseño: es fácil imaginar cómo se verá una habitación con nuevos muebles o color de pared.
- Escenas fantásticas: amigos del patio trasero pueden encontrarse en París o en Marte - y seguir siendo reconocibles.
Un ejemplo de mezcla de dos imágenes. Ilustración: Google
Por qué es importante
Google posiciona el Gemini actualizado como una herramienta para un nuevo nivel de personalización y narración visual. El modelo abre oportunidades para la creatividad, comunicación en línea y trabajo profesional con contenido visual - desde la creación de álbumes familiares hasta campañas publicitarias.
Un ejemplo de una combinación de diseño. Ilustración: Google
Según los desarrolladores, todos los cálculos se realizan manteniendo la privacidad del usuario, y la actualización es solo el primer paso hacia funciones de edición aún más flexibles.
Fuente: Google