2026/04/06

Agente de imágenes IA: Genera una sola imagen o cien — Sin cambiar de herramientas

El agente de imágenes IA de NanoBanana se encarga de todo, desde imágenes de concepto individuales hasta transferencias de estilos por lotes en una sola conversación. No se requiere ingeniería de prompt

Resumen rápido

El Agente de imágenes por IA de NanoBanana convierte el lenguaje natural en imágenes listas para producción — de forma individual o por lotes. Describe lo que quieras, y el Agente se encarga de la ingeniería de prompt, la relación de aspecto, la selección de modelos y la transferencia de estilo basada en referencias. Una sola charla. Sin cambiar de herramientas.

📌 Puntos clave (lectura de 10 segundos)

✅ Imagen única, sin fricción: Di "genera una imagen de X" — el Agente elabora el prompt optimizado y lo ejecuta de inmediato
✅ Modo por lotes: Hasta 20 imágenes en una sola solicitud — fotos de producto, variantes de publicidad, hojas de personajes
✅ Transferencia de estilo: Sube una imagen de referencia, describe el estilo deseado — todas las salidas se mantienen alineadas con la marca
✅ Expansión de guion gráfico: Sube cualquier imagen → obtén 3 tomas cinematográficas de prompt para la producción de video
✅ Más de 6 modelos: Desde borradores de 2 créditos hasta calidad insignia de 6 créditos — el Agente elige el adecuado
⏱️ Tiempo de lectura: 4 minutos

El problema con la "generación de imágenes por IA" hoy en día

La mayoría de las herramientas de imágenes por IA te dan un cuadro de texto. Escribes algo, obtienes un resultado, ajustas, vuelves a generar. Repites el proceso. Funciona para una sola imagen. No funciona cuando necesitas veinte.

El otro problema: la ingeniería de prompt. Obtener una buena imagen de un modelo de difusión requiere un vocabulario específico — ángulos de cámara, condiciones de iluminación, modificadores de estilo, relaciones de aspecto técnicas. La mayoría de la gente no quiere aprenderlo. Quieren describir lo que quieren en lenguaje cotidiano y obtener la imagen correcta.

El Agente de imágenes por IA de NanoBanana resuelve ambos problemas. Traduce el lenguaje natural en prompts de generación optimizados, elige el modelo adecuado para la tarea y puede ejecutar un lote completo en el tiempo que tarda en describir lo que necesitas.

Agente de imágenes por IA en funcionamiento

Lo que puede hacer el Agente de imágenes por IA

Generación de una sola imagen

Este es el caso de uso más sencillo. Describes una imagen — con el nivel de detalle que quieras — y el Agente la genera de inmediato.

"Haz un paisaje urbano de ciencia ficción oscuro de noche, iluminación cinematográfica, plano amplio"

Entre bambalinas, el Agente:

Analiza tu intención (sujeto, estilo, ambiente, composición, iluminación)
Elige la relación de aspecto adecuada (16:9 para formato cinematográfico, 9:16 para retrato, 1:1 para redes sociales)
Selecciona un modelo apropiado según la expectativa de calidad y el costo
Redacta un prompt en inglés específico y detallado — sin descriptores vagos como "hermoso" o "bueno"
Lo ejecuta de inmediato — sin cuadro de confirmación

Obtienes la imagen. Si quieres una variante, describe el cambio en lenguaje natural.

💡 El Agente nunca pregunta "¿estás seguro?" al generar imágenes — actúa de inmediato, por lo que el ciclo de retroalimentación se mantiene ágil.

Generación de imágenes por lotes

Aquí es donde el Agente de imágenes se gana su nombre. Describe varias necesidades de imágenes en un solo mensaje, y el Agente las envía todas a la vez.

"Genera 8 fotos de producto de un altavoz inalámbrico en diferentes entornos: en un escritorio, parque al aire libre, cafetería, gimnasio, encimera de cocina, playa, fondo blanco de estudio y estante de salón. Con una estética de fotografía de estilo de vida moderno."

El Agente:

Crea 8 prompts optimizados separados, cada uno adaptado a su entorno específico
Envía los 8 en paralelo
Los renderiza como tarjetas individuales que se actualizan a medida que cada una se completa
Usa automáticamente un modelo rentable para lotes grandes

El modo por lotes admite hasta 20 imágenes por solicitud. Para proyectos más grandes, divide en lotes múltiples.

Generación de imágenes por lotes — 8 fotos de producto generadas en paralelo

Transferencia de estilo

Sube una imagen de referencia y describe el estilo deseado — el Agente aplica la transformación de forma coherente en la cantidad de salidas que necesites.

Casos de uso comunes:

Consistencia de marca: Sube la mascota de tu marca, genera 10 variaciones estacionales
Fotografía de producto: Sube fotos de producto, conviértelas a una estética específica (anime, pintura al óleo, dibujo lineal minimalista)
Consistencia de personaje: Crea un personaje una sola vez, reutilízalo como referencia para todas las generaciones posteriores

La imagen de referencia ancla la identidad visual. El prompt describe la transformación.

"Toma esta foto de producto [imagen] y réplicala al estilo de un cartel de publicidad japonesa vintage de la década de 1970"

Expansión de guion gráfico (img → tomas)

Este es el puente entre el Agente de imágenes y el Agente de video.

Sube cualquier imagen al chat y pide prompts de guion gráfico. El Agente analiza la imagen y genera 3 desgloses de tomas cinematográficas — ángulos, movimientos y momentos diferentes de la misma escena — cada uno optimizado para la generación de video.

Salida:

Toma 1: Plano amplio de presentación prompt
Toma 2: Plano medio cercano con movimiento
Toma 3: Detalle cercano o toma en POV

Cada prompt está listo para integrarse directamente en las herramientas de generación de vídeo de NanoBanana. La IA detecta automáticamente la relación de aspecto de tu imagen de origen, por lo que todos los planos se mantienen proporcionalmente consistentes.

Una vez aparezca el guion gráfico, el Agente te ofrecerá generar imágenes de vista previa para los 3 planos usando tu imagen original como referencia, para que puedas validar el aspecto antes de gastar créditos de generación de vídeo.

Expansión de guion gráfico — de una imagen a 3 planos cinematográficos

Modelos y Precios

El Agente selecciona un modelo automáticamente según el contexto de tu solicitud, pero siempre puedes especificar uno. Opciones actuales:

Model	Credits	Best for
gemini-2.5-flash	2cr	Borrados rápidos, iteraciones
grok-imagine	2cr	Fotorrealista, económico
gpt-4o	2cr	Creativo, seguimiento de instrucciones
flux2-klein	3cr	Rápido, buena calidad
nanobanana-2	4cr	Calidad equilibrada + enfoque web (predeterminado)
flux2	4cr	Equilibrado, versátil
seedream-4.0	4cr	Alta calidad
gemini-3-pro	6cr	Calidad máxima
flux2pro	6cr	Calidad premium
seedream-5.0	6cr	Calidad de próxima generación

Para lotes de trabajo (8–20 imágenes), el Agente usa por defecto un modelo rentable como flux2-klein (3cr) o grok-imagine (2cr) a menos que lo especifiques tú. Un lote de 10 imágenes a 2cr cada una = 20 créditos en total.

Cómo se diferencia de un generador de imágenes estándar

Feature	Plain text-to-image	NanoBanana Image Agent
Prompt engineering	Tú escribes el prompt	El Agente lo escribe a partir de tu descripción
Batch generation	Uno a la vez	Hasta 20 en paralelo
Style transfer	Construcción manual de prompt	Describe el estilo, adjunta una referencia
Model selection	Tú eliges	El Agente elige según la solicitud
Storyboard for video	No compatible	Incluye expansión de planos integrada
In-context follow-up	Empieza de nuevo	Modifica en la misma conversación

El valor del Agente de Imágenes no es un modelo de imágenes mejorado, sino una IA que entiende lo que intentas hacer y se encarga de las decisiones técnicas automáticamente.

Para quién es esto

Equipos de comercio electrónico que necesitan variaciones de fotografía de productos a gran escala. Sube la imagen de origen, describe los entornos o estilos deseados y obtén 20 variantes en minutos.

Gerentes de redes sociales que necesitan múltiples relaciones de aspecto o estilos visuales a partir de un solo concepto. Describe una sola vez y genera para todas las plataformas.

Diseñadores y directores creativos que quieren explorar direcciones visuales rápidamente antes de comprometerse a una sesión de fotos o una comisión de ilustración. Usa el Agente como herramienta de ideación.

Creadores de vídeo que necesitan imágenes de referencia antes de iniciar el flujo de trabajo del Director de Vídeo IA. Usa el Agente de Imágenes para establecer el lenguaje visual, luego entrega las referencias al Agente Director para crear el guion gráfico.

Cómo empezar

Abre una nueva conversación en NanoBanana y solo describe lo que quieras. Algunos ejemplos para probar:

"Genera un concepto de logotipo minimalista para una marca de café llamada Blackwood. Moderno, elegante, en escala de grises."
"Crea 5 imágenes de publicidad para una aplicación de fitness — muestra diferentes entornos de entrenamiento, sensación enérgica, 16:9"
"Toma esta foto de referencia [imagen] y réplicala como una ilustración al estilo de Studio Ghibli"
"Expande esta imagen en 3 planos de guion gráfico para un vídeo de producto"

🎨 Comienza a generar con el Agente de Imágenes →

Preguntas frecuentes

¿Funciona el Agente de Imágenes sin un proyecto o guion?

Sí. Las herramientas del Agente de Imágenes siempre están disponibles, no es necesario configurar ningún proyecto. Solo describe lo que quieras y genera.

¿Puedo especificar el modelo yo mismo?

Claro que sí. Solo mencionalo en tu solicitud ("usa gemini-3-pro para esto") o configura un modelo de imágenes preferido en las preferencias de tu cuenta. El Agente siempre respetará tu preferencia a menos que solicites algo diferente.

¿Cómo maneja los fallos la generación por lotes?

Si una imagen de un lote falla, las demás continúan. Solo se te cobrará por las generaciones exitosas. Los elementos fallidos se marcan en la tarjeta de resultado para que puedas reintentarlos de forma individual.

¿Cuál es el tamaño máximo de lote?

20 imágenes por solicitud. Para proyectos más grandes, divide en lotes múltiples, el Agente maneja esto de forma óptima.

¿Puedo usar las imágenes generadas como referencias para más generaciones?

Sí. Una vez que se genera una imagen, puedes referirte a ella en la misma conversación ("usa esa última imagen como referencia para el siguiente lote") y el Agente extraerá la URL automáticamente.

¿Funciona la transferencia de estilo con cualquier imagen?

La transferencia de estilo funciona mejor cuando la imagen de referencia establece claramente la identidad visual (personaje, producto, ubicación o estilo) que quieres preservar. Las referencias borrosas o de baja resolución pueden producir resultados inconsistentes.

¿En qué se diferencia Image Agent de AI Video Director?

Son complementarios. Image Agent está diseñado específicamente para la generación rápida y flexible de imágenes: imágenes individuales, lotes o transferencias de estilo. AI Video Director es una tubería de producción de extremo a extremo: guion → personajes → storyboard → clips de video. Image Agent puede alimentar al Director de Video proporcionando imágenes de referencia para garantizar la coherencia de los personajes o las escenas.

¿Puedo usar Image Agent para trabajo comercial?

Sí. Todas las imágenes generadas en NanoBanana están disponibles para uso comercial. Consulta los términos de servicio para obtener detalles completos sobre los derechos de uso.

Todos los articulos

Categorías

Resumen rápido El problema con la "generación de imágenes por IA" hoy en día Lo que puede hacer el Agente de imágenes por IA Generación de una sola imagen Generación de imágenes por lotes Transferencia de estilo Expansión de guion gráfico (img → tomas)Modelos y Precios Cómo se diferencia de un generador de imágenes estándar Para quién es esto Cómo empezar Preguntas frecuentes ¿Funciona el Agente de Imágenes sin un proyecto o guion?¿Puedo especificar el modelo yo mismo?¿Cómo maneja los fallos la generación por lotes?¿Cuál es el tamaño máximo de lote?¿Puedo usar las imágenes generadas como referencias para más generaciones?¿Funciona la transferencia de estilo con cualquier imagen?¿En qué se diferencia Image Agent de AI Video Director?¿Puedo usar Image Agent para trabajo comercial?

Más artículos

Product

Veo 3.1 Lite Prompt Guía: Más de 20 Prompt listos para usar para videos cinematográficos de IA

Aprende exactamente cómo prompt Veo 3.1 Lite para obtener resultados cinematográficos. Cubre tipos de plano, movimiento de cámara, audio y más de 20 prompt para copiar y pegar de todos los géneros — sin relleno

Bubbles

2026/04/02

Product

Veo 3.1 Lite Imagen a Vídeo: Convierte fotos de productos en clips en menos de un minuto

Cómo usar el modo image-to-video de Veo 3.1 Lite para crear demostraciones de productos, contenido para redes sociales y vídeos de marca a partir de fotos fijas — con ejemplos reales y consejos de flujo de trabajo

Bubbles

2026/04/02

Product

Wan 2.7 contra Wan 2.6: Qué cambió realmente

Wan 2.7 añade control de primer y último fotograma, entrada de imagen de 9 cuadrículas, video multi-reference, y edición de instrucciones que no tenía Wan 2.6. Aquí tienes un desglose práctico de lo que cambió y cuándo usar cada uno.

Bubbles

2026/04/02

2026/04/06

Agente de imágenes IA: Genera una sola imagen o cien — Sin cambiar de herramientas

Resumen rápido

📌 Puntos clave (lectura de 10 segundos)

✅ Imagen única, sin fricción: Di "genera una imagen de X" — el Agente elabora el prompt optimizado y lo ejecuta de inmediato
✅ Modo por lotes: Hasta 20 imágenes en una sola solicitud — fotos de producto, variantes de publicidad, hojas de personajes
✅ Transferencia de estilo: Sube una imagen de referencia, describe el estilo deseado — todas las salidas se mantienen alineadas con la marca
✅ Expansión de guion gráfico: Sube cualquier imagen → obtén 3 tomas cinematográficas de prompt para la producción de video
✅ Más de 6 modelos: Desde borradores de 2 créditos hasta calidad insignia de 6 créditos — el Agente elige el adecuado
⏱️ Tiempo de lectura: 4 minutos

El problema con la "generación de imágenes por IA" hoy en día

Agente de imágenes por IA en funcionamiento

Lo que puede hacer el Agente de imágenes por IA

Generación de una sola imagen

Este es el caso de uso más sencillo. Describes una imagen — con el nivel de detalle que quieras — y el Agente la genera de inmediato.

"Haz un paisaje urbano de ciencia ficción oscuro de noche, iluminación cinematográfica, plano amplio"

Entre bambalinas, el Agente:

Analiza tu intención (sujeto, estilo, ambiente, composición, iluminación)
Elige la relación de aspecto adecuada (16:9 para formato cinematográfico, 9:16 para retrato, 1:1 para redes sociales)
Selecciona un modelo apropiado según la expectativa de calidad y el costo
Redacta un prompt en inglés específico y detallado — sin descriptores vagos como "hermoso" o "bueno"
Lo ejecuta de inmediato — sin cuadro de confirmación

Obtienes la imagen. Si quieres una variante, describe el cambio en lenguaje natural.

💡 El Agente nunca pregunta "¿estás seguro?" al generar imágenes — actúa de inmediato, por lo que el ciclo de retroalimentación se mantiene ágil.

Generación de imágenes por lotes

Aquí es donde el Agente de imágenes se gana su nombre. Describe varias necesidades de imágenes en un solo mensaje, y el Agente las envía todas a la vez.

El Agente:

Crea 8 prompts optimizados separados, cada uno adaptado a su entorno específico
Envía los 8 en paralelo
Los renderiza como tarjetas individuales que se actualizan a medida que cada una se completa
Usa automáticamente un modelo rentable para lotes grandes

El modo por lotes admite hasta 20 imágenes por solicitud. Para proyectos más grandes, divide en lotes múltiples.

Generación de imágenes por lotes — 8 fotos de producto generadas en paralelo

Transferencia de estilo

Sube una imagen de referencia y describe el estilo deseado — el Agente aplica la transformación de forma coherente en la cantidad de salidas que necesites.

Casos de uso comunes:

Consistencia de marca: Sube la mascota de tu marca, genera 10 variaciones estacionales
Fotografía de producto: Sube fotos de producto, conviértelas a una estética específica (anime, pintura al óleo, dibujo lineal minimalista)
Consistencia de personaje: Crea un personaje una sola vez, reutilízalo como referencia para todas las generaciones posteriores

La imagen de referencia ancla la identidad visual. El prompt describe la transformación.

"Toma esta foto de producto [imagen] y réplicala al estilo de un cartel de publicidad japonesa vintage de la década de 1970"

Expansión de guion gráfico (img → tomas)

Este es el puente entre el Agente de imágenes y el Agente de video.

Salida:

Toma 1: Plano amplio de presentación prompt
Toma 2: Plano medio cercano con movimiento
Toma 3: Detalle cercano o toma en POV

Expansión de guion gráfico — de una imagen a 3 planos cinematográficos

Modelos y Precios

El Agente selecciona un modelo automáticamente según el contexto de tu solicitud, pero siempre puedes especificar uno. Opciones actuales:

Model	Credits	Best for
gemini-2.5-flash	2cr	Borrados rápidos, iteraciones
grok-imagine	2cr	Fotorrealista, económico
gpt-4o	2cr	Creativo, seguimiento de instrucciones
flux2-klein	3cr	Rápido, buena calidad
nanobanana-2	4cr	Calidad equilibrada + enfoque web (predeterminado)
flux2	4cr	Equilibrado, versátil
seedream-4.0	4cr	Alta calidad
gemini-3-pro	6cr	Calidad máxima
flux2pro	6cr	Calidad premium
seedream-5.0	6cr	Calidad de próxima generación

Cómo se diferencia de un generador de imágenes estándar

Feature	Plain text-to-image	NanoBanana Image Agent
Prompt engineering	Tú escribes el prompt	El Agente lo escribe a partir de tu descripción
Batch generation	Uno a la vez	Hasta 20 en paralelo
Style transfer	Construcción manual de prompt	Describe el estilo, adjunta una referencia
Model selection	Tú eliges	El Agente elige según la solicitud
Storyboard for video	No compatible	Incluye expansión de planos integrada
In-context follow-up	Empieza de nuevo	Modifica en la misma conversación

El valor del Agente de Imágenes no es un modelo de imágenes mejorado, sino una IA que entiende lo que intentas hacer y se encarga de las decisiones técnicas automáticamente.

Para quién es esto

Gerentes de redes sociales que necesitan múltiples relaciones de aspecto o estilos visuales a partir de un solo concepto. Describe una sola vez y genera para todas las plataformas.

Cómo empezar

Abre una nueva conversación en NanoBanana y solo describe lo que quieras. Algunos ejemplos para probar:

"Genera un concepto de logotipo minimalista para una marca de café llamada Blackwood. Moderno, elegante, en escala de grises."
"Crea 5 imágenes de publicidad para una aplicación de fitness — muestra diferentes entornos de entrenamiento, sensación enérgica, 16:9"
"Toma esta foto de referencia [imagen] y réplicala como una ilustración al estilo de Studio Ghibli"
"Expande esta imagen en 3 planos de guion gráfico para un vídeo de producto"

🎨 Comienza a generar con el Agente de Imágenes →

Más artículos

Product

Veo 3.1 Lite Prompt Guía: Más de 20 Prompt listos para usar para videos cinematográficos de IA

Bubbles

2026/04/02

Product

Veo 3.1 Lite Imagen a Vídeo: Convierte fotos de productos en clips en menos de un minuto

Bubbles

2026/04/02

Product

Wan 2.7 contra Wan 2.6: Qué cambió realmente

Bubbles

2026/04/02