VEO 3.1
Veo 3.1 en cinco canales — audio, 4K y remix de 15 segundos en una sola API.
La API de Gemini Omni convierte un prompt, una imagen única o tres imágenes de referencia en un clip de 4 a 10 segundos en 720p, 1080p o 4K. Un solo endpoint cubre texto a video, imagen a video y fusión de tres imágenes — el modelo de video más reciente de Google, facturado por generación.
≤ 2000 caracteres · obligatorio
Por defecto 720p
16:9 o 9:16 · por defecto 16:9
Predeterminado 6 · se ignora en modo vídeo de referencia
Try one of these prompts
Flujos de trabajo reales y casos de uso en producción que puedes construir y lanzar con este modelo.
Envía una imagen de referencia y un prompt de movimiento. La API de Gemini Omni devuelve un clip de 4 a 10 segundos desde el mismo endpoint que tus llamadas de texto a video — sin cambiar de modelo, sin integración adicional. Lanza una solicitud en 1080p o 4K cuando necesites el resultado listo para producción.
Generar un clipEnvía tres imágenes de referencia junto con un prompt y la API de Gemini Omni combina escena, personaje y producto en una sola toma con movimiento. Olvídate del storyboard, las máscaras y el compositing multi-pasada — la fusión de tres imágenes es el modo más diferenciado de la API de Gemini Omni y se entrega desde el mismo endpoint /api/v1/videos/generations que texto a video.
Describe la escena, elige 4K y la API de Gemini Omni devuelve un clip en el nivel de máxima fidelidad — ideal para tomas hero, anuncios sociales y video para landing pages. El audio queda fuera de la superficie de reapi, así que el resultado encaja sin fricciones en cualquier editor posterior.
Basado en créditos: 1 crédito = 0,001 USD. Solo pagas por las generaciones completadas.
| Categoría | Unidad | Precio |
|---|---|---|
| 720p | ||
| 4 segundos | 1 generation | $0.495 495 credits |
| 6 segundos | 1 generation | $0.66 660 credits |
| 8 segundos | 1 generation | $0.825 825 credits |
| 10 segundos | 1 generation | $0.99 990 credits |
| 1080p | ||
| 4 segundos | 1 generation | $0.495 495 credits |
| 6 segundos | 1 generation | $0.66 660 credits |
| 8 segundos | 1 generation | $0.825 825 credits |
| 10 segundos | 1 generation | $0.99 990 credits |
| 4K | ||
| 4 segundos | 1 generation | $1.155 1155 credits |
| 6 segundos | 1 generation | $1.32 1320 credits |
| 8 segundos | 1 generation | $1.485 1485 credits |
| 10 segundos | 1 generation | $1.65 1650 credits |
| Referencia 720p | ||
| por generación | 1 generation | $1.32 1320 credits |
| Referencia 1080p | ||
| por generación | 1 generation | $1.32 1320 credits |
| Referencia 4K | ||
| por generación | 1 generation | $1.98 1980 credits |
La API de Gemini Omni elige el modo según la cantidad de image_urls que envíes. Cero te da texto a video, una da imagen a video, tres da fusión de tres imágenes — todo en la misma llamada /api/v1/videos/generations, con la misma autenticación y el mismo patrón de polling de tareas. Dos imágenes no se admiten; la API de Gemini Omni rechaza esa combinación en el gateway con un 400 claro.
La API de Gemini Omni cobra por generación, no por segundo. 720p y 1080p comparten la misma tarifa; solo 4K tiene recargo. Consulta las tarifas actuales por nivel en la tabla de precios de esta página. Los trabajos fallidos de la API de Gemini Omni se reembolsan automáticamente — tu worker nunca paga por un resultado que no recibiste.
Sáltate el onboarding de Google Cloud, la configuración de facturación y el baile con las service accounts. Regístrate en reapi, toma una clave API y podrás llamar a la API de Gemini Omni en menos de un minuto. Mismo modelo, mismas salidas — menos obstáculos para enviar a producción.
Regístrate y obtén una clave desde el panel. Los créditos gratuitos cubren tus primeras llamadas a la API de Gemini Omni — sin tarjeta requerida.
AbrirHaz POST a /api/v1/videos/generations con model = gemini-omni. La API de Gemini Omni devuelve un task ID al instante para que tu worker siga trabajando.
AbrirGET /api/v1/tasks/:id hasta que el status sea completed. Descarga la salida de la API de Gemini Omni y envíala a producción.
AbrirDudas comunes sobre este modelo.
Explora más modelos de la misma categoría.
Veo 3.1 en cinco canales — audio, 4K y remix de 15 segundos en una sola API.
ByteDance
Texto/imagen/audio a video — 4 variantes, precio por segundo.
ByteDance
Texto/imagen/audio a vídeo de nueva generación de ByteDance — próximamente.
Alibaba Cloud Bailian
Texto, imagen, video de referencia y edición de video — una sola llamada a la Happy Horse 1.0 API.
Pruébalo en el playground o consigue una API key para integrarlo ahora.