Encadenar planos en secuencia

Tres enfoques para una secuencia más larga que un clip suelto: start/end frame, multi-shot en una generación, y extensión continua de video.

Cualquier modelo de video genera clips de 5 a 15 segundos como máximo. Para una secuencia de 30 segundos, un minuto o más, hay que encadenar. Tres enfoques distintos según qué herramienta uses y qué tipo de continuidad necesites.

Comparativa rápida

Enfoque	Cómo funciona	Cuándo elegirlo	Herramienta canónica
Start frame y end frame	Subís dos imágenes y el modelo interpola entre ellas; el último frame del clip 1 se vuelve start del clip 2	Necesitas control granular de cada transición	Kling (2.1, O1, 3.0)
Multi-shot en una sola generación	Uno o varios prompts producen varios planos conectados en una sola pasada	Querés una secuencia corta (hasta 15 s) sin micro-gestionar cortes	Higgsfield Cinema Studio, Kling 3.0
Extensión continua	Generás un clip, extraés los últimos segundos como referencia, generás el siguiente	Necesitas una sola toma aparente sin cortes visibles	Seedance 2.0

Enfoque 1: start frame y end frame (Kling)

Es el método más antiguo y el de más control. Disponible en Kling 2.1, O1 y 3.0.

Workflow

Preparar las imágenes. Generá las imágenes con el mismo modelo y mismo estilo (Nano Banana Pro, Flux Context, Midjourney con omnireference). Compartí paleta, iluminación y personaje. Misma resolución (idealmente 1920x1080).
En Kling, modo image-to-video con frames. Pestaña frames. Click en start frame, subí la imagen de inicio. Click en end frame, subí la imagen de cierre.
Escribí el prompt. Le decís a Kling qué pasa entre los dos frames: "el caballero toma la copa de la mesa y gira hacia la derecha como preparándose para irse" funciona; "caballero con copa" no.
Configurá modo y duración. Mode: Professional como default. Duration: empezá con 5 segundos para validar, subí a 10 si la transición pide más tiempo. Sound effects: desactivá para clips que vas a sonorizar después.
Encadená el siguiente clip. Cuando el primer video sirve, extraé el último frame y usalo como start frame del siguiente.

Cómo extraer el último frame

Tres caminos. Cualquiera vale:

Media Player Classic. Abrís el video, vas al último frame, File → Save Image.
Cualquier editor con función de exportar frame. DaVinci Resolve, Premiere, CapCut.
ffmpeg desde terminal. Una sola línea:
```
ffmpeg -sseof -0.1 -i video.mp4 -vframes 1 ultimo-frame.jpg
```
Lee los últimos 0.1 segundos del video y exporta un solo frame como JPG.

Variante: videos loopables

Si querés un loop ambient (caballero sentado frente al fuego que se repite), dos caminos:

Same frame loop. Subís la misma imagen como start y end. Problema: a veces sale estático porque Kling interpreta "empieza y termina igual" como "no cambies nada". Funciona mejor cuando el prompt especifica qué se mueve ("el fuego titila, el caballero mueve la cabeza").
Extract-last-frame loop. Generás un clip con acción (el esqueleto levanta la mano). Extraés el último frame. Hacés un segundo clip donde el start frame es "mano arriba" y el end frame es "mano abajo" (la imagen original). Los dos clips juntos forman un ciclo natural sin congelarse.

Transiciones de escenarios muy distintos salen mal

Si tu start frame es interior y tu end frame es exterior con un caballo en otro plano, Kling intenta interpolar entre dos escenarios sin información del espacio intermedio y puede inventar atajos raros (el personaje "teletransportado", cámaras incoherentes). Solución: partí la transición en dos generaciones con una imagen intermedia que comparta más contexto con cada lado.

Enfoque 2: multi-shot en una sola generación

Producir varios planos conectados en una sola generación. Disponible en Higgsfield Cinema Studio y en Kling 3.0.

En Higgsfield Cinema Studio

En el modo video, modo de generación tiene tres opciones:

Single shot: un solo clip continuo.
Multi-shot auto: el sistema descompone tu prompt en varios sub-planos conectados automáticamente.
Multi-shot manual: control total. Definís hasta 6 planos en una línea de tiempo. Cada plano tiene su propia duración, prompt, movimiento de cámara y rampa de velocidad.

Multi-shot auto es la opción rápida cuando querés una secuencia corta sin micro-gestionar cada plano. Manual es cuando cada plano necesita decisiones específicas (un dolly right en el plano 1, un drone shot en el plano 2, un orbit en el plano 3, cada uno con su propia velocidad).

En Kling 3.0

Restricciones duras:

Duración total máxima: 15 segundos.
Cada plano dura mínimo 3 segundos. Máximo 5 planos en una generación (5 × 3 s).
Cada plano tiene un campo de prompt con límite de 500 caracteres.

Workflow:

Subí el starting frame del primer plano.
Activá el toggle Multi-shot. Aparecen las secciones de prompt, una por plano.
Seleccioná tus elements (personaje, producto) en cada plano para garantizar consistencia. Ver mantener personaje consistente.
Escribí los prompts de cada plano. Cada uno con lente (24 mm wide, 85 mm portrait, 50 mm standard), ángulo (low angle, over the shoulder, close-up) y la acción específica del plano dentro del arco narrativo de 15 segundos.
Verificá que cada prompt no supere 500 caracteres y que cada plano tenga seleccionados sus elements.
Generá.

Plantilla para ChatGPT que arma los prompts

Pasale a ChatGPT este pedido y ajusta entre corchetes: "Write me a multi-shot prompt that shows [personaje] in [situación]. He is [acción principal]. Use a variety of camera angles. Write this as individual prompts so each can be dropped into an AI video generator. Be specific about character position and actions as well as the lenses used for each shot. All action needs to happen within 15 seconds with each shot lasting a minimum of 3 seconds. Each prompt is a maximum of 500 characters.". Devuelve 4-5 prompts listos para pegar.

Multi-shot puramente text-to-video

Podés hacer multi-shot sin subir starting frame. Kling 3.0 genera todos los planos solo a partir de los prompts. Útil cuando no tenés imagen base pero sí una escena clara en mente.

Enfoque 3: extensión continua (Seedance)

Cuando querés que la secuencia parezca una sola toma sin cortes, no varios planos cortados. Seedance 2.0 lo resuelve aceptando un recorte de video como referencia.

Workflow

Armá un grid del personaje en varias poses sobre fondo blanco (frente, tres cuartos, lateral, espalda). Es la referencia de identidad. Ver mantener personaje consistente.
Generá el primer clip (8 a 10 segundos recomendado). Referencias: imagen del personaje, imagen de la locación, grid de vistas.
Descargá el clip y extraé los últimos 3 segundos. En Higgsfield hay una opción al subir un video que recorta hasta 14 segundos.
Generá el siguiente clip con ese recorte como referencia de video, junto con el grid de personaje (para que no pierda identidad).
En el prompt agregá una instrucción de continuidad. Por ejemplo: "extiende el video por 15 segundos con una escena continua desde el último frame, manteniendo el mismo personaje principal, el mismo traje, la misma iluminación y la misma identidad facial". Ajustá las especificaciones a tu clip.
Repetí los pasos 3-5 hasta llegar a la duración total que necesitás.

El resultado es fluido: la cámara parece continua, el personaje no cambia entre segmentos, la iluminación no salta.

Cuanto más corto, más controlable

Los creadores que más trabajan con Seedance reportan que clips de 8 a 10 segundos dan mejores resultados que los de 15 segundos máximos. Más espacio significa más libertad para que el modelo improvise. Para videos largos, generá más clips cortos y bien dirigidos, y montá en el editor.

Cuál elegir

Si necesitas control granular de cada transición y cada plano puede tener una composición distinta: start frame y end frame con Kling.
Si querés una secuencia corta de 10-15 segundos con varios planos conectados, el flujo más rápido: multi-shot en una sola generación (Higgsfield o Kling 3.0).
Si la pieza pide una toma continua larga sin cortes visibles: extensión continua con Seedance.
Si no podés decidir y vas a probar las tres: empezá por la opción 2 (multi-shot). Es el camino menos costoso por iteración.

Edición final

En los tres enfoques, la edición final se hace fuera. CapCut (gratis, web y desktop) es la más mencionada por accesible. DaVinci Resolve, Premiere y iMovie funcionan igual. No hace falta agregar transiciones entre clips si los generaste con start/end frame: la transición ya viene en la generación.

Errores comunes

Mezclar resoluciones entre frames. Si una imagen sale 1440x960 y otra 1920x1080, los clips encadenados saltan visualmente. Trabajá todo a la misma resolución (idealmente 1920x1080) o upscaleá antes de pasar a Kling.
Cropear thumbnails de un contact sheet directo. El thumbnail tiene baja resolución y el modelo de video rellena con suposiciones. Pasá siempre por una regeneración a alta resolución.
No bloquear elements en multi-shot. Si en cada plano del multi-shot no seleccionás los elements del personaje, Kling improvisa cada plano por separado y la consistencia se rompe.
Pedirle a Seedance que "extienda 15 segundos" cuando el modelo no tiene contexto suficiente. Ajustá la instrucción de continuidad al detalle real del clip (color del traje, tipo de locación, iluminación) en cada extensión.

Próximo paso

Si necesitas plano por plano más control de lente y apertura: generar planos cinematográficos. Si querés transformar un clip que ya tenés (cambiar estilo, clima, personaje): transformar video existente.

Encadenar planos en secuencia

En esta página