Generar la narración

Genera la voz en off con IA, ajusta el tono por escena y sincroniza los tiempos para que audio y video cuadren.


Paso 5 de 7

Con las escenas aprobadas, generas la narración. El toolkit crea un archivo de audio por cada escena, lo que te permite regenerar una sola escena sin rehacer todo el video.

Generar la voz en off

Escribe /generate-voiceover en la conversación con Claude, o pídelo en lenguaje natural:

Genera la narración de mi video

Claude verifica que la revisión de escenas esté completa. Si no revisaste las escenas, te recomienda hacerlo primero (ver Revisar las escenas).

Después te pregunta:

  1. Proveedor de voz. La voz gratuita (Qwen3-TTS) o la premium (ElevenLabs), según lo que configuraste en Preparar el entorno.
  2. Voz y tono. Si tu marca tiene una voz configurada, la usa automáticamente. Si no, te pide que elijas speaker y tono.

Claude genera un archivo de audio por cada escena. Al terminar, te muestra el resultado:

EscenaDuración del audio
1. Título3.2 segundos
2. Agenda12.1 segundos
3. Demo de búsqueda18.5 segundos
4. Comparación11.3 segundos
5. Métricas4.8 segundos
6. Cierre3.9 segundos
Total53.8 segundos

Genera una escena de prueba primero

Antes de generar todo el video, pide que genere solo la escena de título o una escena corta. Escúchala. Si la voz y el tono te gustan, genera el resto. Si no, ajusta antes de gastar créditos en todas las escenas.

Elegir tono por escena

No todas las escenas tienen que sonar igual. Puedes personalizar el tono de cada una:

EscenaTono sugeridoPor qué
TítuloCálidoEstablece el mood, invita a quedarse
AgendaProfesionalInformativo, directo
DemoTutorialGuía al espectador por lo que está viendo
DatosEntusiastaDestaca los números, transmite logro
CierreCálidoCierra con cercanía

Para personalizar una escena:

En la escena de datos, usa un tono entusiasta. En el cierre, usa tono cálido.

Claude aplica el tono indicado solo a esa escena.

Sincronizar los tiempos

La duración real del audio casi nunca coincide exactamente con la duración estimada de la escena. Es normal: la voz de IA no habla a velocidad exacta. Una escena estimada en 10 segundos puede producir un audio de 8 o de 12.

Pídele a Claude que sincronice:

Sincroniza los tiempos de las escenas con el audio real

Claude compara la duración real de cada audio con la duración configurada de cada escena y ajusta automáticamente. Las escenas se alargan o se acortan para coincidir con el audio.

Antes de sincronizar

EscenaDuración configuradaAudio realDiferencia
Título5s3.2s-1.8s (aire muerto al final)
Demo20s18.5s-1.5s (aire muerto)
Datos5s6.1s+1.1s (narración cortada)

Después de sincronizar

Las duraciones de las escenas coinciden con el audio. No hay silencios incómodos ni narración cortada.

La sincronización es automática

No necesitas calcular nada a mano. Claude lee las duraciones reales de cada archivo de audio y ajusta la configuración del video para que coincidan. Si después regeneras el audio de una escena, sincroniza de nuevo.

Si no te gusta cómo suena

Tienes tres opciones:

  1. Cambiar la voz o el tono. Pídele a Claude que regenere una escena con otro speaker o tono: "Regenera la escena 3 con la voz de Vivian en tono profesional."
  2. Editar el texto. Si el problema es lo que dice, no cómo lo dice, edita el guion de esa escena y regenera: "Cambia el texto de la escena 4 a... y regenera el audio."
  3. Ajustar la velocidad. Si la narración va muy rápido o muy lento, puedes pedir ajustes de pacing.

La ventaja del modo por escena es que solo regeneras lo que necesitas. El resto queda intacto.

Siguiente paso

Con la narración generada y los tiempos sincronizados, lo siguiente es agregar música de fondo. Este paso es opcional: si prefieres un video solo con narración, puedes saltar directo a previsualizar y exportar.

En esta página