Automatización

Cómo hacer videos virales clonando tu voz con Claude

El pipeline para producir 1 video viral por día clonando tu voz con ElevenLabs, escribiendo el guión con Claude y armando el avatar con HeyGen. De 3 horas a 8 minutos por video.

Mateo CañoMateo Caño7 min de lectura
Cómo hacer videos virales clonando tu voz con Claude

Hacer un reel a mano es 3 horas: pensar el hook, escribir el guión, grabar 8 takes, editar, agregar subtítulos, exportar, subir. En 2026 todo ese loop se reduce a 8 minutos sin renunciar a que el video sea con tu voz y tu cara. La clave es clonar tu voz una sola vez y dejar que Claude maneje el resto. Para entender el stack completo de marketing automatizado, leé cómo automatizar todo el marketing de tu marca con IA.

Este es el pipeline exacto que uso para postear 1 reel por día en @ai._kid sin grabar todos los días. Combina 4 herramientas: Claude para el guión, ElevenLabs para la voz, HeyGen o VEED para el video, y la API de Instagram para publicar. De idea a post: 8 minutos. Si todavía no tenés un agente armado para orquestar el pipeline, mirá la guía completa de OpenClaw.


¿Qué es clonar tu voz para hacer videos?

Clonar tu voz es entrenar un modelo de IA con un sample de audio tuyo (1 a 3 minutos para Instant Clone, 30+ minutos para Professional) para que después pueda decir cualquier texto sonando como vos. Una vez clonada, generás audio nuevo en segundos: pegás un guión, elegís la voz, descargás el MP3.

Cuando ese audio se combina con un avatar fotorrealista (HeyGen) o con lipsync sobre tu propio video (VEED Fabric), obtenés un reel donde sos vos hablando — sin haber grabado ese día. La voz suena natural, los labios matchean, y el video se publica automáticamente.


¿Por qué importa ahora?

  1. El threshold de calidad bajó al nivel real. ElevenLabs v3 y HeyGen 4 ya no tienen ese sonido robótico de 2023. La gente no nota la diferencia salvo que estén buscando.
  2. El costo cayó a USD 50 al mes. Lo que antes era studio + editor + tiempo se reemplaza por 4 suscripciones que suman menos que una hora de un freelance.
  3. El algoritmo premia volumen consistente. Las cuentas que postean 1 reel por día crecen 3x más rápido que las que postean 2 por semana. Sin clonado de voz, ese ritmo es insostenible.

El pipeline completo en 6 pasos

#PasoHerramientaTiempoOutput
1Encontrar referencia viralAdLoop research API1 minTranscript + métricas
2Generar guión adaptadoClaude Opus 4.71 minScript de 30s
3Clonar voz (una sola vez)ElevenLabs Instant Clone3 minVoice ID
4Generar TTSElevenLabs API30 segMP3
5Armar videoHeyGen o VEED Fabric2 minMP4 con lipsync
6PublicarIG Graph API + TikTok API30 segPost en feed

Paso 1 — Encontrar la referencia viral

Identificá 3 a 5 cuentas de tu nicho que estén creciendo y mirá los reels que tengan 5x más views que el promedio de la cuenta. Esos son los outliers — los que rompieron el algoritmo. Tomá el link y mandalo al endpoint:

curl -X POST https://dev.adloop.app/api/research/scrape \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.instagram.com/reel/XXXXX"}'

La respuesta te trae caption, transcript completo del audio, métricas y el video URL. Ese transcript es el input del paso 2.

Paso 2 — Generar el guión con Claude

Abrí Claude (o Claude Code) y pegá el transcript con este prompt:

Acá tenés el transcript de un reel viral. Extraé:
1. El hook de los primeros 3 segundos
2. La estructura narrativa (problema → giro → resolución)
3. El CTA final

Después adaptalo a mi marca [contexto de tu marca]. Que dure 25-35 segundos
hablando a velocidad natural. Mantené la estructura pero cambiá ejemplos y
contexto.

Claude te devuelve un guión limpio listo para narrar. Para que la voz clonada lea bien, evitá números (escribilos en letras), siglas raras, y poné comas cada 4 a 7 palabras.

Paso 3 — Clonar tu voz en ElevenLabs

Una vez por todo el pipeline. Entrá a ElevenLabs Voice Lab, elegí "Instant Voice Clone" y subí 1 a 3 minutos de audio tuyo grabado en buena calidad: micrófono USB, habitación sin eco, hablando con rango emocional variado. Aceptá los términos (verificación de identidad). En 30 segundos tenés tu Voice ID.

Si vas a usar la voz para ads pagas o producto comercial, considerá Professional Voice Clone (30+ minutos de audio, calidad muy superior, USD 99/mes Pro plan).

Paso 4 — Generar el TTS con tu voz

Pegá el guión del paso 2 en ElevenLabs Speech Synthesis, elegí tu voz clonada y generá. Configuración recomendada: stability 50%, similarity 75%, style 30%. Descargá el MP3.

Si vas a usar lipsync VEED Fabric después, acelerá el MP3 a 1.10x con ffmpeg — VEED tiende a alargar el audio en el render y suena lento si no compensás:

ffmpeg -i voz.mp3 -filter:a "atempo=1.10" voz_speed.mp3

Paso 5 — Armar el video

Tenés dos caminos según si te querés grabar la cara o no.

Opción A — HeyGen (avatar IA): subí tu Voice ID o el MP3 a HeyGen, elegí un avatar (o entrená el tuyo con 2 minutos de video tuyo a cámara) y generá. En 2 a 5 minutos tenés un MP4 9:16 listo. Útil para cuando no querés mostrar tu cara real, o para escalar a varios idiomas con el mismo personaje.

Opción B — VEED Fabric lipsync (tu cara real): grabá 1 video genérico tuyo a cámara (30 segundos, hablando cualquier cosa, mirando al lente). Ese video lo reusás como base. Pasalo a VEED Fabric junto con el MP3 nuevo y la herramienta te ajusta los labios para que matcheen el audio. El resultado: vos hablando con un guión que nunca grabaste. Más realista que HeyGen porque sos vos de verdad.

Paso 6 — Publicar a Instagram y TikTok

Subí el MP4 a un storage público (Supabase Storage, S3, Cloudinary) y publicá vía API. Si usás AdLoop, está todo armado: POST /api/meta/publish/reel y POST /api/tiktok/publish con el video URL y el caption. Para Instagram necesitás cuenta Business conectada. Para TikTok necesitás aprobación de la Content Posting API (1 a 3 días).

Si querés que el caption salga generado también con Claude, pasale el transcript del guión y pedile 3 hooks distintos para el caption + 5 hashtags relevantes.


Cómo empezar hoy

  1. Grabá 3 minutos de audio limpio. Una sola vez. Con micrófono decente, en una habitación sin eco. Es el único paso "manual" del pipeline.
  2. Cloná tu voz en ElevenLabs. Plan Creator (USD 22/mes) alcanza para empezar.
  3. Identificá 1 referencia viral en tu nicho. Mirá los outliers de 3 cuentas que admires.
  4. Corré el pipeline una vez de punta a punta. De referencia a post publicado. Medí cuánto tardaste.
  5. Iterá. La segunda vez baja a la mitad. La quinta corrida ya estás en menos de 10 minutos por video.

¿Qué significa esto para vos?

  • Si sos creator — postear 1 video por día deja de ser una jornada. Es 10 minutos antes del desayuno.
  • Si sos founder — el contenido orgánico de la marca personal escala sin que tengas que sacrificar product time. Vos seguís siendo la cara, pero no estás 3 horas grabando.
  • Si sos agencia — podés ofrecer "1 reel diario para el CEO del cliente" como producto, generando todo con la voz clonada del founder. Margen 80%+.
  • Si sos marketer in-house — testás 30 hooks por mes en lugar de 4. El learning rate se multiplica por 7.

El cambio real: producir video deja de ser un cuello de botella de producción y pasa a ser un cuello de botella de ideas. Que es exactamente donde querés estar.



Preguntas frecuentes sobre videos virales con voz clonada

Para Instant Voice Clone de ElevenLabs alcanza con 1 a 3 minutos de audio limpio (sin ruido de fondo, sin música, hablando con tu tono natural). Para Professional Voice Clone, que da resultados muy superiores, necesitás 30 minutos a 3 horas de audio bien grabado. Lo ideal es grabar en una habitación sin eco, con micrófono USB decente (Blue Yeti, Shure MV7) y leer un guión variado en intención: alegre, neutral, serio, susurro. Cuanto más rango emocional capturen los samples, mejor performa la voz clonada en diferentes contextos. Una vez clonada, podés usarla todas las veces que quieras sin volver a grabar.

HeyGen genera un avatar nuevo desde cero — un humano fotorrealista o tu propio avatar entrenado — que habla con la voz que le pases. Es ideal cuando no querés grabarte la cara, o querés escalar a varios idiomas con la misma persona digital. El lipsync sobre tu propio video (con VEED Fabric o herramientas similares) toma un video tuyo existente y le cambia los labios para que matcheen el nuevo audio. Es más realista porque sos vos de verdad, pero solo funciona si ya tenés video de tu cara hablando. La regla práctica: si la marca depende de tu cara real, lipsync sobre video tuyo. Si querés escalar a 50 videos por semana, HeyGen.

Lo más efectivo es identificar 3 a 5 cuentas de tu nicho que estén creciendo y mirar sus reels con más views relativos al promedio de la cuenta — eso son los outliers, los que rompieron el algoritmo. Hay skills automatizados para esto: el endpoint POST https://dev.adloop.app/api/research/scrape te devuelve caption, transcript completo y métricas de cualquier link de Instagram, TikTok o YouTube. Con eso, le pasás el transcript a Claude y le pedís que extraiga el hook, la estructura narrativa y el CTA. En 2 minutos tenés el esqueleto del formato listo para adaptarlo a tu marca. Más sobre research de contenido en las mejores herramientas de IA para tu negocio en 2026.

Para 1 video diario el costo total ronda los USD 50 a USD 80 por mes. Desglose: Claude Pro USD 20 (guión + análisis de referencias), ElevenLabs Creator USD 22 (cloning + ~100k caracteres de TTS por mes), HeyGen Creator USD 24 (15 minutos de video por mes). Si vas a usar lipsync con VEED Fabric en lugar de HeyGen, la API cuesta ~USD 0.10 por segundo de video, así que un reel de 30 segundos sale USD 3. Comparado con contratar un editor (USD 200 a USD 500 por video) o grabar y editar vos mismo (3 horas por reel), el ROI es claro desde la segunda semana.

Sí. La Instagram Graph API acepta uploads de reels vía URL pública, y la TikTok Content Posting API también. Una vez generado el MP4 final con el lipsync, lo subís a un storage público (Supabase Storage, S3, Cloudinary) y publicás con una llamada al endpoint correspondiente. El stack que uso para @ai._kid lo hace todo desde un prompt en Claude Code: scrape → guión → voz → video → publish. Para Instagram tu cuenta tiene que estar conectada como Business y linkeada a una Página de Facebook; para TikTok hay que pedir aprobación de la Content Posting API, que toma 1 a 3 días hábiles. Si no querés meterte con APIs directamente, cualquier scheduler con upload por URL te resuelve el último paso. Más sobre auto-publish en cómo automatizar todo el marketing de tu marca con IA y en la guía de OpenClaw.

Fuentes e inspiración

Mirá los posts originales donde desarrollamos estas ideas en redes.

Decorative floral background for booking section
Helped over 100+ businesses

Turn content chaos into a system, today.

Book a free 30-minute assessment and we'll show you exactly where a content system can save you time and scale your output.

thrivevenice.Californiathrivevenice.California
thrivevenice.Californiathrivevenice.California

Ready to systematize your content?

Schedule a free 30-minute call to discover how a content system can replace hours of manual work every week.