Универсальный процесс создания вертикального ролика 30-45 сек для клиента. Первый прогон — стоматология RSTOM в Алматы. Если процесс переиспользуется ≥3 раза, оформляется в Claude-skill.
Ролик = последовательность 4-6 секундных шотов трёх типов. Каждый тип маршрутизируется в свой движок.
Персонаж смотрит в камеру, говорит реплику. Lip-sync обязателен — губы синхронны с озвучкой.
Персонаж взаимодействует с продуктом / окружением. Off-camera narration — голос накладывается на сборке.
Графики, цифры, чертежи на blueprint-фоне. Анимированные линии и числа подсвечивают преимущества.
Ключевой технический трюк всего пайплайна — split voiceover от видео. Полная озвучка 30-45 сек генерится одним файлом через ElevenLabs ДО генерации видео. Потом нарезается на per-shot куски. В Seedance с lip-sync идут только talking-head шоты; b-roll и blueprint-анимации генерятся вообще без аудио. На финальной склейке поверх кладётся полный voiceover-трек.
Это в 3-5× дешевле полного lip-sync на каждом кадре и в разы стабильнее: Seedance video+audio комбо падает в status: failed без debug-сообщения — известное ограничение, проверено на прошлом UGC-хуке.
Шаблон beat'ов. Под конкретного клиента и оффер тайминги двигаются ±2 сек, но порядок «hook → проблема → решение → преимущества → оффер → CTA» сохраняется.
| Тайминг | Beat | Тип кадра | Содержание |
|---|---|---|---|
| 0—3s | Hook | talking-head | Цеплящая фраза в камеру — intriguing claim или вопрос |
| 3—6s | Hook reinforce | persona b-roll | Персонаж делает что-то, voiceover продолжает hook |
| 6—12s | Problem | mix · persona + blueprint | Боль ЦА. Blueprint-схема визуализирует «как обычно» |
| 12—18s | Solution | talking-head + product | Персонаж представляет решение, голос продолжает |
| 18—26s | Benefits | blueprint анимация | 3 преимущества — анимированные стрелки, графики, цифры |
| 26—33s | Offer | talking-head | Конкретное предложение: цена, срок, гарантия, консультация |
| 33—38s | CTA | static brand card | Логотип, адрес, телефон, Instagram, «запишись» |
Последовательно. У каждой фазы — артефакт и чекпоинт перед следующей.
Развернуть структуру проекта-клиента. На VPS уже сделано для RSTOM.
projects/video_office/ со скелетомПонять оффер клиента, тон, ЦА, USP — чтобы концепция не была generic. Без этого ролик звучит как все остальные UGC и игнорится.
brief/brief.md — 1 страницаБриф превращается в раскадровку по секундам. Каждая реплика прописана дословно, с эмоцией в скобках.
script/script.md — полная раскадровкаОзвучка делается ДО видео, не после. Это нелогично, но именно так Seedance lip-sync даёт стабильный результат.
voiceover/full.mp3 + voiceover/shot-NN.mp3Опорные изображения для каждого шота. Качество шота на 70% определяется качеством опорного кадра — все video-генерации reference-driven.
frames/shot-NN.jpg · 1080×1920Каждый кадр превращается в 4-6 секундный шот. Все генерации ставятся в очередь одновременно.
shots/shot-NN.mp4 · h264 · 4-6 секСклейка шотов, наложение полной озвучки, выжигание субтитров в Instagram safe-zone.
final/v1.mp4 · 1080×1920 · ≤30 MB для InstagramЧеклист перед отправкой клиенту. Любая красная галочка — назад на пересборку конкретного шота.
quick-publish на Netlify для шаринга превью клиентуГде Instagram UI режет видео и куда нельзя класть субтитры.
| Зона | Координаты (1080×1920) | Что там |
|---|---|---|
| Top | Y=0—270 · 14% | username, время публикации, кнопка close |
| Bottom | Y=1500—1920 · 22% | caption, лайк, комментарий, share, music-плашка |
| Right | X=950—1080 · 12% | actions sidebar |
| Safe для субтитров | Y=1150—1350 · X=60—1020 | читаемо, не перекрывается UI |
Если Тимур не редактирует — беру эти решения сам, аргументы рядом.
| Решение | Default | Аргумент |
|---|---|---|
| Персонаж | Женщина 27-32, типаж «довольная пациентка после процедуры» | UGC-эстетика, ЦА стоматологии = женщины 25-45 с располагаемым доходом |
| Тон оффера | Нативный, не агрессивный (бесплатная консультация + панорама) | Премиум-вертикаль, агрессивный таймер режет доверие |
| Флагман | Определю в Phase 1 по главной странице rstom.kz | Пока не парсил сайт |
| Голос voiceover | Женский Svetlana-like (тёплый, не диктор) + мужской вариант | A/B без полной перегенерации |
| Размещение | projects/video_office/ · переиспользуется для других клиентов |
Не лезу в ai-targetolog/creatives/ — там Performante, другой бренд |
Если pipeline ок — я перехожу к Phase 1 (WebFetch rstom.kz + бриф). Если хочешь поправить структуру beat'ов, персонажа или тон — скажи сейчас, после Phase 1 переписывать дороже.
→ ok, поехали к брифу