Sync frame-accurateREST async + webhooksSortie jusqu'à 4KRetries idempotents

Propulse les workflows lip-sync de 900+ équipes d'ingénierie

API Lip Sync.

Lip-sync as a service. Dépose une URL de visage, une URL d'audio, reçois un MP4 lip-syncé frame-accurate — latence sub-minute, webhooks asynchrones.

Requête d'exemple

Sortie

Appel API d'exemple

POST /v1/lipsync
Authorization: Bearer sk_live_***

{
  "face_url": "https://cdn.example.com/face.jpg",
  "audio_url": "https://cdn.example.com/voice.mp3",
  "format": "16-9",
  "resolution": "1080p"
}

→ 202 Accepted
{ "job_id": "ls_8a2...", "webhook": "..." }

REST async · latence sub-minute · idempotent

118k rendus lip-sync servis ces 30 derniers jours

— Exemple de sortie

▸ preview9:16 · 1080p

00:00 / 00:45▸

— Endpoints

Lip-sync n'importe quel visage à n'importe quel audio.

— Requête d'exemple

endpoint · 1/3

Endpoint

118 params

POST /v1/lipsync avec { face_url, audio_url }. Photo + audio → MP4 avec mouvement de lèvres photoréaliste. Jusqu'à 4K.

AuthBearer clé API

LimitesPar tier de plan

Endpoint

POST /v1/lipsync

REST · Async

— Payload webhook

200 OK

● Live9:16 · 1080p

Réponse webhook

slot · webhook

00:00 / 00:45▸

— Comment ça marche

De la requête au rendu lip-syncé en 3 étapes simples.

Step 1

Obtiens une clé API

Step 2

POST URLs visage + audio

Envoie des URLs signées vers image/vidéo de visage et audio. L'API extrait le modèle facial et le timing des phonèmes.

Step 3

Reçois un webhook

À la complétion, on POST une URL MP4 signée à ton webhook. Ou poll l'endpoint du job jusqu'à la fin.

— Docs

Comment doubler 100k vidéos via API sans casser la banque ?

De l'auth au handler de webhook avec exemples de code en TypeScript et Python.

▸ Docs · 16:9

J'ai doublé 10 000 démos produit via API en 4h (pas à pas).

— Pour qui

Fait pour les équipes d'ingénierie.

Localisation

Plateformes de localisation

Offre du doublage vidéo en tant que service via API. Frame-accurate, multilingue, à l'échelle.

L&D

Plateformes L&D

Re-synchronise l'audio narrateur entre les mises à jour de cours. Même instructeur, nouvelles lignes, sans refilmer.

Médias

Médias & news

Auto-double des clips d'actualité pour des audiences internationales. Même présentateur, chaque langue, chaque clip.

SaaS

SaaS de médias personnalisés

Génère des vidéos lip-syncées personnalisées à grande échelle — outreach vente, onboarding, transactionnel.

— Comparatif

DIY lip-sync vs ClipNova Lip Sync API.

Construire ça toi-même = mois d'infra ML. ClipNova le ship derrière un seul endpoint REST.

Critère

Lip Sync API

Infra DIY

Setup

Une clé API, un endpoint

Monter une GPU farm + modèles

Temps au premier sync

Minutes

Mois de travail ML

Qualité

Frame-accurate, photoréaliste

Engager une équipe ML pour égaler

Idempotence

Intégrée

Construire toi-même

Compliance

SOC 2 + résidence UE

Auditer toi-même

— Cas d'usage

Vois ce que les équipes construisent avec.

Déploiements en production par catégorie.

Doublage vidéo à grande échelle.

Une entreprise média double 10 000 clips d'actualité par semaine dans 8 langues. Même présentateur, même énergie, chaque langue.

Endpoints batch
8 langues par passe
Cohérence du présentateur préservée
Webhook sur chaque clip

16:9

Dépose l'exemple ici

slot · dub-api

Outreach commercial personnalisé.

Un SaaS envoie à chaque prospect un pitch vidéo lip-syncé du fondateur, personnalisé à son entreprise.

Rendu par prospect
Visage fondateur + voix clonée
Latence sub-minute
Audit logs

16:9

Dépose l'exemple ici

slot · outreach-api

Mises à jour de narrateur L&D.

Un LMS pousse des mises à jour de script aux leçons existantes. Même narrateur, nouvelles lignes, sans refilmer — juste un re-sync.

Updates audio uniquement
Continuité visuelle préservée
Versionning
Endpoints bulk

16:9

Dépose l'exemple ici

slot · lms-api

— FAQ

Questions fréquentes.

Qu'est-ce que l'API Lip Sync ?

Un endpoint REST qui prend une URL de visage et une URL d'audio, et renvoie un MP4 lip-syncé frame-accurate. Conçu pour un usage programmatique à haut volume.

Quels inputs sont acceptés ?

Visage : JPG, PNG, MP4, MOV. Audio : MP3, WAV, M4A. Les deux passés en URLs signées (ou uploadés via endpoint /uploads).

Qualité par rapport à l'UI ClipNova ?

Même modèle, même qualité. L'API est le même moteur qui propulse l'outil UI.

Latence ?

Sous 2 minutes pour une vidéo source de 60 s. Les rendus 4K prennent 4–6 min.

Idempotence ?

Oui. Chaque requête accepte un header Idempotency-Key. Safe pour retry.

Fiabilité des webhooks ?

Payloads signés, retries avec exponential backoff pendant 24h, logs complets dans le dashboard.

Compliance ?

SOC 2 Type II. Résidence des données UE disponible en enterprise. Pas d'entraînement sur les inputs utilisateur.