Deepgram API
Transcription, synthèse vocale et agents vocaux rapides et précis, par API.
Deepgram est une plateforme d'IA vocale dont l'API couvre la transcription audio (speech-to-text) avec ses modèles Nova, la synthèse vocale (text-to-speech) avec Aura, et la création d'agents vocaux temps réel via la Voice Agent API. Elle est appréciée pour sa rapidité, sa précision et sa facturation à la seconde d'audio réellement traité. Elle s'adresse aux développeurs qui veulent transcrire des appels, des réunions ou des médias à grande échelle, ajouter une voix à leurs produits, ou bâtir des assistants vocaux interactifs.
Que propose l'API Deepgram ?
Tarifs de l'API Deepgram
Pay-as-you-go facturé à la seconde d'audio réellement traité (pas d'arrondi à la minute), sans minimum ni engagement. Tarifs différents selon le mode streaming ou pré-enregistré. Plan Growth avec crédits prépayés annuels et tarifs réduits, et offre Enterprise sur mesure.
Offre gratuite — Crédit gratuit de 200 $ offert à l'inscription, sans carte bancaire et sans expiration, couvrant environ 26 000 minutes (~433 heures) de transcription Nova-3 monolingue.
Authentification & intégration
Authentification par clé API générée dans la console (console.deepgram.com), transmise dans l'en-tête Authorization de chaque requête (Authorization: Token <DEEPGRAM_API_KEY>).
API REST pour la transcription pré-enregistrée et la synthèse vocale (réponses synchrones), et API WebSocket pour le streaming temps réel (transcription live et agents vocaux). SDK officiels Python, JavaScript, .NET et Go.
Cas d'usage de l'API Deepgram
- Transcrire automatiquement des appels téléphoniques, réunions ou podcasts à grande échelle.
- Ajouter une transcription temps réel à une visioconférence ou un outil de prise de notes.
- Bâtir un agent vocal ou un assistant téléphonique interactif avec la Voice Agent API.
- Doter une application d'une voix de synthèse à faible latence via Aura-2.
- Analyser des centres d'appels (sujets, sentiment) à partir des transcriptions.
- Sous-titrer automatiquement des vidéos ou des contenus médias.
✓ Points forts
- Modèles de transcription rapides et précis, en batch comme en streaming temps réel.
- Facturation à la seconde réellement traitée, sans arrondi à la minute ni minimum.
- Crédit gratuit généreux de 200 $ sans carte bancaire ni expiration.
- Suite complète STT + TTS + agents vocaux dans une seule plateforme.
- SDK officiels dans plusieurs langages et streaming WebSocket à faible latence.
⚠ Limites
- Produit principalement orienté API : pas d'interface no-code complète pour les non-développeurs.
- Le mode streaming est facturé à un tarif différent du pré-enregistré, à anticiper.
- La couverture multilingue, bien que large, varie selon les modèles et les langues.
- Les meilleurs tarifs nécessitent un engagement Growth avec crédits prépayés annuels.
Questions fréquentes sur l'API Deepgram
Deepgram propose-t-il un essai gratuit ?
Oui, un crédit gratuit de 200 $ est offert à l'inscription, sans carte bancaire et sans expiration, soit environ 433 heures de transcription Nova-3 monolingue.
Comment est facturée la transcription ?
À la seconde d'audio réellement traité, sans arrondi à la minute, avec des tarifs distincts selon le mode pré-enregistré (~0,0077 $/min) ou streaming (~0,0048 $/min) pour Nova-3.
Quelle authentification utilise l'API ?
Une clé API générée dans la console Deepgram, transmise dans l'en-tête Authorization de chaque requête sous la forme Authorization: Token <clé>.
Peut-on transcrire en temps réel ?
Oui, Deepgram propose une API WebSocket de streaming pour la transcription live à faible latence, utilisable notamment pour les visioconférences et les agents vocaux.
Qu'est-ce que la Voice Agent API ?
Une API qui combine transcription, raisonnement par LLM et synthèse vocale dans une seule connexion temps réel, pour construire des agents vocaux interactifs, facturée à la minute.
Deepgram fait-il aussi de la synthèse vocale ?
Oui, le modèle Aura-2 convertit du texte en voix naturelle à faible latence, facturé environ 0,030 $ pour 1 000 caractères en pay-as-you-go.







