FREUDIX/Studio
Tableau de bord
freudix.academy
SEO
Les bases du SEOLocal SEOProgrammatic SEOCréer un PBNAutomatiser vos réseaux de sitesTrouver un domaine expiré
Business
Site d'affiliationVente de liensCréer un programme d'affiliation
YouTube
Créer une chaîne YouTubeCréer des vidéos IACréer des musiques IAMontage vidéo (Capcut)
Claude Code
Créer des agents IACréer des SkillsCréer un workflow avec Claude CoWork
Dev
Installer une IA en localVidéos motion designCréer un jeu navigateurCréer une extension ChromeCréer une app PC
VidéosKeyword SEODatasets & ListesWebsite CheckerAffiliation FinderSEO Spots FinderAPIs FinderMCP FinderWorkflows.mdMes Skills.mdMes agents.mdMes OutilsMes templates
Le studio
À proposRoadmapAI Team
Mentions·Confidentialité
Accueil · APIs Finder · Audio & voix · Deepgram
D
Deepgram
Audio & voix
Tarification
Freemium
Authentification
Clé API
Catégorie
Audio & voix
Accéder à Deepgram →
→ Créer un compte→ Documentation officielle
← Toutes les APIs de données
Aperçu du site DeepgramVisiter Deepgram →

Deepgram API

Transcription, synthèse vocale et agents vocaux rapides et précis, par API.

Deepgram est une plateforme d'IA vocale dont l'API couvre la transcription audio (speech-to-text) avec ses modèles Nova, la synthèse vocale (text-to-speech) avec Aura, et la création d'agents vocaux temps réel via la Voice Agent API. Elle est appréciée pour sa rapidité, sa précision et sa facturation à la seconde d'audio réellement traité. Elle s'adresse aux développeurs qui veulent transcrire des appels, des réunions ou des médias à grande échelle, ajouter une voix à leurs produits, ou bâtir des assistants vocaux interactifs.

Que propose l'API Deepgram ?

Speech-to-Text (Nova-3)
Transcrit l'audio en texte en mode pré-enregistré (batch) ou streaming temps réel, en anglais et en mode multilingue, avec diarisation et ponctuation.
Text-to-Speech (Aura-2)
Convertit du texte en voix naturelle à faible latence, adaptée aux applications conversationnelles.
Voice Agent API
Combine transcription, raisonnement LLM et synthèse vocale dans une seule connexion pour bâtir des agents vocaux temps réel.

Tarifs de l'API Deepgram

Pay-as-you-go facturé à la seconde d'audio réellement traité (pas d'arrondi à la minute), sans minimum ni engagement. Tarifs différents selon le mode streaming ou pré-enregistré. Plan Growth avec crédits prépayés annuels et tarifs réduits, et offre Enterprise sur mesure.

Speech-to-Text Nova-3 pré-enregistré (par minute)
$0.0077
Speech-to-Text Nova-3 streaming (par minute)
$0.0048
Text-to-Speech Aura-2 (par 1 000 caractères)
$0.030
Voice Agent API Standard (par minute)
$0.075

Offre gratuite — Crédit gratuit de 200 $ offert à l'inscription, sans carte bancaire et sans expiration, couvrant environ 26 000 minutes (~433 heures) de transcription Nova-3 monolingue.

Authentification & intégration

Authentification par clé API générée dans la console (console.deepgram.com), transmise dans l'en-tête Authorization de chaque requête (Authorization: Token <DEEPGRAM_API_KEY>).

API REST pour la transcription pré-enregistrée et la synthèse vocale (réponses synchrones), et API WebSocket pour le streaming temps réel (transcription live et agents vocaux). SDK officiels Python, JavaScript, .NET et Go.

Cas d'usage de l'API Deepgram

  • Transcrire automatiquement des appels téléphoniques, réunions ou podcasts à grande échelle.
  • Ajouter une transcription temps réel à une visioconférence ou un outil de prise de notes.
  • Bâtir un agent vocal ou un assistant téléphonique interactif avec la Voice Agent API.
  • Doter une application d'une voix de synthèse à faible latence via Aura-2.
  • Analyser des centres d'appels (sujets, sentiment) à partir des transcriptions.
  • Sous-titrer automatiquement des vidéos ou des contenus médias.

✓ Points forts

  • Modèles de transcription rapides et précis, en batch comme en streaming temps réel.
  • Facturation à la seconde réellement traitée, sans arrondi à la minute ni minimum.
  • Crédit gratuit généreux de 200 $ sans carte bancaire ni expiration.
  • Suite complète STT + TTS + agents vocaux dans une seule plateforme.
  • SDK officiels dans plusieurs langages et streaming WebSocket à faible latence.

⚠ Limites

  • Produit principalement orienté API : pas d'interface no-code complète pour les non-développeurs.
  • Le mode streaming est facturé à un tarif différent du pré-enregistré, à anticiper.
  • La couverture multilingue, bien que large, varie selon les modèles et les langues.
  • Les meilleurs tarifs nécessitent un engagement Growth avec crédits prépayés annuels.

Questions fréquentes sur l'API Deepgram

Deepgram propose-t-il un essai gratuit ?

Oui, un crédit gratuit de 200 $ est offert à l'inscription, sans carte bancaire et sans expiration, soit environ 433 heures de transcription Nova-3 monolingue.

Comment est facturée la transcription ?

À la seconde d'audio réellement traité, sans arrondi à la minute, avec des tarifs distincts selon le mode pré-enregistré (~0,0077 $/min) ou streaming (~0,0048 $/min) pour Nova-3.

Quelle authentification utilise l'API ?

Une clé API générée dans la console Deepgram, transmise dans l'en-tête Authorization de chaque requête sous la forme Authorization: Token <clé>.

Peut-on transcrire en temps réel ?

Oui, Deepgram propose une API WebSocket de streaming pour la transcription live à faible latence, utilisable notamment pour les visioconférences et les agents vocaux.

Qu'est-ce que la Voice Agent API ?

Une API qui combine transcription, raisonnement par LLM et synthèse vocale dans une seule connexion temps réel, pour construire des agents vocaux interactifs, facturée à la minute.

Deepgram fait-il aussi de la synthèse vocale ?

Oui, le modèle Aura-2 convertit du texte en voix naturelle à faible latence, facturé environ 0,030 $ pour 1 000 caractères en pay-as-you-go.

Découvrir Deepgram →

Autres APIs Audio & voix

Aperçu ElevenLabs
ElevenLabs
Synthèse vocale IA réaliste et clonage de voix multilingue via API.
Aperçu AssemblyAI
AssemblyAI
Transcription audio, résumé et analyse de la parole par IA via API.
Aperçu Murf
Murf
Synthèse vocale IA de qualité studio avec voix multilingues via API.
Aperçu Play.ht
Play.ht
Génération de voix off IA réalistes et clonage vocal en streaming via API.
Aperçu Speechmatics
Speechmatics
Transcription vocale précise multilingue, en temps réel ou par lot, via API.
Aperçu Rev AI
Rev AI
Transcription et sous-titrage audio/vidéo par IA, asynchrone et temps réel, via API.
Outils
  • Recherche de mots-clés
  • Datasets & Listes
  • Analyseur de site
  • SEO Spots Finder
Annuaires
  • APIs Finder
  • Outils sélectionnés
  • Programmes d'affiliation
  • Vente de liens
Claude Code
  • Skills
  • Agents IA
  • Templates
  • Freudix Academy
Newsletter

Nouveaux outils, formations et mises à jour — direct dans ta boîte.

Zéro spam · désabonnement en 1 clic.

FREUDIX/Studio— outils SEO & business gratuitsMentions légalesConfidentialité