DeepSeek API

Des modèles de raisonnement performants à un prix parmi les plus bas du marché.

DeepSeek API est l'interface développeur de DeepSeek, le laboratoire chinois d'IA connu pour ses modèles ouverts très compétitifs. Elle donne accès via une API REST à des modèles de génération de texte et de raisonnement avancé, dans un format compatible avec celui d'OpenAI. Son principal argument est un coût au token particulièrement agressif, encore réduit par un mécanisme de cache de contexte, ce qui en fait une option privilégiée pour les développeurs cherchant un excellent rapport qualité-prix.

Que propose l'API DeepSeek ?

Chat Completions

Génération de texte conversationnelle en mode standard (non-thinking) pour les tâches générales.

Reasoning (mode thinking)

Mode de raisonnement étape par étape, qui expose la chaîne de pensée du modèle pour les tâches complexes.

FIM Completion

Complétion de type fill-in-the-middle, utile pour la génération et l'insertion de code.

Context Caching

Mise en cache automatique du contexte répété, qui réduit fortement le coût des tokens d'entrée déjà vus.

Function calling & JSON output

Appel d'outils et sortie structurée en JSON pour intégrer le modèle dans des workflows applicatifs.

Tarifs de l'API DeepSeek

Paiement à l'usage, facturé au nombre de tokens (entrée et sortie). Les tokens d'entrée déjà présents en cache sont facturés à un tarif très fortement réduit. Le crédit est prépayé et déduit au fil des requêtes.

deepseek-chat — entrée cache miss (par million de tokens)

$0.14

deepseek-chat — entrée cache hit (par million de tokens)

$0.014

deepseek-chat — sortie (par million de tokens)

$0.28

deepseek-reasoner — entrée cache miss (par million de tokens)

$0.14

deepseek-reasoner — sortie (par million de tokens)

$0.28

Offre gratuite — Pas de crédit gratuit permanent annoncé : l'utilisation nécessite un solde prépayé. La documentation et le format compatible OpenAI permettent toutefois de prototyper l'intégration très facilement, et les tarifs au token sont assez bas pour que les premiers tests coûtent des fractions de centime.

Authentification & intégration

Clé API transmise en jeton Bearer dans l'en-tête Authorization (Authorization: Bearer <clé>). La clé se génère depuis la plateforme DeepSeek.

API REST au format compatible OpenAI (base URL https://api.deepseek.com), avec également un endpoint compatible Anthropic (https://api.deepseek.com/anthropic). Utilisable avec les SDK OpenAI standards. Prise en charge du streaming, de l'appel d'outils (function calling), de la sortie JSON, de la complétion FIM et du mode raisonnement.

Cas d'usage de l'API DeepSeek

Intégrer un assistant conversationnel à très faible coût dans une application grand public.
Résoudre des problèmes complexes (maths, logique, code) en exploitant le mode raisonnement.
Générer et compléter du code, y compris en insertion au milieu d'un fichier via la complétion FIM.
Traiter de gros volumes de requêtes en profitant du cache de contexte pour réduire la facture.
Remplacer un fournisseur LLM plus cher en réutilisant le code OpenAI existant grâce au format compatible.
Construire des agents avec appel d'outils et sorties structurées en JSON.

✓ Points forts

Coût au token parmi les plus bas du marché, encore réduit par le cache de contexte.
Format d'API compatible OpenAI (et Anthropic) : migration quasi immédiate du code existant.
Mode raisonnement performant qui expose la chaîne de pensée pour les tâches difficiles.
Prise en charge complète des fonctionnalités modernes : streaming, function calling, JSON, FIM.
Modèles réputés pour leur bon rapport performance-prix sur le code et le raisonnement.

⚠ Limites

Catalogue de modèles restreint, centré sur le texte et le raisonnement (pas de vision ni d'audio).
Fournisseur chinois : des contraintes de conformité ou de résidence des données pour certaines entreprises.
Noms de modèles et tarifs sujets à des changements et dépréciations réguliers.
Pas de crédit gratuit permanent : il faut approvisionner un solde avant d'utiliser l'API en volume.

Questions fréquentes sur l'API DeepSeek

DeepSeek API est-il vraiment moins cher que les autres ?

Oui, son tarif au token figure parmi les plus bas du marché, de l'ordre de quelques centimes de dollar par million de tokens. Le cache de contexte réduit encore le coût des tokens d'entrée déjà vus, jusqu'à un dixième du tarif normal.

L'API est-elle compatible avec le code OpenAI ?

Oui. DeepSeek utilise un format compatible OpenAI avec la base URL https://api.deepseek.com, et propose aussi un endpoint compatible Anthropic. On peut réutiliser les SDK OpenAI en changeant simplement la base URL et la clé.

Quelle différence entre deepseek-chat et deepseek-reasoner ?

deepseek-chat correspond au mode standard (non-thinking) pour les tâches générales, tandis que deepseek-reasoner active le mode raisonnement (thinking), qui réfléchit étape par étape et expose sa chaîne de pensée pour les problèmes complexes.

Comment s'authentifier ?

On génère une clé API sur la plateforme DeepSeek puis on l'envoie en jeton Bearer dans l'en-tête Authorization de chaque requête, comme avec l'API OpenAI.

Qu'est-ce que le cache de contexte ?

C'est un mécanisme qui met en cache les portions de contexte déjà envoyées. Lorsqu'une requête réutilise ce contexte (cache hit), les tokens d'entrée concernés sont facturés à un tarif très réduit, ce qui abaisse fortement le coût des conversations longues et répétitives.

DeepSeek prend-il en charge le function calling ?

Oui, l'API gère l'appel d'outils (function calling), la sortie structurée en JSON, le streaming et la complétion FIM, ce qui permet de l'intégrer dans des agents et des workflows applicatifs.

Découvrir DeepSeek API →

Visiter DeepSeek API →

DeepSeek API

Des modèles de raisonnement performants à un prix parmi les plus bas du marché.

Que propose l'API DeepSeek ?

Chat Completions

Génération de texte conversationnelle en mode standard (non-thinking) pour les tâches générales.

Reasoning (mode thinking)

Mode de raisonnement étape par étape, qui expose la chaîne de pensée du modèle pour les tâches complexes.

FIM Completion

Complétion de type fill-in-the-middle, utile pour la génération et l'insertion de code.

Context Caching

Mise en cache automatique du contexte répété, qui réduit fortement le coût des tokens d'entrée déjà vus.

Function calling & JSON output

Appel d'outils et sortie structurée en JSON pour intégrer le modèle dans des workflows applicatifs.

Tarifs de l'API DeepSeek

deepseek-chat — entrée cache miss (par million de tokens)

$0.14

deepseek-chat — entrée cache hit (par million de tokens)

$0.014

deepseek-chat — sortie (par million de tokens)

$0.28

deepseek-reasoner — entrée cache miss (par million de tokens)

$0.14

deepseek-reasoner — sortie (par million de tokens)

$0.28

Authentification & intégration

Clé API transmise en jeton Bearer dans l'en-tête Authorization (Authorization: Bearer <clé>). La clé se génère depuis la plateforme DeepSeek.