Perplexity (Sonar) API
Une API de chat connectée au web en temps réel, avec citations à l'appui.
Sonar est l'API de Perplexity qui permet d'interroger des modèles de langage capables de chercher des informations à jour sur le web et de répondre en citant leurs sources. Elle s'utilise comme une API de chat completions compatible avec le format OpenAI, ce qui facilite l'intégration dans un produit existant. Elle s'adresse aux développeurs qui veulent ajouter une recherche grounded (réponses appuyées sur des données web fraîches) à leurs applications, chatbots, agents ou outils d'analyse, sans construire eux-mêmes la couche de recherche.
Que propose l'API Perplexity (Sonar) ?
Tarifs de l'API Perplexity (Sonar)
Pay-as-you-go sans abonnement : on paie les tokens consommés (entrée et sortie) ainsi qu'un coût par requête lié au volume de contenu web récupéré (search context : low, medium, high). Le crédit est déduit d'un solde prépayé.
Authentification & intégration
Authentification par clé API en jeton Bearer dans l'en-tête Authorization (Authorization: Bearer <PERPLEXITY_API_KEY>), sur le endpoint https://api.perplexity.ai.
API REST de chat completions au format compatible OpenAI : les SDK Python et JavaScript d'OpenAI fonctionnent avec des modifications minimes. Réponses au format standard (choices, message, usage) enrichies des citations et sources web. Sorties structurées disponibles via response_format (JSON Schema / JSON mode).
Cas d'usage de l'API Perplexity (Sonar)
- Ajouter à un chatbot des réponses à jour sur l'actualité, appuyées par des citations vérifiables.
- Construire un agent de recherche qui synthétise plusieurs sources web sur un sujet donné.
- Enrichir un produit existant compatible OpenAI avec une couche de recherche grounded sans réécrire le code.
- Générer des résumés factuels d'évènements récents avec liens vers les sources.
- Automatiser une veille concurrentielle ou sectorielle alimentée par des données web fraîches.
- Répondre à des questions complexes multi-étapes grâce aux modèles de raisonnement avec recherche.
✓ Points forts
- Réponses connectées au web en temps réel, avec citations des sources.
- API compatible OpenAI : intégration rapide via les SDK existants.
- Plusieurs modèles selon le besoin (rapidité, profondeur, raisonnement, recherche exhaustive).
- Tarification pay-as-you-go sans abonnement obligatoire.
- Sorties structurées (JSON Schema) pour parser facilement les réponses.
⚠ Limites
- Le coût combine tokens et frais par requête liés au volume de recherche, ce qui complique l'estimation.
- Périmètre centré sur la recherche grounded : moins polyvalent qu'un LLM généraliste pur.
- Les modèles Pro et de recherche profonde peuvent vite coûter cher sur de gros volumes.
- La qualité des réponses dépend des sources web disponibles et de leur fraîcheur.
Questions fréquentes sur l'API Perplexity (Sonar)
Qu'est-ce que l'API Sonar de Perplexity ?
C'est une API de chat qui interroge des modèles de langage capables de chercher des informations à jour sur le web et de répondre en citant leurs sources, accessible via un endpoint compatible OpenAI.
Quelle authentification utilise l'API Sonar ?
Une clé API transmise en jeton Bearer dans l'en-tête Authorization de chaque requête, vers le endpoint https://api.perplexity.ai.
Quelle est la différence entre Sonar et Sonar Pro ?
Sonar est le modèle léger et économique pour des réponses rapides, tandis que Sonar Pro est plus puissant, effectue une recherche plus approfondie et renvoie davantage de citations, à un tarif de sortie plus élevé.
Comment fonctionne la tarification ?
Le pay-as-you-go combine un coût par million de tokens (entrée et sortie) et un coût par requête qui dépend du volume de contenu web récupéré (search context low, medium ou high).
Peut-on obtenir des réponses au format JSON ?
Oui, l'API supporte les sorties structurées via le paramètre response_format, en mode JSON ou en fournissant un JSON Schema décrivant le format attendu.
L'API est-elle compatible avec le SDK OpenAI ?
Oui, le endpoint de chat completions suit le format OpenAI : les SDK Python et JavaScript d'OpenAI fonctionnent en changeant simplement l'URL de base et la clé.







