inferrs peut servir des modèles locaux derrière une APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 compatible OpenAI. OpenClaw fonctionne avec inferrs via le chemin générique openai-completions.
| Propriété | Valeur |
|---|---|
| ID du fournisseur | inferrs (personnalisé ; configurer sous models.providers.inferrs) |
| Plugin | aucun — inferrs n’est pas un Plugin de fournisseur OpenClaw intégré |
| Variable d’environnement d’authentification | Facultative. N’importe quelle valeur fonctionne si votre serveur inferrs n’a pas d’authentification |
| API | compatible OpenAI (openai-completions) |
| URL de base suggérée | http://127.0.0.1:8080/v1 (ou là où se trouve votre serveur inferrs) |
Il est actuellement préférable de traiter
inferrs comme un backend compatible OpenAI personnalisé auto-hébergé, et non comme un Plugin de fournisseur OpenClaw dédié. Vous le configurez via models.providers.inferrs plutôt qu’avec un indicateur de choix d’intégration. Si vous avez besoin d’un vrai Plugin intégré avec découverte automatique, consultez SGLang ou vLLM.Premiers pas
Exemple de configuration complet
Cet exemple utilise Gemma 4 sur un serveurinferrs local.
Démarrage à la demande
Inferrs peut aussi être démarré par OpenClaw uniquement lorsqu’un modèleinferrs/... est
sélectionné. Ajoutez localService à la même entrée de fournisseur :
command doit être absolu. Utilisez which inferrs sur l’hôte Gateway et placez ce
chemin dans la configuration. Pour la référence complète des champs, consultez
Services de modèles locaux.
Configuration avancée
Pourquoi requiresStringContent est important
Pourquoi requiresStringContent est important
Certaines routes Chat Completions de OpenClaw aplatira les parties de contenu en texte pur en chaînes simples avant d’envoyer
la requête.
inferrs acceptent uniquement des chaînes
messages[].content, et non des tableaux structurés de parties de contenu.Gemma et mise en garde sur le schéma d’outils
Gemma et mise en garde sur le schéma d’outils
Certaines combinaisons actuelles Cela désactive la surface de schéma d’outils d’OpenClaw pour le modèle et peut réduire la pression de prompt
sur les backends locaux plus stricts.Si de très petites requêtes directes fonctionnent toujours mais que les tours d’agent OpenClaw normaux continuent de
planter dans
inferrs + Gemma acceptent les petites requêtes directes
/v1/chat/completions, mais échouent toujours lors des tours complets du runtime d’agent
OpenClaw.Si cela se produit, essayez d’abord ceci :inferrs, le problème restant se situe généralement dans le comportement du modèle/serveur
en amont plutôt que dans la couche de transport d’OpenClaw.Test de fumée manuel
Test de fumée manuel
Une fois configuré, testez les deux couches :Si la première commande fonctionne mais que la seconde échoue, consultez la section de dépannage ci-dessous.
Comportement de type proxy
Comportement de type proxy
inferrs est traité comme un backend /v1 compatible OpenAI de type proxy, et non comme un
point de terminaison OpenAI natif.- La mise en forme des requêtes propre aux points de terminaison OpenAI natifs ne s’applique pas ici
- Pas de
service_tier, pas de Responsesstore, pas d’indications de cache de prompt, et pas de mise en forme de payload de compatibilité de raisonnement OpenAI - Les en-têtes d’attribution OpenClaw masqués (
originator,version,User-Agent) ne sont pas injectés sur les URL de baseinferrspersonnalisées
Dépannage
curl /v1/models échoue
curl /v1/models échoue
inferrs n’est pas en cours d’exécution, n’est pas accessible, ou n’est pas lié à l’hôte/au port
attendus. Assurez-vous que le serveur est démarré et écoute à l’adresse que vous
avez configurée.messages[].content attendait une chaîne
messages[].content attendait une chaîne
Définissez
compat.requiresStringContent: true dans l’entrée de modèle. Consultez la
section requiresStringContent ci-dessus pour plus de détails.Les appels directs /v1/chat/completions réussissent, mais openclaw infer model run échoue
Les appels directs /v1/chat/completions réussissent, mais openclaw infer model run échoue
Essayez de définir
compat.supportsTools: false pour désactiver la surface de schéma d’outils.
Consultez la mise en garde sur le schéma d’outils de Gemma ci-dessus.inferrs plante toujours sur les tours d’agent plus volumineux
inferrs plante toujours sur les tours d’agent plus volumineux
Si OpenClaw n’obtient plus d’erreurs de schéma mais que
inferrs plante toujours sur des tours
d’agent plus volumineux, traitez cela comme une limitation en amont de inferrs ou du modèle. Réduisez
la pression de prompt ou passez à un autre backend local ou modèle.Associés
Modèles locaux
Exécuter OpenClaw avec des serveurs de modèles locaux.
Services de modèles locaux
Démarrer des serveurs de modèles locaux à la demande pour les fournisseurs configurés.
Dépannage Gateway
Déboguer des backends locaux compatibles OpenAI qui réussissent les sondes mais échouent lors des exécutions d’agent.
Sélection du modèle
Vue d’ensemble de tous les fournisseurs, références de modèles et comportement de basculement.