O LM Studio é um app amigável, mas poderoso, para executar modelos de pesos abertos no seu próprio hardware. Ele permite executar modelos llama.cpp (GGUF) ou MLX (Apple Silicon). Vem em um pacote com GUI ou como daemon sem interface gráfica (Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
llmster). Para documentação do produto e de configuração, consulte lmstudio.ai.
Início rápido
- Instale o LM Studio (desktop) ou
llmster(sem interface gráfica) e, em seguida, inicie o servidor local:
- Inicie o servidor
- Se a autenticação do LM Studio estiver habilitada, defina
LM_API_TOKEN:
- Execute a integração inicial e escolha
LM Studio:
- Na integração inicial, use o prompt
Default modelpara escolher seu modelo do LM Studio.
author/model-name (por exemplo, qwen/qwen3.5-9b). As refs de modelo do OpenClaw
prefixam o nome do provedor: lmstudio/qwen/qwen3.5-9b. Você pode encontrar a chave exata de
um modelo executando curl http://localhost:1234/api/v1/models e verificando o campo key.
Integração inicial não interativa
Use a integração inicial não interativa quando quiser automatizar a configuração por script (CI, provisionamento, bootstrap remoto):--custom-model-id recebe a chave do modelo conforme retornada pelo LM Studio (por exemplo, qwen/qwen3.5-9b), sem
o prefixo de provedor lmstudio/.
Para servidores LM Studio autenticados, passe --lmstudio-api-key ou defina LM_API_TOKEN.
Para servidores LM Studio não autenticados, omita a chave; o OpenClaw armazena um marcador local não secreto.
--custom-api-key continua compatível por compatibilidade, mas --lmstudio-api-key é preferível para o LM Studio.
Isso grava models.providers.lmstudio e define o modelo padrão como
lmstudio/<custom-model-id>. Quando você fornece uma chave de API, a configuração também grava o
perfil de autenticação lmstudio:default.
A configuração interativa pode solicitar um comprimento de contexto de carregamento preferido opcional e aplicá-lo aos modelos do LM Studio descobertos que ela salva na configuração.
A configuração do Plugin do LM Studio confia no endpoint configurado do LM Studio para solicitações de modelo, incluindo hosts loopback, LAN e tailnet. Você pode optar por sair definindo models.providers.lmstudio.request.allowPrivateNetwork: false.
Configuração
Compatibilidade de uso em streaming
O LM Studio é compatível com uso em streaming. Quando ele não emite um objetousage no formato do OpenAI, o OpenClaw recupera as contagens de tokens a partir dos metadados
timings.prompt_n / timings.predicted_n no estilo llama.cpp.
O mesmo comportamento de uso em streaming se aplica a estes backends locais compatíveis com OpenAI:
- vLLM
- SGLang
- llama.cpp
- LocalAI
- Jan
- TabbyAPI
- text-generation-webui
Compatibilidade de raciocínio
Quando a descoberta de/api/v1/models do LM Studio relata opções de raciocínio
específicas do modelo, o OpenClaw expõe os valores reasoning_effort
compatíveis com OpenAI correspondentes nos metadados de compatibilidade do modelo. Builds atuais do LM Studio podem anunciar opções binárias
de UI, como allowed_options: ["off", "on"], enquanto rejeitam esses valores
em /v1/chat/completions; o OpenClaw normaliza esse formato binário de descoberta para
none, minimal, low, medium, high e xhigh antes de enviar solicitações.
Configurações salvas antigas do LM Studio que contêm mapas de raciocínio off/on
são normalizadas da mesma forma quando o catálogo é carregado.
Configuração explícita
Solução de problemas
LM Studio não detectado
Certifique-se de que o LM Studio esteja em execução. Se a autenticação estiver habilitada, defina tambémLM_API_TOKEN:
Erros de autenticação (HTTP 401)
Se a configuração relatar HTTP 401, verifique sua chave de API:- Verifique se
LM_API_TOKENcorresponde à chave configurada no LM Studio. - Para detalhes de configuração da autenticação do LM Studio, consulte Autenticação do LM Studio.
- Se seu servidor não exigir autenticação, deixe a chave em branco durante a configuração.
Carregamento de modelo just-in-time
O LM Studio oferece suporte ao carregamento de modelos just-in-time (JIT), em que os modelos são carregados na primeira solicitação. O OpenClaw pré-carrega modelos por meio do endpoint de carregamento nativo do LM Studio por padrão, o que ajuda quando o JIT está desabilitado. Para permitir que o JIT, o TTL ocioso e o comportamento de auto-remoção do LM Studio gerenciem o ciclo de vida do modelo, desabilite a etapa de pré-carregamento do OpenClaw:Host LM Studio em LAN ou tailnet
Use o endereço acessível do host do LM Studio, mantenha/v1 e certifique-se de que o LM Studio esteja vinculado além do loopback nessa máquina:
lmstudio confia automaticamente no endpoint local/privado configurado para solicitações de modelo protegidas. IDs de provedor personalizados de loopback, como localhost ou 127.0.0.1, também são confiáveis automaticamente; para IDs de provedor personalizados de LAN, tailnet ou DNS privado, defina models.providers.<id>.request.allowPrivateNetwork: true explicitamente.