LM Studio - OpenClaw

LM Studio é um app amigável e poderoso para executar modelos de pesos abertos no seu próprio hardware. Ele permite executar modelos llama.cpp (GGUF) ou MLX (Apple Silicon). Vem em um pacote com GUI ou daemon sem interface gráfica (llmster). Para documentação de produto e configuração, consulte lmstudio.ai.

Início rápido

Instale o LM Studio (desktop) ou llmster (sem interface gráfica) e então inicie o servidor local:

curl -fsSL https://lmstudio.ai/install.sh | bash

Inicie o servidor

Certifique-se de iniciar o app desktop ou executar o daemon usando o seguinte comando:

lms daemon up

lms server start --port 1234

Se você estiver usando o app, certifique-se de que o JIT esteja ativado para uma experiência fluida. Saiba mais no guia de JIT e TTL do LM Studio.

Se a autenticação do LM Studio estiver ativada, defina LM_API_TOKEN:

export LM_API_TOKEN="your-lm-studio-api-token"

Se a autenticação do LM Studio estiver desativada, você pode deixar a chave de API em branco durante a configuração interativa do OpenClaw. Para detalhes de configuração de autenticação do LM Studio, consulte Autenticação do LM Studio.

Execute o onboarding e escolha LM Studio:

openclaw onboard

No onboarding, use o prompt Default model para escolher seu modelo do LM Studio.

Você também pode definir ou alterá-lo depois:

openclaw models set lmstudio/qwen/qwen3.5-9b

As chaves de modelo do LM Studio seguem o formato author/model-name (por exemplo, qwen/qwen3.5-9b). As refs de modelo do OpenClaw prefixam o nome do provedor: lmstudio/qwen/qwen3.5-9b. Você pode encontrar a chave exata de um modelo executando curl http://localhost:1234/api/v1/models e consultando o campo key.

Onboarding não interativo

Use o onboarding não interativo quando quiser automatizar a configuração por script (CI, provisionamento, bootstrap remoto):

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio

Ou especifique a URL base, o modelo e a chave de API opcional:

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio \
  --custom-base-url http://localhost:1234/v1 \
  --lmstudio-api-key "$LM_API_TOKEN" \
  --custom-model-id qwen/qwen3.5-9b

--custom-model-id recebe a chave do modelo conforme retornada pelo LM Studio (por exemplo, qwen/qwen3.5-9b), sem o prefixo de provedor lmstudio/. Para servidores LM Studio autenticados, passe --lmstudio-api-key ou defina LM_API_TOKEN. Para servidores LM Studio não autenticados, omita a chave; o OpenClaw armazena um marcador local não secreto. --custom-api-key continua compatível, mas --lmstudio-api-key é preferível para o LM Studio. Isso grava models.providers.lmstudio e define o modelo padrão como lmstudio/<custom-model-id>. Quando você fornece uma chave de API, a configuração também grava o perfil de autenticação lmstudio:default. A configuração interativa pode solicitar um comprimento de contexto de carregamento preferencial opcional e o aplica aos modelos do LM Studio descobertos que ela salva na configuração. A configuração do Plugin do LM Studio confia no endpoint configurado do LM Studio para solicitações de modelo, incluindo hosts local loopback, LAN e tailnet. Origens de metadados/link-local ainda exigem opt-in explícito. Você pode optar por sair definindo models.providers.lmstudio.request.allowPrivateNetwork: false.

Configuração

Compatibilidade de uso em streaming

O LM Studio é compatível com uso em streaming. Quando ele não emite um objeto usage no formato do OpenAI, o OpenClaw recupera as contagens de tokens dos metadados no estilo llama.cpp timings.prompt_n / timings.predicted_n. O mesmo comportamento de uso em streaming se aplica a estes backends locais compatíveis com OpenAI:

vLLM
SGLang
llama.cpp
LocalAI
Jan
TabbyAPI
text-generation-webui

Compatibilidade de raciocínio

Quando a descoberta /api/v1/models do LM Studio relata opções de raciocínio específicas do modelo, o OpenClaw expõe os valores reasoning_effort compatíveis com OpenAI correspondentes nos metadados de compatibilidade do modelo. Builds atuais do LM Studio podem anunciar opções binárias de UI, como allowed_options: ["off", "on"], enquanto rejeitam esses valores em /v1/chat/completions; o OpenClaw normaliza esse formato de descoberta binário para none, minimal, low, medium, high e xhigh antes de enviar solicitações. Configurações antigas salvas do LM Studio que contêm mapas de raciocínio off/on são normalizadas da mesma forma quando o catálogo é carregado.

Configuração explícita

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "${LM_API_TOKEN}",
        api: "openai-completions",
        models: [
          {
            id: "qwen/qwen3-coder-next",
            name: "Qwen 3 Coder Next",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 128000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Solução de problemas

LM Studio não detectado

Certifique-se de que o LM Studio esteja em execução. Se a autenticação estiver ativada, defina também LM_API_TOKEN:

# Start via desktop app, or headless:
lms server start --port 1234

Verifique se a API está acessível:

curl http://localhost:1234/api/v1/models

Erros de autenticação (HTTP 401)

Se a configuração relatar HTTP 401, verifique sua chave de API:

Confira se LM_API_TOKEN corresponde à chave configurada no LM Studio.
Para detalhes de configuração de autenticação do LM Studio, consulte Autenticação do LM Studio.
Se o servidor não exigir autenticação, deixe a chave em branco durante a configuração.

Carregamento de modelo just-in-time

O LM Studio oferece suporte ao carregamento de modelo just-in-time (JIT), em que os modelos são carregados na primeira solicitação. O OpenClaw pré-carrega modelos pelo endpoint de carregamento nativo do LM Studio por padrão, o que ajuda quando o JIT está desativado. Para deixar que o JIT, o TTL ocioso e o comportamento de auto-evict do LM Studio controlem o ciclo de vida do modelo, desative a etapa de pré-carregamento do OpenClaw:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        api: "openai-completions",
        params: { preload: false },
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

Host LM Studio em LAN ou tailnet

Use o endereço acessível do host do LM Studio, mantenha /v1 e certifique-se de que o LM Studio esteja vinculado além do loopback nessa máquina:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://gpu-box.local:1234/v1",
        apiKey: "lmstudio",
        api: "openai-completions",
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

lmstudio confia automaticamente em seu endpoint local/privado configurado para solicitações de modelo protegidas. Entradas de provedor compatível com OpenAI customizadas/locais também confiam na origem baseUrl exata configurada, exceto origens de metadados/link-local; solicitações para portas ou destinos privados diferentes ainda exigem models.providers.<id>.request.allowPrivateNetwork: true. Defina models.providers.<id>.request.allowPrivateNetwork: false para optar por sair da confiança na origem exata.

​Início rápido

​Onboarding não interativo

​Configuração

​Compatibilidade de uso em streaming

​Compatibilidade de raciocínio

​Configuração explícita

​Solução de problemas

​LM Studio não detectado

​Erros de autenticação (HTTP 401)

​Carregamento de modelo just-in-time

​Host LM Studio em LAN ou tailnet

​Relacionados