LM Studio - OpenClaw

LM Studio to przyjazna, a zarazem wydajna aplikacja do uruchamiania modeli o otwartych wagach na własnym sprzęcie. Umożliwia uruchamianie modeli llama.cpp (GGUF) lub MLX (Apple Silicon). Jest dostępna jako pakiet GUI albo demon bez interfejsu (llmster). Dokumentację produktu i konfiguracji znajdziesz na lmstudio.ai.

Szybki start

Zainstaluj LM Studio (desktop) albo llmster (bez interfejsu), a następnie uruchom lokalny serwer:

curl -fsSL https://lmstudio.ai/install.sh | bash

Uruchom serwer

Upewnij się, że uruchomiono aplikację desktopową albo demon za pomocą następującego polecenia:

lms daemon up

lms server start --port 1234

Jeśli używasz aplikacji, upewnij się, że JIT jest włączone, aby zapewnić płynne działanie. Dowiedz się więcej w przewodniku po JIT i TTL w LM Studio.

Jeśli uwierzytelnianie LM Studio jest włączone, ustaw LM_API_TOKEN:

export LM_API_TOKEN="your-lm-studio-api-token"

Jeśli uwierzytelnianie LM Studio jest wyłączone, możesz zostawić klucz API pusty podczas interaktywnej konfiguracji OpenClaw. Szczegóły konfiguracji uwierzytelniania LM Studio znajdziesz w Uwierzytelnianiu LM Studio.

Uruchom wdrażanie i wybierz LM Studio:

openclaw onboard

Podczas wdrażania użyj monitu Default model, aby wybrać model LM Studio.

Możesz też ustawić lub zmienić go później:

openclaw models set lmstudio/qwen/qwen3.5-9b

Klucze modeli LM Studio mają format author/model-name (np. qwen/qwen3.5-9b). Referencje modeli OpenClaw dodają na początku nazwę dostawcy: lmstudio/qwen/qwen3.5-9b. Dokładny klucz modelu możesz znaleźć, uruchamiając curl http://localhost:1234/api/v1/models i sprawdzając pole key.

Wdrażanie nieinteraktywne

Użyj wdrażania nieinteraktywnego, gdy chcesz oskryptować konfigurację (CI, provisioning, zdalny bootstrap):

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio

Albo podaj bazowy URL, model i opcjonalny klucz API:

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio \
  --custom-base-url http://localhost:1234/v1 \
  --lmstudio-api-key "$LM_API_TOKEN" \
  --custom-model-id qwen/qwen3.5-9b

--custom-model-id przyjmuje klucz modelu zwracany przez LM Studio (np. qwen/qwen3.5-9b), bez prefiksu dostawcy lmstudio/. W przypadku uwierzytelnianych serwerów LM Studio przekaż --lmstudio-api-key albo ustaw LM_API_TOKEN. W przypadku nieuwierzytelnianych serwerów LM Studio pomiń klucz; OpenClaw zapisze lokalny, niepoufny znacznik. --custom-api-key pozostaje obsługiwane ze względu na kompatybilność, ale dla LM Studio preferowane jest --lmstudio-api-key. To zapisuje models.providers.lmstudio i ustawia model domyślny na lmstudio/<custom-model-id>. Gdy podasz klucz API, konfiguracja zapisuje także profil uwierzytelniania lmstudio:default. Konfiguracja interaktywna może zapytać o opcjonalną preferowaną długość kontekstu ładowania i stosuje ją do odkrytych modeli LM Studio zapisywanych w konfiguracji. Konfiguracja Plugin LM Studio ufa skonfigurowanemu punktowi końcowemu LM Studio dla żądań modeli, w tym hostom loopback, LAN i tailnet. Źródła metadata/link-local nadal wymagają jawnego włączenia. Możesz z tego zrezygnować, ustawiając models.providers.lmstudio.request.allowPrivateNetwork: false.

Konfiguracja

Kompatybilność użycia strumieniowego

LM Studio jest zgodne z użyciem strumieniowym. Gdy nie emituje obiektu usage w kształcie OpenAI, OpenClaw odtwarza liczniki tokenów z metadanych w stylu llama.cpp: timings.prompt_n / timings.predicted_n. To samo zachowanie użycia strumieniowego dotyczy tych lokalnych backendów zgodnych z OpenAI:

vLLM
SGLang
llama.cpp
LocalAI
Jan
TabbyAPI
text-generation-webui

Kompatybilność myślenia

Gdy wykrywanie LM Studio przez /api/v1/models zgłasza opcje rozumowania specyficzne dla modelu, OpenClaw ujawnia odpowiadające im wartości reasoning_effort zgodne z OpenAI w metadanych kompatybilności modelu. Obecne kompilacje LM Studio mogą reklamować binarne opcje UI, takie jak allowed_options: ["off", "on"], jednocześnie odrzucając te wartości w /v1/chat/completions; OpenClaw normalizuje ten binarny kształt wykrywania do none, minimal, low, medium, high i xhigh przed wysłaniem żądań. Starsza zapisana konfiguracja LM Studio zawierająca mapy rozumowania off/on jest normalizowana w ten sam sposób podczas ładowania katalogu.

Jawna konfiguracja

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "${LM_API_TOKEN}",
        api: "openai-completions",
        models: [
          {
            id: "qwen/qwen3-coder-next",
            name: "Qwen 3 Coder Next",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 128000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Rozwiązywanie problemów

LM Studio nie zostało wykryte

Upewnij się, że LM Studio działa. Jeśli uwierzytelnianie jest włączone, ustaw też LM_API_TOKEN:

# Start via desktop app, or headless:
lms server start --port 1234

Sprawdź, czy API jest dostępne:

curl http://localhost:1234/api/v1/models

Błędy uwierzytelniania (HTTP 401)

Jeśli konfiguracja zgłasza HTTP 401, sprawdź klucz API:

Sprawdź, czy LM_API_TOKEN odpowiada kluczowi skonfigurowanemu w LM Studio.
Szczegóły konfiguracji uwierzytelniania LM Studio znajdziesz w Uwierzytelnianiu LM Studio.
Jeśli serwer nie wymaga uwierzytelniania, zostaw klucz pusty podczas konfiguracji.

Ładowanie modelu just-in-time

LM Studio obsługuje ładowanie modeli just-in-time (JIT), w którym modele są ładowane przy pierwszym żądaniu. OpenClaw domyślnie wstępnie ładuje modele przez natywny punkt końcowy ładowania LM Studio, co pomaga, gdy JIT jest wyłączone. Aby cykl życia modelu był zarządzany przez JIT, bezczynny TTL i automatyczne eksmitowanie LM Studio, wyłącz krok wstępnego ładowania OpenClaw:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        api: "openai-completions",
        params: { preload: false },
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

Host LM Studio w sieci LAN lub tailnet

Użyj osiągalnego adresu hosta LM Studio, zachowaj /v1 i upewnij się, że LM Studio na tej maszynie jest powiązane poza loopback:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://gpu-box.local:1234/v1",
        apiKey: "lmstudio",
        api: "openai-completions",
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

lmstudio automatycznie ufa skonfigurowanemu lokalnemu/prywatnemu punktowi końcowemu dla chronionych żądań modeli. Niestandardowe/lokalne wpisy dostawców zgodnych z OpenAI także ufają dokładnie skonfigurowanemu źródłu baseUrl, z wyjątkiem źródeł metadata/link-local; żądania do innych prywatnych portów lub miejsc docelowych nadal wymagają models.providers.<id>.request.allowPrivateNetwork: true. Ustaw models.providers.<id>.request.allowPrivateNetwork: false, aby zrezygnować z zaufania do dokładnego źródła.

​Szybki start

​Wdrażanie nieinteraktywne

​Konfiguracja

​Kompatybilność użycia strumieniowego

​Kompatybilność myślenia

​Jawna konfiguracja

​Rozwiązywanie problemów

​LM Studio nie zostało wykryte

​Błędy uwierzytelniania (HTTP 401)

​Ładowanie modelu just-in-time

​Host LM Studio w sieci LAN lub tailnet

​Powiązane