LM Studio は、自分のハードウェア上でオープンウェイトモデルを実行するための、親しみやすく強力なアプリです。llama.cpp(GGUF)または MLX モデル(Apple Silicon)を実行できます。GUI パッケージまたはヘッドレスデーモン(Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
llmster)として提供されます。製品とセットアップのドキュメントについては、lmstudio.ai を参照してください。
クイックスタート
- LM Studio(デスクトップ)または
llmster(ヘッドレス)をインストールし、ローカルサーバーを起動します。
- サーバーを起動します
- LM Studio 認証が有効な場合は、
LM_API_TOKENを設定します。
- オンボーディングを実行し、
LM Studioを選択します。
- オンボーディングでは、
Default modelプロンプトを使って LM Studio モデルを選択します。
author/model-name 形式(例: qwen/qwen3.5-9b)に従います。OpenClaw
のモデル参照ではプロバイダー名を前置します: lmstudio/qwen/qwen3.5-9b。モデルの正確なキーは、
curl http://localhost:1234/api/v1/models を実行し、key フィールドを見ることで確認できます。
非対話型オンボーディング
セットアップをスクリプト化したい場合(CI、プロビジョニング、リモートブートストラップ)は、非対話型オンボーディングを使用します。--custom-model-id は、LM Studio から返されるモデルキー(例: qwen/qwen3.5-9b)を受け取ります。
lmstudio/ プロバイダープレフィックスは含めません。
認証済みの LM Studio サーバーでは、--lmstudio-api-key を渡すか、LM_API_TOKEN を設定します。
未認証の LM Studio サーバーでは、キーを省略します。OpenClaw はローカルの非シークレットマーカーを保存します。
--custom-api-key は互換性のため引き続きサポートされますが、LM Studio では --lmstudio-api-key が推奨されます。
これにより models.providers.lmstudio が書き込まれ、デフォルトモデルが
lmstudio/<custom-model-id> に設定されます。API キーを指定した場合、セットアップは
lmstudio:default 認証プロファイルも書き込みます。
対話型セットアップでは、任意の優先ロードコンテキスト長を入力でき、保存された検出済み LM Studio モデル全体にそれを適用します。
LM Studio Plugin 設定は、loopback、LAN、tailnet ホストを含むモデルリクエストについて、設定済みの LM Studio エンドポイントを信頼します。models.providers.lmstudio.request.allowPrivateNetwork: false を設定するとオプトアウトできます。
設定
ストリーミング使用量の互換性
LM Studio はストリーミング使用量に対応しています。OpenAI 形式のusage オブジェクトを出力しない場合、OpenClaw は代わりに llama.cpp 形式の
timings.prompt_n / timings.predicted_n メタデータからトークン数を復元します。
同じストリーミング使用量の挙動は、次の OpenAI 互換ローカルバックエンドにも適用されます。
- vLLM
- SGLang
- llama.cpp
- LocalAI
- Jan
- TabbyAPI
- text-generation-webui
Thinking の互換性
LM Studio の/api/v1/models 検出がモデル固有の reasoning
オプションを報告する場合、OpenClaw は対応する OpenAI 互換の reasoning_effort
値をモデル互換メタデータとして公開します。現在の LM Studio ビルドは、
allowed_options: ["off", "on"] のようなバイナリの UI オプションを告知することがありますが、
/v1/chat/completions ではそれらの値を拒否します。OpenClaw はリクエスト送信前に、そのバイナリ検出形式を
none、minimal、low、medium、high、xhigh に正規化します。
off/on reasoning マップを含む古い保存済み LM Studio 設定も、
カタログの読み込み時に同じ方法で正規化されます。
明示的な設定
トラブルシューティング
LM Studio が検出されない
LM Studio が実行中であることを確認してください。認証が有効な場合は、LM_API_TOKEN も設定します。
認証エラー(HTTP 401)
セットアップが HTTP 401 を報告する場合は、API キーを確認してください。LM_API_TOKENが LM Studio に設定されたキーと一致していることを確認します。- LM Studio 認証セットアップの詳細については、LM Studio 認証 を参照してください。
- サーバーが認証を必要としない場合は、セットアップ中にキーを空白のままにします。
ジャストインタイムのモデル読み込み
LM Studio は、最初のリクエスト時にモデルを読み込むジャストインタイム(JIT)モデル読み込みをサポートしています。OpenClaw はデフォルトで LM Studio のネイティブ読み込みエンドポイントを通じてモデルをプリロードします。これは JIT が無効な場合に役立ちます。LM Studio の JIT、アイドル TTL、自動エビクト動作にモデルライフサイクルを任せるには、OpenClaw のプリロード手順を無効にします。LAN または tailnet の LM Studio ホスト
LM Studio ホストの到達可能なアドレスを使用し、/v1 を維持し、そのマシン上で LM Studio がループバックを越えてバインドされていることを確認してください。
lmstudio は保護されたモデルリクエストに対して、設定済みのローカル/プライベートエンドポイントを自動的に信頼します。localhost や 127.0.0.1 のようなカスタムループバックプロバイダー ID も自動的に信頼されます。LAN、tailnet、またはプライベート DNS のカスタムプロバイダー ID では、models.providers.<id>.request.allowPrivateNetwork: true を明示的に設定してください。