> ## Documentation Index
> Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# llama.cpp-Provider

`llama-cpp` ist das offizielle externe Provider-Plugin für lokale GGUF-Embeddings.
Es besitzt die von `memorySearch.provider: "local"` verwendete
`node-llama-cpp`-Runtime-Abhängigkeit.

Installieren Sie es, bevor Sie lokale Memory-Embeddings verwenden:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
openclaw plugins install @openclaw/llama-cpp-provider
```

Das Haupt-npm-Paket `openclaw` enthält `node-llama-cpp` nicht. Die native
Abhängigkeit in diesem Plugin zu halten, verhindert, dass normale OpenClaw-npm-Updates
eine manuell installierte Runtime im OpenClaw-Paketverzeichnis löschen.

## Konfiguration

Setzen Sie den Provider für die Memory-Suche auf `local`:

```json5 theme={"theme":{"light":"min-light","dark":"min-dark"}}
{
  agents: {
    defaults: {
      memorySearch: {
        provider: "local",
        local: {
          modelPath: "hf:ggml-org/embeddinggemma-300m-qat-q8_0-GGUF/embeddinggemma-300m-qat-Q8_0.gguf",
        },
      },
    },
  },
}
```

Das Standardmodell ist `embeddinggemma-300m-qat-Q8_0.gguf`. Sie können
`local.modelPath` auch auf eine lokale `.gguf`-Datei verweisen lassen.

## Native Runtime

Verwenden Sie Node 24 für den reibungslosesten nativen Installationspfad. Source-Checkouts mit pnpm
müssen die native Abhängigkeit möglicherweise genehmigen und neu bauen:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm approve-builds
pnpm rebuild node-llama-cpp
```

Für lokale Embeddings mit weniger Aufwand verwenden Sie stattdessen einen lokalen Service-Provider wie
Ollama oder LM Studio.