> ## Documentation Index
> Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Proveedor llama.cpp

`llama-cpp` es el plugin proveedor externo oficial para embeddings GGUF locales.
Es propietario de la dependencia de runtime `node-llama-cpp` usada por
`memorySearch.provider: "local"`.

Instálalo antes de usar embeddings de memoria local:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
openclaw plugins install @openclaw/llama-cpp-provider
```

El paquete npm principal `openclaw` no incluye `node-llama-cpp`. Mantener la
dependencia nativa en este plugin evita que las actualizaciones npm normales de OpenClaw
eliminen un runtime instalado manualmente dentro del directorio del paquete OpenClaw.

## Configuración

Define el proveedor de búsqueda de memoria como `local`:

```json5 theme={"theme":{"light":"min-light","dark":"min-dark"}}
{
  agents: {
    defaults: {
      memorySearch: {
        provider: "local",
        local: {
          modelPath: "hf:ggml-org/embeddinggemma-300m-qat-q8_0-GGUF/embeddinggemma-300m-qat-Q8_0.gguf",
        },
      },
    },
  },
}
```

El modelo predeterminado es `embeddinggemma-300m-qat-Q8_0.gguf`. También puedes apuntar
`local.modelPath` a un archivo `.gguf` local.

## Runtime nativo

Usa Node 24 para la ruta de instalación nativa más fluida. Los checkouts de código fuente que usan pnpm
pueden necesitar aprobar y reconstruir la dependencia nativa:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm approve-builds
pnpm rebuild node-llama-cpp
```

Para embeddings locales con menos fricción, usa en su lugar un proveedor de servicio local como
Ollama o LM Studio.
