Google (Gemini) - OpenClaw

De Google-Plugin biedt toegang tot Gemini-modellen via Google AI Studio, plus beeldgeneratie, mediabegrip (afbeelding/audio/video), tekst-naar-spraak en zoeken op het web via Gemini Grounding.

Provider: google
Auth: GEMINI_API_KEY of GOOGLE_API_KEY
API: Google Gemini API
Runtime-optie: provider/model agentRuntime.id: "google-gemini-cli" hergebruikt Gemini CLI OAuth terwijl modelverwijzingen canoniek blijven als google/*.

Aan de slag

Kies je gewenste auth-methode en volg de installatiestappen.

API-sleutel
Gemini CLI (OAuth)

Beste voor: standaardtoegang tot de Gemini API via Google AI Studio.

Onboarding uitvoeren

openclaw onboard --auth-choice gemini-api-key

Of geef de sleutel direct door:

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"

Een standaardmodel instellen

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}

Controleren of het model beschikbaar is

openclaw models list --provider google

De omgevingsvariabelen GEMINI_API_KEY en GOOGLE_API_KEY worden allebei geaccepteerd. Gebruik degene die je al hebt geconfigureerd.

Beste voor: een bestaande Gemini CLI-login via PKCE OAuth hergebruiken in plaats van een aparte API-sleutel.

De provider google-gemini-cli is een onofficiële integratie. Sommige gebruikers melden accountbeperkingen wanneer OAuth op deze manier wordt gebruikt. Gebruik op eigen risico.

De Gemini CLI installeren

Het lokale commando gemini moet beschikbaar zijn op PATH.

# Homebrew
brew install gemini-cli

# or npm
npm install -g @google/gemini-cli

OpenClaw ondersteunt zowel Homebrew-installaties als globale npm-installaties, inclusief gangbare Windows/npm-indelingen.

Inloggen via OAuth

openclaw models auth login --provider google-gemini-cli --set-default

Controleren of het model beschikbaar is

openclaw models list --provider google

Standaardmodel: google/gemini-3.1-pro-preview
Runtime: google-gemini-cli
Alias: gemini-cli

De Gemini API-model-id van Gemini 3.1 Pro is gemini-3.1-pro-preview. OpenClaw accepteert de kortere google/gemini-3.1-pro als handige alias en normaliseert die vóór provider-aanroepen.Omgevingsvariabelen:

OPENCLAW_GEMINI_OAUTH_CLIENT_ID
OPENCLAW_GEMINI_OAUTH_CLIENT_SECRET

(Of de GEMINI_CLI_*-varianten.)

Als Gemini CLI OAuth-aanvragen mislukken na het inloggen, stel dan GOOGLE_CLOUD_PROJECT of GOOGLE_CLOUD_PROJECT_ID in op de Gateway-host en probeer het opnieuw.

Als inloggen mislukt voordat de browserflow start, controleer dan of het lokale commando gemini is geïnstalleerd en op PATH staat.

google-gemini-cli/*-modelverwijzingen zijn legacy-compatibiliteitsaliassen. Nieuwe configuraties moeten google/*-modelverwijzingen gebruiken plus de runtime google-gemini-cli wanneer ze lokale Gemini CLI-uitvoering willen.

Mogelijkheden

Mogelijkheid	Ondersteund
Chatvoltooiingen	Ja
Beeldgeneratie	Ja
Muziekgeneratie	Ja
Tekst-naar-spraak	Ja
Realtime spraak	Ja (Google Live API)
Afbeeldingsbegrip	Ja
Audiotranscriptie	Ja
Videobegrip	Ja
Zoeken op het web (Grounding)	Ja
Denken/redeneren	Ja (Gemini 2.5+ / Gemini 3+)
Gemma 4-modellen	Ja

Zoeken op het web

De gebundelde gemini-provider voor zoeken op het web gebruikt Gemini Google Search-grounding. Configureer een toegewezen zoeksleutel onder plugins.entries.google.config.webSearch, of laat deze models.providers.google.apiKey hergebruiken na GEMINI_API_KEY:

{
  plugins: {
    entries: {
      google: {
        config: {
          webSearch: {
            apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set
            baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl
            model: "gemini-2.5-flash",
          },
        },
      },
    },
  },
}

De volgorde van credentials is de toegewezen webSearch.apiKey, daarna GEMINI_API_KEY, daarna models.providers.google.apiKey. webSearch.baseUrl is optioneel en bestaat voor operator-proxy’s of compatibele Gemini API-eindpunten; wanneer weggelaten, hergebruikt Gemini zoeken op het web models.providers.google.baseUrl. Zie Gemini zoeken voor het providerspecifieke toolgedrag.

Gemini 3-modellen gebruiken thinkingLevel in plaats van thinkingBudget. OpenClaw koppelt redeneerinstellingen voor Gemini 3, Gemini 3.1 en alias gemini-*-latest aan thinkingLevel, zodat standaardruns en runs met lage latentie geen uitgeschakelde thinkingBudget-waarden verzenden./think adaptive behoudt Google’s dynamische denksemantiek in plaats van een vast OpenClaw-niveau te kiezen. Gemini 3 en Gemini 3.1 laten een vaste thinkingLevel weg zodat Google het niveau kan kiezen; Gemini 2.5 verzendt Google’s dynamische sentinel thinkingBudget: -1.Gemma 4-modellen (bijvoorbeeld gemma-4-26b-a4b-it) ondersteunen denkmodus. OpenClaw herschrijft thinkingBudget naar een ondersteund Google-thinkingLevel voor Gemma 4. Denken instellen op off behoudt uitgeschakeld denken in plaats van te mappen naar MINIMAL.

Beeldgeneratie

De gebundelde google-provider voor beeldgeneratie gebruikt standaard google/gemini-3.1-flash-image-preview.

Ondersteunt ook google/gemini-3-pro-image-preview
Genereren: tot 4 afbeeldingen per aanvraag
Bewerkmodus: ingeschakeld, tot 5 invoerafbeeldingen
Geometrie-instellingen: size, aspectRatio en resolution

Om Google als standaardprovider voor afbeeldingen te gebruiken:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}

Zie Beeldgeneratie voor gedeelde toolparameters, providerselectie en failover-gedrag.

Videogeneratie

De gebundelde google-Plugin registreert ook videogeneratie via de gedeelde tool video_generate.

Standaardvideomodel: google/veo-3.1-fast-generate-preview
Modi: tekst-naar-video, afbeelding-naar-video en referentieflows met één video
Ondersteunt aspectRatio (16:9, 9:16) en resolution (720P, 1080P); audio-uitvoer wordt momenteel niet ondersteund door Veo
Ondersteunde duren: 4, 6 of 8 seconden (andere waarden springen naar de dichtstbijzijnde toegestane waarde)

Om Google als standaardprovider voor video te gebruiken:

{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}

Zie Videogeneratie voor gedeelde toolparameters, providerselectie en failover-gedrag.

Muziekgeneratie

De gebundelde google-Plugin registreert ook muziekgeneratie via de gedeelde tool music_generate.

Standaardmuziekmodel: google/lyria-3-clip-preview
Ondersteunt ook google/lyria-3-pro-preview
Promptinstellingen: lyrics en instrumental
Uitvoerformaat: standaard mp3, plus wav op google/lyria-3-pro-preview
Referentie-invoer: tot 10 afbeeldingen
Door sessies ondersteunde runs ontkoppelen via de gedeelde taak/statusflow, inclusief action: "status"

Om Google als standaardprovider voor muziek te gebruiken:

{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}

Zie Muziekgeneratie voor gedeelde toolparameters, providerselectie en failover-gedrag.

Tekst-naar-spraak

De gebundelde google-spraakprovider gebruikt het TTS-pad van de Gemini API met gemini-3.1-flash-tts-preview.

Standaardstem: Kore
Auth: messages.tts.providers.google.apiKey, models.providers.google.apiKey, GEMINI_API_KEY of GOOGLE_API_KEY
Uitvoer: WAV voor reguliere TTS-bijlagen, Opus voor spraaknotitiedoelen, PCM voor Talk/telefonie
Spraaknotitie-uitvoer: Google PCM wordt verpakt als WAV en met ffmpeg getranscodeerd naar 48 kHz Opus

Google’s batchpad voor Gemini TTS retourneert gegenereerde audio in de voltooide generateContent-respons. Gebruik voor gesproken gesprekken met de laagste latentie de Google realtime spraakprovider, ondersteund door de Gemini Live API, in plaats van batch- TTS. Om Google als standaard-TTS-provider te gebruiken:

{
  messages: {
    tts: {
      auto: "always",
      provider: "google",
      providers: {
        google: {
          model: "gemini-3.1-flash-tts-preview",
          speakerVoice: "Kore",
          audioProfile: "Speak professionally with a calm tone.",
        },
      },
    },
  },
}

Gemini API TTS gebruikt prompts in natuurlijke taal voor stijlcontrole. Stel audioProfile in om een herbruikbare stijlprompt vóór de gesproken tekst te plaatsen. Stel speakerName in wanneer je prompttekst naar een genoemde spreker verwijst. Gemini API TTS accepteert ook expressieve audiotags tussen vierkante haken in de tekst, zoals [whispers] of [laughs]. Om tags buiten het zichtbare chatantwoord te houden terwijl ze naar TTS worden verzonden, plaats je ze binnen een [[tts:text]]...[[/tts:text]]- blok:

Here is the clean reply text.

[[tts:text]][whispers] Here is the spoken version.[[/tts:text]]

Een Google Cloud Console-API-sleutel die is beperkt tot de Gemini API is geldig voor deze provider. Dit is niet het aparte Cloud Text-to-Speech API-pad.

Realtime spraak

De gebundelde google-Plugin registreert een realtime spraakprovider, ondersteund door de Gemini Live API, voor backend-audiobruggen zoals Voice Call en Google Meet.

Instelling	Configuratiepad	Standaard
Model	`plugins.entries.voice-call.config.realtime.providers.google.model`	`gemini-2.5-flash-native-audio-preview-12-2025`
Stem	`...google.voice`	`Kore`
Temperatuur	`...google.temperature`	(niet ingesteld)
VAD-startgevoeligheid	`...google.startSensitivity`	(niet ingesteld)
VAD-eindgevoeligheid	`...google.endSensitivity`	(niet ingesteld)
Stilteperiode	`...google.silenceDurationMs`	(niet ingesteld)
Activiteitsafhandeling	`...google.activityHandling`	Google-standaard, `start-of-activity-interrupts`
Beurtdekking	`...google.turnCoverage`	Google-standaard, `only-activity`
Automatische VAD uitschakelen	`...google.automaticActivityDetectionDisabled`	`false`
Sessiehervatting	`...google.sessionResumption`	`true`
Contextcompressie	`...google.contextWindowCompression`	`true`
API-sleutel	`...google.apiKey`	Valt terug op `models.providers.google.apiKey`, `GEMINI_API_KEY` of `GOOGLE_API_KEY`

Voorbeeld van realtime-configuratie voor spraakoproepen:

{
  plugins: {
    entries: {
      "voice-call": {
        enabled: true,
        config: {
          realtime: {
            enabled: true,
            provider: "google",
            providers: {
              google: {
                model: "gemini-2.5-flash-native-audio-preview-12-2025",
                speakerVoice: "Kore",
                activityHandling: "start-of-activity-interrupts",
                turnCoverage: "only-activity",
              },
            },
          },
        },
      },
    },
  },
}

Google Live API gebruikt bidirectionele audio en functieaanroepen via een WebSocket. OpenClaw past telefonie-/Meet-bridge-audio aan de PCM Live API-stream van Gemini aan en houdt toolaanroepen op het gedeelde realtime-spraakcontract. Laat temperature niet ingesteld tenzij je samplingwijzigingen nodig hebt; OpenClaw laat niet-positieve waarden weg, omdat Google Live transcripties zonder audio kan retourneren voor temperature: 0. Gemini API-transcriptie is ingeschakeld zonder languageCodes; de huidige Google SDK weigert taalcodehints op dit API-pad.

Control UI Talk ondersteunt Google Live-browsersessies met beperkte eenmalige tokens. Backend-only realtime-spraakproviders kunnen ook via het generieke Gateway-relaytransport draaien, waarbij providerreferenties op de Gateway blijven.

Voer voor live-verificatie door maintainers OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts uit. De smoke dekt ook OpenAI-backend-/WebRTC-paden; de Google-stap maakt dezelfde beperkte Live API-tokenvorm aan die door Control UI Talk wordt gebruikt, opent het browser- WebSocket-eindpunt, verzendt de initiële setup-payload en wacht op setupComplete.

Geavanceerde configuratie

Direct Gemini cache reuse

Voor directe Gemini API-runs (api: "google-generative-ai") geeft OpenClaw een geconfigureerde cachedContent-handle door aan Gemini-verzoeken.

Configureer per-model- of globale parameters met cachedContent of legacy cached_content
Als beide aanwezig zijn, wint cachedContent
Voorbeeldwaarde: cachedContents/prebuilt-context
Gemini-cache-hitgebruik wordt genormaliseerd naar OpenClaw cacheRead vanuit upstream cachedContentTokenCount

{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}

Gemini CLI usage notes

Bij gebruik van de OAuth-provider google-gemini-cli gebruikt OpenClaw standaard Gemini CLI-stream-json-uitvoer en normaliseert het gebruik vanuit de laatste stats-payload. Legacy --output-format json-overrides gebruiken nog steeds de JSON-parser.

Gestreamde antwoordtekst komt uit assistant-message-events.
Voor legacy JSON-uitvoer komt antwoordtekst uit het CLI JSON-veld response.
Gebruik valt terug op stats wanneer de CLI usage leeg laat.
stats.cached wordt genormaliseerd naar OpenClaw cacheRead.
Als stats.input ontbreekt, leidt OpenClaw invoertokens af uit stats.input_tokens - stats.cached.

Environment and daemon setup

Als de Gateway als daemon draait (launchd/systemd), zorg er dan voor dat GEMINI_API_KEY beschikbaar is voor dat proces (bijvoorbeeld in ~/.openclaw/.env of via env.shellEnv).

Gerelateerd

Model selection

Providers, modelrefs en failovergedrag kiezen.

Image generation

Gedeelde parameters voor beeldtools en providerselectie.

Video generation

Gedeelde parameters voor videotools en providerselectie.

Music generation

Gedeelde parameters voor muziektools en providerselectie.

​Aan de slag

​Mogelijkheden

​Zoeken op het web

​Beeldgeneratie

​Videogeneratie

​Muziekgeneratie

​Tekst-naar-spraak

​Realtime spraak

​Geavanceerde configuratie

​Gerelateerd

Model selection

Image generation

Video generation

Music generation

Aan de slag

Mogelijkheden

Zoeken op het web

Beeldgeneratie

Videogeneratie

Muziekgeneratie

Tekst-naar-spraak

Realtime spraak

Geavanceerde configuratie

Gerelateerd