De Google-Plugin biedt toegang tot Gemini-modellen via Google AI Studio, plus afbeeldingsgeneratie, mediabegrip (afbeelding/audio/video), tekst-naar-spraak en webzoekopdrachten via Gemini Grounding.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Aanbieder:
google - Authenticatie:
GEMINI_API_KEYofGOOGLE_API_KEY - API: Google Gemini API
- Runtimeoptie: provider/model
agentRuntime.id: "google-gemini-cli"hergebruikt Gemini CLI OAuth terwijl modelverwijzingen canoniek blijven alsgoogle/*.
Aan de slag
Kies je gewenste authenticatiemethode en volg de installatiestappen.- API-sleutel
- Gemini CLI (OAuth)
Mogelijkheden
| Mogelijkheid | Ondersteund |
|---|---|
| Chatvoltooiingen | Ja |
| Afbeeldingsgeneratie | Ja |
| Muziekgeneratie | Ja |
| Tekst-naar-spraak | Ja |
| Realtime spraak | Ja (Google Live API) |
| Afbeeldingsbegrip | Ja |
| Audiotranscriptie | Ja |
| Videobegrip | Ja |
| Webzoekopdracht (Grounding) | Ja |
| Denken/redeneren | Ja (Gemini 2.5+ / Gemini 3+) |
| Gemma 4-modellen | Ja |
Webzoekopdracht
De meegeleverdegemini-provider voor webzoekopdrachten gebruikt Gemini Google Search-grounding.
Configureer een specifieke zoeksleutel onder plugins.entries.google.config.webSearch,
of laat deze models.providers.google.apiKey hergebruiken na GEMINI_API_KEY:
webSearch.apiKey, daarna GEMINI_API_KEY,
daarna models.providers.google.apiKey. webSearch.baseUrl is optioneel en
bestaat voor operatorproxies of compatibele Gemini API-eindpunten; wanneer dit wordt weggelaten,
hergebruikt Gemini-webzoekopdracht models.providers.google.baseUrl. Zie
Gemini-zoekopdracht voor het providerspecifieke toolgedrag.
Afbeeldingsgeneratie
De meegeleverdegoogle-provider voor afbeeldingsgeneratie gebruikt standaard
google/gemini-3.1-flash-image-preview.
- Ondersteunt ook
google/gemini-3-pro-image-preview - Genereren: maximaal 4 afbeeldingen per aanvraag
- Bewerkingsmodus: ingeschakeld, maximaal 5 invoerafbeeldingen
- Geometrie-instellingen:
size,aspectRatioenresolution
Zie Afbeeldingsgeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Videogeneratie
De meegeleverdegoogle-Plugin registreert ook videogeneratie via de gedeelde
tool video_generate.
- Standaardvideomodel:
google/veo-3.1-fast-generate-preview - Modi: tekst-naar-video, afbeelding-naar-video en flows met één videoreferentie
- Ondersteunt
aspectRatio(16:9,9:16) enresolution(720P,1080P); audio-uitvoer wordt vandaag niet ondersteund door Veo - Ondersteunde duurwaarden: 4, 6 of 8 seconden (andere waarden worden afgerond naar de dichtstbijzijnde toegestane waarde)
Zie Videogeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Muziekgeneratie
De meegeleverdegoogle-Plugin registreert ook muziekgeneratie via de gedeelde
tool music_generate.
- Standaardmuziekmodel:
google/lyria-3-clip-preview - Ondersteunt ook
google/lyria-3-pro-preview - Promptinstellingen:
lyricseninstrumental - Uitvoerformaat: standaard
mp3, pluswavopgoogle/lyria-3-pro-preview - Referentie-invoer: maximaal 10 afbeeldingen
- Runs met sessieondersteuning worden losgekoppeld via de gedeelde taak-/statusflow, inclusief
action: "status"
Zie Muziekgeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Tekst-naar-spraak
De meegeleverdegoogle-spraakprovider gebruikt het Gemini API TTS-pad met
gemini-3.1-flash-tts-preview.
- Standaardstem:
Kore - Authenticatie:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYofGOOGLE_API_KEY - Uitvoer: WAV voor normale TTS-bijlagen, Opus voor spraaknotitiedoelen, PCM voor Talk/telefonie
- Spraaknotitie-uitvoer: Google PCM wordt verpakt als WAV en getranscodeerd naar 48 kHz Opus met
ffmpeg
generateContent-respons. Gebruik voor gesproken gesprekken met de laagste latentie de
Google-provider voor realtime spraak, ondersteund door de Gemini Live API, in plaats van batch-
TTS.
Google als standaardprovider voor TTS gebruiken:
audioProfile in om een herbruikbare stijlprompt vóór de gesproken tekst te plaatsen. Stel
speakerName in wanneer je prompttekst naar een benoemde spreker verwijst.
Gemini API TTS accepteert ook expressieve audiotags tussen vierkante haken in de tekst,
zoals [whispers] of [laughs]. Plaats ze in een [[tts:text]]...[[/tts:text]]-
blok om tags uit het zichtbare chatantwoord te houden terwijl ze naar TTS worden verzonden:
Een Google Cloud Console API-sleutel die is beperkt tot de Gemini API is geldig voor deze
provider. Dit is niet het aparte Cloud Text-to-Speech API-pad.
Realtime spraak
De meegeleverdegoogle-Plugin registreert een provider voor realtime spraak, ondersteund door de
Gemini Live API voor backend-audiobruggen zoals Voice Call en Google Meet.
| Instelling | Configuratiepad | Standaard |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model | gemini-2.5-flash-native-audio-preview-12-2025 |
| Stem | ...google.voice | Kore |
| Temperatuur | ...google.temperature | (niet ingesteld) |
| VAD-startgevoeligheid | ...google.startSensitivity | (niet ingesteld) |
| VAD-eindgevoeligheid | ...google.endSensitivity | (niet ingesteld) |
| Stilteduur | ...google.silenceDurationMs | (niet ingesteld) |
| Activiteitsafhandeling | ...google.activityHandling | Google-standaard, start-of-activity-interrupts |
| Beurtdekking | ...google.turnCoverage | Google-standaard, only-activity |
| Automatische VAD uitschakelen | ...google.automaticActivityDetectionDisabled | false |
| Sessiehervatting | ...google.sessionResumption | true |
| Contextcompressie | ...google.contextWindowCompression | true |
| API-sleutel | ...google.apiKey | Valt terug op models.providers.google.apiKey, GEMINI_API_KEY of GOOGLE_API_KEY |
Google Live API gebruikt bidirectionele audio en functieaanroepen via een WebSocket.
OpenClaw past audio van telefonie-/Meet-bridges aan naar Gemini’s PCM Live API-stream en
houdt toolaanroepen op het gedeelde realtime-spraakcontract. Laat
temperature
niet ingesteld tenzij je samplingwijzigingen nodig hebt; OpenClaw laat niet-positieve waarden weg
omdat Google Live transcripties zonder audio kan retourneren voor temperature: 0.
Gemini API-transcriptie is ingeschakeld zonder languageCodes; de huidige Google
SDK wijst taalcodehints op dit API-pad af.Control UI Talk ondersteunt Google Live-browsersessies met beperkte tokens voor eenmalig gebruik.
Backend-only realtime-spraakproviders kunnen ook via het generieke
Gateway-relaytransport draaien, waarbij providerreferenties op de Gateway blijven.
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts.
De smoke dekt ook OpenAI-backend-/WebRTC-paden; de Google-stap maakt dezelfde
beperkte Live API-tokenvorm aan die door Control UI Talk wordt gebruikt, opent het browser-
WebSocket-eindpunt, verstuurt de initiële setup-payload en wacht op
setupComplete.
Geavanceerde configuratie
Direct Gemini-cachehergebruik
Direct Gemini-cachehergebruik
Voor directe Gemini API-runs (
api: "google-generative-ai") geeft OpenClaw
een geconfigureerde cachedContent-handle door aan Gemini-verzoeken.- Configureer per-model- of globale parameters met
cachedContentof de ouderecached_content - Als beide aanwezig zijn, wint
cachedContent - Voorbeeldwaarde:
cachedContents/prebuilt-context - Gemini-cache-hitgebruik wordt genormaliseerd naar OpenClaw
cacheReadvanuit upstreamcachedContentTokenCount
Gebruiksnotities voor Gemini CLI JSON
Gebruiksnotities voor Gemini CLI JSON
Bij gebruik van de OAuth-provider
google-gemini-cli normaliseert OpenClaw
de CLI JSON-uitvoer als volgt:- Antwoordtekst komt uit het CLI JSON-veld
response. - Gebruik valt terug op
statswanneer de CLIusageleeg laat. stats.cachedwordt genormaliseerd naar OpenClawcacheRead.- Als
stats.inputontbreekt, leidt OpenClaw invoertokens af uitstats.input_tokens - stats.cached.
Omgeving en daemoninstelling
Omgeving en daemoninstelling
Als de Gateway als daemon draait (launchd/systemd), zorg er dan voor dat
GEMINI_API_KEY
beschikbaar is voor dat proces (bijvoorbeeld in ~/.openclaw/.env of via
env.shellEnv).Gerelateerd
Modelselectie
Providers, modelrefs en failovergedrag kiezen.
Afbeeldingen genereren
Gedeelde parameters voor afbeeldingstools en providerselectie.
Video genereren
Gedeelde parameters voor videotools en providerselectie.
Muziek genereren
Gedeelde parameters voor muziektools en providerselectie.