web_fetch टूल एक साधारण HTTP GET करता है और पठनीय सामग्री निकालता है
(HTML को markdown या text में)। यह JavaScript निष्पादित नहीं करता।
JS-प्रधान साइटों या लॉगिन-संरक्षित पेजों के लिए, इसके बजाय
वेब ब्राउज़र का उपयोग करें।
त्वरित शुरुआत
web_fetch डिफ़ॉल्ट रूप से सक्षम है — किसी कॉन्फ़िगरेशन की आवश्यकता नहीं। एजेंट इसे
तुरंत कॉल कर सकता है:
टूल पैरामीटर
फ़ेच करने के लिए URL। केवल
http(s)।मुख्य-सामग्री निष्कर्षण के बाद आउटपुट फ़ॉर्मैट।
आउटपुट को इतने वर्णों तक छोटा करें।
यह कैसे काम करता है
Fetch
Chrome-जैसे User-Agent और
Accept-Language
header के साथ HTTP GET भेजता है। निजी/आंतरिक hostnames को ब्लॉक करता है और redirects को फिर से जांचता है।Fallback (optional)
अगर Readability विफल हो जाती है और Firecrawl चुना गया है, तो
bot-circumvention mode के साथ Firecrawl API के ज़रिए फिर से कोशिश करता है।
प्रगति अपडेट
web_fetch केवल तब सार्वजनिक progress line उत्सर्जित करता है जब fetch पांच सेकंड के बाद भी pending हो:
कॉन्फ़िगरेशन
Firecrawl fallback
अगर Readability extraction विफल हो जाता है, तोweb_fetch bot-circumvention और बेहतर extraction के लिए
Firecrawl पर fallback कर सकता है:
plugins.entries.firecrawl.config.webFetch.apiKey वैकल्पिक है और SecretRef objects का समर्थन करता है।
Legacy tools.web.fetch.firecrawl.* config को openclaw doctor --fix द्वारा auto-migrate किया जाता है।
अगर आप Firecrawl API-key SecretRef configure करते हैं और वह बिना
FIRECRAWL_API_KEY env fallback के unresolved है, तो gateway startup तेज़ी से विफल हो जाता है।Firecrawl
baseUrl overrides लॉक डाउन हैं: hosted traffic
https://api.firecrawl.dev का उपयोग करता है; self-hosted overrides को निजी या
internal endpoints को target करना चाहिए, और http:// केवल उन्हीं private targets के लिए accepted है।tools.web.fetch.providerfetch fallback provider को स्पष्ट रूप से चुनता है।- अगर
providerछोड़ा गया है, तो OpenClaw configured credentials से पहले ready web-fetch provider को auto-detect करता है। Non-sandboxedweb_fetchऐसे installed plugins का उपयोग कर सकता है जोcontracts.webFetchProvidersdeclare करते हैं और runtime पर matching provider register करते हैं। official Firecrawl Plugin यह fallback देता है। - Sandboxed
web_fetchcalls bundled providers और ऐसे installed providers की अनुमति देते हैं जिनकी official npm या ClawHub provenance verified है। आज यह official Firecrawl Plugin को permit करता है; third-party external fetch plugins excluded रहते हैं। - अगर Readability disabled है, तो
web_fetchसीधे selected provider fallback पर जाता है। अगर कोई provider available नहीं है, तो यह सुरक्षित रूप से विफल होता है।
Trusted env proxy
अगर आपके deployment कोweb_fetch को trusted outbound
HTTP(S) proxy से गुजारना आवश्यक है, तो tools.web.fetch.useTrustedEnvProxy: true set करें।
इस mode में, OpenClaw request भेजने से पहले अब भी hostname-based SSRF checks लागू करता है,
लेकिन local DNS pinning करने के बजाय proxy को DNS resolve करने देता है।
इसे केवल तब enable करें जब proxy operator-controlled हो और DNS resolution के बाद
outbound policy enforce करता हो।
अगर कोई HTTP(S) proxy env var configured नहीं है, या target host
NO_PROXY द्वारा excluded है, तो web_fetch local DNS
pinning के साथ normal strict path पर fallback करता है।सीमाएं और सुरक्षा
maxCharsकोtools.web.fetch.maxCharsCapतक clamp किया जाता है- Response body को parsing से पहले
maxResponseBytesपर cap किया जाता है; oversized responses को warning के साथ truncate किया जाता है - Private/internal hostnames blocked हैं
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeऔरtools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangetrusted fake-IP proxy stacks के लिए संकरे opt-ins हैं; उन्हें unset छोड़ें जब तक आपका proxy उन synthetic ranges का मालिक न हो और अपनी destination policy enforce न करता हो- Redirects check किए जाते हैं और
maxRedirectsद्वारा limited होते हैं useTrustedEnvProxyएक explicit opt-in है और इसे केवल operator-controlled proxies के लिए enable करना चाहिए जो DNS resolution के बाद भी outbound policy enforce करते हैंweb_fetchbest-effort है — कुछ sites को वेब ब्राउज़र चाहिए
टूल प्रोफ़ाइल
अगर आप tool profiles या allowlists का उपयोग करते हैं, तोweb_fetch या group:web जोड़ें:
संबंधित
- वेब खोज — कई providers के साथ web search करें
- वेब ब्राउज़र — JS-प्रधान sites के लिए full browser automation
- Firecrawl — Firecrawl search और scrape tools