web_fetch выполняет обычный HTTP GET и извлекает читаемое содержимое
(HTML в markdown или текст). Он не выполняет JavaScript.
Для сайтов, сильно зависящих от JS, или страниц, защищенных входом в систему, используйте
веб-браузер.
Быстрый старт
web_fetch включен по умолчанию — настройка не требуется. Агент может
вызвать его сразу:
Параметры инструмента
URL для получения. Только
http(s).Формат вывода после извлечения основного содержимого.
Обрезать вывод до указанного количества символов.
Как это работает
Fetch
Отправляет HTTP GET с User-Agent, похожим на Chrome, и заголовком
Accept-Language. Блокирует частные/внутренние имена хостов и повторно проверяет перенаправления.Fallback (optional)
Если Readability не срабатывает и выбран Firecrawl, повторяет попытку через
API Firecrawl в режиме обхода ботов.
Обновления хода выполнения
web_fetch выводит публичную строку хода выполнения только если получение все еще ожидает
завершения через пять секунд:
Конфигурация
Резервный вариант Firecrawl
Если извлечение Readability не срабатывает,web_fetch может перейти на
Firecrawl для обхода ботов и более качественного извлечения:
plugins.entries.firecrawl.config.webFetch.apiKey необязателен и поддерживает объекты SecretRef.
Устаревшая конфигурация tools.web.fetch.firecrawl.* автоматически мигрируется командой openclaw doctor --fix.
Если вы настраиваете SecretRef для API-ключа Firecrawl и он не разрешается при отсутствии
резервного env
FIRECRAWL_API_KEY, запуск gateway быстро завершается ошибкой.Переопределения Firecrawl
baseUrl жестко ограничены: размещенный трафик использует
https://api.firecrawl.dev; самостоятельные переопределения должны указывать на частные или
внутренние конечные точки, а http:// принимается только для таких частных целей.tools.web.fetch.providerявно выбирает резервного поставщика получения.- Если
providerопущен, OpenClaw автоматически определяет первого готового поставщика web-fetch по настроенным учетным данным. Неизолированныйweb_fetchможет использовать установленные плагины, которые объявляютcontracts.webFetchProvidersи регистрируют соответствующего поставщика во время выполнения. Официальный плагин Firecrawl предоставляет этот резервный вариант. - Изолированные вызовы
web_fetchдопускают встроенных поставщиков, а также установленных поставщиков, чье официальное происхождение из npm или ClawHub подтверждено. На сегодня это разрешает официальный плагин Firecrawl; сторонние внешние плагины получения остаются исключенными. - Если Readability отключен,
web_fetchсразу переходит к выбранному резервному поставщику. Если поставщик недоступен, он завершается закрытым отказом.
Доверенный env-прокси
Если вашему развертыванию требуется, чтобыweb_fetch проходил через доверенный исходящий
HTTP(S)-прокси, установите tools.web.fetch.useTrustedEnvProxy: true.
В этом режиме OpenClaw по-прежнему применяет проверки SSRF на основе имени хоста перед отправкой
запроса, но позволяет прокси разрешать DNS вместо локального DNS
pinning. Включайте это только когда прокси контролируется оператором и обеспечивает
исходящую политику после разрешения DNS.
Если env-переменная HTTP(S)-прокси не настроена или целевой хост исключен через
NO_PROXY, web_fetch возвращается к обычному строгому пути с локальным DNS
pinning.Ограничения и безопасность
maxCharsограничивается значениемtools.web.fetch.maxCharsCap- Тело ответа ограничивается
maxResponseBytesперед разбором; слишком большие ответы обрезаются с предупреждением - Частные/внутренние имена хостов блокируются
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeиtools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeявляются узкими opt-in для доверенных стеков прокси с поддельными IP; оставьте их неустановленными, если ваш прокси не владеет этими синтетическими диапазонами и не обеспечивает собственную политику назначения- Перенаправления проверяются и ограничиваются
maxRedirects useTrustedEnvProxyявляется явным opt-in и должен включаться только для контролируемых оператором прокси, которые все равно обеспечивают исходящую политику после разрешения DNSweb_fetchработает по принципу best-effort — некоторым сайтам нужен веб-браузер
Профили инструментов
Если вы используете профили инструментов или списки разрешений, добавьтеweb_fetch или group:web:
Связанные материалы
- Веб-поиск — поиск в интернете через нескольких поставщиков
- Веб-браузер — полноценная автоматизация браузера для сайтов, сильно зависящих от JS
- Firecrawl — инструменты поиска и скрейпинга Firecrawl