Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer는 provider 기반 추론 워크플로의 표준 헤드리스 표면입니다.
이는 의도적으로 원시 gateway RPC 이름이나 원시 agent 도구 ID가 아니라 기능군을 노출합니다.
infer를 스킬로 만들기
이 내용을 복사해 agent에 붙여넣으세요.- 일반적인 사용자 의도를 올바른 infer 하위 명령에 매핑
- 다루는 워크플로에 대한 몇 가지 표준 infer 예시 포함
- 예시와 제안에서
openclaw infer ...선호 - 스킬 본문 안에서 전체 infer 표면을 다시 문서화하지 않음
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
infer를 사용하는 이유
openclaw infer는 OpenClaw 안에서 provider 기반 추론 작업을 위한 일관된 CLI를 제공합니다.
장점:
- 각 백엔드마다 일회성 래퍼를 연결하는 대신 OpenClaw에 이미 구성된 provider와 모델을 사용합니다.
- 모델, 이미지, 오디오 전사, TTS, 비디오, 웹, 임베딩 워크플로를 하나의 명령 트리 아래에 유지합니다.
- 스크립트, 자동화, agent 기반 워크플로에 안정적인
--json출력 형식을 사용합니다. - 작업의 본질이 “추론 실행”일 때 OpenClaw의 퍼스트파티 표면을 선호합니다.
- 대부분의 infer 명령에서 gateway 없이 일반 로컬 경로를 사용합니다.
openclaw infer ...를 선호하세요. 이는 provider 요청이 만들어지기 전에 배포된 CLI, config 로딩, 기본 agent 해석, 번들 Plugin 활성화, 공유 기능 runtime을 실행해 봅니다.
명령 트리
일반적인 작업
이 표는 일반적인 추론 작업을 해당 infer 명령에 매핑합니다.| 작업 | 명령 | 참고 |
|---|---|---|
| 텍스트/모델 프롬프트 실행 | openclaw infer model run --prompt "..." --json | 기본적으로 일반 로컬 경로를 사용합니다 |
| 이미지에서 모델 프롬프트 실행 | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | 여러 이미지 입력에는 --file을 반복합니다 |
| 이미지 생성 | openclaw infer image generate --prompt "..." --json | 기존 파일에서 시작할 때는 image edit을 사용합니다 |
| 이미지 파일 설명 | openclaw infer image describe --file ./image.png --prompt "..." --json | --model은 이미지 가능 <provider/model>이어야 합니다 |
| 오디오 전사 | openclaw infer audio transcribe --file ./memo.m4a --json | --model은 <provider/model>이어야 합니다 |
| 음성 합성 | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status는 gateway 지향입니다 |
| 비디오 생성 | openclaw infer video generate --prompt "..." --json | --resolution 같은 provider 힌트를 지원합니다 |
| 비디오 파일 설명 | openclaw infer video describe --file ./clip.mp4 --json | --model은 <provider/model>이어야 합니다 |
| 웹 검색 | openclaw infer web search --query "..." --json | |
| 웹 페이지 가져오기 | openclaw infer web fetch --url https://example.com --json | |
| 임베딩 생성 | openclaw infer embedding create --text "..." --json |
동작
openclaw infer ...는 이러한 워크플로의 기본 CLI 표면입니다.- 출력이 다른 명령이나 스크립트에서 소비될 경우
--json을 사용하세요. - 특정 백엔드가 필요할 때는
--provider또는--model provider/model을 사용하세요. - 실행을 원시 상태로 유지하면서 일회성 thinking/reasoning 수준(
off,minimal,low,medium,high,adaptive,xhigh, 또는max)을 전달하려면model run --thinking <level>을 사용하세요. image describe,audio transcribe,video describe의 경우--model은<provider/model>형식이어야 합니다.image describe에서 명시적인--model은 해당 provider/model을 직접 실행합니다. 모델 카탈로그 또는 provider config에서 모델이 이미지 가능이어야 합니다.codex/<model>은 제한된 Codex 앱 서버 이미지 이해 턴을 실행하고,openai-codex/<model>은 OpenAI Codex OAuth provider 경로를 사용합니다.- 상태 비저장 실행 명령은 기본적으로 로컬을 사용합니다.
- Gateway 관리 상태 명령은 기본적으로 gateway를 사용합니다.
- 일반 로컬 경로는 gateway가 실행 중일 필요가 없습니다.
- 로컬
model run은 가벼운 일회성 provider completion입니다. 구성된 agent 모델과 auth를 해석하지만, chat-agent 턴을 시작하거나, 도구를 로드하거나, 번들 MCP 서버를 열지 않습니다. model run --file은 이미지 파일을 받아 MIME 타입을 감지하고, 제공된 프롬프트와 함께 선택된 모델로 전송합니다. 여러 이미지에는--file을 반복하세요.model run --file은 이미지가 아닌 입력을 거부합니다. 오디오 파일에는infer audio transcribe를, 비디오 파일에는infer video describe를 사용하세요.model run --gateway는 Gateway 라우팅, 저장된 auth, provider 선택, 임베디드 runtime을 실행해 보지만, 여전히 원시 모델 probe로 실행됩니다. 제공된 프롬프트와 이미지 첨부를 이전 세션 transcript, bootstrap/AGENTS context, context-engine assembly, 도구, 번들 MCP 서버 없이 전송합니다.model run --gateway --model <provider/model>은 요청이 Gateway에 일회성 provider/model override 실행을 요구하므로 신뢰된 operator gateway credential이 필요합니다.- 로컬
model run --thinking은 가벼운 provider-completion 경로를 사용합니다.adaptive및max같은 provider별 수준은 가장 가까운 이식 가능한 simple-completion 수준으로 매핑됩니다.
모델
provider 기반 텍스트 추론과 모델/provider 검사에는model을 사용하세요.
<provider/model> 참조를 사용하세요.
- 로컬
model run은 non-Codex provider의 경우 선택한 모델에 제공된 프롬프트만 전송하므로 provider/model/auth 상태를 확인하는 가장 좁은 CLI smoke입니다. - 로컬
model run --model <provider/model>은 해당 provider가 config에 쓰이기 전에도models list --all의 정확한 번들 정적 카탈로그 행을 사용할 수 있습니다. provider auth는 여전히 필요합니다. credential이 없으면Unknown model이 아니라 auth 오류로 실패합니다. - Mistral Medium 3.5 reasoning probe에서는 temperature를 설정하지 않은 기본값으로 두세요. Mistral은
reasoning_effort="high"와temperature: 0조합을 거부합니다. 기본 temperature 또는0.7같은 0이 아닌 reasoning-mode 값을 사용해mistral/mistral-medium-3-5를 사용하세요. openai-codex/*로컬 probe는 좁은 예외입니다. OpenClaw는 Codex Responses transport가 필수instructions필드를 채울 수 있도록 최소 system instruction을 추가하되, 전체 agent context, 도구, 메모리, 세션 transcript는 추가하지 않습니다.- 로컬
model run --file은 이 가벼운 경로를 유지하며 단일 사용자 메시지에 이미지 콘텐츠를 직접 첨부합니다. PNG, JPEG, WebP 같은 일반 이미지 파일은 MIME 타입이image/*로 감지될 때 작동합니다. 지원되지 않거나 인식되지 않는 파일은 provider 호출 전에 실패합니다. model run --file은 선택한 멀티모달 텍스트 모델을 직접 테스트하려는 경우에 가장 적합합니다. OpenClaw의 이미지 이해 provider 선택과 기본 이미지 모델 라우팅을 원할 때는infer image describe를 사용하세요.- 선택한 모델은 이미지 입력을 지원해야 합니다. 텍스트 전용 모델은 provider 계층에서 요청을 거부할 수 있습니다.
model run --prompt는 공백이 아닌 텍스트를 포함해야 합니다. 빈 프롬프트는 로컬 provider 또는 Gateway가 호출되기 전에 거부됩니다.- 로컬
model run은 provider가 텍스트 출력을 반환하지 않으면 0이 아닌 값으로 종료되므로, 도달할 수 없는 로컬 provider와 빈 completion이 성공한 probe처럼 보이지 않습니다. - 모델 입력을 원시로 유지하면서 Gateway 라우팅, agent-runtime 설정, 또는 Gateway 관리 provider 상태를 테스트해야 할 때는
model run --gateway를 사용하세요. 전체 agent context, 도구, 메모리, 세션 transcript를 원할 때는openclaw agent또는 chat 표면을 사용하세요. model auth login,model auth logout,model auth status는 저장된 provider auth 상태를 관리합니다.
이미지
생성, 편집, 설명에는image를 사용하세요.
-
기존 입력 파일에서 시작할 때는
image edit를 사용합니다. -
참조 이미지 편집에서 지오메트리 힌트를 지원하는 제공자/모델에는
image edit와 함께--size,--aspect-ratio또는--resolution을 사용합니다. -
투명 배경 OpenAI PNG 출력을 위해서는
--model openai/gpt-image-1.5와 함께--output-format png --background transparent를 사용합니다.--openai-background는 OpenAI 전용 별칭으로 계속 사용할 수 있습니다. 배경 지원을 선언하지 않는 제공자는 해당 힌트를 무시된 재정의로 보고합니다. -
번들 이미지 제공자 중 어떤 항목을 발견할 수 있고, 구성되었으며, 선택되었는지, 그리고 각 제공자가 어떤 생성/편집 기능을 노출하는지 확인하려면
image providers --json을 사용합니다. -
이미지 생성 변경 사항에 대한 가장 좁은 라이브 CLI 스모크 테스트로
image generate --model <provider/model> --json을 사용합니다. 예:JSON 응답은ok,provider,model,attempts및 기록된 출력 경로를 보고합니다.--output이 설정된 경우 최종 확장자는 제공자가 반환한 MIME 유형을 따를 수 있습니다. -
image describe및image describe-many에서는 OCR, 비교, UI 검사 또는 간결한 캡션 작성 같은 작업별 지침을 비전 모델에 제공하려면--prompt를 사용합니다. -
느린 로컬 비전 모델이나 콜드 Ollama 시작에는
--timeout-ms를 사용합니다. -
image describe의 경우--model은 이미지 지원<provider/model>이어야 합니다. -
로컬 Ollama 비전 모델의 경우 먼저 모델을 가져오고
OLLAMA_API_KEY를 임의의 자리표시자 값(예:ollama-local)으로 설정합니다. Ollama를 참조하세요.
오디오
파일 전사에는audio를 사용합니다.
audio transcribe는 파일 전사용이며, 실시간 세션 관리용이 아닙니다.--model은<provider/model>이어야 합니다.
TTS
음성 합성과 TTS 제공자 상태에는tts를 사용합니다.
tts status는 Gateway가 관리하는 TTS 상태를 반영하므로 기본값이 Gateway입니다.- TTS 동작을 검사하고 구성하려면
tts providers,tts voices및tts set-provider를 사용합니다.
비디오
생성과 설명에는video를 사용합니다.
video generate는--size,--aspect-ratio,--resolution,--duration,--audio,--watermark및--timeout-ms를 허용하며 이를 비디오 생성 런타임으로 전달합니다.video describe의 경우--model은<provider/model>이어야 합니다.
웹
검색 및 가져오기 워크플로에는web을 사용합니다.
- 사용 가능하고 구성되었으며 선택된 제공자를 검사하려면
web providers를 사용합니다.
임베딩
벡터 생성 및 임베딩 제공자 검사에는embedding을 사용합니다.
JSON 출력
Infer 명령은 공유 엔벌로프 아래에서 JSON 출력을 정규화합니다.okcapabilitytransportprovidermodelattemptsoutputserror
outputs에는 OpenClaw가 기록한 파일이 포함됩니다. 자동화에는 사람이 읽을 수 있는 stdout을 파싱하는 대신 해당 배열의 path, mimeType, size 및 미디어별 차원을 사용합니다.
일반적인 함정
참고
openclaw capability ...는openclaw infer ...의 별칭입니다.