Chuyển đến nội dung chính

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenAI cung cấp API cho nhà phát triển cho các mô hình GPT, và Codex cũng có sẵn dưới dạng tác tử lập trình theo gói ChatGPT thông qua các client Codex của OpenAI. OpenClaw giữ các bề mặt này tách biệt để cấu hình luôn dễ dự đoán. OpenClaw dùng openai/* làm tuyến mô hình OpenAI chuẩn. Các lượt tác tử nhúng trên mô hình OpenAI chạy qua runtime app-server Codex gốc theo mặc định; xác thực bằng khóa API OpenAI trực tiếp vẫn có sẵn cho các bề mặt OpenAI không phải tác tử như hình ảnh, embeddings, giọng nói và realtime.
  • Mô hình tác tử - các mô hình openai/* thông qua runtime Codex; đăng nhập bằng xác thực Codex để dùng gói đăng ký ChatGPT/Codex, hoặc cấu hình một bản dự phòng khóa API OpenAI tương thích với Codex khi bạn chủ ý muốn xác thực bằng khóa API.
  • API OpenAI không phải tác tử - truy cập OpenAI Platform trực tiếp với tính phí theo mức sử dụng thông qua OPENAI_API_KEY hoặc onboarding khóa API OpenAI.
  • Cấu hình cũ - các tham chiếu mô hình openai-codex/* được sửa bởi openclaw doctor --fix thành openai/* cộng với runtime Codex.
OpenAI hỗ trợ rõ ràng việc dùng OAuth theo gói đăng ký trong các công cụ và workflow bên ngoài như OpenClaw. Nhà cung cấp, mô hình, runtime và kênh là các lớp riêng biệt. Nếu các nhãn đó đang bị trộn lẫn với nhau, hãy đọc Runtime tác tử trước khi thay đổi cấu hình.

Lựa chọn nhanh

Mục tiêuDùngGhi chú
Gói đăng ký ChatGPT/Codex với runtime Codex gốcopenai/gpt-5.5Thiết lập tác tử OpenAI mặc định. Đăng nhập bằng xác thực Codex.
Tính phí khóa API trực tiếp cho mô hình tác tửopenai/gpt-5.5 cộng với hồ sơ khóa API tương thích CodexDùng auth.order.openai để đặt bản dự phòng sau xác thực gói đăng ký.
Tính phí khóa API trực tiếp qua PI rõ ràngopenai/gpt-5.5 cộng với runtime nhà cung cấp/mô hình piChọn một hồ sơ khóa API openai thông thường.
Bí danh API ChatGPT Instant mới nhấtopenai/chat-latestChỉ dùng khóa API trực tiếp. Bí danh di động cho thử nghiệm, không phải mặc định.
Xác thực gói đăng ký ChatGPT/Codex qua PI rõ ràngopenai/gpt-5.5 cộng với runtime nhà cung cấp/mô hình piChọn một hồ sơ xác thực openai-codex cho tuyến tương thích.
Tạo hoặc chỉnh sửa hình ảnhopenai/gpt-image-2Hoạt động với OPENAI_API_KEY hoặc OAuth OpenAI Codex.
Hình ảnh nền trong suốtopenai/gpt-image-1.5Dùng outputFormat=png hoặc webpopenai.background=transparent.

Bản đồ tên gọi

Các tên tương tự nhau nhưng không thể thay thế cho nhau:
Tên bạn thấyLớpÝ nghĩa
openaiTiền tố nhà cung cấpTuyến mô hình OpenAI chuẩn; các lượt tác tử dùng runtime Codex.
openai-codexTiền tố xác thực/hồ sơ cũNamespace hồ sơ OAuth/gói đăng ký OpenAI Codex cũ hơn. Các hồ sơ hiện có và auth.order.openai-codex vẫn hoạt động.
Plugin codexPluginPlugin OpenClaw đi kèm cung cấp runtime app-server Codex gốc và điều khiển chat /codex.
provider/model agentRuntime.id: codexRuntime tác tửBuộc dùng harness app-server Codex gốc cho các lượt nhúng khớp.
/codex ...Bộ lệnh chatRàng buộc/điều khiển các luồng app-server Codex từ một cuộc hội thoại.
runtime: "acp", agentId: "codex"Tuyến phiên ACPĐường dự phòng rõ ràng chạy Codex thông qua ACP/acpx.
Điều này có nghĩa là một cấu hình có thể chủ ý chứa các tham chiếu mô hình openai/* trong khi các hồ sơ xác thực vẫn trỏ đến thông tin xác thực tương thích với Codex. Ưu tiên auth.order.openai cho cấu hình mới; các hồ sơ openai-codex:* hiện có và auth.order.openai-codex vẫn được hỗ trợ. openclaw doctor --fix ghi lại các tham chiếu mô hình cũ openai-codex/* sang tuyến mô hình OpenAI chuẩn.
GPT-5.5 có sẵn thông qua cả truy cập khóa API OpenAI Platform trực tiếp và các tuyến gói đăng ký/OAuth. Với gói đăng ký ChatGPT/Codex cộng với thực thi Codex gốc, dùng openai/gpt-5.5; cấu hình runtime không đặt giờ sẽ chọn harness Codex cho các lượt tác tử OpenAI. Chỉ dùng hồ sơ khóa API OpenAI khi bạn muốn xác thực bằng khóa API trực tiếp cho một mô hình tác tử OpenAI.
Các lượt mô hình tác tử OpenAI yêu cầu Plugin app-server Codex đi kèm. Cấu hình runtime PI rõ ràng vẫn có sẵn như một tuyến tương thích tùy chọn. Khi PI được chọn rõ ràng với một hồ sơ xác thực openai-codex, OpenClaw giữ tham chiếu mô hình công khai là openai/* và định tuyến PI nội bộ thông qua transport xác thực Codex cũ. Chạy openclaw doctor --fix để sửa các tham chiếu mô hình openai-codex/* lỗi thời hoặc các ghim phiên PI cũ không đến từ cấu hình runtime rõ ràng.

Phạm vi tính năng OpenClaw

Năng lực OpenAIBề mặt OpenClawTrạng thái
Chat / ResponsesNhà cung cấp mô hình openai/<model>
Mô hình gói đăng ký Codexopenai/<model> với OAuth openai-codex
Tham chiếu mô hình Codex cũopenai-codex/<model>Được doctor sửa thành openai/<model>
Harness app-server Codexopenai/<model> với runtime bị bỏ qua hoặc provider/model agentRuntime.id: codex
Tìm kiếm web phía serverCông cụ OpenAI Responses gốcCó, khi tìm kiếm web được bật và không ghim nhà cung cấp
Hình ảnhimage_generate
Videovideo_generate
Chuyển văn bản thành giọng nóimessages.tts.provider: "openai" / tts
Chuyển giọng nói thành văn bản theo lôtools.media.audio / hiểu media
Chuyển giọng nói thành văn bản streamingVoice Call streaming.provider: "openai"
Giọng nói realtimeVoice Call realtime.provider: "openai" / Control UI Talk
EmbeddingsNhà cung cấp embedding bộ nhớ

Embeddings bộ nhớ

OpenClaw có thể dùng OpenAI, hoặc một endpoint embedding tương thích OpenAI, cho việc lập chỉ mục memory_search và embeddings truy vấn:
{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        model: "text-embedding-3-small",
      },
    },
  },
}
Với các endpoint tương thích OpenAI yêu cầu nhãn embedding bất đối xứng, đặt queryInputTypedocumentInputType bên dưới memorySearch. OpenClaw chuyển tiếp chúng dưới dạng các trường yêu cầu input_type dành riêng cho nhà cung cấp: embeddings truy vấn dùng queryInputType; các đoạn bộ nhớ đã lập chỉ mục và lập chỉ mục theo lô dùng documentInputType. Xem Tham chiếu cấu hình bộ nhớ để biết ví dụ đầy đủ.

Bắt đầu

Chọn phương thức xác thực bạn ưu tiên và làm theo các bước thiết lập.
Phù hợp nhất cho: truy cập API trực tiếp và tính phí theo mức sử dụng.
1

Lấy khóa API của bạn

Tạo hoặc sao chép một khóa API từ bảng điều khiển OpenAI Platform.
2

Chạy onboarding

openclaw onboard --auth-choice openai-api-key
Hoặc truyền khóa trực tiếp:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"
3

Xác minh mô hình có sẵn

openclaw models list --provider openai

Tóm tắt tuyến

Tham chiếu mô hìnhCấu hình runtimeTuyếnXác thực
openai/gpt-5.5bị bỏ qua / provider/model agentRuntime.id: "codex"Harness app-server CodexHồ sơ OpenAI tương thích Codex
openai/gpt-5.4-minibị bỏ qua / provider/model agentRuntime.id: "codex"Harness app-server CodexHồ sơ OpenAI tương thích Codex
openai/gpt-5.5provider/model agentRuntime.id: "pi"Runtime nhúng PIHồ sơ openai hoặc hồ sơ openai-codex đã chọn
Các mô hình tác tử openai/* dùng harness app-server Codex. Để dùng xác thực khóa API cho một mô hình tác tử, tạo một hồ sơ khóa API tương thích Codex và sắp thứ tự nó bằng auth.order.openai; OPENAI_API_KEY vẫn là dự phòng trực tiếp cho các bề mặt API OpenAI không phải tác tử. Các mục auth.order.openai-codex cũ hơn vẫn hoạt động.

Ví dụ cấu hình

{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },
}
Để thử mô hình Instant hiện tại của ChatGPT từ OpenAI API, đặt mô hình thành openai/chat-latest:
{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/chat-latest" } } },
}
chat-latest là một bí danh di động. OpenAI mô tả nó là mô hình Instant mới nhất được dùng trong ChatGPT và khuyến nghị gpt-5.5 cho việc dùng API sản xuất, vì vậy hãy giữ openai/gpt-5.5 làm mặc định ổn định trừ khi bạn chủ ý muốn hành vi của bí danh đó. Bí danh hiện chỉ chấp nhận độ dài văn bản medium, nên OpenClaw chuẩn hóa các override độ dài văn bản OpenAI không tương thích cho mô hình này.
OpenClaw không cung cấp openai/gpt-5.3-codex-spark. Các yêu cầu OpenAI API trực tiếp từ chối mô hình đó, và catalog Codex hiện tại cũng không cung cấp nó.

Xác thực app-server Codex gốc

Harness app-server Codex gốc dùng các tham chiếu model openai/* kèm cấu hình runtime bị bỏ qua hoặc provider/model agentRuntime.id: "codex", nhưng auth của nó vẫn dựa trên tài khoản. OpenClaw chọn auth theo thứ tự này:
  1. Các hồ sơ auth OpenAI theo thứ tự cho tác nhân, ưu tiên dưới auth.order.openai. Các hồ sơ openai-codex:* hiện có và auth.order.openai-codex vẫn hợp lệ cho bản cài đặt cũ hơn.
  2. Tài khoản hiện có của app-server, chẳng hạn như đăng nhập ChatGPT bằng Codex CLI cục bộ.
  3. Chỉ với các lần khởi chạy app-server stdio cục bộ, CODEX_API_KEY, sau đó OPENAI_API_KEY, khi app-server báo cáo không có tài khoản và vẫn yêu cầu OpenAI auth.
Điều đó có nghĩa là đăng nhập đăng ký ChatGPT/Codex cục bộ không bị thay thế chỉ vì tiến trình gateway cũng có OPENAI_API_KEY cho các model OpenAI trực tiếp hoặc embeddings. Dự phòng API-key qua env chỉ là đường dẫn stdio cục bộ không có tài khoản; nó không được gửi đến các kết nối app-server WebSocket. Khi một hồ sơ Codex kiểu đăng ký được chọn, OpenClaw cũng giữ CODEX_API_KEYOPENAI_API_KEY khỏi tiến trình con app-server stdio được tạo và gửi thông tin đăng nhập đã chọn thông qua RPC đăng nhập app-server. Khi hồ sơ đăng ký đó bị chặn bởi một giới hạn sử dụng Codex, OpenClaw có thể xoay sang hồ sơ API-key openai:* theo thứ tự tiếp theo mà không thay đổi model đã chọn hoặc rời khỏi harness Codex. Sau khi thời gian đặt lại đăng ký trôi qua, hồ sơ đăng ký lại đủ điều kiện.

Tạo hình ảnh

Plugin openai đi kèm đăng ký tạo hình ảnh thông qua công cụ image_generate. Nó hỗ trợ cả tạo hình ảnh bằng OpenAI API-key và tạo hình ảnh bằng Codex OAuth thông qua cùng tham chiếu model openai/gpt-image-2.
Khả năngOpenAI API keyCodex OAuth
Tham chiếu modelopenai/gpt-image-2openai/gpt-image-2
Xác thựcOPENAI_API_KEYĐăng nhập OpenAI Codex OAuth
TransportOpenAI Images APIBackend Codex Responses
Số hình ảnh tối đa mỗi yêu cầu44
Chế độ chỉnh sửaĐã bật (tối đa 5 hình ảnh tham chiếu)Đã bật (tối đa 5 hình ảnh tham chiếu)
Ghi đè kích thướcĐược hỗ trợ, bao gồm kích thước 2K/4KĐược hỗ trợ, bao gồm kích thước 2K/4K
Tỷ lệ khung hình / độ phân giảiKhông chuyển tiếp đến OpenAI Images APIĐược ánh xạ tới kích thước được hỗ trợ khi an toàn
{
  agents: {
    defaults: {
      imageGenerationModel: { primary: "openai/gpt-image-2" },
    },
  },
}
Xem Tạo hình ảnh để biết các tham số công cụ dùng chung, lựa chọn nhà cung cấp và hành vi chuyển đổi dự phòng.
gpt-image-2 là mặc định cho cả tạo hình ảnh từ văn bản OpenAI và chỉnh sửa hình ảnh. gpt-image-1.5, gpt-image-1gpt-image-1-mini vẫn có thể dùng như các ghi đè model rõ ràng. Dùng openai/gpt-image-1.5 cho đầu ra PNG/WebP nền trong suốt; API gpt-image-2 hiện tại từ chối background: "transparent". Với yêu cầu nền trong suốt, tác nhân nên gọi image_generate với model: "openai/gpt-image-1.5", outputFormat: "png" hoặc "webp", và background: "transparent"; tùy chọn nhà cung cấp openai.background cũ hơn vẫn được chấp nhận. OpenClaw cũng bảo vệ các tuyến OpenAI công khai và OpenAI Codex OAuth bằng cách viết lại các yêu cầu trong suốt mặc định openai/gpt-image-2 thành gpt-image-1.5; Azure và các endpoint tương thích OpenAI tùy chỉnh giữ nguyên tên deployment/model đã cấu hình của chúng. Thiết lập tương tự được cung cấp cho các lượt chạy CLI headless:
openclaw infer image generate \
  --model openai/gpt-image-1.5 \
  --output-format png \
  --background transparent \
  --prompt "A simple red circle sticker on a transparent background" \
  --json
Dùng cùng các cờ --output-format--background với openclaw infer image edit khi bắt đầu từ một tệp đầu vào. --openai-background vẫn khả dụng dưới dạng alias riêng cho OpenAI. Với các bản cài đặt Codex OAuth, hãy giữ cùng tham chiếu openai/gpt-image-2. Khi một hồ sơ OAuth openai-codex được cấu hình, OpenClaw phân giải OAuth access token đã lưu đó và gửi yêu cầu hình ảnh qua backend Codex Responses. Nó không thử OPENAI_API_KEY trước hoặc âm thầm chuyển về một API key cho yêu cầu đó. Hãy cấu hình models.providers.openai rõ ràng bằng API key, URL cơ sở tùy chỉnh hoặc endpoint Azure khi bạn muốn tuyến OpenAI Images API trực tiếp thay thế. Nếu endpoint hình ảnh tùy chỉnh đó nằm trên LAN/địa chỉ riêng đáng tin cậy, cũng đặt browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw giữ các endpoint hình ảnh tương thích OpenAI riêng tư/nội bộ bị chặn trừ khi lựa chọn tham gia này có mặt. Tạo:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1
Tạo PNG trong suốt:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent
Chỉnh sửa:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

Tạo video

Plugin openai được đóng gói kèm đăng ký tạo video thông qua công cụ video_generate.
Khả năngGiá trị
Mô hình mặc địnhopenai/sora-2
Chế độVăn bản-thành-video, hình ảnh-thành-video, chỉnh sửa một video
Đầu vào tham chiếu1 hình ảnh hoặc 1 video
Ghi đè kích thướcĐược hỗ trợ
Ghi đè khácaspectRatio, resolution, audio, watermark bị bỏ qua kèm cảnh báo công cụ
{
  agents: {
    defaults: {
      videoGenerationModel: { primary: "openai/sora-2" },
    },
  },
}
Xem Tạo video để biết các tham số công cụ dùng chung, lựa chọn nhà cung cấp và hành vi chuyển dự phòng.

Đóng góp lời nhắc GPT-5

OpenClaw thêm một đóng góp lời nhắc GPT-5 dùng chung cho các lượt chạy thuộc họ GPT-5 trên nhiều nhà cung cấp. Nó áp dụng theo mã định danh mô hình, nên openai/gpt-5.5, các tham chiếu cũ trước khi sửa chữa như openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5, và các tham chiếu GPT-5 tương thích khác đều nhận cùng một lớp phủ. Các mô hình GPT-4.x cũ hơn thì không. Bộ khai thác Codex gốc được đóng gói kèm sử dụng cùng hành vi GPT-5 và lớp phủ Heartbeat thông qua chỉ dẫn dành cho nhà phát triển của máy chủ ứng dụng Codex, nên các phiên openai/gpt-5.x được định tuyến qua Codex vẫn giữ cùng hướng dẫn theo đến cùng và Heartbeat chủ động, dù Codex sở hữu phần còn lại của lời nhắc bộ khai thác. Đóng góp GPT-5 thêm một hợp đồng hành vi có gắn thẻ cho việc duy trì persona, an toàn thực thi, kỷ luật công cụ, hình dạng đầu ra, kiểm tra hoàn tất và xác minh. Hành vi trả lời theo kênh và tin nhắn im lặng vẫn nằm trong lời nhắc hệ thống OpenClaw dùng chung và chính sách gửi đi. Hướng dẫn GPT-5 luôn được bật cho các mô hình khớp. Lớp kiểu tương tác thân thiện là riêng biệt và có thể cấu hình.
Giá trịHiệu ứng
"friendly" (mặc định)Bật lớp kiểu tương tác thân thiện
"on"Bí danh cho "friendly"
"off"Chỉ tắt lớp kiểu thân thiện
{
  agents: {
    defaults: {
      promptOverlays: {
        gpt5: { personality: "friendly" },
      },
    },
  },
}
Giá trị không phân biệt chữ hoa chữ thường khi chạy, nên cả "Off""off" đều tắt lớp kiểu thân thiện.
plugins.entries.openai.config.personality kế thừa vẫn được đọc như một phương án dự phòng tương thích khi thiết lập dùng chung agents.defaults.promptOverlays.gpt5.personality chưa được đặt.

Giọng nói và lời nói

Plugin openai được đóng gói kèm đăng ký tổng hợp lời nói cho bề mặt messages.tts.
Thiết lậpĐường dẫn cấu hìnhMặc định
Mô hìnhmessages.tts.providers.openai.modelgpt-4o-mini-tts
Giọngmessages.tts.providers.openai.voicecoral
Tốc độmessages.tts.providers.openai.speed(chưa đặt)
Chỉ dẫnmessages.tts.providers.openai.instructions(chưa đặt, chỉ gpt-4o-mini-tts)
Định dạngmessages.tts.providers.openai.responseFormatopus cho ghi chú thoại, mp3 cho tệp
Khóa APImessages.tts.providers.openai.apiKeyDự phòng về OPENAI_API_KEY
URL cơ sởmessages.tts.providers.openai.baseUrlhttps://api.openai.com/v1
Phần thân bổ sungmessages.tts.providers.openai.extraBody / extra_body(chưa đặt)
Các mô hình có sẵn: gpt-4o-mini-tts, tts-1, tts-1-hd. Các giọng có sẵn: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody được hợp nhất vào JSON yêu cầu /audio/speech sau các trường do OpenClaw tạo, vì vậy hãy dùng nó cho các điểm cuối tương thích OpenAI cần khóa bổ sung như lang. Các khóa prototype bị bỏ qua.
{
  messages: {
    tts: {
      providers: {
        openai: { model: "gpt-4o-mini-tts", voice: "coral" },
      },
    },
  },
}
Đặt OPENAI_TTS_BASE_URL để ghi đè URL cơ sở TTS mà không ảnh hưởng đến điểm cuối API trò chuyện. OpenAI TTS vẫn được cấu hình thông qua khóa API; để phản hồi thoại trực tiếp chỉ dùng OAuth, hãy dùng đường dẫn giọng nói Realtime thay vì lời nói STT -> TTS ở chế độ agent.
Plugin openai được đóng gói kèm đăng ký chuyển lời nói thành văn bản theo lô thông qua bề mặt phiên âm hiểu nội dung đa phương tiện của OpenClaw.
  • Mô hình mặc định: gpt-4o-transcribe
  • Điểm cuối: OpenAI REST /v1/audio/transcriptions
  • Đường dẫn đầu vào: tải lên tệp âm thanh multipart
  • Được OpenClaw hỗ trợ ở mọi nơi phiên âm âm thanh đầu vào sử dụng tools.media.audio, bao gồm các đoạn kênh thoại Discord và tệp đính kèm âm thanh của kênh
Để ép dùng OpenAI cho phiên âm âm thanh đầu vào:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "openai",
            model: "gpt-4o-transcribe",
          },
        ],
      },
    },
  },
}
Gợi ý ngôn ngữ và lời nhắc được chuyển tiếp đến OpenAI khi được cung cấp bởi cấu hình đa phương tiện âm thanh dùng chung hoặc yêu cầu phiên âm theo từng lệnh gọi.
Plugin openai đi kèm đăng ký tính năng phiên âm thời gian thực cho Plugin Voice Call.
Cài đặtĐường dẫn cấu hìnhMặc định
Mô hìnhplugins.entries.voice-call.config.streaming.providers.openai.modelgpt-4o-transcribe
Ngôn ngữ...openai.language(chưa đặt)
Lời nhắc...openai.prompt(chưa đặt)
Thời lượng im lặng...openai.silenceDurationMs800
Ngưỡng VAD...openai.vadThreshold0.5
Xác thực...openai.apiKey, OPENAI_API_KEY, hoặc OAuth openai-codexKhóa API kết nối trực tiếp; OAuth phát hành bí mật máy khách phiên âm Realtime
Sử dụng kết nối WebSocket tới wss://api.openai.com/v1/realtime với âm thanh G.711 u-law (g711_ulaw / audio/pcmu). Khi chỉ cấu hình OAuth openai-codex, Gateway phát hành một bí mật máy khách phiên âm Realtime tạm thời trước khi mở WebSocket. Nhà cung cấp phát trực tuyến này dành cho đường dẫn phiên âm thời gian thực của Voice Call; giọng nói Discord hiện ghi các đoạn ngắn rồi dùng đường dẫn phiên âm hàng loạt tools.media.audio thay thế.
Plugin openai đi kèm đăng ký giọng nói thời gian thực cho Plugin Voice Call.
Cài đặtĐường dẫn cấu hìnhMặc định
Mô hìnhplugins.entries.voice-call.config.realtime.providers.openai.modelgpt-realtime-2
Giọng nói...openai.voicealloy
Nhiệt độ (cầu nối triển khai Azure)...openai.temperature0.8
Ngưỡng VAD...openai.vadThreshold0.5
Thời lượng im lặng...openai.silenceDurationMs500
Phần đệm tiền tố...openai.prefixPaddingMs300
Mức nỗ lực suy luận...openai.reasoningEffort(chưa đặt)
Xác thực...openai.apiKey, OPENAI_API_KEY, hoặc OAuth openai-codexBrowser Talk và các cầu nối backend không phải Azure có thể dùng OAuth Codex
Các giọng Realtime tích hợp sẵn có cho gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. OpenAI khuyến nghị marincedar để có chất lượng Realtime tốt nhất. Đây là một tập riêng biệt với các giọng Chuyển văn bản thành giọng nói ở trên; đừng giả định một giọng TTS như fable, nova, hoặc onyx là hợp lệ cho các phiên Realtime.
Các cầu nối realtime backend OpenAI dùng dạng phiên WebSocket Realtime GA, vốn không chấp nhận session.temperature. Các triển khai Azure OpenAI vẫn khả dụng qua azureEndpointazureDeployment và giữ dạng phiên tương thích với triển khai. Hỗ trợ gọi công cụ hai chiều và âm thanh G.711 u-law.
Giọng nói Realtime được chọn khi phiên được tạo. OpenAI cho phép hầu hết các trường phiên thay đổi sau đó, nhưng không thể thay đổi giọng nói sau khi mô hình đã phát ra âm thanh trong phiên đó. OpenClaw hiện để lộ các mã định danh giọng Realtime tích hợp sẵn dưới dạng chuỗi.
Control UI Talk dùng các phiên realtime trình duyệt OpenAI với một bí mật máy khách tạm thời do Gateway phát hành và trao đổi SDP WebRTC trực tiếp từ trình duyệt với OpenAI Realtime API. Khi không cấu hình khóa API OpenAI trực tiếp, Gateway có thể phát hành bí mật máy khách đó bằng hồ sơ OAuth openai-codex đã chọn. Chuyển tiếp Gateway và các cầu nối WebSocket realtime backend Voice Call dùng cùng phương án dự phòng OAuth cho các endpoint OpenAI gốc. Có thể xác minh trực tiếp bởi maintainer với OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts; các nhánh OpenAI xác minh cả cầu nối WebSocket backend và trao đổi SDP WebRTC của trình duyệt mà không ghi nhật ký bí mật.

Endpoint Azure OpenAI

Nhà cung cấp openai đi kèm có thể nhắm tới một tài nguyên Azure OpenAI để tạo hình ảnh bằng cách ghi đè URL cơ sở. Trên đường dẫn tạo hình ảnh, OpenClaw phát hiện tên máy chủ Azure trên models.providers.openai.baseUrl và tự động chuyển sang dạng yêu cầu của Azure.
Giọng nói thời gian thực dùng một đường dẫn cấu hình riêng (plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint) và không bị ảnh hưởng bởi models.providers.openai.baseUrl. Xem accordion Giọng nói thời gian thực trong Giọng nói và lời nói để biết các cài đặt Azure của nó.
Dùng Azure OpenAI khi:
  • Bạn đã có gói đăng ký, hạn mức, hoặc thỏa thuận doanh nghiệp Azure OpenAI
  • Bạn cần vùng lưu trú dữ liệu theo khu vực hoặc các kiểm soát tuân thủ do Azure cung cấp
  • Bạn muốn giữ lưu lượng bên trong một tenancy Azure hiện có

Cấu hình

Để tạo hình ảnh Azure thông qua nhà cung cấp openai đi kèm, trỏ models.providers.openai.baseUrl tới tài nguyên Azure của bạn và đặt apiKey thành khóa Azure OpenAI (không phải khóa OpenAI Platform):
{
  models: {
    providers: {
      openai: {
        baseUrl: "https://<your-resource>.openai.azure.com",
        apiKey: "<azure-openai-api-key>",
      },
    },
  },
}
OpenClaw nhận dạng các hậu tố máy chủ Azure này cho tuyến tạo hình ảnh Azure:
  • *.openai.azure.com
  • *.services.ai.azure.com
  • *.cognitiveservices.azure.com
Đối với các yêu cầu tạo hình ảnh trên một máy chủ Azure được nhận dạng, OpenClaw:
  • Gửi header api-key thay vì Authorization: Bearer
  • Dùng các đường dẫn theo phạm vi triển khai (/openai/deployments/{deployment}/...)
  • Thêm ?api-version=... vào mỗi yêu cầu
  • Dùng thời gian chờ yêu cầu mặc định 600 giây cho các lệnh gọi tạo hình ảnh Azure. Các giá trị timeoutMs theo từng lệnh gọi vẫn ghi đè mặc định này.
Các URL cơ sở khác (OpenAI công khai, proxy tương thích OpenAI) giữ dạng yêu cầu hình ảnh OpenAI tiêu chuẩn.
Định tuyến Azure cho đường dẫn tạo hình ảnh của nhà cung cấp openai yêu cầu OpenClaw 2026.4.22 trở lên. Các phiên bản cũ hơn xử lý mọi openai.baseUrl tùy chỉnh giống endpoint OpenAI công khai và sẽ thất bại với các triển khai hình ảnh Azure.

Phiên bản API

Đặt AZURE_OPENAI_API_VERSION để ghim một phiên bản Azure preview hoặc GA cụ thể cho đường dẫn tạo hình ảnh của Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"
Mặc định là 2024-12-01-preview khi biến này chưa được đặt.

Tên model là tên triển khai

Azure OpenAI liên kết model với các triển khai. Đối với các yêu cầu tạo hình ảnh Azure được định tuyến qua nhà cung cấp openai đi kèm, trường model trong OpenClaw phải là tên triển khai Azure mà bạn đã cấu hình trong cổng Azure, không phải id model OpenAI công khai. Nếu bạn tạo một triển khai tên là gpt-image-2-prod phục vụ gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1
Quy tắc dùng tên triển khai tương tự cũng áp dụng cho các lệnh gọi tạo hình ảnh được định tuyến qua nhà cung cấp openai đi kèm.

Tình trạng khả dụng theo khu vực

Tạo hình ảnh Azure hiện chỉ khả dụng ở một số khu vực (ví dụ eastus2, swedencentral, polandcentral, westus3, uaenorth). Hãy kiểm tra danh sách khu vực hiện tại của Microsoft trước khi tạo triển khai, và xác nhận model cụ thể được cung cấp trong khu vực của bạn.

Khác biệt về tham số

Azure OpenAI và OpenAI công khai không phải lúc nào cũng chấp nhận cùng các tham số hình ảnh. Azure có thể từ chối các tùy chọn mà OpenAI công khai cho phép (ví dụ một số giá trị background nhất định trên gpt-image-2) hoặc chỉ cung cấp chúng trên các phiên bản model cụ thể. Những khác biệt này đến từ Azure và model nền tảng, không phải OpenClaw. Nếu một yêu cầu Azure thất bại với lỗi xác thực, hãy kiểm tra tập tham số được hỗ trợ bởi triển khai và phiên bản API cụ thể của bạn trong cổng Azure.
Azure OpenAI sử dụng transport gốc và hành vi tương thích nhưng không nhận các tiêu đề ghi nhận ẩn của OpenClaw — xem accordion Tuyến gốc so với tuyến tương thích OpenAI trong Cấu hình nâng cao.Đối với lưu lượng chat hoặc Responses trên Azure (ngoài tạo hình ảnh), hãy dùng luồng onboarding hoặc một cấu hình nhà cung cấp Azure chuyên dụng — chỉ riêng openai.baseUrl không lấy được dạng API/auth của Azure. Có một nhà cung cấp azure-openai-responses/* riêng; xem accordion Compaction phía máy chủ bên dưới.

Cấu hình nâng cao

OpenClaw ưu tiên WebSocket và dự phòng SSE ("auto") cho openai/*.Ở chế độ "auto", OpenClaw:
  • Thử lại một lỗi WebSocket sớm một lần trước khi chuyển sang SSE
  • Sau một lỗi, đánh dấu WebSocket là suy giảm trong khoảng 60 giây và dùng SSE trong thời gian chờ nguội
  • Gắn các tiêu đề định danh phiên và lượt ổn định cho các lần thử lại và kết nối lại
  • Chuẩn hóa bộ đếm sử dụng (input_tokens / prompt_tokens) trên các biến thể transport
Giá trịHành vi
"auto" (mặc định)WebSocket trước, dự phòng SSE
"sse"Chỉ buộc dùng SSE
"websocket"Chỉ buộc dùng WebSocket
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: { transport: "auto" },
        },
      },
    },
  },
}
Tài liệu OpenAI liên quan:
OpenClaw cung cấp một nút bật/tắt chế độ nhanh dùng chung cho openai/*:
  • Chat/UI: /fast status|on|off
  • Cấu hình: agents.defaults.models["<provider>/<model>"].params.fastMode
Khi được bật, OpenClaw ánh xạ chế độ nhanh sang xử lý ưu tiên của OpenAI (service_tier = "priority"). Các giá trị service_tier hiện có được giữ nguyên, và chế độ nhanh không viết lại reasoning hoặc text.verbosity.
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { fastMode: true } },
      },
    },
  },
}
Ghi đè phiên được ưu tiên hơn cấu hình. Xóa ghi đè phiên trong giao diện Phiên sẽ đưa phiên về mặc định đã cấu hình.
API của OpenAI cung cấp xử lý ưu tiên qua service_tier. Đặt giá trị này cho từng mô hình trong OpenClaw:
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { serviceTier: "priority" } },
      },
    },
  },
}
Giá trị được hỗ trợ: auto, default, flex, priority.
serviceTier chỉ được chuyển tiếp đến các endpoint OpenAI gốc (api.openai.com) và các endpoint Codex gốc (chatgpt.com/backend-api). Nếu bạn định tuyến một trong hai nhà cung cấp qua proxy, OpenClaw sẽ giữ nguyên service_tier.
Với các mô hình OpenAI Responses trực tiếp (openai/* trên api.openai.com), trình bao bọc luồng Pi-harness của OpenAI plugin tự động bật Compaction phía máy chủ:
  • Bắt buộc store: true (trừ khi tương thích mô hình đặt supportsStore: false)
  • Chèn context_management: [{ type: "compaction", compact_threshold: ... }]
  • compact_threshold mặc định: 70% của contextWindow (hoặc 80000 khi không có)
Điều này áp dụng cho đường dẫn Pi harness tích hợp sẵn và các hook của nhà cung cấp OpenAI được dùng bởi các lần chạy nhúng. Harness máy chủ ứng dụng Codex gốc tự quản lý ngữ cảnh của nó thông qua Codex và được cấu hình bằng tuyến tác nhân mặc định của OpenAI hoặc chính sách runtime của nhà cung cấp/mô hình.
Hữu ích cho các endpoint tương thích như Azure OpenAI Responses:
{
  agents: {
    defaults: {
      models: {
        "azure-openai-responses/gpt-5.5": {
          params: { responsesServerCompaction: true },
        },
      },
    },
  },
}
responsesServerCompaction chỉ kiểm soát việc chèn context_management. Các mô hình OpenAI Responses trực tiếp vẫn bắt buộc store: true trừ khi tương thích đặt supportsStore: false.
Với các lần chạy họ GPT-5 trên openai/*, OpenClaw có thể dùng một hợp đồng thực thi nhúng nghiêm ngặt hơn:
{
  agents: {
    defaults: {
      embeddedPi: { executionContract: "strict-agentic" },
    },
  },
}
Với strict-agentic, OpenClaw:
  • Không còn xem một lượt chỉ lập kế hoạch là tiến triển thành công khi có sẵn hành động công cụ
  • Thử lại lượt đó với điều hướng hành động ngay
  • Tự động bật update_plan cho công việc đáng kể
  • Hiển thị trạng thái bị chặn rõ ràng nếu mô hình tiếp tục lập kế hoạch mà không hành động
Chỉ áp dụng cho các lần chạy họ GPT-5 của OpenAI và Codex. Các nhà cung cấp khác và các họ mô hình cũ hơn vẫn giữ hành vi mặc định.
OpenClaw xử lý các endpoint OpenAI trực tiếp, Codex và Azure OpenAI khác với các proxy /v1 tương thích OpenAI chung:Tuyến gốc (openai/*, Azure OpenAI):
  • Chỉ giữ reasoning: { effort: "none" } cho các mô hình hỗ trợ mức nỗ lực none của OpenAI
  • Bỏ qua suy luận đã tắt đối với các mô hình hoặc proxy từ chối reasoning.effort: "none"
  • Mặc định dùng chế độ nghiêm ngặt cho lược đồ công cụ
  • Chỉ đính kèm các header ghi công ẩn trên các máy chủ gốc đã xác minh
  • Giữ định hình yêu cầu chỉ dành cho OpenAI (service_tier, store, tương thích suy luận, gợi ý cache prompt)
Tuyến proxy/tương thích:
  • Dùng hành vi tương thích thoáng hơn
  • Loại bỏ store của Completions khỏi payload openai-completions không gốc
  • Chấp nhận JSON truyền qua nâng cao params.extra_body/params.extraBody cho các proxy Completions tương thích OpenAI
  • Chấp nhận params.chat_template_kwargs cho các proxy Completions tương thích OpenAI như vLLM
  • Không bắt buộc lược đồ công cụ nghiêm ngặt hoặc header chỉ dành cho tuyến gốc
Azure OpenAI dùng truyền tải gốc và hành vi tương thích nhưng không nhận các header ghi công ẩn.

Liên quan

Lựa chọn mô hình

Chọn nhà cung cấp, tham chiếu mô hình và hành vi chuyển đổi dự phòng.

Tạo hình ảnh

Tham số công cụ hình ảnh dùng chung và lựa chọn nhà cung cấp.

Tạo video

Tham số công cụ video dùng chung và lựa chọn nhà cung cấp.

OAuth và xác thực

Chi tiết xác thực và quy tắc tái sử dụng thông tin đăng nhập.