已可通过官方 Discord Gateway 网关用于私信和服务器频道。Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
配对
Discord 私信默认使用配对模式。
斜杠命令
原生命令行为和命令目录。
频道故障排除
跨渠道诊断和修复流程。
快速设置
你需要创建一个带有机器人的新应用,将该机器人添加到你的服务器,并将其配对到 OpenClaw。我们建议将机器人添加到你自己的私有服务器。如果你还没有服务器,请先创建一个(选择 Create My Own > For me and my friends)。创建 Discord 应用和机器人
前往 Discord Developer Portal,然后点击 New Application。将其命名为类似 “OpenClaw” 的名称。点击侧边栏中的 Bot。将 Username 设置为你给 OpenClaw 智能体起的名称。
启用特权意图
仍在 Bot 页面上,向下滚动到 Privileged Gateway Intents 并启用:
- Message Content Intent(必需)
- Server Members Intent(推荐;角色允许列表和名称到 ID 匹配需要它)
- Presence Intent(可选;仅状态更新需要)
复制你的机器人令牌
在 Bot 页面上向上滚动并点击 Reset Token。复制该令牌并保存到某处。这是你的 Bot Token,稍后会用到。
尽管名称如此,这会生成你的第一个令牌,并没有任何内容被“重置”。
生成邀请 URL 并将机器人添加到你的服务器
点击侧边栏中的 OAuth2。你将生成一个带有正确权限的邀请 URL,用于将机器人添加到你的服务器。向下滚动到 OAuth2 URL Generator 并启用:
botapplications.commands
- 查看频道 Text Permissions
- 发送消息
- 读取消息历史
- 嵌入链接
- 附加文件
- 添加回应(可选)
启用 Developer Mode 并收集你的 ID
回到 Discord 应用中,你需要启用 Developer Mode,才能复制内部 ID。
- 点击 User Settings(头像旁边的齿轮图标)→ Advanced → 打开 Developer Mode
- 右键点击侧边栏中的 服务器图标 → Copy Server ID
- 右键点击你自己的头像 → Copy User ID
允许来自服务器成员的私信
要让配对工作,Discord 需要允许你的机器人向你发送私信。右键点击你的服务器图标 → Privacy Settings → 打开 Direct Messages。这会允许服务器成员(包括机器人)向你发送私信。如果你想通过 Discord 私信使用 OpenClaw,请保持此项启用。如果你只计划使用服务器频道,可以在配对后禁用私信。
安全设置你的机器人令牌(不要在聊天中发送)
你的 Discord 机器人令牌是机密(类似密码)。在向智能体发消息之前,请先在运行 OpenClaw 的机器上设置它。如果 OpenClaw 已作为后台服务运行,请通过 OpenClaw Mac 应用重启它,或停止并重启
openclaw gateway run 进程。
对于托管服务安装,请在存在 DISCORD_BOT_TOKEN 的 shell 中运行 openclaw gateway install,或将该变量存储在 ~/.openclaw/.env 中,这样服务在重启后就能解析 env SecretRef。
如果你的主机被 Discord 的启动应用查询阻止或限速,请从 Developer Portal 设置 Discord 应用/客户端 ID,以便启动时跳过该 REST 调用。默认账户使用 channels.discord.applicationId;运行多个 Discord 机器人时,使用 channels.discord.accounts.<accountId>.applicationId。配置 OpenClaw 并配对
- 询问你的智能体
- CLI / 配置
在任何现有渠道(例如 Telegram)中与你的 OpenClaw 智能体聊天并告诉它。如果 Discord 是你的第一个渠道,请改用 CLI / 配置标签页。
“我已经在配置中设置了 Discord 机器人令牌。请使用 User ID<user_id>和 Server ID<server_id>完成 Discord 设置。”
令牌解析会感知账户。配置令牌值优先于环境变量回退。
DISCORD_BOT_TOKEN 仅用于默认账户。
如果两个已启用的 Discord 账户解析到同一个机器人令牌,OpenClaw 只会为该令牌启动一个 Gateway 网关监控器。来自配置的令牌优先于默认环境变量回退;否则第一个已启用账户胜出,重复账户会被报告为已禁用。
对于高级出站调用(消息工具/渠道操作),显式的逐调用 token 会用于该调用。这适用于发送和读取/探测类操作(例如 read/search/fetch/thread/pins/permissions)。账户策略/重试设置仍来自活动运行时快照中所选的账户。推荐:设置服务器工作区
私信可用后,你可以将 Discord 服务器设置为完整工作区,其中每个频道都有自己的智能体会话和独立上下文。对于只有你和你的机器人的私有服务器,推荐这样做。将你的服务器添加到服务器允许列表
这会让你的智能体能够在服务器上的任何频道中响应,而不仅是私信。
- 询问你的智能体
- 配置
“将我的 Discord Server ID <server_id> 添加到服务器允许列表”
允许无需 @mention 即可响应
默认情况下,只有在服务器频道中被 @mentioned 时,你的智能体才会响应。对于私有服务器,你可能希望它响应每条消息。在服务器频道中,普通助手最终回复默认保持私密。可见的 Discord 输出必须使用
message 工具显式发送,因此智能体默认可以旁观,并且只有在它判断频道回复有用时才发帖。这意味着所选模型必须可靠地调用工具。如果 Discord 显示正在输入,日志也显示 token 用量,但没有发布消息,请检查会话日志中是否有带 didSendViaMessagingTool: false 的助手文本。这意味着模型生成了私密最终答案,而不是调用 message(action=send)。切换到更强的工具调用模型,或使用下面的配置恢复旧版自动最终回复。- 询问你的智能体
- 配置
“允许我的智能体在此服务器上无需被 @mentioned 即可响应”
#coding、#home、#research,或任何适合你工作流的内容。
运行时模型
- Gateway 网关拥有 Discord 连接。
- 回复路由是确定性的:Discord 入站回复会返回到 Discord。
- Discord 服务器/频道元数据会作为不受信任的上下文加入模型提示中, 而不是作为用户可见的回复前缀。如果模型把该封套复制回来, OpenClaw 会从出站回复和未来的重放上下文中剥离复制的元数据。
- 默认情况下(
session.dmScope=main),直接聊天共享智能体主会话(agent:main:main)。 - 服务器频道使用隔离的会话键(
agent:<agentId>:discord:channel:<channelId>)。 - 群组私信默认会被忽略(
channels.discord.dm.groupEnabled=false)。 - 原生斜杠命令在隔离的命令会话中运行(
agent:<agentId>:discord:slash:<userId>),同时仍携带CommandTargetSessionKey指向路由后的对话会话。 - 面向 Discord 的纯文本 cron/heartbeat 公告投递会使用最终的 助手可见答案一次。媒体和结构化组件载荷在智能体发出多个可投递载荷时, 仍保持多消息形式。
论坛频道
Discord 论坛和媒体频道只接受主题帖。OpenClaw 支持两种创建方式:- 向论坛父级(
channel:<forumId>)发送消息以自动创建主题。主题标题使用你的消息中第一行非空内容。 - 使用
openclaw message thread create直接创建主题。不要为论坛频道传递--message-id。
channel:<threadId>)。
交互式组件
OpenClaw 支持用于智能体消息的 Discord 组件 v2 容器。使用带components 载荷的消息工具。交互结果会作为普通入站消息路由回智能体,并遵循现有 Discord replyToMode 设置。
支持的块:
text、section、separator、actions、media-gallery、file- 操作行最多允许 5 个按钮或一个选择菜单
- 选择类型:
string、user、role、mentionable、channel
components.reusable=true 可允许按钮、选择和表单在过期前被多次使用。
要限制谁可以点击按钮,请在该按钮上设置 allowedUsers(Discord 用户 ID、标签或 *)。配置后,不匹配的用户会收到一条仅自己可见的拒绝消息。
/model 和 /models 斜杠命令会打开交互式模型选择器,其中包含提供商、模型和兼容运行时下拉菜单,以及一个提交步骤。/models add 已弃用,现在会返回弃用消息,而不是从聊天中注册模型。选择器回复仅自己可见,并且只有调用用户可以使用。Discord 选择菜单限制为 25 个选项,因此当你希望选择器只为所选提供商(例如 openai-codex 或 vllm)显示动态发现的模型时,请向 agents.defaults.models 添加 provider/* 条目。
文件附件:
file块必须指向附件引用(attachment://<filename>)- 通过
media/path/filePath提供附件(单个文件);多个文件使用media-gallery - 当上传名称应与附件引用匹配时,使用
filename覆盖上传名称
- 添加最多包含 5 个字段的
components.modal - 字段类型:
text、checkbox、radio、select、role-select、user-select - OpenClaw 会自动添加触发按钮
访问控制和路由
- 私信策略
- 访问组
- 服务器策略
- 提及和群组私信
channels.discord.dmPolicy 控制私信访问。channels.discord.allowFrom 是规范的私信允许列表。pairing(默认)allowlistopen(要求channels.discord.allowFrom包含"*")disabled
pairing 模式下被提示进行配对)。多账号优先级:channels.discord.accounts.default.allowFrom仅适用于default账号。- 对于单个账号,
allowFrom优先于旧版dm.allowFrom。 - 当命名账号自己的
allowFrom和旧版dm.allowFrom均未设置时,会继承channels.discord.allowFrom。 - 命名账号不会继承
channels.discord.accounts.default.allowFrom。
channels.discord.dm.policy 和 channels.discord.dm.allowFrom 仍会读取以保持兼容。openclaw doctor --fix 会在不改变访问权限的前提下尽可能将它们迁移到 dmPolicy 和 allowFrom。用于投递的私信目标格式:user:<id><@id>提及
allowFrom 中的 ID 会被视为用户私信目标。基于角色的智能体路由
使用bindings[].match.roles 按角色 ID 将 Discord 服务器成员路由到不同智能体。基于角色的绑定只接受角色 ID,并且会在对等或父对等绑定之后、仅服务器绑定之前求值。如果绑定还设置了其他匹配字段(例如 peer + guildId + roles),则所有配置字段都必须匹配。
原生命令和命令授权
commands.native默认为"auto",并为 Discord 启用。- 按渠道覆盖:
channels.discord.commands.native。 commands.native=false会在启动期间跳过 Discord 斜杠命令注册和清理。此前注册的命令可能仍会在 Discord 中可见,直到你从 Discord 应用中移除它们。- 原生命令认证使用与普通消息处理相同的 Discord 允许列表/策略。
- 对未授权用户,命令可能仍会在 Discord UI 中可见;执行时仍会强制应用 OpenClaw 认证,并返回 “not authorized”。
ephemeral: true
功能详情
回复标签和原生回复
回复标签和原生回复
Discord 支持智能体输出中的回复标签:
[[reply_to_current]][[reply_to:<id>]]
channels.discord.replyToMode 控制:off(默认)firstallbatched
off 会禁用隐式回复线程。显式 [[reply_to_*]] 标签仍会被遵循。
first 始终会把隐式原生回复引用附加到该轮次的第一条出站 Discord 消息。
batched 仅在入站轮次是多条消息的防抖批处理时,才会附加 Discord 的隐式原生回复引用。这在你希望主要针对含义不明确的突发聊天使用原生回复,而不是每个单消息轮次都使用时很有用。消息 ID 会在上下文/历史记录中暴露,以便智能体可以定位特定消息。实时流预览
实时流预览
OpenClaw 可以通过发送临时消息并在文本到达时编辑它来流式传输回复草稿。预览流式传输仅支持文本;媒体回复会回退到正常投递。当明确启用
channels.discord.streaming 接受 off | partial | block | progress(默认)。progress 会保留一条可编辑的状态草稿,并用工具进度更新它,直到最终投递;共享的起始标签是一条滚动行,因此一旦出现足够多的工作内容,它就会像其余内容一样滚动离开。streamMode 是旧版运行时别名。运行 openclaw doctor --fix 可将持久化配置重写为规范键。将 channels.discord.streaming.mode 设置为 off 可禁用 Discord 预览编辑。如果明确启用了 Discord 分块流式传输,OpenClaw 会跳过预览流,以避免重复流式传输。partial会在令牌到达时编辑同一条预览消息。block会发出草稿大小的分块(使用draftChunk调整大小和断点,并限制在textChunkLimit内)。- 媒体、错误和显式回复的最终消息会取消待处理的预览编辑。
streaming.preview.toolProgress(默认true)控制工具/进度更新是否复用预览消息。- 工具/进度行会在可用时渲染为紧凑的表情符号 + 标题 + 详情,例如
🛠️ Bash: run tests或🔎 Web Search: for "query"。 streaming.preview.commandText/streaming.progress.commandText控制紧凑进度行中的命令/执行详情:raw(默认)或status(仅工具标签)。
block 流式传输时,OpenClaw 会跳过预览流,以避免重复流式传输。历史记录、上下文和线程行为
历史记录、上下文和线程行为
服务器历史记录上下文:
channels.discord.historyLimit默认20- 回退:
messages.groupChat.historyLimit 0会禁用
channels.discord.dmHistoryLimitchannels.discord.dms["<user_id>"].historyLimit
- Discord 线程会作为渠道会话路由,并继承父渠道配置,除非被覆盖。
- 线程会话会继承父渠道的会话级
/model选择,作为仅模型回退;线程本地/model选择仍优先,且父转录历史不会被复制,除非启用了转录继承。 channels.discord.thread.inheritParent(默认false)会让新的自动线程从父转录播种。按账号覆盖位于channels.discord.accounts.<id>.thread.inheritParent下。- 消息工具反应可以解析
user:<id>私信目标。 guilds.<guild>.channels.<channel>.requireMention: false会在回复阶段激活回退期间保留。
子智能体的线程绑定会话
子智能体的线程绑定会话
Discord 可以将线程绑定到会话目标,因此该线程中的后续消息会继续路由到同一会话(包括子智能体会话)。命令:注意:
/focus <target>将当前/新线程绑定到子智能体/会话目标/unfocus移除当前线程绑定/agents显示活动运行和绑定状态/session idle <duration|off>查看/更新已聚焦绑定的不活动自动取消聚焦/session max-age <duration|off>查看/更新已聚焦绑定的硬性最大存续时间
session.threadBindings.*设置全局默认值。channels.discord.threadBindings.*覆盖 Discord 行为。spawnSessions控制通过sessions_spawn({ thread: true })和 ACP 线程生成来自动创建/绑定线程。默认:true。defaultSpawnContext控制线程绑定生成的原生子智能体上下文。默认:"fork"。- 已弃用的
spawnSubagentSessions/spawnAcpSessions键会由openclaw doctor --fix迁移。 - 如果账号禁用了线程绑定,
/focus和相关线程绑定操作将不可用。
持久 ACP 渠道绑定
持久 ACP 渠道绑定
对于稳定的“始终在线”ACP 工作区,请配置顶层类型化 ACP 绑定,目标指向 Discord 对话。配置路径:注意:
bindings[],带有type: "acp"和match.channel: "discord"
/acp spawn codex --bind here会在原位置绑定当前渠道或线程,并让未来消息保持在同一 ACP 会话上。线程消息会继承父渠道绑定。- 在已绑定渠道或线程中,
/new和/reset会在原位置重置同一 ACP 会话。临时线程绑定可以在活动期间覆盖目标解析。 spawnSessions通过--thread auto|here控制子线程创建/绑定。
反应通知
反应通知
按服务器的反应通知模式:
offown(默认)allallowlist(使用guilds.<id>.users)
确认反应
确认反应
ackReaction 会在 OpenClaw 处理入站消息时发送一个确认表情符号。解析顺序:channels.discord.accounts.<accountId>.ackReactionchannels.discord.ackReactionmessages.ackReaction- 智能体身份表情符号回退(
agents.list[].identity.emoji,否则为 ”👀”)
- Discord 接受 unicode 表情符号或自定义表情符号名称。
- 使用
""可禁用渠道或账号的反应。
配置写入
配置写入
渠道发起的配置写入默认启用。这会影响
/config set|unset 流程(当命令功能启用时)。禁用:Gateway 网关代理
Gateway 网关代理
通过带有 按账号覆盖:
channels.discord.proxy 的 HTTP(S) 代理路由 Discord gateway WebSocket 流量和启动 REST 查询(应用 ID + 允许列表解析)。PluralKit 支持
PluralKit 支持
启用 PluralKit 解析,将代理消息映射到系统成员身份:注意:
- 允许列表可以使用
pk:<memberId> - 仅当
channels.discord.dangerouslyAllowNameMatching: true时,成员显示名称才会按名称/slug 匹配 - 查询使用原始消息 ID,并受时间窗口约束
- 如果查询失败,代理消息会被视为机器人消息并丢弃,除非
allowBots=true
出站提及别名
出站提及别名
当智能体需要对已知 Discord 用户进行确定性的出站提及时,使用
mentionAliases。键是不带前导 @ 的 handle;值是 Discord 用户 ID。未知 handle、@everyone、@here 以及 Markdown 代码跨度中的提及会保持不变。在线状态配置
在线状态配置
Discord 中的批准
Discord 中的批准
Discord 支持在私信中基于按钮的批准处理,也可以选择在发起的渠道中发布批准提示。配置路径:
channels.discord.execApprovals.enabledchannels.discord.execApprovals.approvers(可选;可行时回退到commands.ownerAllowFrom)channels.discord.execApprovals.target(dm|channel|both,默认值:dm)agentFilter、sessionFilter、cleanupAfterResolve
enabled 未设置或为 "auto",并且至少可以从 execApprovals.approvers 或 commands.ownerAllowFrom 解析出一个批准者时,Discord 会自动启用原生 exec 批准。Discord 不会从渠道 allowFrom、旧版 dm.allowFrom 或直接消息 defaultTo 推断 exec 批准者。设置 enabled: false 可显式禁用 Discord 作为原生批准客户端。对于 /diagnostics 和 /export-trajectory 等敏感的仅所有者群组命令,OpenClaw 会私下发送批准提示和最终结果。当调用命令的所有者有 Discord 所有者路由时,它会优先尝试 Discord 私信;如果不可用,则回退到 commands.ownerAllowFrom 中第一个可用的所有者路由,例如 Telegram。当 target 为 channel 或 both 时,批准提示会在渠道中可见。只有已解析的批准者可以使用按钮;其他用户会收到临时拒绝。批准提示会包含命令文本,因此仅应在受信任渠道中启用渠道投递。如果无法从会话键推导出渠道 ID,OpenClaw 会回退到私信投递。Discord 还会渲染其他聊天渠道使用的共享批准按钮。原生 Discord 适配器主要添加批准者私信路由和渠道扇出。
当这些按钮存在时,它们就是主要批准 UX;OpenClaw
仅应在工具结果表示
聊天批准不可用或手动批准是唯一路径时,才包含手动 /approve 命令。
如果 Discord 原生批准运行时未激活,OpenClaw 会保留
本地确定性的 /approve <id> <decision> 提示可见。如果
运行时已激活,但原生卡片无法投递到任何目标,
OpenClaw 会在同一聊天中发送回退通知,其中包含待处理批准里的确切 /approve
命令。Gateway 网关身份验证和批准解析遵循共享 Gateway 网关客户端契约(plugin: ID 通过 plugin.approval.resolve 解析;其他 ID 通过 exec.approval.resolve 解析)。批准默认在 30 分钟后过期。参见 Exec 批准。工具和操作门控
Discord 消息操作包括消息、渠道管理、审核、在线状态和元数据操作。 核心示例:- 消息:
sendMessage、readMessages、editMessage、deleteMessage、threadReply - 反应:
react、reactions、emojiList - 审核:
timeout、kick、ban - 在线状态:
setPresence
event-create 操作接受可选的 image 参数(URL 或本地文件路径),用于设置定时事件封面图像。
操作门控位于 channels.discord.actions.* 下。
默认门控行为:
| 操作组 | 默认值 |
|---|---|
| reactions, messages, threads, pins, polls, search, memberInfo, roleInfo, channelInfo, channels, voiceStatus, events, stickers, emojiUploads, stickerUploads, permissions | enabled |
| roles | disabled |
| moderation | disabled |
| presence | disabled |
Components v2 UI
OpenClaw 将 Discord components v2 用于 exec 批准和跨上下文标记。Discord 消息操作也可以接受components 来实现自定义 UI(高级;需要通过 discord 工具构造组件 payload),旧版 embeds 仍可使用,但不推荐。
channels.discord.ui.components.accentColor设置 Discord 组件容器使用的强调色(十六进制)。- 使用
channels.discord.accounts.<id>.ui.components.accentColor按账户设置。 - 当 components v2 存在时,会忽略
embeds。
语音
Discord 有两个不同的语音表面:实时语音频道(连续对话)和语音消息附件(波形预览格式)。Gateway 网关支持两者。语音频道
设置检查清单:- 在 Discord Developer Portal 中启用 Message Content Intent。
- 使用角色/用户允许列表时,启用 Server Members Intent。
- 使用
bot和applications.commandsscopes 邀请机器人。 - 在目标语音频道中授予 Connect、Speak、Send Messages 和 Read Message History 权限。
- 启用原生命令(
commands.native或channels.discord.commands.native)。 - 配置
channels.discord.voice。
/vc join|leave|status 控制会话。该命令使用账户默认智能体,并遵循与其他 Discord 命令相同的允许列表和群组策略规则。
voice.tts仅会为stt-tts语音播放覆盖messages.tts。实时模式使用voice.realtime.voice。voice.mode控制对话路径。默认值是agent-proxy:实时语音前端负责轮次时序、中断和播放,通过openclaw_agent_consult将实质性工作委托给路由到的 OpenClaw 智能体,并像处理来自该说话者的已输入 Discord 提示一样处理结果。stt-tts保留较旧的批处理 STT 加 TTS 流程。bidi让实时模型直接对话,同时暴露openclaw_agent_consult作为 OpenClaw 大脑。voice.agentSession控制哪个 OpenClaw 对话接收语音轮次。保持未设置时使用语音频道自己的会话,或者设置{ mode: "target", target: "channel:<text-channel-id>" },让语音频道作为现有 Discord 文本频道会话(例如#maintainers)的麦克风/扬声器扩展。voice.model会覆盖 Discord 语音响应和实时咨询所用的 OpenClaw 智能体大脑。保持未设置时继承路由到的智能体模型。它与voice.realtime.model是分开的。agent-proxy通过discord-voice路由语音,这会保留说话者和目标会话的正常所有者/工具授权,但会隐藏智能体tts工具,因为 Discord 语音拥有播放权。默认情况下,agent-proxy会为所有者说话者提供等同所有者的完整工具访问权限(voice.realtime.toolPolicy: "owner"),并强烈倾向于在给出实质性回答前咨询 OpenClaw 智能体(voice.realtime.consultPolicy: "always")。在默认的always模式中,实时层不会在咨询答案前自动说填充内容;它会捕获并转写语音,然后说出路由后的 OpenClaw 答案。如果 Discord 仍在播放第一个答案时有多个强制咨询答案完成,后续的精确语音答案会排队,直到播放空闲,而不是在句子中途替换语音。- 在
stt-tts模式中,STT 使用tools.media.audio;voice.model不影响转写。 - 在实时模式中,
voice.realtime.provider、voice.realtime.model和voice.realtime.voice配置实时音频会话。对于 OpenAI Realtime 2 加 Codex 大脑,使用voice.realtime.model: "gpt-realtime-2"和voice.model: "openai-codex/gpt-5.5"。 - OpenAI 实时提供商接受当前的 Realtime 2 事件名称,以及用于输出音频和转写事件的旧版 Codex 兼容别名,因此兼容的提供商快照可以发生偏移而不会丢失助手音频。
voice.realtime.bargeIn控制 Discord 说话者开始事件是否中断活跃的实时播放。如果未设置,它会跟随实时提供商的输入音频中断设置。voice.realtime.minBargeInAudioEndMs控制 OpenAI 实时打断截断音频前的最短助手播放时长。默认值:250。在低回声房间中设置为0可立即中断,或者在回声较重的扬声器设置中调高它。- 对于 Discord 播放中的 OpenAI 语音,设置
voice.tts.provider: "openai",并在voice.tts.openai.voice或voice.tts.providers.openai.voice下选择 Text-to-speech 语音。在当前 OpenAI TTS 模型上,cedar是一个不错的偏男性声音选择。 - 每个频道的 Discord
systemPrompt覆盖会应用到该语音频道的语音转写轮次。 - 语音转写轮次会根据 Discord
allowFrom(或dm.allowFrom)推导所有者状态;非所有者说话者不能访问仅限所有者的工具(例如gateway和cron)。 - Discord 语音对于纯文本配置是选择启用的;设置
channels.discord.voice.enabled=true(或保留现有channels.discord.voice块)以启用/vc命令、语音运行时以及GuildVoiceStatesGateway 网关意图。 channels.discord.intents.voiceStates可以显式覆盖语音状态意图订阅。保持未设置时,该意图会跟随有效的语音启用状态。- 如果
voice.autoJoin对同一个服务器有多个条目,OpenClaw 会加入该服务器最后配置的频道。 voice.allowedChannels是可选的驻留允许列表。保持未设置时允许/vc join加入任何已授权的 Discord 语音频道。设置后,/vc join、启动时自动加入和机器人语音状态移动都将限制到列出的{ guildId, channelId }条目。将它设置为空数组会拒绝所有 Discord 语音加入。如果 Discord 将机器人移到允许列表之外,OpenClaw 会离开该频道,并在有可用目标时重新加入配置的自动加入目标。voice.daveEncryption和voice.decryptionFailureTolerance会透传给@discordjs/voice加入选项。- 如果未设置,
@discordjs/voice默认值为daveEncryption=true和decryptionFailureTolerance=24。 - OpenClaw 默认使用纯 JS 的
opusscript解码器接收 Discord 语音。可选的原生@discordjs/opus包会被仓库 pnpm 安装策略忽略,因此普通安装、Docker 通道和无关测试不会编译原生插件。专用语音性能主机可以在安装原生插件后通过OPENCLAW_DISCORD_OPUS_DECODER=native选择启用。 voice.connectTimeoutMs控制/vc join和自动加入尝试的初始@discordjs/voiceReady 等待。默认值:30000。voice.reconnectGraceMs控制 OpenClaw 在销毁断开的语音会话前等待其开始重连的时长。默认值:15000。- 在
stt-tts模式中,语音播放不会仅仅因为另一个用户开始说话而停止。为避免反馈回路,OpenClaw 会在 TTS 播放期间忽略新的语音捕获;请在播放结束后再说下一轮。实时模式会将说话者开始转发为实时提供商的打断信号。 - 在实时模式中,扬声器回声进入打开的麦克风可能看起来像打断并中断播放。对于回声较重的 Discord 房间,设置
voice.realtime.providers.openai.interruptResponseOnInputAudio: false,防止 OpenAI 在输入音频上自动中断。如果你仍希望 Discord 说话者开始事件中断活跃播放,请添加voice.realtime.bargeIn: true。OpenAI 实时桥会将短于voice.realtime.minBargeInAudioEndMs的播放截断视为可能的回声/噪声并忽略,将其记录为已跳过,而不是清除 Discord 播放。 voice.captureSilenceGraceMs控制 OpenClaw 在 Discord 报告说话者停止后等待多久才将该音频片段最终确定用于 STT。默认值:2500;如果 Discord 将正常停顿切分成零碎的部分转写,请调高此值。- 当 ElevenLabs 是选定的 TTS 提供商时,Discord 语音播放会使用流式 TTS,并从提供商响应流开始。没有流式支持的提供商会回退到合成临时文件路径。
- OpenClaw 还会监视接收解密失败,并在短时间窗口内重复失败后通过离开/重新加入语音频道自动恢复。
- 如果更新后接收日志反复显示
DecryptionFailed(UnencryptedWhenPassthroughDisabled),请收集依赖报告和日志。内置的@discordjs/voice版本线包含来自 discord.js PR #11449 的上游填充修复,该修复关闭了 discord.js issue #11419。 - 当 OpenClaw 最终确定捕获到的说话者片段时,
The operation was aborted接收事件是预期行为;它们是详细诊断,不是警告。 - 详细 Discord 语音日志会为每个接受的说话者片段包含一个有界的单行 STT 转写预览,因此调试时可以同时看到用户侧和智能体回复侧,而不会转储无界转写文本。
- 在
agent-proxy模式中,强制咨询回退会跳过可能不完整的转写片段,例如以...结尾的文本或像and这样的尾随连接词,以及明显不可操作的结束语,例如“be right back”或“bye”。当这避免了陈旧的排队答案时,日志会显示forced agent consult skipped reason=...。
node-gyp 源码构建工具链。
安装原生插件后,使用以下命令启动 Gateway 网关:
discord voice: opus decoder: @discordjs/opus。如果没有选择启用环境变量,或者原生插件缺失或无法在主机上加载,OpenClaw 会记录 discord voice: opus decoder: opusscript,并通过纯 JS 回退继续接收语音。
STT 加 TTS 管道:
- Discord PCM 捕获会转换为 WAV 临时文件。
tools.media.audio处理 STT,例如openai/gpt-4o-mini-transcribe。- 转写会通过 Discord 入口和路由发送,同时响应 LLM 以语音输出策略运行,该策略会隐藏智能体
tts工具并要求返回文本,因为 Discord 语音拥有最终 TTS 播放权。 - 设置
voice.model时,它只会覆盖此语音频道轮次的响应 LLM。 voice.tts会合并并覆盖messages.tts;支持流式传输的提供商会直接馈送播放器,否则会播放生成的音频文件到已加入的频道。
voice.agentSession 块时,每个语音频道都会获得自己的路由 OpenClaw 会话。例如,/vc join channel:234567890123456789 会与该 Discord 语音频道的会话对话。实时模型只是语音前端;实质性请求会交给配置的 OpenClaw 智能体。如果实时模型在未调用咨询工具的情况下生成最终转写,OpenClaw 会强制将咨询作为回退,因此默认行为仍像是在和智能体对话。
旧版 STT 加 TTS 示例:
agent-proxy 模式中,机器人会加入配置的语音频道,但 OpenClaw 智能体轮次使用目标频道的正常路由会话和智能体。实时语音会话会将返回结果说回语音频道。监督智能体仍然可以根据其工具策略使用正常消息工具,包括在合适时发送单独的 Discord 消息。
有用的目标形式:
target: "channel:123456789012345678"通过 Discord 文本频道会话路由。target: "123456789012345678"会被视为频道目标。target: "dm:123456789012345678"或target: "user:123456789012345678"通过该直接消息会话路由。
bargeIn: true 允许 Discord 说话者开始事件和已活跃的说话者音频,在下一个捕获的轮次到达 OpenAI 之前取消活跃的实时响应。audioEndMs 低于 minBargeInAudioEndMs 的很早期抢话信号会被视为可能的回声/噪声并忽略,因此模型不会在第一个播放帧处被截断。
预期语音日志:
- 加入时:
discord voice: joining ... voiceSession=... supervisorSession=... agentSessionMode=... voiceModel=... realtimeModel=... - 实时启动时:
discord voice: realtime bridge starting ... autoRespond=false interruptResponse=false bargeIn=false minBargeInAudioEndMs=... - 说话者音频时:
discord voice: realtime speaker turn opened ...、discord voice: realtime input audio started ... outputAudioMs=... outputActive=...,以及discord voice: realtime speaker turn closed ... chunks=... discordBytes=... realtimeBytes=... interruptedPlayback=... - 跳过过期语音时:
discord voice: realtime forced agent consult skipped reason=incomplete-transcript ...或reason=non-actionable-closing ... - 实时响应完成时:
discord voice: realtime audio playback finishing reason=response.done ... audioMs=... chunks=... - 播放停止/重置时:
discord voice: realtime audio playback stopped reason=... audioMs=... elapsedMs=... chunks=... - 实时咨询时:
discord voice: realtime consult requested ... voiceSession=... supervisorSession=... question=... - Agent 回答时:
discord voice: agent turn answer ... - 精确语音入队时:
discord voice: realtime exact speech queued ... queued=... outputAudioMs=... outputActive=...,随后是discord voice: realtime exact speech dequeued reason=player-idle ... - 检测到抢话时:
discord voice: realtime barge-in detected source=speaker-start ...或discord voice: realtime barge-in detected source=active-speaker-audio ...,随后是discord voice: realtime barge-in requested reason=... outputAudioMs=... outputActive=... - 实时中断时:
discord voice: realtime model interrupt requested client:response.cancel reason=barge-in,随后是discord voice: realtime model audio truncated client:conversation.item.truncate reason=barge-in audioEndMs=...或discord voice: realtime model interrupt confirmed server:response.done status=cancelled ... - 忽略回声/噪声时:
discord voice: realtime model interrupt ignored client:conversation.item.truncate.skipped reason=barge-in audioEndMs=0 minAudioEndMs=250 - 禁用抢话时:
discord voice: realtime capture ignored during playback (barge-in disabled) ... - 空闲播放时:
discord voice: realtime barge-in ignored reason=... outputActive=false ... playbackChunks=0
realtime audio playback started表示 Discord 已开始播放助手音频。网桥会从此时开始统计助手输出分块、Discord PCM 字节、提供商实时字节,以及合成音频时长。realtime speaker turn opened标记某个 Discord 说话者变为活跃。如果播放已处于活跃状态且bargeIn已启用,后面可能会出现barge-in detected source=speaker-start。realtime input audio started标记该说话者轮次收到的第一个实际音频帧。这里的outputActive=true或非零outputAudioMs表示麦克风在助手播放仍处于活跃状态时发送输入。barge-in detected source=active-speaker-audio表示 OpenClaw 在助手播放处于活跃状态时看到了实时说话者音频。这有助于区分真实打断和没有有效音频的 Discord 说话者开始事件。barge-in requested reason=...表示 OpenClaw 已要求实时提供商取消或截断活跃响应。它包含outputAudioMs、outputActive和playbackChunks,因此你可以看到中断前实际播放了多少助手音频。realtime audio playback stopped reason=...是本地 Discord 播放重置点。原因会说明是谁停止了播放:barge-in、player-idle、provider-clear-audio、forced-agent-consult、stream-close或session-close。realtime speaker turn closed汇总捕获的输入轮次。chunks=0或hasAudio=false表示说话者轮次已打开,但没有可用音频到达实时网桥。interruptedPlayback=true表示该输入轮次与助手输出重叠,并触发了抢话逻辑。
outputAudioMs:日志行之前由实时提供商生成的助手音频时长。audioMs:OpenClaw 在播放停止前统计的助手音频时长。elapsedMs:打开和关闭播放流或说话者轮次之间的挂钟时间。discordBytes:发送到 Discord 语音或从 Discord 语音接收的 48 kHz 立体声 PCM 字节。realtimeBytes:发送到实时提供商或从实时提供商接收的提供商格式 PCM 字节。playbackChunks:为活跃响应转发到 Discord 的助手音频分块。sinceLastAudioMs:最后一个捕获的说话者音频帧与说话者轮次关闭之间的间隔。
- 如果立即截断,并且带有
source=active-speaker-audio、较小的outputAudioMs,且同一用户在附近,通常说明扬声器回声进入了麦克风。提高voice.realtime.minBargeInAudioEndMs,降低扬声器音量,使用耳机,或设置voice.realtime.providers.openai.interruptResponseOnInputAudio: false。 source=speaker-start后跟speaker turn closed ... hasAudio=false表示 Discord 报告了说话者开始,但没有音频到达 OpenClaw。这可能是短暂的 Discord 语音事件、噪声门行为,或客户端短暂按下麦克风。- 如果
audio playback stopped reason=stream-close附近没有抢话或provider-clear-audio,表示本地 Discord 播放流意外结束。检查前面的提供商和 Discord 播放器日志。 capture ignored during playback (barge-in disabled)表示 OpenClaw 在助手音频处于活跃状态时有意丢弃了输入。如果你希望语音打断播放,请启用voice.realtime.bargeIn。barge-in ignored ... outputActive=false表示 Discord 或提供商 VAD 报告了语音,但 OpenClaw 没有活跃播放可供打断。这不应截断音频。
voice.model 使用 LLM 路由凭证,tools.media.audio 使用 STT 凭证,messages.tts/voice.tts 使用 TTS 凭证,voice.realtime.providers 或提供商的常规认证配置使用实时提供商凭证。
语音消息
Discord 语音消息会显示波形预览,并要求使用 OGG/Opus 音频。OpenClaw 会自动生成波形,但需要 Gateway 网关主机上有ffmpeg 和 ffprobe 来检查并转换。
- 提供本地文件路径(URL 会被拒绝)。
- 省略文本内容(Discord 会拒绝同一 payload 中同时包含文本和语音消息)。
- 接受任何音频格式;OpenClaw 会按需转换为 OGG/Opus。
故障排除
使用了不允许的 intents,或机器人看不到服务器消息
使用了不允许的 intents,或机器人看不到服务器消息
- 启用 Message Content Intent
- 当你依赖用户/成员解析时,启用 Server Members Intent
- 更改 intents 后重启 Gateway 网关
服务器消息被意外阻止
服务器消息被意外阻止
- 验证
groupPolicy - 验证
channels.discord.guilds下的服务器 allowlist - 如果服务器
channelsmap 存在,则只允许列出的频道 - 验证
requireMention行为和提及模式
Require mention 为 false,但仍被阻止
Require mention 为 false,但仍被阻止
常见原因:
groupPolicy="allowlist",但没有匹配的服务器/频道 allowlistrequireMention配置在错误的位置(必须位于channels.discord.guilds或频道条目下)- 发送者被服务器/频道
usersallowlist 阻止
长时间运行的 Discord 轮次或重复回复
长时间运行的 Discord 轮次或重复回复
典型日志:
Slow listener detected ...stuck session: sessionKey=agent:...:discord:... state=processing ...
- 单账号:
channels.discord.eventQueue.listenerTimeout - 多账号:
channels.discord.accounts.<accountId>.eventQueue.listenerTimeout - 这只控制 Discord Gateway 网关监听器工作,不控制 agent 轮次生命周期
Gateway 网关元数据查找超时警告
Gateway 网关元数据查找超时警告
OpenClaw 在连接前会获取 Discord
/gateway/bot 元数据。短暂失败会回退到 Discord 的默认 Gateway 网关 URL,并在日志中进行限速。元数据超时旋钮:- 单账号:
channels.discord.gatewayInfoTimeoutMs - 多账号:
channels.discord.accounts.<accountId>.gatewayInfoTimeoutMs - 配置未设置时的环境变量回退:
OPENCLAW_DISCORD_GATEWAY_INFO_TIMEOUT_MS - 默认值:
30000(30 秒),最大值:120000
Gateway 网关 READY 超时重启
Gateway 网关 READY 超时重启
OpenClaw 在启动期间和运行时重连之后等待 Discord 的 Gateway 网关
READY 事件。带有启动错峰的多账号设置可能需要比默认值更长的启动 READY 窗口。READY 超时旋钮:- 启动单账号:
channels.discord.gatewayReadyTimeoutMs - 启动多账号:
channels.discord.accounts.<accountId>.gatewayReadyTimeoutMs - 配置未设置时的启动环境变量回退:
OPENCLAW_DISCORD_READY_TIMEOUT_MS - 启动默认值:
15000(15 秒),最大值:120000 - 运行时单账号:
channels.discord.gatewayRuntimeReadyTimeoutMs - 运行时多账号:
channels.discord.accounts.<accountId>.gatewayRuntimeReadyTimeoutMs - 配置未设置时的运行时环境变量回退:
OPENCLAW_DISCORD_RUNTIME_READY_TIMEOUT_MS - 运行时默认值:
30000(30 秒),最大值:120000
权限审计不匹配
权限审计不匹配
channels status --probe 权限检查仅适用于数字频道 ID。如果你使用 slug 键,运行时匹配仍可工作,但 probe 无法完整验证权限。私信和配对问题
私信和配对问题
- 私信已禁用:
channels.discord.dm.enabled=false - 私信策略已禁用:
channels.discord.dmPolicy="disabled"(旧版:channels.discord.dm.policy) - 在
pairing模式中等待配对批准
机器人到机器人循环
机器人到机器人循环
Voice STT 因 DecryptionFailed(...) 丢弃
Voice STT 因 DecryptionFailed(...) 丢弃
- 保持 OpenClaw 为当前版本(
openclaw update),确保 Discord 语音接收恢复逻辑可用 - 确认
channels.discord.voice.daveEncryption=true(默认) - 从
channels.discord.voice.decryptionFailureTolerance=24(上游默认值)开始,仅在需要时调整 - 查看日志中的:
discord voice: DAVE decrypt failures detecteddiscord voice: repeated decrypt failures; attempting rejoin
- 如果自动重新加入后故障仍然持续,请收集日志,并与 discord.js #11419 和 discord.js #11449 中的上游 DAVE 接收历史进行对比
配置参考
主要参考:Configuration reference - Discord。高信号 Discord 字段
高信号 Discord 字段
- 启动/认证:
enabled、token、accounts.*、allowBots - 策略:
groupPolicy、dm.*、guilds.*、guilds.*.channels.* - 命令:
commands.native、commands.useAccessGroups、configWrites、slashCommand.* - 事件队列:
eventQueue.listenerTimeout(监听器预算)、eventQueue.maxQueueSize、eventQueue.maxConcurrency - Gateway 网关:
gatewayInfoTimeoutMs、gatewayReadyTimeoutMs、gatewayRuntimeReadyTimeoutMs - 回复/历史:
replyToMode、historyLimit、dmHistoryLimit、dms.*.historyLimit - 递送:
textChunkLimit、chunkMode、maxLinesPerMessage - 流式传输:
streaming(旧版别名:streamMode)、streaming.preview.toolProgress、draftChunk、blockStreaming、blockStreamingCoalesce - 媒体/重试:
mediaMaxMb(限制出站 Discord 上传,默认100MB)、retry - 操作:
actions.* - 在线状态:
activity、status、activityType、activityUrl - UI:
ui.components.accentColor - 功能:
threadBindings、顶层bindings[](type: "acp")、pluralkit、execApprovals、intents、agentComponents、heartbeat、responsePrefix
安全和运维
- 将 bot token 视为密钥(在受监督环境中优先使用
DISCORD_BOT_TOKEN)。 - 授予最小权限的 Discord 权限。
- 如果命令部署/状态已过期,请重启 Gateway 网关,并使用
openclaw channels status --probe重新检查。
相关
配对
将 Discord 用户与 Gateway 网关配对。
群组
群聊和允许列表行为。
频道路由
将入站消息路由到智能体。
安全
威胁模型和加固。
多 Agent 路由
将服务器和频道映射到智能体。
斜杠命令
原生命令行为。