134 lines
6.6 KiB
Markdown
134 lines
6.6 KiB
Markdown
---
|
||
read_when:
|
||
- 解释流式传输或分块在渠道上的工作方式
|
||
- 更改块流式传输或渠道分块行为
|
||
- 调试重复/提前的块回复或草稿流式传输问题
|
||
summary: 流式传输 + 分块行为(块回复、草稿流式传输、限制)
|
||
title: 流式传输与分块
|
||
x-i18n:
|
||
generated_at: "2026-02-01T20:24:24Z"
|
||
model: claude-opus-4-5
|
||
provider: pi
|
||
source_hash: f014eb1898c4351b1d6b812223226d91324701e3e809cd0f3faf6679841bc353
|
||
source_path: concepts/streaming.md
|
||
workflow: 14
|
||
---
|
||
|
||
# 流式传输 + 分块
|
||
|
||
OpenClaw 有两个独立的"流式传输"层:
|
||
|
||
- **块流式传输(渠道):** 在助手生成内容时发送已完成的**块**。这些是普通的渠道消息(不是 token 增量)。
|
||
- **类 Token 流式传输(仅 Telegram):** 在生成过程中用部分文本更新**草稿气泡**;最终消息在结束时发送。
|
||
|
||
目前**没有真正的 token 流式传输**到外部渠道消息。Telegram 草稿流式传输是唯一的部分流式传输界面。
|
||
|
||
## 块流式传输(渠道消息)
|
||
|
||
块流式传输在助手输出可用时以粗粒度块发送。
|
||
|
||
```
|
||
Model output
|
||
└─ text_delta/events
|
||
├─ (blockStreamingBreak=text_end)
|
||
│ └─ chunker emits blocks as buffer grows
|
||
└─ (blockStreamingBreak=message_end)
|
||
└─ chunker flushes at message_end
|
||
└─ channel send (block replies)
|
||
```
|
||
|
||
图例:
|
||
|
||
- `text_delta/events`:模型流事件(对于非流式模型可能较为稀疏)。
|
||
- `chunker`:`EmbeddedBlockChunker`,应用最小/最大边界 + 断点偏好。
|
||
- `channel send`:实际的出站消息(块回复)。
|
||
|
||
**控制项:**
|
||
|
||
- `agents.defaults.blockStreamingDefault`:`"on"`/`"off"`(默认关闭)。
|
||
- 渠道覆盖:`*.blockStreaming`(以及按账户的变体)可按渠道强制 `"on"`/`"off"`。
|
||
- `agents.defaults.blockStreamingBreak`:`"text_end"` 或 `"message_end"`。
|
||
- `agents.defaults.blockStreamingChunk`:`{ minChars, maxChars, breakPreference? }`。
|
||
- `agents.defaults.blockStreamingCoalesce`:`{ minChars?, maxChars?, idleMs? }`(发送前合并流式块)。
|
||
- 渠道硬性上限:`*.textChunkLimit`(例如 `channels.whatsapp.textChunkLimit`)。
|
||
- 渠道分块模式:`*.chunkMode`(默认 `length`,`newline` 在空行(段落边界)处分割,然后再按长度分块)。
|
||
- Discord 软性上限:`channels.discord.maxLinesPerMessage`(默认 17)拆分过长的回复以避免 UI 裁剪。
|
||
|
||
**边界语义:**
|
||
|
||
- `text_end`:分块器发出块后立即流式传输;在每个 `text_end` 时刷新。
|
||
- `message_end`:等待助手消息完成后,再刷新缓冲输出。
|
||
|
||
`message_end` 在缓冲文本超过 `maxChars` 时仍会使用分块器,因此可能在最后发出多个块。
|
||
|
||
## 分块算法(低/高边界)
|
||
|
||
块分块由 `EmbeddedBlockChunker` 实现:
|
||
|
||
- **低边界:** 在缓冲区 >= `minChars` 之前不发出(除非强制)。
|
||
- **高边界:** 优先在 `maxChars` 之前分割;如果强制,则在 `maxChars` 处分割。
|
||
- **断点偏好:** `paragraph` → `newline` → `sentence` → `whitespace` → 硬断点。
|
||
- **代码围栏:** 永远不在围栏内分割;当在 `maxChars` 处被强制分割时,关闭并重新打开围栏以保持 Markdown 有效。
|
||
|
||
`maxChars` 会被限制在渠道的 `textChunkLimit` 以内,因此不会超过按渠道的上限。
|
||
|
||
## 合并(合并流式块)
|
||
|
||
当块流式传输启用时,OpenClaw 可以在发送前**合并连续的块**。这减少了"单行刷屏"的情况,同时仍提供渐进式输出。
|
||
|
||
- 合并会等待**空闲间隔**(`idleMs`)后再刷新。
|
||
- 缓冲区受 `maxChars` 限制,超出时会刷新。
|
||
- `minChars` 防止在积累足够文本之前发送微小片段(最终刷新始终发送剩余文本)。
|
||
- 连接符由 `blockStreamingChunk.breakPreference` 派生(`paragraph` → `\n\n`,`newline` → `\n`,`sentence` → 空格)。
|
||
- 渠道覆盖可通过 `*.blockStreamingCoalesce` 设置(包括按账户的配置)。
|
||
- 除非覆盖,Signal/Slack/Discord 的默认合并 `minChars` 会提升至 1500。
|
||
|
||
## 块之间的仿真人节奏
|
||
|
||
当块流式传输启用时,你可以在块回复之间(第一个块之后)添加**随机停顿**。这让多气泡回复感觉更自然。
|
||
|
||
- 配置:`agents.defaults.humanDelay`(通过 `agents.list[].humanDelay` 按智能体覆盖)。
|
||
- 模式:`off`(默认)、`natural`(800–2500ms)、`custom`(`minMs`/`maxMs`)。
|
||
- 仅适用于**块回复**,不适用于最终回复或工具摘要。
|
||
|
||
## "流式发送块还是一次性发送全部"
|
||
|
||
对应关系:
|
||
|
||
- **流式发送块:** `blockStreamingDefault: "on"` + `blockStreamingBreak: "text_end"`(边生成边发送)。非 Telegram 渠道还需要设置 `*.blockStreaming: true`。
|
||
- **结束时一次性发送:** `blockStreamingBreak: "message_end"`(刷新一次,如果内容很长可能产生多个块)。
|
||
- **不使用块流式传输:** `blockStreamingDefault: "off"`(仅最终回复)。
|
||
|
||
**渠道说明:** 对于非 Telegram 渠道,块流式传输**默认关闭**,除非 `*.blockStreaming` 显式设置为 `true`。Telegram 可以通过 `channels.telegram.streamMode` 进行草稿流式传输,无需块回复。
|
||
|
||
配置位置提醒:`blockStreaming*` 默认值位于 `agents.defaults` 下,而非根配置。
|
||
|
||
## Telegram 草稿流式传输(类 Token)
|
||
|
||
Telegram 是唯一支持草稿流式传输的渠道:
|
||
|
||
- 在**带话题的私聊**中使用 Bot API `sendMessageDraft`。
|
||
- `channels.telegram.streamMode: "partial" | "block" | "off"`。
|
||
- `partial`:用最新的流式文本更新草稿。
|
||
- `block`:以分块方式更新草稿(使用相同的分块器规则)。
|
||
- `off`:不进行草稿流式传输。
|
||
- 草稿分块配置(仅用于 `streamMode: "block"`):`channels.telegram.draftChunk`(默认值:`minChars: 200`,`maxChars: 800`)。
|
||
- 草稿流式传输与块流式传输是分离的;块回复默认关闭,仅在非 Telegram 渠道通过 `*.blockStreaming: true` 启用。
|
||
- 最终回复仍然是普通消息。
|
||
- `/reasoning stream` 将推理过程写入草稿气泡(仅 Telegram)。
|
||
|
||
当草稿流式传输处于活跃状态时,OpenClaw 会禁用该回复的块流式传输,以避免双重流式传输。
|
||
|
||
```
|
||
Telegram (private + topics)
|
||
└─ sendMessageDraft (draft bubble)
|
||
├─ streamMode=partial → update latest text
|
||
└─ streamMode=block → chunker updates draft
|
||
└─ final reply → normal message
|
||
```
|
||
|
||
图例:
|
||
|
||
- `sendMessageDraft`:Telegram 草稿气泡(不是真正的消息)。
|
||
- `final reply`:普通的 Telegram 消息发送。
|