|
|
8c7b9b45fd
|
feat: 启用豆包二遍识别模式以提升实时性和准确率
- 切换到 bigmodel_async endpoint 并启用 enable_nonstream
- 第一遍流式识别提供实时文字预览
- VAD 分句后自动触发第二遍非流式识别提升准确率
- 修改文本处理逻辑从累加改为替换(适配 full 模式)
- 统一配置字段命名:app_key → app_id, access_key → access_token
|
2026-03-01 21:34:54 +08:00 |
|
|
|
bfaa792760
|
fix: 修复语音停顿导致提前粘贴的问题(累积文本,松开按钮才粘贴)
|
2026-03-01 06:34:55 +08:00 |
|
|
|
350e405fac
|
feat: ASR 从双向流式切换为流式输入模式(bigmodel_nostream)
- endpoint 从 bigmodel_async 改为 bigmodel_nostream
- 二进制协议去掉 sequence 字段,初始请求和音频帧均不带序号
- 最后一帧使用 FlagLastNoSeq 标志
- RequestMeta 新增 result_type=single、end_window_size=400
- ShowUtterances 关闭(nostream 模式不需要)
- readLoop 简化:nostream 模式下直接返回 final 结果
|
2026-03-01 06:12:58 +08:00 |
|
|
|
75abe72bf6
|
fix: 修复停止录音后未等待豆包返回最终结果,导致历史记录和自动粘贴失效
|
2026-03-01 04:21:57 +08:00 |
|
|
|
2ce0323ba5
|
fix: 修复豆包 ASR 音频格式字段,format 应为 pcm,codec 应为 raw
|
2026-03-01 04:01:46 +08:00 |
|
|
|
35032c1777
|
feat: add Doubao ASR client and paste module
|
2026-03-01 03:03:46 +08:00 |
|