|
|
b786d9f90b
|
feat: 实现本地热词管理,移除平台绑定
- 使用 corpus.context 参数直接传递热词列表(豆包文档支持)
- 移除 boosting_table_id 配置,避免绑定火山引擎控制台
- 实现 BuildHotwordsContext 函数,将本地热词转换为 JSON 格式
- 热词配置完全本地化,便于迁移到其他 ASR 平台
配置示例:
hotwords:
- 张三
- 李四
- VoicePaste
程序自动转换为豆包 API 要求的格式:
{"hotwords":[{"word":"张三"},{"word":"李四"},{"word":"VoicePaste"}]}
|
2026-03-02 01:36:14 +08:00 |
|
|
|
4120d6451e
|
refactor: 简化热词配置为豆包控制台 ID
- 移除本地热词列表配置,改为直接使用豆包控制台的热词表 ID
- 删除 internal/asr/hotwords.go(不再需要本地解析)
- 简化 client.go 逻辑,直接传递 boosting_table_id
- 移除 protocol.go 中的 boosting_table_name 字段
- 更新配置示例,添加控制台链接说明
使用方法:
1. 在豆包控制台创建热词表:https://console.volcengine.com/speech/hotword
2. 复制热词表 ID 到 config.yaml 的 boosting_table_id 字段
|
2026-03-02 01:16:34 +08:00 |
|
|
|
96d685fdf2
|
feat: 添加豆包 ASR 热词功能支持
- 在 config.yaml 中添加 hotwords 配置项,支持本地管理热词列表
- 实现热词解析、格式化和表名生成工具(internal/asr/hotwords.go)
- 在 ASR 连接建立时自动将热词发送给豆包(boosting_table_name 参数)
- 支持热词权重配置(1-10,默认 4),格式:"词|权重" 或 "词"
- 支持配置热重载,修改热词后新连接自动生效
- 为未来动态热词功能预留扩展接口
热词格式示例:
hotwords:
- 张三|8
- VoicePaste|10
- 人工智能|6
|
2026-03-02 00:55:37 +08:00 |
|
|
|
8c7b9b45fd
|
feat: 启用豆包二遍识别模式以提升实时性和准确率
- 切换到 bigmodel_async endpoint 并启用 enable_nonstream
- 第一遍流式识别提供实时文字预览
- VAD 分句后自动触发第二遍非流式识别提升准确率
- 修改文本处理逻辑从累加改为替换(适配 full 模式)
- 统一配置字段命名:app_key → app_id, access_key → access_token
|
2026-03-01 21:34:54 +08:00 |
|
|
|
bfaa792760
|
fix: 修复语音停顿导致提前粘贴的问题(累积文本,松开按钮才粘贴)
|
2026-03-01 06:34:55 +08:00 |
|
|
|
350e405fac
|
feat: ASR 从双向流式切换为流式输入模式(bigmodel_nostream)
- endpoint 从 bigmodel_async 改为 bigmodel_nostream
- 二进制协议去掉 sequence 字段,初始请求和音频帧均不带序号
- 最后一帧使用 FlagLastNoSeq 标志
- RequestMeta 新增 result_type=single、end_window_size=400
- ShowUtterances 关闭(nostream 模式不需要)
- readLoop 简化:nostream 模式下直接返回 final 结果
|
2026-03-01 06:12:58 +08:00 |
|
|
|
75abe72bf6
|
fix: 修复停止录音后未等待豆包返回最终结果,导致历史记录和自动粘贴失效
|
2026-03-01 04:21:57 +08:00 |
|
|
|
2ce0323ba5
|
fix: 修复豆包 ASR 音频格式字段,format 应为 pcm,codec 应为 raw
|
2026-03-01 04:01:46 +08:00 |
|
|
|
35032c1777
|
feat: add Doubao ASR client and paste module
|
2026-03-01 03:03:46 +08:00 |
|