logo
当前页

发布日志

2026-01-23

2026-01-21

v2.2.0
  1. 支持在完成语音识别的基础上实现翻译能力。
  • 目前支持翻译的粒度:房间级别、流级别
  • 目前已支持的翻译模型包括 doubao-seed-translation、Qwen-MT 等 注意:这些翻译模型的鉴权信息请自行购买后通过创建任务。详细请查看配置翻译
  1. 支持识别结果和翻译结果通过 RTC 房间信令流式字幕下发。通过创建识别任务时配置 SubtitleType 字段,即可从 ZEGO Express SDK 的 RTC 房间消息获取到流式识别结果或翻译结果。详细可查看显示字幕

2025-12-04

v2.1.0
  1. 支持创建语音识别任务时,指定识别某些流。可实现房间内仅识别某些指定用户的音频流。

2025-11-12

v2.0.0
  1. 支持单 RTC 房间无上限用户数量进行语音识别。

  2. 新增阿里云百炼语音识别能力。支持中文(普通话 / 方言)、粤语、英语、日语、韩语等,含 2 类模型(需联系 ZEGO 商务开通,配置 vendor 选择模型):

    • Paraformer:适配噪音环境、中文方言场景
    • Gummy:适配多语种混合场景,及德语、法语、俄语、意大利语、西班牙语场景

    详情请参考配置 ASR

  3. 新增微软实时语音识别能力。支持英语、法语、德语、西班牙语等一系列海外语言。(需联系 ZEGO 商务开通)

    详情请参考配置 ASR

2025-07-25

v1.0.0

全新发布。针对 RTC 房间内的所有音频流进行实时语音识别,将语音转为文字,可实现在线会议实时字幕、多语种语聊房互动、全球直播字幕等场景。

  1. 识别延迟600ms左右
  2. 识别准确度提升40%+
  3. 相较于传统识别方案,成本降低50%+

上一篇

定价

下一篇

快速接入

当前页

返回到顶部