展示字幕

2026-07-13

功能介绍

本文介绍如何基于ZEGO的客户端的字幕组件，实现在语音通话、视频通话中，流式（打字机式）展示对应用户/音频流的字幕。

字幕组件中，涉及的核心字段说明如下：

字段	类型	描述
Timestamp	Number	时间戳，秒级别
SeqId	Number	包序列号，可能乱序，请根据序列号对消息进行排序。极端情况下 Id 可能不连续。
Round	Number	对话轮次，每次用户主动说话轮次增加
Cmd	Number	201: ASR 语音识别的文本 202: LLM 翻译的文本
Data	Object	具体内容，各 Cmd 对应不同 Data

Cmd 不同对应的 Data 也不同，具体如下：

已按照快速开始文档实现基础功能：
- 集成 ZEGO Express SDK 实现基本的语音通话功能。
- 基于云端实时语音识别，开启云端实时语音识别，并配置 SubtitleType（默认值为 0）为 1、2 或 3，从而将字幕通过房间信令下发。

注意

必须使用下载 SDK 及 Demo 页面针对 Cloud ASR 优化的 ZEGO Express SDK 版本，否则无法正常显示字幕。

可以通过筛选UserId等，实现仅展示某些用户或某些流的字幕。以仅显示其他人翻译后的字幕为例。

注意

建议您默认使用字幕组件实现。

客户端可通过监听 onRecvExperimentalAPI 回调获取 method 为 liveroom.room.on_recive_room_channel_message 的房间自定义消息。

根据 Cmd 字段判断消息类型，并根据 Data 字段获取消息内容。