超低延迟直播

产品简介

客户端 SDK

升级指南

常用错误码

计费说明

快速开始

直播能力

通信能力

房间能力

音频能力

视频能力

其他能力

最佳实践

合规文档

产品功能

直播能力

基础功能

基础功能	功能描述	业务场景
RTMP 推流到 ZEGO 服务器	在直播场景下，主播可以通过 RTMP 推流工具将音视频流推送到 ZEGO 服务器，实现低延迟的效果。	直播场景。
混流	把多人的多路视频流混合为一路流，从而只需要拉取一条流就能看到房间内所有成员的画面，听到房间内所有成员的声音。	多人通话主播连麦。

进阶功能

进阶功能	功能描述	业务场景
使用本地导播	在本地对画面和声音进行混合，将多路音视频流或页面元素、合并为一路音视频流后推流，助力开发者实现更丰富的场景。	直播场景。

通信能力

基础功能

基础功能	功能描述	业务场景
用户权限控制	使用 Token 对用户进行权限控制，如：指定用户可以进房/退房；指定用户发言/静音；指定用户。	视频会议。
通话质量监测	对音视频的质量进行检测，如分辨率、帧率、码率、采样率等多指标检测，确保质量稳定。	银行开户、远程鉴定等对音视频质量有较高要求和限定的场景。
网络测速	可在用户进行推/拉流前，检测上行和下行网络速度，判断当前网络环境下适合推/拉多大码率的音视频流。	通话场景、教育场景、直播场景。
设备检测	为了保证实时通信体验，通话或直播前可以进行设备检测，提前识别并排查问题。设备检测主要是检测本地麦克风、摄像头以及扬声器是否能正常工作。	通话场景、教育场景、直播场景。

进阶功能

进阶功能	功能描述	业务场景
直播连麦	一个房间内，可以出现多个主播，进行同屏连麦直播。	多主播不同地区连麦。多人 KTV 合唱。多人连麦直播。
同时推多路流	一个用户可以推送多路音视频流，如分享屏幕的同时，将摄像头的视频流进行发送。	视频会议中播放 PPT 的同时，看到主讲人的画面。
媒体补充增强信息（SEI）	文本信息与音视频内容打包在一起通过流媒体通道进行传输，以此实现文本数据与音视频内容的精准同步的目的。	视频画面的精准布局。远端歌词同步。直播答题。
云代理	通过设置 SDK 的云代理接口，将 SDK 对应的所有流量通过云端的代理服务器中转，实现与 RTC、L3（超低延迟直播）通信。	医院、政府、公司内部等有内网等限制性的网络环境中。
音视频轨道替换	在浏览器中，本地存在两条及以上的媒体流（音轨、视轨）时，可以通过 ZEGO Express Web SDK 自由组合媒体流包含的音视轨。	直播场景。
游戏语音	模仿真实世界，人根据声音的方位及距离等因素，从而有不同的听觉感受，例如距离越远，声音越小等。同时可以对能接收到音源的人进行分组限定，例如房间中，分组进行讨论，不同组听不到彼此声音等。	元宇宙。同一房间，分组交流或对战。

房间能力

基础功能

基础功能	功能描述	业务场景
房间连接状态说明	判断用户在房间内的连接状态，以及各个连接状态的转化过程。	-
实时消息与信令	实时消息主要提供纯文本消息的收发功能，可向同一房间内的其他用户发送广播消息和弹幕消息，或者对某些指定用户发送自定义消息，并可以根据需要自行实现点赞、送礼物、答题等互动功能。	秀场直播。语聊房。

进阶功能

进阶功能	功能描述	业务场景
登录多房间	一个用户可以同时进入多个房间进行音视频通话或观看直播。	老师多班在线教学。

音频能力

基础功能

基础功能	功能描述	业务场景
音频频谱与音量变化	音频频谱：即数字音频信号在各频点的能量值。音量变化：即某条流音量的大小。	判断麦上的用户谁在说话、麦克风、扬声器等是否可用。音频频谱动画展示。
耳返与声道设置	耳机采集监听，在设备上插入耳机（普通耳机或蓝牙耳机）后，能从本机耳机侧听到本设备麦克风采集的声音。	秀场直播。情感 FM。音乐教学等较为专业场景。
音频 3A 处理	在实时音视频通话或直播时，可以对音频进行 3A 处理，以提高通话或直播质量和用户体验。 AEC（回声消除）：对采集到的音频数据进行过滤以减少音频中的回声。 AGC（自动增益控制）：开启该功能后，SDK 能够自动调节麦克风音量，适应远近拾音，保持音量稳定。 ANS（降噪）：识别声音中的背景噪声并进行消除，开启该功能后可以使人声更加清晰。	所有希望有高质量实时音视频服务的场景。
变声/混响/立体声	为增加趣味性和互动性，用户可以通过变声来搞怪，通过混响烘托气氛，通过立体声使声音更具立体感。ZEGO Express SDK 提供了多种预设的变声、混响、混响回声、立体声效果，开发者可以灵活设置自己想要的声音。	直播语聊房 K 歌房匿名社交游戏娱乐角色扮演

进阶功能

进阶功能	功能描述	业务场景
混音	SDK 从 App 获取一路音频数据，将 App 提供的音频数据与 SDK 采集的音频数据整合为一路音频数据，从而实现在通话或直播过程中播放自定义的声音、音乐文件，并且让房间内的其他人也听到的能力。	社交语聊直播
AI 降噪	实时自动识别不同场景，智能调整 AI 降噪策略提供最佳的降噪及音质效果。通话场景下将除人声外的所有声音识别为噪音并进行消除。音乐场景下自动调整降噪效果还原音乐音质。	语音房、会议、语音开黑等 1v1 或多人音视频通话场景，以及声卡、弹唱、近场音乐的直播或者在线 KTV 场景。
自定义音频采集	开发者可以自行获取音频信息后，交给 Zego Express SDK 进行传输。	在线或本地音频文件传输。定制采集系统的音频文件进行传输。

视频能力

基础功能

基础功能	功能描述	业务场景
常用视频配置	在直播时，自定义设置采集及播放的视频相关配置，如视频采集分辨率、视频编码输出分辨率、视频帧率、视频码率、视图模式和镜像模式等。	对分辨率、码率、镜像等有特殊要求的场景。
基础美颜	当在视频通话或直播时，希望向对方呈现出良好的肌肤状态，可结合 AI 美颜实现基础美颜功能。	秀场直播音视频通话
屏幕共享	视频通话或互动直播过程中将屏幕内容以视频的方式共享给房间内的其他用户。	视频会议游戏直播

进阶功能

进阶功能	功能描述	业务场景
设置视频编码方式	可对视频的编解码进行详细设置，包括启用分层视频编码、使用硬件编解码和设置编码方式等。	对编解码有特殊要求时。
自定义视频采集	自定义向 Zego Express SDK 提供视频输入源输入视频数据，并由 Zego Express SDK 进行编码推流的功能。	使用了第三方美颜厂商的美颜 SDK。摄像头无法被 SDK 正常使用。直播非摄像头采集的数据。
背景虚化及虚拟背景	将视频画面中的主体从原始画面中分离出来，并对主体外的区域做如下处理：虚化主体外的区域以自定义图片替换主体外的区域	在线会议远程教育视频通话

其他能力

基础功能

基础功能	功能描述	业务场景
媒体播放器	提供播放音视频媒体文件的能力，并且支持将所播放的媒体文件的音画数据推流出去。	播放测试音频。播放背景音乐。播放视频文件。
音效文件播放器	提供音效播放器，并进行音效统一管理，实现对增强真实感或者烘托场景氛围的简短效果音的播放/控制等功能。	秀场直播。游戏娱乐。
音视频录制	本地媒体录制组件提供媒体本地录制的能力，把直播过程中的音视频数据录制存储到本地文件。	会议录制直播录制。

当前页

返回到顶部