实时音视频

产品简介

计费说明

实时音视频 SDK 与实时语音 SDK 差异

客户端 SDK

升级指南

常见错误码

快速开始

跑通示例源码

实现视频通话

场景化音视频配置

连接至 ZEGO 文档 MCP 服务

通信能力

视频能力

直播能力

合规文档

产品功能

2024-02-05

通信能力

基础功能

基础功能	功能描述	业务场景
音视频通话	用户加入同一个房间，并进行音视频通话。	1v1 视频通话多人视频会议
音视频直播	同一个房间，包含主播及观众，主播可以进行音视频直播，该房间内的观众可以观看直播。	秀场直播游戏直播电商直播
用户权限控制	使用 Token 对用户进行权限控制，如：指定用户可以进房/退房；指定用户发言/静音；指定用户。	视频会议
通话前检测	在进行音视频通话或直播前，对摄像头、麦克风、显示器等进行设备检测，确保通话或直播的正常运行。	正常的通话功能检测
通话质量监测	对音视频的质量进行检测，如分辨率、帧率、码率、采样率等多指标检测，确保质量稳定。	银行开户、远程鉴定等对音视频质量较高要求和限定的场景
网络测速	可在用户进行推/拉流前，检测上行和下行网络速度，判断当前网络环境下适合推/拉多大码率的音视频流。	通话场景、教育场景、直播场景

进阶功能

进阶功能	功能描述	业务场景
直播连麦	一个房间内，可以出现多个主播，进行同屏连麦直播。	多主播不同地区连麦多人 KTV 合唱秀场直播
多源采集	提供灵活易用的音视频采集源与通道管理能力，减少开发者的开发及维护成本。	视频会议、在线教育
同时推送多路流	一个用户可以推送多路音视频流，如分享屏幕的同时，将摄像头的视频流进行发送。	视频会议中播放 PPT 的同时，看到主讲人的画面
媒体补充增强信息（SEI）	文本信息与音视频内容打包在一起通过流媒体通道进行传输，以此实现文本数据与音视频内容的精准同步的目的。	视频画面的精准布局远端歌词同步直播答题
流量控制	ZEGO 业内领先技术。SDK 根据自己以及对端当前网络环境状态来动态调整视频推流的码率、帧率、分辨率，以及音频码率，自动适应当前网络环境及网络波动，从而保证视频能流畅发布。	所有希望有高质量实时音视频服务的场景
地理围栏	将音视频及信令数据传输限定在某一区域，用以满足地区数据隐私安全相关法规，即限定访问某一特定区域的音视频服务。	通话场景
音视频流加密	推流时对流进行加密，拉流时必须有与加密密钥一致的解密密钥。	需要加密流信息以保护通信安全的场景
游戏语音	模仿真实世界，人根据声音的方位及距离等因素，从而有不同的听觉感受，例如距离越远，声音越小等。同时可以对能接收到音源的人进行分组限定，例如房间中，分组进行讨论，不同组听不到彼此声音等。	元宇宙同一房间，分组交流或对战

房间能力

基础功能

基础功能	功能描述	业务场景
房间连接状态说明	判断用户在房间内的连接状态，以及各个连接状态的转化过程。	-
实时消息与信令	实时消息主要提供纯文本消息的收发功能，可向同一房间内的其他用户发送广播消息和弹幕消息，或者对某些指定用户发送自定义消息，并可以根据需要自行实现点赞、送礼物、答题等互动功能。	秀场直播语聊房

进阶功能

进阶功能	功能描述	业务场景
登录多房间	一个用户可以同时进入多个房间进行音视频通话或观看直播。	老师多班在线教学

音频能力

基础功能

基础功能	功能描述	业务场景
音频频谱与音量变化	音频频谱：即数字音频信号在各频点的能量值。音量变化：即某条流音量的大小。	判断麦上的用户谁在说话、麦克风、扬声器等是否可用音频频谱动画展示等
耳返与声道设置	耳机采集监听，在设备上插入耳机（普通耳机或蓝牙耳机）后，能从本机耳机侧听到本设备麦克风采集的声音。双声道，指两个声音通道，听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置。	秀场直播情感 FM 音乐教学等较为专业场景
音频 3A 处理	在实时音视频通话或直播时，可以对音频进行 3A 处理，以提高通话或直播质量和用户体验。 AEC（回声消除）：对采集到的音频数据进行过滤以减少音频中的回声。 AGC（自动增益控制）：开启该功能后，SDK 能够自动调节麦克风音量，适应远近拾音，保持音量稳定。 ANS（降噪）：识别声音中的背景噪声并进行消除，开启该功能后可以使人声更加清晰。	所有希望有高质量实时音视频服务的场景
变声/混响/立体声	为增加趣味性和互动性，用户可以通过变声来搞怪，通过混响烘托气氛，通过立体声使声音更具立体感。 ZEGO Express SDK 提供了多种预设的变声、混响、混响回声、立体声效果，开发者可以灵活设置自己想要的声音。	直播语聊房 K 歌房匿名社交游戏娱乐角色扮演

进阶功能

进阶功能	功能描述	业务场景
自定义音频采集	开发者可以自行获取音频信息后，交给 SDK 进行传输。	在线或本地音频文件传输定制采集系统的音频文件进行传输
自定义音频渲染	音频的由开发者自行渲染后进行播放。	开发者有自己的特殊渲染需求
自定义音频处理	开发者可以自行进行音频特殊处理。	有 SDK 无法满足的特殊的声音处理需求时，如特殊变声
原始音频数据获取	获取原始音频录制的功能，获取的原始音频数据格式为 PCM。	音频数据留存或特殊处理

视频能力

基础功能

基础功能	功能描述	业务场景
常用视频配置	在视频通话或直播时，自定义设置采集及播放的视频的相关配置，如视频采集分辨率、视频编码输出分辨率、视频帧率、码率、视图模式和镜像模式等。	视频通话直播场景
视频画面旋转	用户使用移动设备进行直播或视频通话时，可以采用不同的视频采集方向，并且可以根据对端用户的摄像头方向的角度进行适配调整。	多类型设备视频通话、直播场景，需要最佳的视频播放角度的场景
屏幕共享	视频通话或互动直播过程中将屏幕内容以视频的方式共享给房间内的其他用户。	视频会议游戏直播
水印和截图	可以在视频画面上添加版权 Logo 等水印。	有版权的视频分享等

进阶功能

进阶功能	功能描述	业务场景
设置视频编码方式	可对视频的编解码进行详细设置，包括启用分层视频编码、使用硬件编解码和设置编码方式等。	对编解码有特殊要求时
设置视频编码属性	ZEGO Express Web SDK 支持 H.264 和 VP8 两种视频编码格式，开发者在视频通话时可以根据业务场景需要选择适合的视频编码格式，使不同端之间进行编码对齐，实现多端互通。	视频通话
自定义视频采集	自定义向 ZEGO Express SDK 提供视频输入源输入视频数据，并由 ZEGO Express SDK 进行编码推流的功能。	使用了第三方美颜厂商的美颜 SDK 摄像头无法被 SDK 正常使用直播非摄像头采集的数据
自定义视频前处理	开发者自行对视频数据进行自定义的前处理。	美颜、添加挂件等操作
主体分割	ZEGO 业内领先技术。在推流端将矩形视频内的主体（多数情况下是人）通过 AI 算法分离出来并在 RTC 网络中传输、在拉流端渲染。	多人异地同台、秀场直播同台 PK、多人在线自习等多人同台场景
H.265	通过更加先进的 H.265 编码技术，在相同码率的情况下，提供更高的清晰度。	网络环境较差下需要较高的音视频通话、直播体验对带宽较为敏感

直播能力

基础功能

基础功能	功能描述	业务场景
混流	把多人的多路视频流混流为一路流，从而只需要拉取一条流就能看到房间内所有成员的画面，听到房间内所有成员的声音。	多人通话主播连麦
使用 CDN 直播	统一接入多家 CDN 能力，该功能支持推流到 CDN，打通 RTC 产品和 CDN 直播产品，方便用户从网页或第三方播放器直接观看直播内容。	高并发的基础直播、对直播延迟无强要求的场景
通过 URL 拉流	当推流端使用第三方推流工具（例如 OBS 软件、网络摄像头 IP Camera 等）将流推到 CDN 时，或通过使用 ZEGO SDK 转推 CDN 功能将音视频画面推送到第三方 CDN 上时，可使用直接传入 URL 地址的方式进行拉流。	第三方直播画面获取

其他能力

基础功能

基础功能	功能描述	业务场景
媒体播放器	提供播放音视频媒体文件的能力，并且支持将播放的媒体文件的音画数据推流出去。	播放测试音频播放背景音乐播放视频文件
音效文件播放器	提供音效播放器，并进行音效统一管理，实现增强真实感或者烘托场景氛围播放的简短效果音的播放控制等效果。	秀场直播游戏娱乐
音视频录制	在进行视频通话、直播、在线教学时，用户经常需要将视频录制保存下来，方便后续其他用户点播观看。ZEGO 提供了多种录制方案，满足不同场景下的录制需求。	会议录制直播录制通话录制在线课堂录制
摄像头变焦	通过 SDK 设置摄像头的变焦倍数，可实现拍摄时放大远方物体的效果。	户外直播

当前页

返回到顶部