自定义音频采集与渲染
功能简介
自定义音频采集
以下情况时,建议使用自定义音频采集功能:
- 客户需要从现有音频流、音频文件、或者定制的采集系统中获得采集后输入,交给 SDK 传输。
- 客户有自己对 PCM 输入源做特殊的音效处理的需求,在音效处理后输入,交给 SDK 传输。
自定义音频渲染
当客户有自己渲染的需求,例如对拉取到的原始 PCM 数据做特殊应用或者处理后再渲染,建议使用 SDK 的自定义音频渲染功能。
音频的采集和渲染分为 3 种情况:
- 内部采集、内部渲染
- 自定义采集、自定义渲染
- 自定义采集、内部渲染
开发者请根据自己的业务场景,选择合适的音频采集和渲染方式。
示例源码下载
请参考 下载示例源码 获取源码。
相关源码请查看 “/ZegoExpressExample/Examples/AdvancedAudioProcessing/CustomAudioCaptureAndRendering” 目录下的文件。
使用步骤
下图为 API 接口调用时序图:

1 初始化SDK
请参考 快速开始 - 实现流程 的 “创建引擎”。
2 开启自定义音频采集渲染
可调用 ZegoCustomAudioConfig 设置 sourceType = ZEGO_AUDIO_SOURCE_TYPE_CUSTOM
,再调用 enableCustomAudioIO 接口开启自定义音频 IO 功能。
调用示例:
// 设置音频源为自定义采集渲染
ZegoCustomAudioConfig audioConfig;
audioConfig.sourceType = ZEGO_AUDIO_SOURCE_TYPE_CUSTOM;
engine->enableCustomAudioIO(true, &audioConfig);
3 登录房间后推/拉流
请参考 快速开始 - 实现流程 的 “登录房间”、“推流” 和 “拉流”。
4 采集音频数据
将采集到的音频数据通过 sendCustomAudioCaptureAACData 或 sendCustomAudioCapturePCMData 传递给引擎。
5 渲染音频数据
使用 fetchCustomAudioRenderPCMData 从引擎中获取音频数据,拿到音频数据后再通渲染设备播放。
常见问题
-
调用自定义音频采集渲染相关接口的时机?
- enableCustomAudioIO:应该在引擎启动前开始调用,即开始预览、推拉流之前。
- sendCustomAudioCaptureAACData/sendCustomAudioCapturePCMData:应该在开始预览和推流后调用。如果在开始预览、推流前调用,SDK 内部会直接丢弃收到的数据。
- fetchCustomAudioRenderPCMData:应该在调用了开始拉流后调用,在开始拉流前获取到的都是无效的静音数据。
-
调用自定义音频采集渲染相关接口的频率?
最优的方式是按照物理音频设备的时钟驱动,在物理采集设备采集到数据的时候调用 sendCustomAudioCaptureAACData 和 sendCustomAudioCapturePCMData;在物理渲染设备需要数据时调用 fetchCustomAudioRenderPCMData。如果开发者的实际场景中没有具体的物理设备来驱动,建议每 10 ~ 20 ms 调用一次上述接口。
-
调用 fetchCustomAudioRenderPCMData,如果 SDK 内部数据不足 “dataLength” 时, SDK 如何处理?
在保证 “param” 填写正常的情况下,当 SDK 内部的数据不足 “dataLength” 时,不足的剩余长度按照静音数据补齐。