自定义音频采集与渲染

2024-02-27

功能简介

自定义音频采集

以下情况时，建议使用自定义音频采集功能：

客户需要从现有音频流、音频文件、或者定制的采集系统中获得采集后输入，交给 SDK 传输。
客户有自己对 PCM 输入源做特殊的音效处理的需求，在音效处理后输入，交给 SDK 传输。

自定义音频渲染

当客户有自己渲染的需求，例如对拉取到的原始 PCM 数据做特殊应用或者处理后再渲染，建议使用 SDK 的自定义音频渲染功能。

注意

音频的采集和渲染分为 3 种情况：

内部采集、内部渲染
自定义采集、自定义渲染
自定义采集、内部渲染

开发者请根据自己的业务场景，选择合适的音频采集和渲染方式。

示例源码下载

请参考下载示例源码获取源码。

相关源码请查看 “/ZegoExpressExample/Examples/AdvancedAudioProcessing/CustomAudioCaptureAndRendering” 目录下的文件。

使用步骤

下图为 API 接口调用时序图：

1 初始化SDK

请参考快速开始 - 实现流程的 “创建引擎”。

2 开启自定义音频采集渲染

注意

enableCustomAudioIO 需要在 startPublishingStream、startPlayingStream、startPreview、createMediaPlayer、createAudioEffectPlayer 和 createRealTimeSequentialDataManager 之前调用才有效。

可调用 ZegoCustomAudioConfig 设置 sourceType = ZEGO_AUDIO_SOURCE_TYPE_CUSTOM，再调用 enableCustomAudioIO 接口开启自定义音频 IO 功能。

调用示例：

// 设置音频源为自定义采集渲染
ZegoCustomAudioConfig audioConfig;
audioConfig.sourceType = ZEGO_AUDIO_SOURCE_TYPE_CUSTOM;
engine->enableCustomAudioIO(true, &audioConfig);

// 设置音频源为自定义采集渲染
ZegoCustomAudioConfig audioConfig;
audioConfig.sourceType = ZEGO_AUDIO_SOURCE_TYPE_CUSTOM;
engine->enableCustomAudioIO(true, &audioConfig);

3 登录房间后推/拉流

请参考快速开始 - 实现流程的 “登录房间”、“推流” 和 “拉流”。

4 采集音频数据

将采集到的音频数据通过 sendCustomAudioCaptureAACData 或 sendCustomAudioCapturePCMData 传递给引擎。

5 渲染音频数据

使用 fetchCustomAudioRenderPCMData 从引擎中获取音频数据，拿到音频数据后再通渲染设备播放。

常见问题

调用自定义音频采集渲染相关接口的时机？
- enableCustomAudioIO：应该在引擎启动前开始调用，即开始预览、推拉流之前。
- sendCustomAudioCaptureAACData/sendCustomAudioCapturePCMData：应该在开始预览和推流后调用。如果在开始预览、推流前调用，SDK 内部会直接丢弃收到的数据。
- fetchCustomAudioRenderPCMData：应该在调用了开始拉流后调用，在开始拉流前获取到的都是无效的静音数据。
调用自定义音频采集渲染相关接口的频率？

最优的方式是按照物理音频设备的时钟驱动，在物理采集设备采集到数据的时候调用 sendCustomAudioCaptureAACData 和 sendCustomAudioCapturePCMData；在物理渲染设备需要数据时调用 fetchCustomAudioRenderPCMData。如果开发者的实际场景中没有具体的物理设备来驱动，建议每 10 ~ 20 ms 调用一次上述接口。
调用 fetchCustomAudioRenderPCMData，如果 SDK 内部数据不足 “dataLength” 时， SDK 如何处理？

在保证 “param” 填写正常的情况下，当 SDK 内部的数据不足 “dataLength” 时，不足的剩余长度按照静音数据补齐。