实时语音
  • 平台类型
  • 框架 / 引擎
  • iOS
  • Android
  • macOS
  • Windows
  • Linux
  • Web
  • 小程序

概述

更新时间:2021-06-15 17:08

实时语音(Express Audio)是一款实时的音频互动服务产品,能够为开发者提供便捷接入、高清流畅、多平台互通、低延迟、高并发的音视服务,可以实现一对多,多对多的实时语音互动,秀场直播,语音会议等场景。

实时语音同时为开发者提供 4 行代码全平台极速接入音视频服务的能力,能够让开发者在 30 分钟内构建出拥有完美音频体验的产品和服务。

1 主要功能和场景

  • 基础功能

    主要功能 功能描述 业务场景
    直播推拉流 支持 RTMP、FLV、HLS 和 RTP 等协议,全球节点实现超低 100 ms 延迟,同时提供多 CDN 推流,自适应流控等功能。
    • 在线教育
    • 秀场直播
    直播连麦 支持多主播连麦,多人实时通讯等功能,可实现多达 32 路的连麦直播推拉流。
    • PK 连麦
    • 多人会议
  • 音频引擎

    主要功能 功能描述 业务场景
    回声消除 引擎中自带回声消除功能,在双讲情况下,各方语音清晰,双工体验良好,支持舒适,适度和激进三种回声消除模式。
    • 在线教育
    • 秀场直播
    噪音抑制 引擎中自带噪音抑制功能,它结合心理声学模型,能够提高 20 dB 以上的信噪比, 同时不损伤语音音质。
    • 在线教育
    • 秀场直播
    自动增益 引擎中自带自动增益功能,能够自动调节麦克风音量,适应远近拾音,在吵杂环境下带来良好的体验。
    • 在线教育
    • 秀场直播
    多种编码 支持多种硬编、多种软编,以适应多种应用场景和网络环境的编码要求。
    • 在线教育
    • 秀场直播
    多种解码 支持多种硬解、多种软解,以适应多种应用场景和网络环境的解码要求。
    • 在线教育
    • 秀场直播
  • 网络传输

    主要功能 功能描述 业务场景
    网络传输 QoS 实现冗余数据(FEC)和重传策略(ARQ)的动态平衡,一方面保障宽带的充分利用,另一方面不至于抢带宽造成链路自身拥塞。 全场景
    网络自适应 提供端到端的全链条优化算法,能根据当前网络情况预测网速并自动进行流控,支持弱网自适应推流和拉流。 全场景
    智能调节 码率和帧率的智能调节,保障了流畅性。 全场景
    抖动缓冲 在弱网环境下,利用良好的抖动缓冲策略找到延时与流畅的最佳契合点。 全场景

2 特性指标

特性 实时语音指标
SDK 包体积

Express-Audio SDK 安装包增量大小如下:

  • iOS(arm64):5.75 MB
  • Android(arm64):7.23 MB
  • Android(armv7):6.94 MB
  • macOS(x86_64):16.67 MB
  • Windows(x86):11.83 MB
  • Windows(x86_64):14.64 MB
多人音频 支持 32 路实时语音互动。
音频质量
  • 音频采样率:16 kHz ~ 48 kHz。
  • 支持单、双声道。
  • 回声消除:支持 10 路同时讲话。
海量并发 全球 200 多个 BGP 节点,提供稳定的跨国内容分发网络。

3 平台兼容

实时语音支持 iOS、Android、Windows、macOS、Web、小程序并支持平台间互通,具体的兼容性要求见下表。

平台 支持版本 支持架构
iOS 7.0 或以上版本
  • arm64
  • armv7
  • x86_64(模拟器)
Android 4.1 或以上版本
  • arm64-v8a
  • armeabi-v7a
  • x86
  • x86_64
Windows Windows 7 或以上版本
  • x86
  • x64
Linux
  • Ubuntu 16.04 或以上版本
  • CentOS
x86_64
macOS 10.10 或以上版本 x64
Web
  • Chrome 58 或以上版本
  • Firefox 56 或以上版本
  • Safari 11 或以上版本
  • Opera 45 或以上版本
  • QQ 浏览器 windows 10.1 或以上版本、macOS 4.4 或以上版本
  • 360 安全浏览器极速模式
-
小程序 支持 -