数智人创作平台
  • 产品简介
    • 概述
    • 发布日志
    • 计费说明
  • 创作数智人视频
  • 查看权益
  • 调整音频
  • 形象声音采集指南
  • 企业账号管理平台
  • 文档中心
  • 数智人创作平台
  • 调整音频

调整音频

更新时间:2023-12-20 15:55

针对不同驱动生成的音频,您可以实现以下操作。

文本驱动生成的音频

如果对 文本驱动 生成的音频不满意,如停顿不当、音色不合适或读音不准确,您可以单击文本驱动的分镜台词编辑窗口,进入“数智人配音文本”弹窗,通过以下步骤进行修改。

插入停顿

  1. 鼠标单击需要停顿的地方,单击“插入停顿”按钮,即可插入停顿。

  2. 修改停顿长短。

    如果默认的停顿长度不符合您的需求,开启“读音检测”,单击需要修改的停顿,在下拉列表中即可修改长短或移除。

调整音色

单击“音色”按钮,即可修改音频的音色、语速、语调和音量。

相关说明如下所示:

属性 说明
音色
数智人的音色,只能选择与数值人性别一致的音色。如果您需要定制音色,请发送邮件至 aigc@zego.im 进行调整。
语速
数智人的说话速度,取值范围为 [-500, 500],默认为 0。取值越大,语速也快,反之亦然。
语调
数智人的说话语调,取值范围为 [-500, 500],默认为 0。取值越大,语调越高,反之亦然。
音量
数智人的说话音量,取值范围为 [0, 100],默认为 50。取值越大,声音越大,反之亦然。

调整读音

单击“读音检测”按钮,开启检测功能,平台会自动检测文本中是否存在多音字、数字、英文字母等可调节读音的内容。检测完毕后,可修改读音的字词会被添加橙色标记,单击即可选择其他读音。

调整示例:

多音字 数字 英文

语音驱动生成的音频

通过 语音驱动 上传音频后,您可以将其切分为多段音频,用于多个分镜。

切分台词

您可以单击分镜音频的“切分台词”按钮,进入“切分台词”弹窗,通过以下步骤进行修改。

  1. 播放音频,单击“添加分镜点”,即可划分音频。

  2. 如果划分分镜错误,单击错误的分镜点,随后单击“垃圾桶”图标,即可删除该分镜点。

  3. 划分台词完毕后,单击保存。

    右侧音频驱动栏和底部出现新的分镜信息。

本篇目录