视频数字人采集指南
本文介绍如何获取您的形象和声音样本。
说明
形象和声音采集可以分开进行,不必使用相机录制声音。
前提条件
请提前发送邮件至 aigc@zego.im,开通形象定制或声音克隆服务。
形象采集
形象采集流程分为准备硬件、布置现场、拍摄模特和提交文件,共四个步骤。
1 准备硬件
请根据下列两种参数要求的其中一种要求,配置您的拍摄硬件。
参数要求 1 | 参数要求 2 | |
---|---|---|
录制规格 |
|
|
录制时长 | 大于 12 min | 大于 12 min |
相机编码格式、码率、采样标准 |
|
|
注意事项 | - | 当使用 1080p 分辨率录制时,请尽量让模特占据画面中更多像素点,同时避免人物肢体动作超出画面之外 |
2 布置现场
采集需要您使用绿幕布置现场,以便后续抠图。请务必保证绿幕平整无明显褶皱,可以使用卷轴纸背景,也可使用绿色幕布。
如果使用幕布,请用多个大力夹尽量扯平幕布,避免因褶皱受光不均致使后期扣图困难,影响最终效果。
3 拍摄模特
拍摄过程中,模特和导演需完成下表事项,以获得最佳效果。
模特要求
注意事项 | 详细说明 |
---|---|
造型 |
|
开头与结尾 | 在录制开始和结束前,模特都需要保持 10s 的静默姿势(静默姿势由您决定,嘴巴闭合,无静默姿势外的肢体动作,四肢保持静止),此静默姿势也适用于录制中的节奏性停顿。 |
节奏型停顿 | 模特需要在 3-4 句话之间保持约 2s 的停顿,嘴巴闭合,肢体动作回到静默姿势。 |
录音和嘴型 |
|
头部动作 |
|
肢体动作 | 在拍摄过程中,模特可以使用肢体动作,使整体观感生动、富有表现力。但是,如果违反以下任意一条规则,需要重新采集:
|
导演注意事项
注意事项 | 详细说明 |
---|---|
演员应表现自然、具有表现力 |
|
影响绿幕拍摄成片效果的细节 |
|
与模特建立基本的默契 |
|
注意模特的妆容变化 | 当模特拍摄多次 NG 后,面部出油,镜头中形象开始变化,导演应当及时提醒模特进行补妆或者扑粉。 |
4 提交文件
录制完毕后,请将影像文件提交给 ZEGO 相关人员,并注明使用的摄像机品牌,以及是否使用 log 模式。
布光方案参考
以下提供一种布光方案以供参考:直播间布光 4步打造高品质绿幕抠像直播间。这种方案,采用双边侧逆光打轮廓的方式,有助于在场地存在限制(人物距离绿幕距离不够远 ≤4m)时消除人物表面的绿色反光。而人物前方的主光、辅光则可以根据拍摄主题进行调整
声音采集
声音采集流程分为准备文稿、准备录音设备、开始录音和录音结束并提交,共四个步骤。
1 准备文稿
声音采集所用文稿需符合以下要求:
-
字数 6000 字以上。
-
内容符合数字人的应用行业/场景语境。
-
请参考如下模板,调整文稿格式,插入停顿和提示说明。
2 准备录音设备
- 建议使用 Rode/DJI/Sony/猛犸等平台的专业麦克风。
- 如果使用相机录音,请将相机录音设置为手动模式。
- 使用电脑连接麦克风录音,请调整麦克风或声卡设置。
- 调整好与麦克风的距离和位置,确保说话不喷麦即可。
3 开始录音
开始录音后,请确保达成以下要求:
- 背景无杂音、噪音等。
- 诵读文稿的情绪符合期望,并保持一致。
- 发音清晰、吐字清楚、断句清楚,每句之间停顿 2s。
4 录音结束并提交
录音结束后,请完整播放检查一遍,是否满足以下有效音频标准。
标准项目 | 详细说明 |
---|---|
音频时长、格式等参数 |
|
音频音质 |
|
人物口播 |
|