近日,即构科技(ZEGO)SDK完成了新的迭代,新增变声、立体声(3D环绕)、混响三大功能,让玩家能体验到更多新鲜的玩法。
第一,变声功能
现在流行的吃鸡游戏中,萌妹子开语音玩,只要稍微撒个娇,就能收获队友送来的福利,如果是壮汉,就没这个待遇了。有些壮汉就想了各种办法,比如另外安装一个变声软件,伪装成萌妹子。如果游戏自带变声功能,是不是就不用这么麻烦?
又比如,在语聊房、私聊、在线K歌、连麦直播场景中,如果有变声功能,玩家用变声来搞怪,烘托气氛,不但能成功打破“尬聊”的局面,还能展示自己“一人千面”的个性,成为这个直播间最靓的仔。
为了让玩家使用变声,打造更多新鲜有趣的玩法,即构技术团队经过多日努力,终于在实时语音和实时视频SDK中正式上线变声功能。
变声的原理,是通过改变用户的音调和音色,使输出的声音在感官上与原始声音不同。即构的SDK,通过“变调不变速”的方法,改变说话人基频的大小,同时保持语速和语义不变,即保持短时频谱包络(共振峰的位置和带宽)和时间过程基本不变,来估算出变调后的声音波形,从而实现变声。
基于此,再在算法上不断优化,目前,即构推出的变声功能可模拟出萝莉、大叔、熊孩子等多种变声效果,实现男声变女声、女声变男声。另外,即构SDK开放了调节参数的接口,客户可根据自己的需要,随意设计更多特定的变声效果。
第二,立体声(3D环绕)功能
立体声功能可在电台、线上KTV、游戏竞技、在线教育等多个场景中应用,以线上KTV场景为例,用户在APP内演唱时采集到的声音属于单声道,没有声相和方向感,比较单调,加入立体声功能后,用户的K歌声音在相位、音色、音调上都有调整,增加了空间感和方向感,变得更加立体。
将手机采集到的单声道变成用户听到的立体声,需要把单声道的声音信号虚拟成立体声的。即构通过对声音传播路径进行建模,输入原始的波形数据,通过对推流声音的角度做设置,模拟出前方180度方位的声音来源,如左侧音、右侧音,同时也可以对角度进行持续性的调整,模拟出环绕音的效果。
第三,混响功能
混响在主播直播唱歌、线上K歌用得最多。现在市面上就有外置声卡(也叫直播声卡)提供混响的效果,主播在麦克风外接这个声卡后,在唱歌模式中唱出来的歌声就显得丰满、富有层次,带有空间感,听众就像在开阔的音乐厅听音乐剧一样,享受被被音乐包围的感觉,这就是混响音效的魅力。
即构SDK主要通过两个步骤实现混响效果:
1、通过指定延迟时间和衰减程度,以原始的声音波形为输入,产生多个延迟(模拟反弹回来的)波形;
2、把多个延迟波形和原始的波形进行叠加,产生最终有混响效果的声音波形。延迟波形的个数越多,叠加产生的声音波形就比较丰满和有层次感,混响的效果也越好。
有了即构直播SDK自带的混响功能,主播们在直播间直播时,不用在麦克风上再外接一个带混响的声卡,直播间的观众也能听到演唱会般效果。个人用户拿起手机打开K歌平台,就能随时随地K歌自嗨。
另外,即构混响功能也开放了调节参数的接口,除了提供的大堂、山谷、酒吧、会议室等多种模式外,用户也可以根据需要,自己任意调节混响效果。
后续,我们将针对这三大功能,陆续推出相关深度技术文章,和大家交流。
目前,即构SDK的变声、立体声(3D环绕)、混响三大功能,已集成在KTV解决方案中,长按下面二维码,下载Demo,即刻就能体验!