时间: 2025-02-07 10:42:49 作者; 江南客户端下载
金融界2024年12月2日音讯,国家知识产权局信息显现,北京优趣韶光文明科技有限公司请求一项名为“根据声纹的动画人物智能同步用户办法”的专利,公开号 CN 119048650 A,请求日期为2024年8月。
专利摘要显现,本发明触及根据声纹的动画人物智能同步用户办法,详细触及多模态数据处理范畴,使用高清摄像头收集用户形象数据,并对用户形象数据进行缩放、像素点方位的匹配和填充,经过直方图均衡化增强图画对比度,使用高斯滤波加权对用户形象数据存在噪声进行去除,使用户形象数据在固定尺度下坚持明晰,而且细节丰厚,构建卷积神经网络根据动画的主色调和人物形象输出终究的用户虚拟形象,使用麦克风收集用户声纹数据,经过傅里叶变换对每个窗口的声响信号进行频谱表明,构建 Transformer 编码器并增加自注意力机制和前馈神经网络,将用户虚拟形象和用户声纹转化的动画语音进行同步并主动替换,为用户供给更个性化和沉溺式的交互体会。
江南客户端下载