跟猫说话的语音_跟猫说话的语音神器
科大讯飞申请多说话人语音识别专利,有效提升对混合语音的识别结果...金融界2024 年7 月23 日消息,天眼查知识产权信息显示,科大讯飞股份有限公司申请一项名为“多说话人语音识别方法、装置、相关设备及计算机程序产品“公开号CN202410590383.6,申请日期为2024 年5 月。专利摘要显示,本申请公开了一种多说话人语音识别方法、装置、相关设是什么。
科大讯飞申请语音识别专利,提升了目标说话人语音识别结果的准确度金融界2024年7月5日消息,天眼查知识产权信息显示,科大讯飞股份有限公司申请一项名为“特定说话人语音识别方法、装置、相关设备及计算机程序产品”,公开号CN202410520839.1,申请日期为2024年4月。专利摘要显示,本申请公开了一种特定说话人语音识别方法、装置、相关设备好了吧!
o(╯□╰)o
哔哩哔哩申请语音转换专利,可以直接将用户说话的语音转换成语音...所述第一静音/非静音数据及目标用户的第一音色特征数据输入至训练好的语音转换模型中,得到目标梅尔频谱;将所述目标梅尔频谱输入至声码器中,得到目标语音,所述目标语音音频中的音色为所述目标用户的音色。本申请可以直接将用户说话的语音转换成语音内容不变但具有目标用户小发猫。
ˋ0ˊ
携程网申请语音识别专利,解决旁边人说话的干扰问题,提高了语音对话...金融界2024年3月30日消息,据国家知识产权局公告,携程旅游网络技术(上海)有限公司申请一项名为“说话人的语音识别方法、系统、电子设备及存储介质“公开号CN117789728A,申请日期为2023年12月。专利摘要显示,本发明公开了一种说话人的语音识别方法、系统、电子设备及存是什么。
中国电信申请说话人日志记录方法、装置、存储介质和电子设备专利,...本申请公开了一种说话人日志记录方法、装置、存储介质和电子设备。包括:获取目标音频数据,其中,目标音频数据中包括多个说话人的对话语音;按照时间顺序将目标音频数据划分为多个目标音频帧,并提取每个目标音频帧内的目标声学特征,其中,每个目标音频帧对应一个目标时间段,目是什么。
∪^∪
平安(深圳)申请语音合成方法、语音合成装置、电子设备及存储介质...语音合成装置、电子设备及存储介质“公开号CN202410841463.4,申请日期为2024 年6 月。专利摘要显示,本申请提出的语音合成方法、语是什么。 根据目标音色向量和目标内容向量进行解码,得到目标合成语音数据。本申请能够保证语音合成的质量,且能够针对任意说话对象进行语音转换是什么。
视源股份申请语音内容表示提取相关专利,提高语音说话内容的提取效果以使自编码器能够从输入的语音信号中提取出语音内容表示,而忽略语音信号中的韵律结构。后续在提取原始语音信号时,首先从原始语音信号提取出第一梅尔频谱,并将第一梅尔频谱输入到设置好的自编码器,利用自编码器将与说话人相关的语音表示转换为说话人无关的语音内容表示,从等会说。
...语音识别模型专利,提高噪声场景或者多说话人的场景中的语音识别效果基于所述语音特征向量和所述含噪语音特征向量,调整所述初始语音识别模型的模型参数,得到所述语音识别模型。本发明实施例提供的语音识别模型的训练方法、语音识别方法、装置和设备能够提高噪声场景或者多说话人的场景中的语音识别效果。本文源自金融界
...世界申请语音生成方法专利,生成较为自然的带有情感表达的特定说话...本申请公开了一种语音生成方法、装置、电子设备及计算机可读存储介质,涉及互联网技术领域,在构建语音生成模型的过程中额外引入了描述语音特点的音素持续时长和样本语音特征信息同时进行监督训练,使得语音生成模型能够生成较为自然的带有情感表达的特定说话人的高质量语音还有呢?
腾讯公司取得说话人日志模型的训练方法、装置、设备及存储介质专利...将特征序列及估计吸引子序列输入至说话人日志模型中得到估计说话人类别概率;基于估计说话人类别概率及真实标签,计算第一损失函数值;基于第一损失函数值对模型参数进行更新。通过上述方法,使得训练好的说话人日志模型能够具备更高的语音信号识别精度,从而生成更加准确的说还有呢?
原创文章,作者:上海汇犇奔科技有限公司,如若转载,请注明出处:http://fsdfs.cn/74ipogua.html