据官方介绍,新一代HAM-TTS语音合成大模型率先突破数据收集难题,将训练数据量扩增至超65万小时,将参数量扩增至8亿。此外,吉利还采取了巧妙的数据增强策略。即通过拼接、替换等方式在训练数据中人为设置“噪音”,以此提升语音合成大模型对音色的辨识能力,让合成出来的音频音色更稳定、更连贯,更接近于人声。
星瑞即通过拼接、替换等方式在训练数据中人为设置“噪音”
摘要来自:《吉利新一代HAM-TTS语音合成大模型正式发布 具备声音》
【易车摘要频道】下列精选内容摘自于《吉利新一代HAM-TTS语音合成大模型正式发布 具备声音》的片段:
相关摘要