文章来源于互联网:声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。
Sesame 官方博客中正式写道他们的研究跨越恐怖谷效应,来源:https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice

-
项目地址:https://github.com/SesameAILabs/csm
-
huggingface 地址:https://huggingface.co/spaces/sesame/csm-1b


文章来源于互联网:声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷