文章来源于互联网:AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
-
论文地址:https://arxiv.org/abs/2409.13832 -
项目主页:https://gtsinger.github.io/ -
开源数据:https://huggingface.co/datasets/GTSinger/GTSinger -
开源代码:https://github.com/GTSinger/GTSinger
图 1:现有开源歌唱数据集的信息表。Speech 表示配对朗读数据。Align 和 RMS 分别表示人工音素对齐和真实乐谱。Style 表示全局风格标签。

-
基本信息:Chinese, ZH-Alto-1, Mixed Voice and Falsetto, 逆光 -
全局风格:fast, medium, pop, happy -
歌词:离开释怀 很短暂又重来 有时候自问自答
混声组:
假声组:
朗读: 
-
基本信息:English, EN-Alto-2, Breathy, Yesterday Once More -
全局风格:slow, medium, pop, happy -
歌词:when I was young i’d listen to the radio
气声组:
朗读: 










