项目类型

项目类别

最新

热搜企业:

demucs Python
Fork 0 关注 0

我们提供了一个在MusDB数据集上实现音乐源分离的Demucs和Conv-Tasnet。他们可以分开鼓,低音和人声从其余与最先进的结果,超越之前的波形或声谱图的方法。本文详细介绍了波形域音乐源分离的结构和结果。 Demucs是受Wave-U-Net和SING的启发,基于U-Net卷积架构,其中GLUs是编码器和解码器之间的BiLSTM,用于特定的解码器的权值初始化和转置卷积。Conv-Tasnet是一种为语音开发的分离模型,它使用步幅为1的纯卷积模型和扩展的卷积块,预测在已学习过完备的线性表示上的掩模。我们重用了来自kaituoxu/Conv-TasNet存储库的代码,并添加了对多个音频通道的支持。

原始仓库地址:https://github.com/facebookresearch/demucs.git

浏览量:27 下载量:0 项目类别: 语音识别
4 months前更新
espnet Python
Fork 0 关注 0

ESPnet is an end-to-end speech processing toolkit, mainly focuses on end-to-end speech recognition and end-to-end text-to-speech. ESPnet uses chainer and pytorch as a main deep learning engine, and also follows Kaldi style data processing, feature extraction/format, and recipes to provide a complete setup for speech recognition and other speech processing experiments.

原始仓库地址:https://github.com/espnet/espnet.git

浏览量:23 下载量:0 项目类别: 语音识别
4 months前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie