项目类型

项目类别

最新

热搜企业:

Megatron-LM Python
Fork 0 关注 0

**Megatron**功能非常强大。目前,我们支持GPT2和BERT的模型并行、多模混合精度训练。 我们的代码库能够有效地训练一个72层83亿个参数的GPT2语言模型,该模型具有跨512个gpu的8路模型和64路数据并行性。我们发现,更大的语言模型能够在短短5个训练阶段就超越当前GPT2-1.5B wikitext。 为了训练BERT,我们的存储库在3天内对BERT Large在64 V100 gpus上进行训练。

原始仓库地址:https://github.com/NVIDIA/Megatron-LM.git

浏览量:1545 下载量:233 项目类别: 语义识别
over 1 year前更新

**MatchPyramid-for-semantic-matching**是论文“文本匹配作为图像识别”的一种简单的Keras实现。 具体地址为:https://arxiv.org/abs/1602.06359

原始仓库地址:https://github.com/ddddwy/MatchPyramid-for-semantic-matching.git

浏览量:1870 下载量:997 项目类别: 语义识别
over 1 year前更新
Fork 1 关注 4

AI 服务框架

原始仓库地址:https://github.com/xfyun/athenaserving.git

浏览量:535 下载量:2 项目类别: 语义识别
over 1 year前更新
porcupine Python
Fork 0 关注 0

本项目是基于深度学习的设备唤醒词检测功能。本项目的优点包括:1.使用在实际环境中训练的深度神经网络;2.紧凑且计算效率高,非常适合物联网;3.跨平台。它在定点ANSI C中实现,适用于RaspberryPi,Linux,Windows,Mac,iOS,Android等平台。

原始仓库地址:https://github.com/picovoice/porcupine.git

浏览量:71 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

本项目是一个用于对不同语音到文本引擎进行基准测试的极简且可扩展的框架。深度学习一直是语音识别技术最近发展的主要驱动力,但是由于物联网平台的严格计算/存储限制,它对基于云的引擎非常有利。Picovoice专有的深度学习技术可将这些改进转移到具有显着更低的CPU/内存占用量的IoT平台。

原始仓库地址:https://github.com/picovoice/speech-to-text-benchmark.git

浏览量:82 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

本项目用于快速语音克隆任务,能够在5秒钟内克隆语音以实时生成其他任意语音。该项目使用实时工作的声码器的从说话者验证到多说话者语音合成的转换学习(SV2TTS)的实现。SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。

原始仓库地址:https://github.com/corentinj/real-time-voice-cloning.git

浏览量:98 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

本项目使用深度学习自动识别音乐流派。本项目使用一个旨在创建可识别音乐流派的神经网络模型,为用户提供更好的音乐指引。同时该项目可以运行于浏览器中,为用于提供更好的可视化展示。

原始仓库地址:https://github.com/deepsound-project/genre-recognition.git

浏览量:68 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

本项目是使用3D卷积神经网络实现的唇语识别任务。该代码旨在提供用于视听匹配的耦合三维卷积神经网络的实现。唇语识别只是这项工作的一个具体应用。本项目所构建的视听识别(Audio-visual recognition,AVR)系统是利用从一个模态中提取的信息来补充缺失的信息,提高另一个模态的识别能力。

原始仓库地址:https://github.com/astorfi/lip-reading-deeplearning.git

浏览量:79 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

本项目是基于 TensorFlow 实习的语音转换模型。本项目是一个多对一的语音转换系统,首先采用一个音素分类网络,在每个时间步将某人的话语分类为一种音素类别;然后是一个语音合成网络,从电话合成目标说话者的语音。

原始仓库地址:https://github.com/andabi/deep-voice-conversion.git

浏览量:63 下载量:0 项目类别: 语义识别
about 1 year前更新
Fork 0 关注 0

该项目是基于 TensorFlow 实现的音乐源分离模型。音乐源分离是一种将声音与音乐(例如流行音乐)分离的任务。本项目使用了Posen的深度递归神经网络,并结合iKala数据集和MIR-1K数据集进行共同训练,取得了显著的效果。

原始仓库地址:https://github.com/andabi/music-source-separation.git

浏览量:59 下载量:0 项目类别: 语义识别
about 1 year前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie