项目类型

项目类别

最新

热搜企业:

senteval Python
Fork 0 关注 0

用于评估句子嵌入质量的python工具。 SentEval是一个评价句子嵌入质量的库。我们通过在广泛而多样的“转移”任务集上使用它们作为特征来评估它们的泛化能力。目前,SentEval包含17个下游任务。我们还包括了一套10个探究性任务,评估在句子嵌入中编码的语言属性。我们的目标是简化一般用途的固定大小句子表示法的研究和发展。

原始仓库地址:https://github.com/facebookresearch/senteval.git

浏览量:13 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
infersent Python
Fork 0 关注 0

InferSent是一种为英语句子提供语义表示的句子嵌入方法。它是在自然语言推理数据上训练的,并能很好地推广到许多不同的任务。 我们提供我们的预先训练的英语句子编码器从我们的论文和我们的SentEval评估工具包。

原始仓库地址:https://github.com/facebookresearch/infersent.git

浏览量:14 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
muse Python
Fork 0 关注 0

MUSE是一个多语言单词嵌入的Python库,其目标是为社区提供: 最先进的多语言单词嵌入(在公共空间对齐的fastText嵌入) 用于培训和评估的大型高质量双语词典. 我们包括两种方法,一种是监督的,使用双语字典或相同的字符串,另一种是不使用任何并行数据的非监督的(更多细节见无并行数据的单词翻译)。

原始仓库地址:https://github.com/facebookresearch/muse.git

浏览量:12 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
Fork 0 关注 0

Effective Transformer is built on top of the NVIDIA open sourced project FasterTransformer with many advanced optimizations. Our experiments show Effective Transformer can significantly reduce the execution time and memory consumption, especially for large batch size cases.

原始仓库地址:https://github.com/bytedance/effective_transformer.git

浏览量:12 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
chinesenlp HTML
Fork 0 关注 0

Datasets, SOTA results of every fields of Chinese NLP

原始仓库地址:https://github.com/didi/chinesenlp.git

浏览量:14 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
familia C++
Fork 0 关注 0

Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用户以“拿来即用”的方式进行文本分类、文本聚类、个性化推荐等多种场景的调研和应用。考虑到主题模型训练成本较高以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和落地。

原始仓库地址:https://github.com/baidu/familia.git

浏览量:24 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
ddparser Python
Fork 0 关注 0

DDParser(Baidu Dependency Parser)是百度自然语言处理部基于深度学习平台飞桨(PaddlePaddle)和大规模标注数据研发的依存句法分析工具。其训练数据不仅覆盖了多种输入形式的数据,如键盘输入query、语音输入query,还覆盖了多种场景的数据,如新闻、论坛。该工具在随机评测数据上取得了优异的效果。同时,该工具使用简单,一键完成安装及预测。

原始仓库地址:https://github.com/baidu/ddparser.git

浏览量:17 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
Fork 0 关注 0

NeuralClassifier is designed for quick implementation of neural models for hierarchical multi-label classification task, which is more challenging and common in real-world scenarios. A salient feature is that NeuralClassifier currently provides a variety of text encoders, such as FastText, TextCNN, TextRNN, RCNN, VDCNN, DPCNN, DRNN, AttentiveConvNet and Transformer encoder, etc. It also supports other text classification scenarios, including binary-class and multi-class classification. It is built on PyTorch. Experiments show that models built in our toolkit achieve comparable performance with reported results in the literature.

原始仓库地址:https://github.com/tencent/neuralnlp-neuralclassifier.git

浏览量:16 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
Fork 0 关注 0

a fast and user-friendly runtime for transformer inference (Bert, Albert, GPT2, Decoders, etc) on CPU and GPU.

原始仓库地址:https://github.com/tencent/turbotransformers.git

浏览量:14 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新
ansj_seg Java
Fork 0 关注 0

这是一个基于n-Gram+CRF+HMM的中文分词的java实现. 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.

原始仓库地址:https://github.com/nlpchina/ansj_seg.git

浏览量:14 下载量:0 项目类别: 自然语言处理-其他
about 1 month前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie