最新

热搜企业:

puck Java
Fork 0 关注 0

本项目是一个基于 GPU 的快速自然语言解析程序。Puck是用于自然语言的高速,高精度解析器。它可以与Berkeley Parser和NVIDIA GPU训练的语法一起使用。在最近流行的NVIDIA GPU(例如GTX 680)上,每秒约有400个句子,而完整的 Berkeley grammar 长度小于等于40个句子。本项目同时提供完整的说明文档,方便开发者使用。

原始仓库地址:https://github.com/dlwh/puck.git

浏览量:13 下载量:0 项目类别: 命名实体识别
3 months前更新
Fork 0 关注 0

本项目是基于 PyTorch 实现的进行文本分类的 CNN 模型。CNN 模型在计算机视觉领域已经得到了广泛的应用,为了利用 CNN 强大的特征提取能力,本项目使用 CNN 进行文本分类。本项目所设计的整体模型主要分为三个部分:输入层、卷积+池化层、全连接+softmax层。这个模型结构相对简单,是由文本输入特殊性造成的。

原始仓库地址:https://github.com/shawn1993/cnn-text-classification-pytorch.git

浏览量:11 下载量:0 项目类别: 命名实体识别
3 months前更新
nut Python
Fork 0 关注 0

本项目是一个用于自然语言处理的工具包。本项目实现了跨语言结构对应学习(Cross-Language Structural Correspondence Learning ,CLSCL),也实现了一种简单的贪婪的从左到右序列标记方法来命名实体识别(named entity recognition,NER)。

原始仓库地址:https://github.com/pprett/nut.git

浏览量:37 下载量:0 项目类别: 命名实体识别
3 months前更新
Fork 0 关注 0

本项目是一个基于自然语言处理技术的文本挖掘项目。本项目针对《 2019年墨西哥政府报告》进行文本挖掘,包括了从PDF文件中提取文本到绘制结果的整个过程。开发者可以以此为例,学习如何针对文本进行分析,并进行可视化展示。

原始仓库地址:https://github.com/phantominsights/mexican-government-report.git

浏览量:8 下载量:0 项目类别: 命名实体识别
4 months前更新
Fork 0 关注 0

本项目是经过微调的预训练GPT2,用于自定义主题特定的文本生成。GPT2的核心思想就是认为可以用无监督的预训练模型去做有监督任务。相比于有监督的多任务学习,语言模型只是不需要显示地定义哪些字段是要预测的输出,所以,实际上有监督的输出只是语言模型序列中的一个子集。

原始仓库地址:https://github.com/prakhar21/textaugmentation-gpt2.git

浏览量:24 下载量:2 项目类别: 命名实体识别
4 months前更新
Fork 0 关注 0

本项目是一个支持多语言的句子嵌入工具库。本项目用于为零镜头跨语言传输计算多语言句子嵌入,尤其是如果没有要处理的语言的训练集时,可以在LASER嵌入的基础上构建一个分类器,对训练数据中使用的任何一种语言进行训练,并将其分类为任何语言的文本。

原始仓库地址:https://github.com/yannvgn/laserembeddings.git

浏览量:13 下载量:0 项目类别: 命名实体识别
4 months前更新
textacy Python
Fork 0 关注 0

本项目是一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。本项目的优点包括:1.方便的入口点,用于处理由spaCy处理的一个或多个文档,并通过自定义扩展和自动语言识别功能添加了适用于正确的spaCy管道的功能;2.多种可下载的数据集,包括文本内容和元数据;3.灵活地提取单词,ngram,名词块,实体,首字母缩写词,关键术语和其他感兴趣的元素;4.文档的标记化和向量化,具有用于训练,解释和可视化主题模型的功能。

原始仓库地址:https://github.com/chartbeat-labs/textacy.git

浏览量:16 下载量:0 项目类别: 命名实体识别
4 months前更新
Fork 0 关注 0

本项目用于自然语言中的同义词替换。通过使用深度学习技术,将自然语言中的单词替换为其同义词。本项目使用了 wordnetNLTK 的语料库,增强了其鲁棒性。

原始仓库地址:https://github.com/paubric/python-sirajnet.git

浏览量:16 下载量:0 项目类别: 命名实体识别
4 months前更新
Fork 0 关注 0

本项目是一个关于自然语言处理、文本挖掘的实践项目集,包括了大规模短语提取、Gensim Word2Vec、TFIDFTransformer与TFIDFVectorizer、使用Gensim访问预训练的单词嵌入等多个项目。

原始仓库地址:https://github.com/kavgan/nlp-in-practice.git

浏览量:13 下载量:0 项目类别: 命名实体识别
4 months前更新
projects Python
Fork 0 关注 0

本项目是一个针对自然语言处理中的多种任务设计的示例项目,涵盖各种任务所用的脚本、基准测试以及数据集。帮助开发者快速熟悉不同的自然语言处理任务,为开发者提供更快捷的入门便利。

原始仓库地址:https://github.com/explosion/projects.git

浏览量:23 下载量:0 项目类别: 命名实体识别
4 months前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie