项目类型

项目类别

最新

热搜企业:

Fork 0 关注 0

**Sentence piece**是一种无监督文本标记器,主要用于基于神经网络的文本生成系统,在神经模型训练之前预先确定词汇量。扩展了对原始语句的直接训练。**SentencePiece**允许我们构建一个纯粹的端到端系统,它不依赖于特定于语言的预处理/后处理。 **Sentence piece**是子词单元的再实现,是解决机器翻译中开放性词汇问题的有效途径。

原始仓库地址:https://github.com/google/sentencepiece.git

浏览量:1578 下载量:583 项目类别: 对话生成
almost 2 years前更新
NLP-progress Python
Fork 0 关注 0

**NLP-progress**,本仓库旨在跟踪自然语言处理(NLP)的进展,并概述最常见的NLP任务及其相应数据集的最新技术。 并且,本项目包含了传统的和核心的NLP任务,如依赖项解析和词性标记以及最近的阅读理解和自然语言推理。主要的目标是为读者提供基准数据集的快速概览和它们的最新技术,作为进一步研究的基础。

原始仓库地址:https://github.com/sebastianruder/NLP-progress.git

浏览量:2305 下载量:162 项目类别: 阅读理解
almost 2 years前更新
CoreNLP Java
Fork 0 关注 0

**Stanford CoreNLP**提供了一组用Java编写的自然语言分析工具。它可以把原始人类语言文本输入然后给出词语的基本形式,他们的词类,无论他们是公司的名字,人,等等,正归化和解释日期,时间,和数字量,标记句子的短语或单词的结构依赖关系,并指出这名词短语指的是相同的实体。它最初是为英语开发的,但现在也为(现代标准)阿拉伯语、(大陆)汉语、法语、德语和西班牙语提供了不同级别的支持。 **Stanford CoreNLP**是一个集成的框架,它使得将一组语言分析工具应用于一段文本非常容易。从纯文本开始,只需两行代码就可以运行所有工具。它的分析为更高级别和特定领域的文本理解应用程序提供了基本的构建块。**CoreNLP**是一套稳定的、经过良好测试的自然语言处理工具,广泛应用于学术界、工业界和政府的各个团体。这些工具使用基于规则的、概率机器学习和深度学习组件。

原始仓库地址:https://github.com/stanfordnlp/CoreNLP.git

浏览量:1930 下载量:596 项目类别: 命名实体识别
almost 2 years前更新
fastText HTML
Fork 0 关注 0

**fastText**是一个高效学习单词表示和句子分类的库。

原始仓库地址:https://github.com/facebookresearch/fastText.git

浏览量:1624 下载量:203 项目类别: 阅读理解
almost 2 years前更新
mt-dnn Python
Fork 0 关注 0

**mt-dnn**PyTorch包实现了用于自然语言理解的多任务深度神经网络(MT-DNN)。

原始仓库地址:https://github.com/namisan/mt-dnn.git

浏览量:2155 下载量:551 项目类别: 阅读理解
almost 2 years前更新
Fork 0 关注 0

建造一个聊天机器人听起来令人生畏,但它完全是可行的。**IKY**是一个用Python构建的人工智能对话对话界面。使用**IKY**很容易创建自然语言会话场景,而不需要编写任何代码。流畅的UI使得创建和训练与机器人的对话变得轻而易举,而且随着它从与人的对话中学习,它会不断变得更聪明。通过将**IKY**的API与该平台集成,IKY可以生活在您选择的任何通道上(如Messenger、Slack等)。

原始仓库地址:https://github.com/alfredfrancis/ai-chatbot-framework.git

浏览量:1497 下载量:357 项目类别: 对话生成
almost 2 years前更新
Fork 0 关注 0

这个repo使用Tensorflow (LSTM + CRF + chars embeddings)实现了一个NER模型。

原始仓库地址:https://github.com/guillaumegenthial/sequence_tagging.git

浏览量:1558 下载量:79 项目类别: 命名实体识别
over 1 year前更新

这个repo包含一些教程,介绍如何使用PyTorch 1.0进行情感分析,以及使用Python 3.7进行TorchText 0.3。前两篇教程将介绍情绪分析的实际方法:递归神经网络(RNNs)。第三个笔记覆盖了FastText模型,最后一个覆盖了convolutional neural network (CNN)模型。还有2个额外的“附录”笔记本。第一个包含用TorchText加载您自己的数据集,第二个包含一个简短的介绍TorchText提供的预先训练好的单词嵌入。如果您发现任何错误或不同意任何解释,请毫不犹豫地提交问题。我欢迎任何正面或负面的反馈。

原始仓库地址:https://github.com/bentrevett/pytorch-sentiment-analysis.git

浏览量:2280 下载量:878 项目类别: 情感分析
over 1 year前更新
DrQA C
Fork 0 关注 0

这是ACL 2017论文中,描述的DrQA系统的PyTorch实现。 DrQA是一个应用于开放式问题回答的阅读理解系统。特别地,DrQA的目标是“大规模机器阅读”(MRS)。在这个设置中,我们正在一个潜在的非常大的非结构化文档语料库中寻找问题的答案(这可能不是多余的)。因此,系统必须将文档检索(查找相关文档)和文本机器理解(从这些文档中识别答案)的挑战结合起来。 我们使用DrQA的实验集中在回答事实性问题,同时使用Wikipedia作为文档的唯一知识来源。维基百科是一个非常适合大规模、丰富、详细信息的来源。要回答任何问题,首先必须从500多万篇文章中检索出少数可能相关的文章,然后仔细地扫描它们以确定答案。

原始仓库地址:https://github.com/facebookresearch/DrQA.git

浏览量:1293 下载量:726 项目类别: 阅读理解
over 1 year前更新
Fork 0 关注 0

综合搜索服务器,用于文档处理的ETL框架(爬行、文本提取、文本分析、命名实体识别和OCR,用于图像和PDF中的嵌入图像),搜索用户界面,文本挖掘,文本分析和用于全文搜索的搜索应用程序,分面搜索,探索性搜索和知识图搜索。

原始仓库地址:https://github.com/opensemanticsearch/open-semantic-search.git

浏览量:1645 下载量:58 项目类别: 命名实体识别
over 1 year前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie