最新
corpusZh Javascript
Fork 0 关注 0

**corpusZh**是一个中文的已标注词性的语料库。可以用于训练HMM模型。

原始仓库地址:https://github.com/liwenzhu/corpusZh.git

浏览量:1906 下载量:243 项目类别: 语料库
4 months前更新
Fork 0 关注 0

本项目是OpenData在保险领域的机器学习任务。 该语料库包含从网站Insurance Library 收集的问题和答案。 据我们所知,这是保险领域首个开放的QA语料库: 该语料库的内容由现实世界的用户提出,高质量的答案由具有深度领域知识的专业人士提供。 所以这是一个具有真正价值的语料,而不是玩具。 在上述论文中,语料库用于答复选择任务。 另一方面,这种语料库的其他用法也是可能的。 例如,通过阅读理解答案,观察学习等自主学习,使系统能够最终拿出自己的看不见的问题的答案。 数据集分为两个部分“问答语料”和“问答对语料”。问答语料是从原始英文数据翻译过来,未经其他处理的。问答对语料是基于问答语料,又做了分词和去标去停,添加label。所以,"问答对语料"可以直接对接机器学习任务。如果对于数据格式不满意或者对分词效果不满意,可以直接对"问答语料"使用其他方法进行处理,获得可以用于训练模型的数据。 欢迎任何进一步增加此数据集的想法。

原始仓库地址:https://github.com/Samurais/insuranceqa-corpus-zh.git

浏览量:1835 下载量:749 项目类别: 语料库
5 months前更新
corpus CSS
Fork 0 关注 0

语料库是另一个CSS工具集。它基本上是我发现自己为每个新项目返回的东西的集合。它使用Flexbox作为网格系统,基于视图的高度和基于百分比的宽度深受Basscss空白模块的影响,并具有一些有用的灰度颜色实用程序。为了突出显示语法,我使用Prism.js,代码设置在Office code Pro中。样式是用SCSS编写的。

原始仓库地址:https://github.com/jamiewilson/corpus.git

浏览量:1841 下载量:714 项目类别: 语料库
5 months前更新
Fork 0 关注 0

**中文人名语料库(Chinese-Names-Corpus)** 业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。 不定期更新。只删词,不加词。 可用于中文分词、人名识别。

原始仓库地址:https://github.com/wainshine/Chinese-Names-Corpus.git

浏览量:1427 下载量:752 项目类别: 语料库
5 months前更新
Dialog_Corpus Python
Fork 0 关注 0

**用于对话系统的中英文语料** Datasets for Training Chatbot System 本项目收集了一些从网络中找到的用于训练中文(英文)聊天机器人的对话语料

原始仓库地址:https://github.com/candlewill/Dialog_Corpus.git

浏览量:1411 下载量:17 项目类别: 语料库
5 months前更新
Fork 0 关注 0

**chatterbot-corpus**这些模块用于快速训练**ChatterBot**响应不同语言的各种输入。虽然**ChatterBot**的大部分设计都是独立于语言的,但是让这些训练集可用来启动一个新的数据库,并使机器人能够产生更多样化的响应,这仍然很有用。 有关如何使用这些数据集的说明,请参阅:https://chatterbot.readthedocs.io/en/latest/training.html#training-with-corpus-data

原始仓库地址:https://github.com/gunthercox/chatterbot-corpus.git

浏览量:2054 下载量:709 项目类别: 语料库
5 months前更新
Fork 0 关注 0

**chatbot-retrieval**这里的代码实现了来自Ubuntu对话语料库的双LSTM编码器模型:一个用于研究非结构化多回合对话系统的大型数据集。

原始仓库地址:https://github.com/dennybritz/chatbot-retrieval.git

浏览量:1862 下载量:982 项目类别: 语料库
5 months前更新
Fork 0 关注 0

原始仓库地址:https://github.com/jinfagang/weibo_terminater.git

浏览量:1563 下载量:349 项目类别: 语料库
6 months前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie