首页
企业/组织
数据集导航
新建镜像项目
新建托管项目
登录
注册
开源镜像
/
textacy
分享
Activities
1
任务
Resources
Repositories
1186
Pull Requests
Roadmap
Calendar
Gantt
本项目是一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。本项目的优点包括:1.方便的入口点,用于处理由spaCy处理的一个或多个文档,并通过自定义扩展和自动语言识别功能添加了适用于正确的spaCy管道的功能;2.多种可下载的数据集,包括文本内容和元数据;3.灵活地提取单词,ngram,名词块,实体,首字母缩写词,关键术语和其他感兴趣的元素;4.文档的标记化和向量化,具有用于训练,解释和可视化主题模型的功能。
项目动态
全部动态
问题动态
资源库动态
讨论区动态
成员管理动态
textacy | 项目
开源镜像
创建时间:03/15/2020 08:35 PM
Loading...