最新

热搜企业:

dstk Python
Fork 0 关注 0

本项目是一个数据科学工具集合。本项目提供了开放数据集和用于数据科学的开源工具,并提供了为 Terminal、Python和Javascript封装的易于使用的REST / JSON API接口,也可独立部署在 Amazon EC2 上。本项目同时提供参考文档,方便开发者查阅。

原始仓库地址:https://github.com/petewarden/dstk.git

浏览量:23 下载量:0 项目类别: 大数据
3 months前更新
538model Python
Fork 0 关注 0

本项目是根据 Nate Silver 对美国大选的预测模型。本项目的数据来源于网站上的方法论文章和《纽约时报》上的方法论文章而构建的。轮询数据是截至2012年10月2日的最新信息。所有这些都可以从Real Clear Politics公开获得。

原始仓库地址:https://github.com/jseabold/538model.git

浏览量:29 下载量:0 项目类别: 大数据
3 months前更新
metronome Java
Fork 0 关注 0

本项目是基于Iterative Reduce的一组并行迭代算法。本项目是一套并行迭代算法,可以在Hadoop的YARN平台上运行。本项目实现了包括并行神经网络、平行线性回归、平行逻辑回归、平行K均值、受限玻尔兹曼机以及并行深度信念网络在内的多种算法,方便开发者的学习和使用。

原始仓库地址:https://github.com/jpatanooga/metronome.git

浏览量:3 下载量:0 项目类别: 大数据
3 months前更新
lifetimes Python
Fork 0 关注 0

本项目是用来进行 lifetime 衡量的模型。生命周期可用于基于以下假设来分析用户:用户“活跃”时会与您互动;被研究的用户可能会在一段时间后“死亡”。通俗来讲,本项目可以用于预测访问者多久返回一次您的网站;了解患者多久可以返回医院;仅使用使用历史记录来预测从某个应用中搅动的个人;预测来自客户的重复购买;以及预测客户的终身价值。

原始仓库地址:https://github.com/camdavidsonpilon/lifetimes.git

浏览量:11 下载量:0 项目类别: 大数据
3 months前更新
tdigest Python
Fork 0 关注 0

本项目是基于 Python 实现的t-digest数据结构,其设计目的是根据流数据或分布式数据计算准确的估算值。这些估计值是百分位数,分位数,修整平均值等。可以添加两个t-摘要,使数据结构非常适合于map-reduce设置,并且可以序列化到小于10kB(而不是存储整个数据列表) 。本项目也支持PySpark 等分布式结构,方便在大数据环境下使用。

原始仓库地址:https://github.com/camdavidsonpilon/tdigest.git

浏览量:5 下载量:0 项目类别: 大数据
3 months前更新
lifelines Python
Fork 0 关注 0

本项目是基于 Python 实现的 Survival analysis。生存分析是用来衡量个人寿命的。精算师或医疗保健专业人员会问“这些人要住多久?”之类的问题,并使用生存分析来回答。例如,人口可以是一个国家的人口(用于精算师),也可以是一个因疾病而折磨的人口(在医疗专业人员的情况下)。本项目提供完整的 API 文档,帮助开发者学习和使用。

原始仓库地址:https://github.com/camdavidsonpilon/lifelines.git

浏览量:12 下载量:0 项目类别: 大数据
3 months前更新
pignlproc Python
Fork 0 关注 0

本项目用于为机器学习、自然语言处理等任务生成数据集。本项目基于 Apache Pig 程序,在公共的Wikipedia和DBpedia数据中构建用于机器学习/ NLP的训练语料库。开发者可以很方便的使用本工具,来构建适合自己任务、模型的数据集、语料库。

原始仓库地址:https://github.com/ogrisel/pignlproc.git

浏览量:38 下载量:0 项目类别: 大数据
3 months前更新
Fork 0 关注 0

本项目用于从 CelebA 数据集中提取高分辨率的人脸图像。CelebA数据集提供了大量的人脸图像,但是,每个对齐图像的大小为218x178,因此从此类图像裁剪出的脸孔会更小!因此,本项目提供了一种方法,可通过68个界标从原始未对齐图像中裁剪出人脸,从而获得更高分辨率的人脸图像。

原始仓库地址:https://github.com/lynnho/hd-celeba-cropper.git

浏览量:11 下载量:0 项目类别: 大数据
3 months前更新
dapy Python
Fork 0 关注 0

本项目是一个在设计时就非常关注易用性的数据分析库。可以提供设计合理的数据结构和丰富的机器学习模型,并快速地实现数据分析思路。本项目的优点包括:1.多种在CMD中呈现数据的方式;2.符合Python语法习惯的二维数据表结构;3.与SQL语法相似的函数封装方法;4.封装了许多常用的数据预处理或者特征工程方法;5.支持多种文件格式的I/O工具;6.内建基本机器学习模型(决策树、多层感知机、线性回归等)

原始仓库地址:https://github.com/jacksonwuxs/dapy.git

浏览量:10 下载量:0 项目类别: 大数据
3 months前更新
akshare Python
Fork 0 关注 0

本项目是一款基于 Python 的开源金融数据接口库。本项目的目的是实现对股票、期货、期权、基金、外汇、债券、指数、数字货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清到数据落地的一套开源工具, 满足金融数据科学家与数据科学爱好者在金融数据获取方面的需求,同时提供完整的中文以及英文文档,方便用户快速使用本项目。

原始仓库地址:https://github.com/jindaxiang/akshare.git

浏览量:18 下载量:0 项目类别: 大数据
3 months前更新

ihub@pcl.ac.cn 鹏城实验室人工智能研究中心

版权所有:鹏城实验室    粤ICP备18066427号-6    Powerd by 国防科技大学Trustie