世間好物不堅牢,彩雲易散琉璃脆。
做最好的博客模板

分享丨不得不赞!这可能是国内最好的海量数据集获取平台

发布时间:2020-10-23相关聚合阅读:

原标题:分享丨不得不赞!这可能是国内最好的海量数据集获取平台

转自 AI有道

在计算机领域中, 好的数据,对模型训练至关重要。自己做数据,即昂贵又费时费力;但是,使用现成的数据集,既不好找又不好下载及使用。

4岁算法工程师-李小姐

进入研发前花大量时间进行模型预研,需要找寻相关的数据集,于是就 在数据的可视化、标签转换上白白耗费了很多心血

需要使用公开数据集进行论文或学术的研究,但是这些几乎都在境外,下载往往需要VPN, 下载又难又慢……

0岁算法工程师-王先生

一个模型的诞生

作为大数据时代背景下的互联网从业者,我们每时每刻都在和数据打交道,算法工程师们当然不例外。在一个合格模型的诞生过程中, 繁杂的数据收集与处理工作往往给算法工程师带来了低效的工作体验。

……

而最近

小编发现了一个数据集获取神器

Graviti Open Dataset

这是一个提供公开数据集的平台,你可以很方便地在上面搜索到想要的数据集,可在线预览样例数据、标注、标签,无需“梯子”即可免费高速下载国外数据集。

一、丰富多元的数据集种

目前,Graviti Open Dataset已收录 1000+个高质量人工智能数据集。

覆盖2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等 多种AI应用领域

与此同时,Graviti Open Dataset还包含了点云、图像、视频序列、三维模型等 多种数据格式

例如无人驾驶方面的海量优质数据

KITTI-object,含2D/3D目标检测点云和图像数据

Synscapes,含25000个真实街景图像

二、便捷迅速的数据集查找

想找心仪数据集,现在一目了然。你不仅可以靠数据集的内容关键词搜索,还可以通过应用行业、标注类型等属性进行 多维度查询

众所周知:找数据难,找海外数据更是难上加难。但拥有Graviti网站就像拥有一把万能钥匙。

想进行COVID肺部医学影像检测模型训练?

随手输入“COVID”即可一键抵达

搜索得到的优质数据集示例

还想搜索医学影像数据集?

勾选“medical”进行行业搜索即得

更多医学相关数据集

三、直接美观的数据集可视化

话不多说,先上图片

训练集人像截取示例

图像多元素分类

无需下载即可浏览样例数据,更有 多种可视化方案供你随时查看。再也不用担心费劲下完整套数据才发现根本不是自己想要的内容。

还没有 心动吗?

压轴亮点来了!

四、畅通高速的海外数据下载

很多时候,我们的数据获取渠道都只提供主流的国内公开数据集,而更普适的模型却需要用海内外的多元数据去共同训练。

针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和进入海外官网下载相比,Graviti 至少提速100%

从此告别繁琐的登录注册流程,告别令人抓狂的下载时长!

普通带宽下载海外数据,实测就有10MB/s的速度

那么问题来了,海外下载提速需要会员吗?还是按次计费呢?

答案是:

完全免费

在Graviti,还有更多有趣又高质量的数据集在持续更新中,快来一起探索吧!