计算机视觉常用图像数据集标签平台

最编程 2024-03-20 14:34:33

...

【开源中国 APP 全新上线】“动弹” 回归、集成大模型对话、畅读技术报告”

1、LabelIMG

2、VGG Image Annotator

3、Supervise.ly

4、Labelbox

5、其他平台

在计算机视觉中海量图片数据的标记是个让人头疼的问题，通过学习总结列举以下几种常用的图像标记平台，从平台的价格、各种功能、工具和格式、项目管理和易用性等方面分析各个平台的特点，希望对小伙伴们有所帮助。

1、LabelIMG

LabelImg是一个开源图像标记工具，它为Windows预先构建了二进制文件，因此它非常易于安装。

价格：免费

功能：仅支持边界框（还有一个RotatedRect格式的版本和一个类标记的优化版本），但没有更高级的功能。格式为PascalVoc XML，并且为源文件夹中的每个图像单独保存注释文件。

项目管理：它没有项目管理属性，但它确实允许一种简单的方法来导入和可视化注释并在必要时进行更正。简单的离线界面使得注释过程非常快，即使它不支持许多热键快捷方式。

GitHub网址：https://github.com/tzutalin/labelImg。

2、VGG Image Annotator

VGG是一个开源工具，就像LabelImg一样，它可以很好地完成不需要项目管理的简单任务。它可以作为在线接口使用，也可以作为HTML文件离线使用。

价格：免费

功能：提供了更多的工具，包括点、线、多边形、圆和椭圆(仅在此列表中支持圆和椭圆!)还可以添加对象和图像属性/标签。注释可以作为一个包含所有注释的JSON文件下载，也可以作为一个CSV文件下载，如果需要查看注释，还可以在之后上传。

项目管理：在数据集管理和用户方面没有什么先进的功能，但是它的界面是多边形注释最有效和最精确的界面之一，因为它允许您查看多边形的线条而不是其他任何内容。它们支持一些热键快捷方式，一般来说应用程序非常轻量级。

网址：http://www.robots.ox.ac.uk/~vgg/software/via/。

3、Supervise.ly

Supervis.ly是一个非常棒的基于web的平台，它提供了一个高级的注释接口，同时还提供了一个自托管的基础设施，用于模型培训和改进。

价格：模型培训版的免费社区版和企业定价

功能性：一系列工具，包括点，线，盒，多边形和用于语义分割的位图画笔（我们还没有发现它们的智能工具太有用了）。还包括在多边形中绘制孔的可能性，这是非常有价值的。另一个非常有用的功能是添加图像和对象标签以及在图层中排序图形的选项。每个图像或PNG蒙版的输出都在JSON文件中，平台还允许您上传Cityscapes和COCO等格式。此外，还可以选择直接在平台上进行数据转换。

项目管理：该平台为数据集管理提供了大量选项，包括为用户添加细化权限，监控性能统计，标记对象等。缺少的一些事情是时间统计和质量控制机制。他们的技术支持团队随时可以解决问题。该界面允许非常精确的工作并支持可定制的热键快捷方式，但最近性能有时很慢，如果平台需要花费大量时间在图像之间切换和记录注释，这可能会非常令人沮丧。

网址：https://supervise.ly/。

4、Labelbox

Labelbox是另一个伟大的基于网络的平台，于2018年初推出，从那时起不断更新和改进其功能。它还提供了通过导入模型预测并查看贴标机和模型之间的共识来集成人在环的可能性。

定价：免费社区版仅限5000张图片和企业版

功能性：提供完整的注释工具，如点，线，盒和多边形，最近为他们的语义分割画笔添加了一个很棒的新功能 – 一个超级像素着色选项，使生活变得如此简单（就像这样和这个开源工具）。输出是一个包含所有注释或PNG掩码的JSON或CSV文件（但是，每个类都有一个掩码，用户需要弄清楚如何处理重叠区域）

项目管理：设置项目非常简单，监控性能有很多选项，包括标记图像所需的秒数统计，以及激活不同贴标机之间的自动共识。您可以选择邀请用户（虽然权限不是那么精细）并查看每个用户的工作。标签界面非常人性化，并支持热键快捷键（虽然不可自定义）。免费版中缺少的一件事是上传注释以便可视化或编辑它们的选项。

网址：https://labelbox.com/。

5、其他平台

Diffgram ：一个非常有前途的平台仍然在beta版，通过训练RCNN优化图像注释。

RectLabel ：用于为MacOS绑定框和多边形的绝佳工具。

Prodigy：它们提供了一个自托管的后端，具有不同的注释接口，包括带有边框的图像注释;他们的产品定价从390美元起，供个人使用(每位用户终身使用)。

DataTurks：提供许多注释功能的平台，免费版本中注释的数据是公开的，小型团队的企业定价从每月300美元开始。

ImageTagger ：一个用于协作图像标签的开源平台。

Fast Annotation Tool ：另一个开源工具，使用OpenCV用于RotatedRect格式的边界框。

LabelMe ：麻省理工学院用于多边形注释的行业经典开源工具，但精度非常低。

PolygonRNN++：仅作为演示版提供，但仍然非常有前景;在Cityscapes数据集上训练的工具确实为自动驾驶汽车生成自动标签，并加强学习。

本文分享 **** - 不脱发的程序猿。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

上一篇：使用树型算法处理表格数据比神经网络更高效

下一篇：自动驾驶方向开源数据集资源汇总