计算机视觉常用图像数据集标签平台
目录
1、LabelIMG
2、VGG Image Annotator
3、Supervise.ly
4、Labelbox
5、其他平台
在计算机视觉中海量图片数据的标记是个让人头疼的问题,通过学习总结列举以下几种常用的图像标记平台,从平台的价格、各种功能、工具和格式、项目管理和易用性等方面分析各个平台的特点,希望对小伙伴们有所帮助。
1、LabelIMG
LabelImg是一个开源图像标记工具,它为Windows预先构建了二进制文件,因此它非常易于安装。
价格:免费
功能:仅支持边界框(还有一个RotatedRect格式的版本和一个类标记的优化版本),但没有更高级的功能。格式为PascalVoc XML,并且为源文件夹中的每个图像单独保存注释文件。
项目管理:它没有项目管理属性,但它确实允许一种简单的方法来导入和可视化注释并在必要时进行更正。简单的离线界面使得注释过程非常快,即使它不支持许多热键快捷方式。
GitHub网址:https://github.com/tzutalin/labelImg。
2、VGG Image Annotator
VGG是一个开源工具,就像LabelImg一样,它可以很好地完成不需要项目管理的简单任务。它可以作为在线接口使用,也可以作为HTML文件离线使用。
价格:免费
功能:提供了更多的工具,包括点、线、多边形、圆和椭圆(仅在此列表中支持圆和椭圆!)还可以添加对象和图像属性/标签。注释可以作为一个包含所有注释的JSON文件下载,也可以作为一个CSV文件下载,如果需要查看注释,还可以在之后上传。
项目管理:在数据集管理和用户方面没有什么先进的功能,但是它的界面是多边形注释最有效和最精确的界面之一,因为它允许您查看多边形的线条而不是其他任何内容。它们支持一些热键快捷方式,一般来说应用程序非常轻量级。
网址:http://www.robots.ox.ac.uk/~vgg/software/via/。
3、Supervise.ly
Supervis.ly是一个非常棒的基于web的平台,它提供了一个高级的注释接口,同时还提供了一个自托管的基础设施,用于模型培训和改进。
价格:模型培训版的免费社区版和企业定价
功能性:一系列工具,包括点,线,盒,多边形和用于语义分割的位图画笔(我们还没有发现它们的智能工具太有用了)。还包括在多边形中绘制孔的可能性,这是非常有价值的。另一个非常有用的功能是添加图像和对象标签以及在图层中排序图形的选项。每个图像或PNG蒙版的输出都在JSON文件中,平台还允许您上传Cityscapes和COCO等格式。此外,还可以选择直接在平台上进行数据转换。
项目管理:该平台为数据集管理提供了大量选项,包括为用户添加细化权限,监控性能统计,标记对象等。缺少的一些事情是时间统计和质量控制机制。他们的技术支持团队随时可以解决问题。该界面允许非常精确的工作并支持可定制的热键快捷方式,但最近性能有时很慢,如果平台需要花费大量时间在图像之间切换和记录注释,这可能会非常令人沮丧。
网址:https://supervise.ly/。
4、Labelbox
Labelbox是另一个伟大的基于网络的平台,于2018年初推出,从那时起不断更新和改进其功能。它还提供了通过导入模型预测并查看贴标机和模型之间的共识来集成人在环的可能性。
定价:免费社区版仅限5000张图片和企业版
功能性:提供完整的注释工具,如点,线,盒和多边形,最近为他们的语义分割画笔添加了一个很棒的新功能 – 一个超级像素着色选项,使生活变得如此简单(就像这样和这个开源工具)。输出是一个包含所有注释或PNG掩码的JSON或CSV文件(但是,每个类都有一个掩码,用户需要弄清楚如何处理重叠区域)
项目管理:设置项目非常简单,监控性能有很多选项,包括标记图像所需的秒数统计,以及激活不同贴标机之间的自动共识。您可以选择邀请用户(虽然权限不是那么精细)并查看每个用户的工作。标签界面非常人性化,并支持热键快捷键(虽然不可自定义)。免费版中缺少的一件事是上传注释以便可视化或编辑它们的选项。
网址:https://labelbox.com/。
5、其他平台
Diffgram :一个非常有前途的平台仍然在beta版,通过训练RCNN优化图像注释。
RectLabel :用于为MacOS绑定框和多边形的绝佳工具。
Prodigy:它们提供了一个自托管的后端,具有不同的注释接口,包括带有边框的图像注释;他们的产品定价从390美元起,供个人使用(每位用户终身使用)。
DataTurks:提供许多注释功能的平台,免费版本中注释的数据是公开的,小型团队的企业定价从每月300美元开始。
ImageTagger :一个用于协作图像标签的开源平台。
Fast Annotation Tool :另一个开源工具,使用OpenCV用于RotatedRect格式的边界框。
LabelMe :麻省理工学院用于多边形注释的行业经典开源工具,但精度非常低。
PolygonRNN++: 仅作为演示版提供,但仍然非常有前景;在Cityscapes数据集上训练的工具确实为自动驾驶汽车生成自动标签,并加强学习。
本文分享 **** - 不脱发的程序猿。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
上一篇: 使用树型算法处理表格数据比神经网络更高效
下一篇: 自动驾驶方向开源数据集资源汇总
推荐阅读
-
[姿势估计] 实践记录:使用 Dlib 和 mediapipe 进行人脸姿势估计 - 本文重点介绍方法 2):方法 1:基于深度学习的方法:。 基于深度学习的方法:基于深度学习的方法利用深度学习模型,如卷积神经网络(CNN)或递归神经网络(RNN),直接从人脸图像中学习姿势估计。这些方法能够学习更复杂的特征表征,并在大规模数据集上取得优异的性能。方法二:基于二维校准信息估计三维姿态信息(计算机视觉 PnP 问题)。 特征点定位:人脸姿态估计的第一步是通过特征点定位来检测和定位人脸的关键点,如眼睛、鼻子和嘴巴。这些关键点提供了人脸的局部结构信息,可用于后续的姿势估计。 旋转表示:常见的旋转表示方法包括欧拉角和旋转矩阵。欧拉角通过三个旋转角度(通常是俯仰、偏航和滚动)描述头部的旋转姿态。旋转矩阵是一个 3x3 矩阵,表示头部从一个坐标系到另一个坐标系的变换。 三维模型重建:根据特征点的定位结果,三维人脸模型可用于姿势估计。通过将人脸的二维图像映射到三维模型上,可以估算出人脸的旋转和平移信息。这就需要建立人脸的三维模型,然后通过优化方法将模型与特征点对齐,从而获得姿势估计结果。 特征点定位 特征点定位是用于检测人脸关键部位的五官基础部分,还有其他更多的特征点表示方法,大家可以参考我上一篇文章中介绍的特征点检测方案实践:人脸校正二次定位操作来解决人脸校正的问题,客户在检测关键点的代码上略有修改,坐标转换部分客户见上图 def get_face_info(image). img_copy = image.copy image.flags.writeable = False image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results = face_detection.process(image) # 在图像上绘制人脸检测注释。 image.flags.writeable = True image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR) box_info, facial = None, None if results.detections: for detection in results. for detection in results.detections: mp_drawing.Drawing.detection = 无 mp_drawing.draw_detection(image, detection) 面部 = detection.location_data.relative_keypoints 返回面部 在上述代码中,返回的数据是五官(6 个关键点的坐标),这是用 mediapipe 库实现的,下面我们可以尝试用另一个库:dlib 来实现。 使用 dlib 使用 Dlib 库在 Python 中实现人脸关键点检测的步骤如下: 确保已安装 Dlib 库,可使用以下命令: pip install dlib 导入必要的库: 加载 Dlib 的人脸检测器和关键点检测器模型: 读取图像并将其灰度化: 使用人脸检测器检测图像中的人脸: 对检测到的人脸进行遍历,并使用关键点检测器检测人脸关键点: 显示绘制了关键点的图像: 以下代码将参数 landmarks_part 添加到要返回的关键点坐标中。
-
计算机视觉常用图像数据集标签平台