视觉探索利器：PyTorch入门实战16——visdom深度可视化指南

最编程 2024-02-19 08:49:09

...

一、初识宝藏visdom

visdom是Facebook专门为Pytorch开发的一款可视化工具，通过官网介绍（http://github.com/facebookresearch/visdom）介绍它能搞定大多数科学运算（处理数值、图像、文本甚至是视频）的可视化任务。visdom支持pytorch、Torch和Numpy。

（1）通过pip install visdom即可完成visdom的安装。

（2）我们要启动visdom服务器：

运行命令：python -m visdom.server 或通过nohup python -m visdom.server &命令将服务放至后台运行。

visdom服务是一个web server服务，默认绑定8097端口（客户端和服务端之间通过tornado进行非阻塞交互），所以我们要在地址栏中输入：http://localhost:8097/ 。

二、一个sinx栗子

通过vis = visdom.Visdom(env = 'test1')构建一个客户端对象vis，该对象可以使用如下常见的画图函数：

line：类似matlab中的plot操作，可以记录某些标量的变化，例如损失、准确率等。

image：可视化图片，如输入的图片或者GAN生成的图片，也可以是卷积核的信息。

text：记录日志等文字信息，支持HTML格式。

histgram：可视化分布，查数据、参数的分布。

scatter：绘制散点图。

bar：绘制柱状图。

pie：绘制饼状图。

# -*- coding: utf-8 -*-
"""
Created on Mon Oct 25 20:15:55 2021

@author: 86493
"""
# %%sh
# 启动visdom服务器
# nohup python -m visdom.server &
import visdom
import torch as t
# 新建一个连接客户端

# 构建一个客户端，指定env = u'test1',默认端口为8097，host是'localhost'
# 还能指定host, port等参数
vis = visdom.Visdom(env = 'test1')
x = t.arange(1, 30, 0.01)
y = t.sin(x)
vis.line(X = x, Y = y, win = 'sinx', opts = {'title': 'y = sin(x)'})

在刚才打开的 http://localhost:8097/ 中我们选择对应的环境（这里是test1）就能显示sinx的图像了。

三、常见功能

3.1 line操作

Visdom同时支持PyTorch的tensor和Numpy的ndarray两种数据结构，但不支持Python的int、float等类型，因此每次传入时都需先将数据转成ndarray或tensor。上述操作的参数一般不同，但有两个参数是绝大多数操作都具备的：

win：用于指定pane的名字，如果不指定，visdom将自动分配一个新的pane。如果两次操作指定的win名字一样，新的操作将覆盖当前pane的内容，因此最好每次操作都重新指定win。

opts：选项，接收一个字典，常见的option包括title、xlabel、ylabel、width等，主要用于设置pane的显示格式。

因为visdom每次操作都会覆盖之前的数值，但往往我们在训练网络的过程中需不断更新数值，如损失值等，这时就需要指定参数update='append'来避免覆盖之前的数值。而除了使用update参数以外，还可以使用vis.updateTrace方法来更新图，但updateTrace不仅能在指定pane上新增一个和已有数据相互独立的Trace，还能像update='append'那样在同一条trace上追加数据。

# append 追加数据
for ii in range(0, 10):
    # y = x
    x = t.Tensor([ii])
    y = x
    vis.line(X=x, Y=y, win='polynomial', update='append' if ii>0 else None)
    
# updateTrace 新增一条线
x = t.arange(0, 9, 0.1)
y = (x ** 2) / 9
vis.line(X=x, Y=y, win='polynomial', name='this is a new Trace',update='new')

在刚才网址里就出现另一个pane的图：

3.2 image操作

image的画图功能可分为如下两类：

image接收一个二维或三维向量，H × W H\times WH×W或3 × H × W 3 \times H\times W3×H×W，前者是黑白图像，后者是彩色图像。

images接收一个四维向量N × C × H × W N\times C\times H\times WN×C×H×W，C CC可以是1或3，分别代表黑白和彩色图像。可实现类似torchvision中make_grid的功能，将多张图片拼接在一起。images也可以接收一个二维或三维的向量，此时它所实现的功能与image一致。

# 可视化一个随机的黑白图片
vis.image(t.randn(64, 64).numpy())

# 随机可视化一张彩色图片
vis.image(t.randn(3, 64, 64).numpy(), win='random2')

# 可视化36张随机的彩色图片，每一行6张
vis.images(t.randn(36, 3, 64, 64).numpy(), 
           nrow=6, 
           win='random3', 
           opts={'title':'random_imgs'})

3.3 text操作

vis.text用于可视化文本，支持所有的html标签，同时也遵循着html的语法标准。例如，换行需使用<br>标签，\r\n无法实现换行。

# （三）text用法
vis.text(u'''<h1>Hello Visdom</h1><br>Visdom是Facebook专门为<b>PyTorch</b>开发的一个可视化工具，
         在内部使用了很久，在2017年3月份开源了它。
         
         Visdom十分轻量级，但是却有十分强大的功能，支持几乎所有的科学运算可视化任务''',
         win='visdom',
         opts={'title': u'visdom简介' }
        )

四、保存

最上方的save按钮，可将当前的env保存成json文件，默认保存路径在~/.visdom/目录下（一般是C盘的user文件夹下）。

更多关于visdom的用法可以参考——http://github.com/facebookresearch/visdom。

上一篇：如何在Photoshop中将图片缩小？

下一篇：如何在RStudio中保存和管理工作环境：一份简明指南