2025-05-28发表2025-05-28更新技能学习 / 代码管理6 分钟读完 (大约918个字)0次访问

深度学习-wandb

wandb是一个机器/深度学习可视化监督工具。

它将实验的运行内容、GPU运行状况同步到网络平台，可随时监察运行情况。

本文将介绍在Python（Pytorch）的环境下wandb的使用方法。

深度学习实验的官方文档

这个平台既可以给科研工作者提供监督实验进度的工具，也可以为开发者提供监督LLM软件开发的可视化工具。

一、安装

注册账号

需要在该网站注册一个账号，每个账号对应一个单独的API，这在后续项目与账号链接时使用。

API可以在项目创建的时候找到，或者在网站点击头像，列表中找到API key获得代码。

账号注册时需要填写组织。学生填写学校即可。

导入wandb

在自己的环境中命令行安装并绑定API：

1	pip install wandb

输入APIkey：

1	wandb login

将网站上的api key粘贴其中。

输入时命令行不会显示输入情况。回车后显示账号名称则表示连接成功。

如果不想上传数据到线上，可以使用离线模式或者完全禁用wandb，稍后讲解。

训练代码（如：train.py）的顶部导入wandb:

1	import wandb

二、使用方法

初始化项目

基本用法，可直接放在代码的顶端或者入口处进行初始化，这里记录的是项目本次运行的基本信息：

import wandb

wandb.init(
    project="你的项目名",        # 例如 "brain-tumor-seg"
    name="实验名称",            # 可选，给本次运行起名字
    config={                    # 可选，记录超参数
        "learning_rate": 0.001,
        "batch_size": 16,
        "epochs": 50
    }
)

如果像我一样使用了argparse来使用控制台管理参数，可以用下面的方法。

例，实验的设置均保存在最后的args中：

import argparse

parser = argparse.ArgumentParser(description="超参数设置")
parser.add_argument('--epochs', type=int, default=10, help='训练轮数')
parser.add_argument('--lr', type=float, default=0.001, help='学习率')
parser.add_argument('--batch_size', type=int, default=32, help='批大小')

args = parser.parse_args()

print(args.epochs, args.lr, args.batch_size)

wandb.init(
    project="My-wonderful-project",  # 项目名称，可自定义
    name=f"{args.model}_{'_'.join(map(str, args.modalities))}",  # 实验名称
    config=vars(args),  # 记录所有超参数
)

wandb-init

若不想讲数据上传到线上，离线模式：

1	wandb.init(mode="offline")

禁用wandb

1	wandb.init(mode="disabled")

记录模型结构

在代码中模型的定义之后：

1 2	model = 你的模型 wandb.watch(model, log="all", log_freq=100)

可以查看模型的每层权重变化。

model

记录每个epoch或者step后的指标

wandb.log({
    "epoch": e + 1,
    "train_loss": train_loss,
    "val_loss": val_loss,
    "val_accuracy": val_acc,
    "learning_rate": current_lr
}, step=epoch)

wandb-log

图像记录

import numpy as np
import wandb

# 假设 image, mask, prediction 都是 numpy 数组，形状 (H, W)
wandb.log({
    "prediction_example": [
        wandb.Image(image, caption="Input"),
        wandb.Image(mask, caption="Ground Truth"),
        wandb.Image(prediction, caption="Prediction")
    ]
})

清理调试实验（可选）

不想保留某次实验，在命令行：

1 2	wandb sync --clean wandb disabled

或者在代码运行的时候init的地方:

1	wandb.init(mode="disabled")

在程序结尾关闭 wandb（可选）

1	wandb.finish()

深度学习-wandb

https://zhouwentong7.github.io/2025/05/28/深度学习-wandb/

作者

Zhou

发布于

2025-05-28

更新于

2025-05-28

许可协议

爱发电支付宝

微信

深度学习-wandb

一、安装

注册账号

导入wandb

二、使用方法

初始化项目

记录模型结构

记录每个epoch或者step后的指标

图像记录

清理调试实验（可选）

在程序结尾关闭 wandb（可选）

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

最新文章

分类

标签

目录