在代码中遨游

2025-07-23发表2025-07-23更新技术学习 / 深度学习3 分钟读完 (大约485个字)

Pytorch自动混合精度AMP出现Loss变为NaN

在使用AMP的方法训练UNETR和SwinUNETR的时候，发现Loss在一定epoch后突然变为NaN（巨大）。

本篇为调查原因和解决方案的总结。

2025-07-03发表2025-07-03更新技术学习 / 深度学习6 分钟读完 (大约864个字)

Pytorch查看模型结构

控制台输出深度学习模型各层结构与特征图尺寸。

2025-05-12发表2025-05-18更新技术学习 / 深度学习 / LLM16 分钟读完 (大约2396个字)

笔记本电脑部署BitNet

BitNet是微软在2025年发布的，可以在CPU上运行的本地大模型。

之前在电脑上配置的wsl终于有了用武之地，成功在ubuntu上完成了部署。本文将介绍部署方法并进行效果展示。

2025-05-06发表2025-05-06更新技术学习 / 深度学习9 分钟读完 (大约1392个字)

Layer Norm和Batch Norm的原理与区别

Batch Normalization 和 Layer Normalization的推导与Pytorch实现。

2025-04-28发表2025-04-28更新技术学习 / 深度学习4 分钟读完 (大约578个字)

Pytorch自动混合精度AMP

AMP（Automatic Mixed Precision）自动混合精度。

可以帮助减少深度学习网络的运行时间和内存占用。本文将简单介绍使用方法。

2025-04-20发表2025-04-21更新技术学习 / 深度学习11 分钟读完 (大约1609个字)

自动执行多个终端命令-Python

深度学习实验，后期有许多要交叉验证或者需要多对比的实验，一个一个在终端修改命令参数再执行太麻烦了，可以用subprocess的方法，在某文件中录入所有需要执行的命令，程序自动书序读取执行。

2025-04-15发表2025-04-15更新技术学习 / 深度学习10 分钟读完 (大约1474个字)

多头自注意力机制-MultiHead Self-Attention

在Transformer中的多头自注意力机制的讲解和代码实现。

2025-04-14发表2025-06-25更新技术学习 / 深度学习5 分钟读完 (大约683个字)

激活函数-Sigmoid

理解 Sigmoid 激活函数：公式、特点与应用

基本概念
代码调用

2025-04-12发表2025-04-12更新技术学习 / 深度学习7 分钟读完 (大约982个字)

激活函数-ReLU-LeakyReLU

对激活函数：

ReLU
Leaky ReLU

进行定义介，包括公式定义、代码实现和优缺点，以及适用场景。

2025-04-10发表2025-04-11更新技术学习 / 深度学习5 分钟读完 (大约790个字)

Attention Gate in Attention UNet

对Attention UNet中使用的Attention Gate（AG）进行介绍和代码分析。

链接

最新文章

归档

follow.it

分类

标签