2026-07-15发表2026-07-15更新技术学习 / 深度学习 / 生成模型3 小时读完 (大约28252个字)

笔记来源

【AI 生图原理与里程碑论文解读｜从 VAE、GAN 到 Diffusion、自回归】
文档链接：https://oigi8odzc5w.feishu.cn/wiki/RcuYwK1iviseDhkOXmAcFH6Snve
word & pdf：https://github.com/huangyf2013320506/bilibili_repository/tree/master/20260628_AI生图

该视频讲解了图像生成模型的重要发展节点，以【扩散】和【自回归】两个路线对生成模型进行总结，最后针对现在LLM中结合图像生成的技术进行了讨论。

本文是自己在看了视频之后对原笔记的搬运与补充。

2026-07-09发表2026-07-10更新技能学习 / Linux13 分钟读完 (大约1920个字)

终端复用器tumx配置与使用

使用SSH登录远程计算机，打开远程窗口执行命令，若突然断线，由于SSH会话终止，进程消失，再次登录时就无法找到上次执行命令了。

为解决这个问题，可使用tmux将会话（session）与终端窗口解绑，达成：窗口关闭时，会话并不终止，而是继续运行，等到以后需要的时候，再让会话"绑定"其他窗口。

2026-06-30发表2026-07-05更新技术学习 - 深度学习 - LLM16 分钟读完 (大约2336个字)

ReasoningLLMs笔记

参考博客

#CoT

主要内容：构建推理模型的四种主要方法

developing-LLMs

来自网络

推理模型是什么

推理模型的优缺点

Deepseek（后简称DS） R1的方法论

改进推理模型的四种主要方法

DS V3和R1发布后LLM的领域的看法

预算有限开发推理模型的建议

2026-06-30发表2026-06-30更新技术学习 / 深度学习 / LLM9 分钟读完 (大约1352个字)

LoRA笔记

LoRA (Low-Rank Adaptation)，一种LLM的微调方法

选择LoRA是因为它通过向变换器层注入可训练的低秩矩阵，主要针对语言模型组件，从而高效适应大型预训练模型。这种方法显著减少了可训练参数的数量，使微调在计算上更轻松，同时保持了强有力的性能。（Kvasir-VQA-x1数据集中介绍）

2026-06-30发表2026-07-05更新技术学习 / 深度学习 / LLM19 分钟读完 (大约2798个字)

Transformer精读-AttentionIsAllYouNeed

学习来源

【《Attention is all you need》论文解读及Transformer架构详细介绍】

阅读思路

以往的模型存在的问题/瓶颈——结构的哪些缺陷导致了性能的有限
- Intro和BG
论文提出的注意力结构解决了什么问题，为什么可以解决
- 核心：Transformer架构和Self-Attention机制
- 对应：Model ，Why Self-Attention

2026-06-30发表2026-06-30更新技术学习 - 深度学习 - LLM13 分钟读完 (大约1892个字)

近年AI应用技术串讲与优质文档记录-笔记

NOTE

B站笔记，对近年大模型技术的总结与文档存档。
视频：【近年AI应用技术串讲与优质文档分享｜Agent、Skill、OpenClaw、Harness……】
分享文档：[近年AI应用技术分享-飞书]（https://oigi8odzc5w.feishu.cn/wiki/WBMfwiNkfi6uNFkRtXdcavDzn0e?from=from_copylink）

2026-05-28发表2026-05-28更新生活 / 阅读13 分钟读完 (大约2021个字)

读后感-卡片笔记写作法

《卡片笔记写作法》

作者： [德] 申克·阿伦斯
出版：人民邮电出版社
豆瓣评分：7.7/10
阅读时长: 4小时左右

2025-10-21发表2025-11-09更新生活 / 留学13 分钟读完 (大约1902个字)

杂记-1

十月下旬的仙台，已经有些凉了。

两件衣服已经无法抵御随风而来的寒意，不过街上的人似乎也没有反应过来该如何穿衣，毛衣或单穿衬衫的都有，最多的还是西装革履。

2025-08-21发表2025-08-21更新技能学习 / 代码管理28 分钟读完 (大约4248个字)

Docker基础

基本概念

Docker中三个重要的基本概念：镜像、容器、仓库。

2025-07-23发表2025-07-23更新技术学习 / 深度学习3 分钟读完 (大约485个字)

Pytorch自动混合精度AMP出现Loss变为NaN

在使用AMP的方法训练UNETR和SwinUNETR的时候，发现Loss在一定epoch后突然变为NaN（巨大）。

本篇为调查原因和解决方案的总结。

基本概念

链接

最新文章

归档

follow.it

分类

标签