2026-06-30发表2026-06-30更新技术学习 - 深度学习 - LLM15 分钟读完 (大约2318个字)ReasoningLLMs笔记参考博客 一文读懂:思维链 CoT(Chain of Thought)-知乎 Understanding Reasoning LLMs #CoT 主要内容:构建推理模型的四种主要方法 来自网络 推理模型是什么 推理模型的优缺点 DS R1的方法论 改进推理模型的四种主要方法 DS V3和R1发布后LLM的领域的看法 预算有限开发推理模型的建议 阅读更多
2026-06-30发表2026-06-30更新技术学习 / 深度学习 / LLM9 分钟读完 (大约1352个字)LoRA笔记LoRA (Low-Rank Adaptation),一种LLM的微调方法 选择LoRA是因为它通过向变换器层注入可训练的低秩矩阵,主要针对语言模型组件,从而高效适应大型预训练模型。这种方法显著减少了可训练参数的数量,使微调在计算上更轻松,同时保持了强有力的性能。(Kvasir-VQA-x1数据集中介绍) 阅读更多
2026-06-30发表2026-06-30更新技术学习 - 深度学习 - LLM13 分钟读完 (大约1892个字)近年AI应用技术串讲与优质文档记录-笔记 NOTE B站笔记,对近年大模型技术的总结与文档存档。 视频:【近年AI应用技术串讲与优质文档分享|Agent、Skill、OpenClaw、Harness……】 分享文档:[近年AI应用技术分享-飞书](https://oigi8odzc5w.feishu.cn/wiki/WBMfwiNkfi6uNFkRtXdcavDzn0e?from=from_copylink) 阅读更多
NOTE B站笔记,对近年大模型技术的总结与文档存档。 视频:【近年AI应用技术串讲与优质文档分享|Agent、Skill、OpenClaw、Harness……】 分享文档:[近年AI应用技术分享-飞书](https://oigi8odzc5w.feishu.cn/wiki/WBMfwiNkfi6uNFkRtXdcavDzn0e?from=from_copylink)