2026-06-30发表2026-06-30更新技术学习 - 深度学习 - LLM13 分钟读完 (大约1892个字)0次访问

近年AI应用技术串讲与优质文档记录-笔记

NOTE

B站笔记，对近年大模型技术的总结与文档存档。
视频：【近年AI应用技术串讲与优质文档分享｜Agent、Skill、OpenClaw、Harness……】
分享文档：[近年AI应用技术分享-飞书]（https://oigi8odzc5w.feishu.cn/wiki/WBMfwiNkfi6uNFkRtXdcavDzn0e?from=from_copylink）

建议：从技术未出现的时的背景进行思考，在什么需求的促使下提出这个工程方案，且该方向存在的问题，为何某种方案最后被大家采纳为行业的标杆，后续又有什么工作进行了改善

1 LLM

《Attention is all you need》提出Transformer架构，促使后续的GPT等大模型的出现。

后续GPT系列的模型，仅采用了Transformer的解码器实现文本生成功能（其原因需要进一步学习）。

之后，出现了很多chatbot。

Prompting Engineering

为什么对同一个大模型，有的人问问题可以得到更好的回复，这就涉及到提示词工程。

但是只能优化提示词质量，也受到大模型窗口大小的限制。

Fine-tuning

提示词对模型的提升还是受限的，进一步可以使用微调（Fine-tuning）的方式优化。

比较值得关注的事LoRa这篇论文，将大模型千亿级参数量的调整压缩到了低纬度的空间进行调整，大幅度降低了计算成本。

可是微调也不是一直有效——

仍然需要GPU
需要数据集
需要长时间训练

RAG检索曾倩技术

最开始是为了解决大模型幻觉问题。

工作：从外部知识库检索相关信息，再结合信息一起生成回答，进而提升准确和时效性。

回答问题时可以提供更多的有效信息。

可以基于模型预训练或者微调阶段尚未学习的私有知识的需求，比微调更容易落地。没有使模型变得更聪明，在工程中有效落地很困难。

难点：文档的切片和入库方式、切入模型的选择、检索算法的选择等…… 若用户请求和文库中的数据相似度较低如何处理。

RAG技术流程

Function call

让模型跳出chatbot，成为一个多功能的工具。

OpenAI设计了一套接口文档（非业内通用协议）。

基本流程如下：
FunctionCall流程

于是大家开始将自己的LLM接入到外部工具中。

可是进一步人们发现，这些外部工具的操作流程存在大量重复，于是有了下一个工作的出现：MCP

MCP

模型上下文协议 (Model Context Protocol，MCP) 是一种开放标准 ，它定义了人工智能应用程序应如何与外部资源通信。MCP 提供了一种统一的解决方案，无需每个人工智能工具自行创建自定义集成。

是Anthropic（Claude的母公司）在2024年11月提出的规范。

MCP流程

Agent

上述工作只是让LLMs有了更好的聊天体验和调用外部工具的能力，但不具备循环工作的能力。

比如，人类确认任务目标后会反复确认已有的能力、资源和任务之间的gap，信行动过程中对比行动结果和目标之间的差距，在和环境的互动过程中完成计划。

Agent就进行了这个循环往复的模拟，Agent Loop：思考→行动→观察

后来发展处两种Agent设计路线：

侧重规划的Agent
侧重反思的Agent

Multi-Agent

在之前模型的能力还是非常有限的，所以一个工作会分为多个Agent共同完成，通过拆分任务和隔离上下文解决单Agent难以处理的复杂问题。

缺点：

Token消耗大
协作效率低
系统复杂度搞
……

[Building multi-agent systems

摘要：Anthropic尝试数月搭建一个多Agent的复杂系统，但是最终发现精心设计提示词可以达到同等的效果，本文讨论了如何识别单Agent的先整理和Multi-Agent效果更好的三种场景：

Multi-Agent最大的弊端是交互上下文耗费的巨大token，但是在单Agent在对话过长的时候容易越回答，答案质量越差，这是因为前期对话内容污染了上下文。这种情况下，Multi-Agent可以帮助摘出重要的token，聚焦于有效的上文信息。
第二种情况，多个代理可以让你探索比单个代理能覆盖的更大的搜索空间，适用于搜索与研究任务，将目标拆解为不同的面交给多个子模型，最后汇总所得，缺点还是消耗的token是巨大的，大概是单一模型的3~10倍，可是在任务处理上能做得更彻底和全面。
最后一种是专业化，不同的任务有时会受益于不同的工具集、系统提示或专业领域。与其让单个代理访问数十种工具，不如由专门的代理配备与其职责匹配的工具集，从而提升可靠性。大概特征是：需要的外部专业工具较多，多个领域交叉，添加新工具时性能下降。

此外，还有一点是设计Multi-Agent的常见工程实践错误：开发者喜欢按照工作职能类型划分任务，但是实际上会造成token消耗和性能底下的问题，因为Agent的精力被浪费在了解释上下文上面。正确的操作：按照上下文隔离的边界进行划分，谁掌握信息，谁负责到底。

Context Engineering

上下文工程：Agent循环过程中产生太多数据，这些海量信息需要被精确选取。

Agent Skill

将Agent的能力（Prompt，工具脚本，文档等）封装为可复用模块，实现低门槛分享与复用，Agent在运行过程中按照需求激活不同的Skill

OpenClaw

在本地运行的AI助手，创新点主要在交互上。

Harness Engineering

驾驭工程：强调通过构建受控环境，让Agent在约束下高效可靠地完成长周期复杂任务。包含围绕Agent构建约束机制、反馈回路、可靠上下文等一系列工程实践。

未来对AI工程师的重新定义。

近年AI应用技术串讲与优质文档记录-笔记

https://zhouwentong7.github.io/2026/06/30/近年AI应用技术串讲与优质文档记录-笔记/

作者

Zhou

发布于

2026-06-30

更新于

2026-06-30

许可协议

爱发电支付宝

微信

近年AI应用技术串讲与优质文档记录-笔记

1 LLM

Prompting Engineering

Fine-tuning

RAG检索曾倩技术

Function call

MCP

Agent

Multi-Agent

Context Engineering

Agent Skill

OpenClaw

Harness Engineering

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

最新文章

分类

标签

目录