RAG on Yuan的博客

金融 RAG Agent 优化：方法、案例与数据

Sun, 10 May 2026 00:00:00 +0000

本项目记录了一个金融问答场景下 Agentic RAG 系统的精细化优化过程，通过系统性诊断 18 个失败案例，把测试集准确率从 0.871 提升到 ~0.919。作者没有盲目调模型，而是采用"先诊断"的思路：用确定性数值预过滤器解决"judge 侧"问题，再做结构化改造，比如 query 改写、反拒答检查、以及针对极值类歧义的五层修复。结果显示：基于 prompt 的反思有效，但结构化、schema 强制的改动可靠性更高。最后，作者刻意把 8 个案例留作不修 —— 要么是数据集噪声，要么是 ROI 不划算 —— 体现了"修一切"和"做面向生产的策略性优化"之间的区别。

给 RAG Agent 挑评估指标 —— 来自一线的笔记

Tue, 05 May 2026 00:00:00 +0000

这篇文章介绍了一套面向 RAG（检索增强生成）Agent 的务实分层评估思路，背景是在复杂的金融文档分析场景（FinanceBench）上做评测。作者的核心观点是：有效的评估不是堆指标的数量，而是在开发周期的不同阶段选出能给出清晰、可行动信号的指标。

通往生成式AI应用工程师之路

Wed, 02 Jul 2025 00:00:00 +0000

AI 构建模块

提示工程技术（Prompting Techniques）
RAG（检索增强生成）
智能体框架（Agentic Frameworks）
护栏机制（Guardrails）
评估系统（Evals）
微调（Fine-Tuning）
计算机使用 / 工具使用（Computer Use / Tool Use）
异步编程（Asynchronous Programming）
MCP（Model Context Protocol）

提示工程技术 + 评估系统 + 计算机使用 / 工具使用

Anthropic 课程

RAG

使用 LlamaIndex 构建 JavaScript RAG Web 应用（DeepLearningAI 视频课程）

病历摘要工作流（RAG 教程）：运行 .ipynb 文件可使用 Google Colab

MCP

MCP：使用 Anthropic 构建富上下文 AI 应用 MCP（Anthropic 官方文档）

智能体框架（Agentic Frameworks）

LangGraph 中的 AI 智能体（DeepLearningAI 视频课程）事件驱动的智能体文档工作流（DeepLearningAI 视频课程）使用 AutoGen 的 AI 智能体设计模式（DeepLearningAI 视频课程）

微调（Fine-Tuning）

理解微调使用 GRPO 强化微调大语言模型（DeepLearningAI 视频课程）