<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>RAG on Yuan的博客</title><link>https://liyuan.org/zh/tags/rag/</link><description>Recent content in RAG on Yuan的博客</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 10 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://liyuan.org/zh/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>金融 RAG Agent 优化：方法、案例与数据</title><link>https://liyuan.org/zh/posts/ai/rag-improvement-via-18-failures/</link><pubDate>Sun, 10 May 2026 00:00:00 +0000</pubDate><guid>https://liyuan.org/zh/posts/ai/rag-improvement-via-18-failures/</guid><description>本项目记录了一个金融问答场景下 Agentic RAG 系统的精细化优化过程，通过系统性诊断 18 个失败案例，把测试集准确率从 &lt;strong>0.871 提升到 ~0.919&lt;/strong>。作者没有盲目调模型，而是采用&amp;quot;先诊断&amp;quot;的思路：用确定性数值预过滤器解决&amp;quot;judge 侧&amp;quot;问题，再做结构化改造，比如 query 改写、反拒答检查、以及针对极值类歧义的五层修复。结果显示：基于 prompt 的反思有效，但结构化、schema 强制的改动可靠性更高。最后，作者刻意把 8 个案例留作不修 —— 要么是数据集噪声，要么是 ROI 不划算 —— 体现了&amp;quot;修一切&amp;quot;和&amp;quot;做面向生产的策略性优化&amp;quot;之间的区别。</description></item><item><title>给 RAG Agent 挑评估指标 —— 来自一线的笔记</title><link>https://liyuan.org/zh/posts/ai/rag-eval-metrics-selection/</link><pubDate>Tue, 05 May 2026 00:00:00 +0000</pubDate><guid>https://liyuan.org/zh/posts/ai/rag-eval-metrics-selection/</guid><description>这篇文章介绍了一套面向 RAG（检索增强生成）Agent 的务实分层评估思路，背景是在复杂的金融文档分析场景（FinanceBench）上做评测。作者的核心观点是：有效的评估不是堆指标的数量，而是在开发周期的不同阶段选出能给出清晰、可行动信号的指标。</description></item><item><title>通往生成式AI应用工程师之路</title><link>https://liyuan.org/zh/posts/ai/ai-learning-materials/</link><pubDate>Wed, 02 Jul 2025 00:00:00 +0000</pubDate><guid>https://liyuan.org/zh/posts/ai/ai-learning-materials/</guid><description>&lt;h2 id="ai-构建模块">AI 构建模块&lt;/h2>
&lt;ul>
&lt;li>提示工程技术（Prompting Techniques）&lt;/li>
&lt;li>RAG（检索增强生成）&lt;/li>
&lt;li>智能体框架（Agentic Frameworks）&lt;/li>
&lt;li>护栏机制（Guardrails）&lt;/li>
&lt;li>评估系统（Evals）&lt;/li>
&lt;li>微调（Fine-Tuning）&lt;/li>
&lt;li>计算机使用 / 工具使用（Computer Use / Tool Use）&lt;/li>
&lt;li>异步编程（Asynchronous Programming）&lt;/li>
&lt;li>MCP（Model Context Protocol）&lt;/li>
&lt;/ul>
&lt;h2 id="提示工程技术--评估系统--计算机使用--工具使用">提示工程技术 + 评估系统 + 计算机使用 / 工具使用&lt;/h2>
&lt;p>&lt;a href="https://github.com/anthropics/courses">Anthropic 课程&lt;/a>&lt;/p>
&lt;h2 id="rag">RAG&lt;/h2>
&lt;p>&lt;a href="https://www.deeplearning.ai/short-courses/javascript-rag-web-apps-with-llamaindex/">使用 LlamaIndex 构建 JavaScript RAG Web 应用（DeepLearningAI 视频课程）&lt;/a>&lt;/p>
&lt;p>&lt;a href="https://github.com/run-llama/llamacloud-demo/blob/main/examples/document_workflows/patient_case_summary/patient_case_summary.ipynb">病历摘要工作流（RAG 教程）&lt;/a>：
运行 &lt;code>.ipynb&lt;/code> 文件可使用 &lt;a href="https://colab.research.google.com/">Google Colab&lt;/a>&lt;/p>
&lt;h2 id="mcp">MCP&lt;/h2>
&lt;p>&lt;a href="https://www.deeplearning.ai/short-courses/mcp-build-rich-context-ai-apps-with-anthropic/">MCP：使用 Anthropic 构建富上下文 AI 应用&lt;/a>
&lt;a href="https://modelcontextprotocol.io/introduction">MCP（Anthropic 官方文档）&lt;/a>&lt;/p>
&lt;h2 id="智能体框架agentic-frameworks">智能体框架（Agentic Frameworks）&lt;/h2>
&lt;p>&lt;a href="https://www.deeplearning.ai/short-courses/ai-agents-in-langgraph/">LangGraph 中的 AI 智能体（DeepLearningAI 视频课程）&lt;/a>
&lt;a href="https://www.deeplearning.ai/short-courses/event-driven-agentic-document-workflows/">事件驱动的智能体文档工作流（DeepLearningAI 视频课程）&lt;/a>
&lt;a href="https://www.deeplearning.ai/short-courses/ai-agentic-design-patterns-with-autogen/">使用 AutoGen 的 AI 智能体设计模式（DeepLearningAI 视频课程）&lt;/a>&lt;/p>
&lt;h2 id="微调fine-tuning">微调（Fine-Tuning）&lt;/h2>
&lt;p>&lt;a href="https://www.databricks.com/glossary/fine-tuning">理解微调&lt;/a>
&lt;a href="https://www.deeplearning.ai/short-courses/reinforcement-fine-tuning-llms-grpo/">使用 GRPO 强化微调大语言模型（DeepLearningAI 视频课程）&lt;/a>&lt;/p></description></item></channel></rss>