Agent 讓 RAG 過時了嗎? 談 AI Coding 的檢索策略

标签: LLM | 发表时间:2025-07-25 13:30 | 作者:ihower
出处:https://ihower.tw/blog

看了一場 Augment Code (也是一家做 AI IDE 的廠商) 來講 “Agentic 檢索” 對比 “傳統 RAG 檢索” 的演講,蠻有啟發的。
在 AI Coding 領域,簡單的工具正在擊敗複雜的 RAG 系統。

AI Coding 的演進歷程

AI Coding 的演進是這樣:

  • 2023: Code completion 補全時代,例如 Github Copilot
  • 2024: 出現側欄 chatbot 來寫這個檔案的 code
  • 2025: 進到 Agent 時代,例如 Claude Code 可以跨多個檔案寫 code

隨著每次演進,IDE 底層檢索的複雜度越來越高。我們知道 LLM 需要正確的 context 才能良好運作(也就是 context engineering),因為需要設計一套檢索系統,找出當下模型所需要參考的程式碼。
像 code completion 只需要超低延遲的簡單檢索即可,chatbot 時代需要理解更複雜的抽象問題,而 agent 就必須理解整個專案的許多不同部分。

他們對 AI Coding 領域的驚人發現是: 簡單的工具就夠了,Augment 團隊在 SWE-Bench 拿下第一名,論文中寫道:「我們探索了新增各種基於嵌入的檢索工具,但發現對於 SWE-Bench 任務來說,這並不是瓶頸。用 grep 和 find 工具就足夠了」。

近期很夯的 Claude Code、OpenAI Codex、Gemini CLI 也通通沒有用 embedding 模型來做檢索。
程式碼檢索為什麼 grep/find 就夠用? 因為程式碼有很多高訊號的關鍵字詞彙,這些結構化的關鍵字讓 grep 搜尋變得非常有效。

Agentic 檢索的工作流程

AI Coding 的 Agent 解決過程像這樣:

  1. 用 find 命令搜尋所有名稱中帶有關鍵字的檔案
  2. 找到檔案後,用檔案讀取工具查看內容。如果檔案比較大,只讀取檔案前 50 行(節省 token)
  3. 用 grep 繼續搜尋相關的類別、方法、函式
  4. 持續迭代用 find 和 grep 和檔案讀取工具,直到檢索出足夠的內容

即使 Agents 有點笨,但他們很堅持。他們最終會用 grep 和 find 找到需要的內容。換句話說,Agent 的堅持性正在補償較差工具的不足。

Agentic 檢索的優勢

  1. 迭代檢索架構很簡單: 傳統方法需要多個嵌入模型、多次運算、平衡結果。Agentic 方法就是一個簡單循環
  2. Token 管理更容易: 達到 token 限制就截斷舊的工具呼叫結果,替換為「已截斷,如需要請重新執行」,Agent 不會遇到錯誤
  3. 建立和維護成本極低: 不需要向量資料庫、資料同步機制等複雜基礎設施
  4. 路徑修正特性: 失敗就再試一次,有自我修正能力

限制與挑戰

但以上僅限於程式碼場景,其他領域就不一定了。講者明確提到限制:

  1. 對低結構邏輯的內容效果不佳: 其他類型內容不像程式碼那樣有組織層次有高訊號關鍵字。讓 Agent 在海量文件中,沒有導航線索去盲目探索效率極低
  2. 難以擴展: 對千萬個檔案跑 grep 根本不可行,例如你無法用 grep 取代 Google 的 PageRank 機制
  3. 相當緩慢和昂貴: 嵌入模型的檢索只需要 50 毫秒,用 Agent 跑你需要好幾分鐘

另外,這裏還有商業模式的考量,如果你的 AI 產品是訂閱制(例如 Cursor 每月 $20),你會需要 RAG 複雜架構來節省成本。如果是 BYOK (自帶 API key) 模式,則可以完全用 Agentic 檢索,不需要用 embedding 模型來做檢索。若是全用 Agent 解決方案會非常昂貴,這會燃燒大量的 tokens。

混合架構:最佳解決方案

因此對非程式碼領域,講者認為混合架構是最佳解:

針對其他領域 (醫療記錄、建築文件、法律文件、歌曲資料庫等),採用混合架構: 建立優秀的 embedding 嵌入模型檢索,然後提供給 Agent 當作工具使用,就像提供 grep 和 find 工具一樣。讓 agentic 循環可以存取優秀的嵌入模型檢索作為工具,結合兩者優勢。

另外他也提到關於記憶系統的洞察,Agent 可以用工具來建立記憶和讀取記憶,來描述程式碼庫特徵,比如「這些是定義模型的檔案」。這些記憶除了是個人化功能,但某種程度上也是語義快取,可以加速未來的搜尋。

三種檢索架構比較

以下附圖三張是講者分析三種檢索架構的比較

總結

  • AI Coding: 簡單的 grep/find 就夠了,Agent 的堅持性補償工具不足
  • 其他領域: 保留現有 embedding 系統,包裝成 Agent 可用的工具
  • 通用原則: 無論你已經擁有什麼檢索系統,都將其轉換為工具並從那裡迭代

最後建議

  1. 如果你已有檢索系統: 不要丟棄,將其轉換為 Agent 工具(這就是做MCP啦),在它之上建立 Agentic 檢索
  2. 如果從零開始: 先建立最簡單的檢索工具,套上 Agent 循環,然後根據最大痛點來迭代
  3. 評估策略: 從 5 個 vibe evals 開始,別急著做定量評估。對自然語言系統,看具體例子比追求數字指標更有用。

參考資料

相关 [agent rag ai] 推荐:

Agent 讓 RAG 過時了嗎? 談 AI Coding 的檢索策略

- - ihower { blogging }
看了一場 Augment Code (也是一家做 AI IDE 的廠商) 來講 “Agentic 檢索” 對比 “傳統 RAG 檢索” 的演講,蠻有啟發的. 在 AI Coding 領域,簡單的工具正在擊敗複雜的 RAG 系統. AI Coding 的演進歷程. AI Coding 的演進是這樣:.

User Agent注入攻击及防御

- - FreeBuf.COM | 关注黑客与极客
CloudFlare公司经常会收到客户询问为什么他们的一些请求会被. CloudFlare WAF 屏蔽. 最近,一位客户就提出他不能理解为什么一个访问他主页简单的 GET 请求会被 WAF 屏蔽. 正如他说的,一个简单的请求访问 WEB 主页,乍看之下好像没什么问题. 除非你仔细查看 User-Agent 部分:.

AI vs AI--当AI与自己聊天

- Tim - Solidot
Shawn the R0ck 写道 "最烦人的事情之一莫过于被强迫与一个白痴对话. 但当你发现你最讨厌与之交谈的白痴其实就是你自己的基于人工智能程序的拷贝...康奈尔创造性机器实验室决定看看当AI尝试跟自己交谈会发生什么. 他们的健谈的AI程序Cleverbot与自己进行文本交互,之后朗读出文本并且显示到视频中.

不用插件修改 Chrome 的 User Agent 字符串、模拟移动触屏设备

- - Chrome迷
今天发现了 Chrome 上一个修改 User Agent 字符串的新方法,甚至还能模拟触屏设备,手动改变你所在的位置(经纬度). 1、打开 Chrome 的”开发者工具”,也就是菜单——工具——开发者工具. 2、在打开的开发者工具(Developer Tools)界面的右下角,点击黑色齿轮图标. 3、然后在黑底界面中点击”Overrides”标签页就能看到了.

一家公司的 AI 教育观:AI 管「教」,真人来「育」

- - 极客公园
叮咚课堂 App 上线不过八个月,他们一面竭力在竞争异常激烈的在线少儿英语赛道上保持着刻意的低调,一面又疯狂地收获了平均 300% 月度的用户增长率. 这让他们创始人邱明丰对未来信心更盛了. 在艾瑞咨询发布的《2018 年中国在线幼儿启蒙英语行业白皮书》中提到,近年来人工智能在互联网教育领域大规模展开,但在在线幼儿启蒙英语教育中的应用甚少,随着资本的注入和行业的发展,其有望通过人工智能进一步提升用户在线启蒙英语学习的体验和效率.

贪吃蛇AI挑战赛第二季

- 温柔一刀 - 黑客志
如果你对这个活动感兴趣,可以先从这里开始,编写一个AI程序,然后将你的AI程序以及你对平台的改进建议发送到jin.cai20#gmail.com,主办方将会从中选择12名选手参加6月24到25持续一个周末的编程派对,并提供往返交通及住宿费用,下面是活动的详情:. 时间: June 24th – June 26th *.

AI 政策引发失业担忧

- - 最新更新 – Solidot
政府智库——中国发展研究基金会和红杉中国的报告 显示,中国出口制造业省份浙江、江苏和广东的几家公司在这三年内因自动化削减了 30% 至 40% 的劳动力. 北京正在实施雄心勃勃的政策以升级制造技术. 官方媒体对包括人工智能领域在内的政府发展目标的报道都集中在积极因素上. 然而,有关当局悄然对此类政策导致的裁员表示了担忧.

科创板,一瓶AI的卸妆水?

- - IT瘾-tuicool
编者按:本文转自 甲子光年,作者小北. “一级市场估值和泡沫怎么起来的,他们自己心里没点数吗. ”一位券商科技产业分析师在谈起即将到来的科创板时对我们说. “我们反正第一批肯定先不上. ”一位AI独角兽融资负责人面对我们对科创板的提问,回答略显暧昧. “你说那家公司为什么就值这么多钱呢. ”一位国内顶尖券商的投行业务部门负责人也曾反问我们,“反正他们的材料递到我这儿,我不会签字.

AI在运维中的应用

- - IT瘾-geek
要:随着X86分布式技术应用,服务器数量越来越多,网络拓扑结构越来越复杂,运维越来越辛苦,风险越来越高. 智能化运维AIOPS将AI技术应用在运维场景,是DevOps的运维部分,是“开发运维一体化云中心”的重要基础设施之一,其最大的价值在于缩短故障恢复时间,提高IT服务连续性. 本文描述一个运维及在这个场景下对AI的需求,目标是尝试将AI引入运维过程,提高运维效率、缩短故障恢复时间.

当 AI 开始进村养猪

- - PingWest品玩
“母猪杜洛克C7259号,没有怀孕,请在12小时内再次安排配种. ”如今,国内一些猪场工作人员已经能在自己的电脑上看到这样的提醒. 与此同时,长白山精气神养殖基地里,一只母猪在猪栏中的六个食槽一一凑过去, 但都没有通过面部识别. 饲喂机纹丝不动,就是不给投料,它只能落寞地走到墙角趴下. 工程师在 App 上查了一下状态,原来智能饲喂机识别出这头猪的当日进食量已经达到配额,不能再吃了.