FIND研究員:李佳珮
檢索增強生成(Retrieval-augmented generation,RAG)正以前所未有的速度改變大型語言模型 (Large Language Model,LLM)的應用面貌。RAG透過整合外部知識庫讓LLM不再只是憑空想像而能即時汲取相關資訊,提升回應的準確性、可靠性和時效性。然而,這項技術同時也帶來了全新的安全挑戰,根據彭博最新研究報告揭露了一個驚人事實:RAG不僅沒有讓AI更安全,反而潛藏新的越獄風險。更令人擔憂的是,趨勢科技的調查發現,全球有超過3,000台RAG核心元件完全暴露在網路上,形同將系統曝露於高風險環境。
圖1:RAG運作原理圖
圖片來源:本文作者由AI 生成(Claude)
RAG運作原理
RAG結合了資料檢索與語言生成模型的能力,讓LLM能即時引用外部知識庫的資訊來回答問題。簡單來說,就是讓AI不只靠自己想,而是先去查詢再回答。
RAG的核心流程如下:
知識來源:彙整文字文件、資料庫或知識圖譜等多元資料構建成專屬知識庫。
索引與嵌入:將資訊轉為語意向量、捕捉語義,方便系統快速進行比對。
向量資料庫:儲存嵌入資料,支援高效的檢索系統。
檢索器:根據查詢問題,從向量資料庫找出最相關的資料內容。
生成器:整合查詢與檢索內容,生成精準回應。
整個過程就像給LLM裝上了一個超級搜尋引擎,讓AI能夠回答特定問題,大幅提升了實用性。
RAG的安全挑戰
RAG 帶來了許多便利,但它複雜架構也帶來了新的安全風險:
模型越獄風險
研究顯示,當 RAG 將大量知識引入模型中可能因上下文提示意外觸發LLM給出不當的回應。本意為提升安全性的知識庫,卻可能因大量文件而讓模型生成不安全回應,形同越獄。
資料洩露與隱私
RAG系統中常常會複製敏感資料到新的儲存空間,例如向量資料庫儲存的嵌入可能透過「反向攻擊」還原敏感資訊。不當處理還可能導致用戶間資料交叉洩露,甚至敏感資訊被未經授權地存取。
資料投毒與竄改
惡意資料可被注入知識庫,影響輸出結果;攻擊者也可能直接篡改向量資料庫,誤導模型導致模型產生錯誤或惡意的回應。
存取控制不足
權限管理不當,或是過度分享資料,都可能讓機密資料暴露給不該存取的人。許多儲存和快取系統的保護不足,也可能導致客戶資料互相洩露。
元件暴露
許多RAG相關伺服器(如 llama.cpp、Ollama、ChromaDB)和Weaviate伺服器,未受保護地暴露於網際網路,缺乏基本的認證機制,讓攻擊者可以輕易讀取、篡改甚至刪除儲存的文件,導致機密資料外洩、服務中斷。
緩解策略
為安全部署RAG,企業可採取以下措施:
輸入過濾:掃描上傳檔案,過濾提示注入,修訂個人身份資訊(Personally Identifiable Information,PII)。
嚴格存取控制:採用角色存取控制(Role-based Access Control,RBAC)和最低權限原則,限制知識庫訪問。
資料加密:加密靜態與傳輸中的資料,探索同態加密或差分隱私等進階技術。
持續監控:即時監測異常檢索模式,快速應對威脅。
零信任原則:僅允許預批准連線,強化雲端部署安全。
紅隊演練:模擬攻擊,識別提示注入或資料投毒等弱點。
事實核查:內建自我檢查,驗證輸出準確性,減少幻覺。
結論
RAG技術為AI帶來革命性進步已廣泛應用於智慧客服、企業知識搜尋與金融報告生成等領域;但其安全挑戰不容忽視。從模型越獄到元件暴露,企業需採取多層次策略,結合嚴格驗證、加密、監控與零信任原則,才能在釋放RAG潛力的同時,保護資料與系統安全。隨著AI技術演進,持續審計與客製化安全方案將是成功關鍵。未來,如何設計具備內建風險意識的RAG架構,將成為安全AI系統的關鍵指標。
參考資料來源:
1.邁向代理式 AI 之路:暴露在外的基石
https://www.trendmicro.com/zh_tw/research/24/k/agentic-ai.html
2.【臺灣資安大會直擊】LLM從訓練資料蒐集到投入應用階段都有風險,專家盤點4大類13種攻擊手法
https://www.ithome.com.tw/news/168752
3.AI本地部署的天坑?RAG曝出重大安全漏洞
https://www.secrss.com/articles/78300
4.Security Risks with RAG Architectures
https://ironcorelabs.com/security-risks-rag/
5.UNDERSTANDING AND MITIGATING RISKS OF GENERATIVE AI
IN FINANCIAL SERVICES
https://assets.bbhub.io/company/sites/51/2025/04/arXiv-Understanding-and-Mitigating-Risks-of-Generative-AI-in-Financial-Services-FINAL-4-25-25.pdf