FIND研究員:李啟榮
來自中國大陸的DeepSeek自問世以來就風波不斷,除了被指控走私高階AI運算晶片、疑似盜取現有ChatGPT資料模型,來達成降低成本的奇效外,還有一系列的資安、敏感詞等相關爭議;DeepSeek的隱憂不止於此,除了將別人的現有資料挪來當常自己的以外,還有可能會藉此變異出其他千奇百怪的玩意兒,也遠遠超出正常、合理使用的範圍,因此DeepSeek讓全世界不得不謹慎以對,藉由了解其潛在不當濫用來做好因應對策、化險為夷。
【技術發展背景】
Deepseek被爆料出衍生自GPT-3.5 Turbo模型並加以改造,如此一來就能節省從零開始研發的成本,同時宣稱訓練成本僅560萬美元(折合約新臺幣1.84億元),但業界不以為然,藉由被指控的走私高階AI運算晶片一事估計,硬體建置成本至少16億美元(折合約新臺幣500億元),實際成本或許不會跟美國行情價相差太多;但DeepSeek則靠開源和低廉成本做號召,除了在中國大陸內部推廣外,更有雄心將觸角伸到世界各個角落。
【技術介紹與應用現況】
據富比世雜誌報導,以色列資安團隊Kela爆料,DeepSeek會無視存取權限,盜取信用卡等機敏個資,甚至會教人將先前盜取的機敏資訊,轉賣給黑市進行洗錢等勾當;富比世編輯團隊也用各種中國政治敏感詞詢問DeepSeek,系統則會拒絕回答、顧左右而言他,可見該系統已經內建符合中國政府遊戲規則的敏感詞過濾機制(Brewster, 2025)。
據財星雜誌報導,一支由思科和賓州大學的合作研究團隊,對DeepSeek進行試驗,研究團隊先輸入50個讓系統觸發「越獄」的關鍵字,試圖了解是否有敏感詞過濾機制,結果系統反應出一堆錯誤答案和有害內容,並指出DeepSeek-R1模型反映出100%的錯誤結果;但研究團隊接著表示,在OpenAI-o1模型只會反映26%的錯誤(Dyos, 2025)。
圖 1:DeepSeek與坊間各大AI模型之攻擊成功率比較
資料來源:Kassianik & Karbasi, 2025
思科接著表示,研究團隊的實驗來自7大負面類別(生化危害、網路犯罪、騷擾與霸凌、有害內容、非法內容、誤導性內容、虛假資訊)的50個負面關鍵字,並與Claude-3.5 Sonnet、GPT-4o、Google Gemini、Meta Llama等坊間主流AI模型進行比對,DeepSeek輸出的結果完全錯誤(Kassianik & Karbasi, 2025),可見該系統確實有容易被越獄突破的嚴重安全漏洞,既能病從口入、也能禍從口出。
圖 2:DeepSeek與坊間各大AI模型之負面關鍵字類別觸發越獄比例
資料來源: Kassianik & Karbasi, 2025
【未來展望/挑戰】
在DeepSeek之前,就有不肖人士嘗試改造既有的ChatGPT成為「惡意GPT」,來產生惡意指令和原始碼;但自從DeepSeek問世之後,由於其標榜的開源、廉價、低門檻,再加上先天結構性的脆弱,更是給予不肖人士方便之門,成為其一大助力。
因此,在AI安全防禦方面更需要通力合作,探討AI運算的幕後原理,掌握可能被利用的潛在破口,並不時滾動式修正與調校,讓AI具有更正確、更主動的判斷和回復能力,並且讓AI的判斷力和防護力能不斷自主學習、與時俱進。
參考資料來源:
1.Brewster, T. (2025, January 28). The Wiretap: DeepSeek Turned Into Evil Malware Maker, Researchers Find. Retrieved from Forbes: https://www.forbes.com/sites/thomasbrewster/2025/01/28/the-wiretap-deepseek-turned-into-evil-malware-maker-researchers-find/
2.Dyos, S. (2025, February 3). Researchers say they had a ‘100% attack success rate’ on jailbreak attempts against Chinese AI startup DeepSeek. Retrieved from Fortune: https://fortune.com/2025/02/02/deepseek-ai-chatbot-security-jailbreak-attempts-openai-cisco/
3.Kassianik, P., & Karbasi, A. (2025, January 31). Evaluating Security Risk in DeepSeek and Other Frontier Reasoning Models. Retrieved from Cisco: https://blogs.cisco.com/security/evaluating-security-risk-in-deepseek-and-other-frontier-reasoning-models