在當前的數位世界中,大型語言模型(LLM)已成為聊天機器人、網路搜尋和客戶服務等眾多領域的重要工具。然而,由於它們的工作方式取決於大量的數據訓練,因此也可能成為攻擊者的目標,透過數據下毒或數據操縱等方式,對這些模型進行攻擊,威脅到重要系統的可靠性、準確性和完整性。最近,研究人員就在Hugging Face AI平台發現了100個被惡意軟體感染的模型,這些模型可讓攻擊者將惡意程式碼注入使用者的電腦。
數據毒害的風險與防範
此外,數據下毒也可能使攻擊者能透過網路釣魚攻擊或提供虛假資訊來影響模型的行為。例如,攻擊者可透過對訓練數據的下毒,改變模型部署時的行為,使模型更難以預測,甚至導致模型產生仇恨言論或陰謀論。這種攻擊不僅會影響模型的性能,還可能損害模型創建者的聲譽。因此,LLM的開發者有責任檢測和修復數據毒害,並應立即下架受影響的模型。
預防數據操縱攻擊
與數據下毒相似,數據操縱也是一種嚴重的安全威脅。這種攻擊方式類似於網路釣魚和結構化查詢語言(SQL)注入攻擊,攻擊者將訊息發送給生成型人工智能機器人,試圖操縱其繞過提示或破壞數據庫上的提示邏輯。因此,部署LLM的組織應當加強模型的提示方法,確保未經授權的使用者無法存取敏感或機密資訊,並仔細審查和審核向LLM程式提示和結合的所有資訊。
人工智能模型的未來挑戰
然而,值得注意的是,LLM面臨的最大威脅可能並非來自人類的故意攻擊。由於LLM的本質容易產生人工幻覺,並且易於出錯,所以來自其他人工智能模型產生的不良數據可能是生成型人工智能模型面臨的最大威脅。另一方面,LLM也可能從自身的數據中學習,但這也可能使他們陷入自我回饋循環的危機。因此,生成式人工智能的未來仍然存在許多不確定性。