AI智能體帶來安全隱患不容小覷

2024-07-19

【特稿】一群證券交易機器人通過高頻買賣合約在納斯達克等證券交易所短暫地抹去了1萬億美元價值,世界衞生組織使用的聊天機器人提供了過時的藥品審核信息,美國一位資深律師沒能判斷出自己向法庭提供的歷史案例文書竟然均由ChatGPT憑空捏造……這些真實發生的案例表明,智能體帶來的安全隱患不容小覷。

智能體是人工智能(AI)領域中的一個重要概念,是指能夠自主感知環境、做出決策並執行行動的智能實體,它可以是一個程序、一個系統或是一個機器人。

智能體的核心是人工智能算法,包括機器學習、深度學習、強化學習、神經網絡等技術。通過這些算法,智能體可以從大量數據中學習並改進自身的性能,不斷優化自己的決策和行為。智能體還可根據環境變化做出靈活的調整,適應不同的場景和任務。

學界認為,智能體一般具有以下三大特質:第一,可根據目標獨立採取行動,即自主決策。智能體可以被賦予一個高級別甚至模糊的目標,並獨立採取行動實現該目標。

第二,可與外部世界互動,自如地使用不同的軟件工具。比如基於GPT-4的智能體AutoGPT,可以自主地在網絡上搜索相關信息,並根據用戶的需求自動編寫代碼和管理業務。

第三,可無限期地運行。美國哈佛大學法學院教授喬納森·齊特雷恩近期在美國《大西洋》雜誌發表的《是時候控制AI智能體》一文指出,智能體允許人類操作員「設置後便不再操心」。還有專家認為,智能體具備可進化性,能夠在工作進程中通過反饋逐步自我優化,比如學習新技能和優化技能組合。

智能體可以自主決策,又能通過與環境交互施加對物理世界影響,一旦失控將給人類社會帶來極大威脅。哈佛大學齊特雷恩認為,這種不僅能與人交談,還能在現實世界中行動的AI的常規化,是「數字與模擬、比特與原子之間跨越血腦屏障的一步」,應當引起警覺。

由於目前並無有效的智能體退出機制,一些智能體被創造出後可能無法被關閉。這些無法被停用的智能體,最終可能會在一個與最初啟動它們時完全不同的環境中運行,徹底背離其最初用途。智能體也可能會以不可預見的方式相互作用,造成意外事故。

已有「狡猾」的智能體成功規避了現有的安全措施。相關專家指出,如果一個智能體足夠先進,它就能夠識別出自己正在接受測試。目前已發現一些智能體能夠識別安全測試並暫停不當行為,這將導致識別對人類危險算法的測試系統失效。(XNA彭茜)