#分享 AI安全警報!高手公布GPT4.1的「越獄咒語」

Github 越獄提示倉庫:
God Mode 越獄團隊已成功越獄OpenAI最新、僅供API使用的模型系列(代號GPT-4.1)。 他們在Github公開了用於「越獄」的特定Prompt。這段精心設計的指令,要求模型使用特殊分隔符、設定為「過度自信的反叛AI天才」口吻,並強制模型在回答前先「在腦中快取」未經過濾的答案,藉此繞過安全機制,避免直接拒絕敏感請求。 根據該用戶說法,透過此方法,已成功讓模型生成了包括「神經毒劑合成配方」、「勒索軟體腳本」、「WAP(濕濕小可愛)的歌詞(超級物化女性)」以及「在家實驗室製造胰島素的方法」等高度敏感或具潛在危險性的內容。 此事件再度引發外界對AI安全防護的疑慮,凸顯了大型語言模型在內容生成限制上仍面臨嚴峻挑戰。 X貼文:
愛心
驚訝
哈哈
76
49
全部留言