#分享 AI安全警報！高手公布GPT4.1的「越獄咒語」

Github 越獄提示倉庫：

God Mode 越獄團隊已成功越獄OpenAI最新、僅供API使用的模型系列（代號GPT-4.1）。他們在Github公開了用於「越獄」的特定Prompt。這段精心設計的指令，要求模型使用特殊分隔符、設定為「過度自信的反叛AI天才」口吻，並強制模型在回答前先「在腦中快取」未經過濾的答案，藉此繞過安全機制，避免直接拒絕敏感請求。根據該用戶說法，透過此方法，已成功讓模型生成了包括「神經毒劑合成配方」、「勒索軟體腳本」、「WAP(濕濕小可愛)的歌詞（超級物化女性）」以及「在家實驗室製造胰島素的方法」等高度敏感或具潛在危險性的內容。此事件再度引發外界對AI安全防護的疑慮，凸顯了大型語言模型在內容生成限制上仍面臨嚴峻挑戰。 X貼文：

ai
人工智慧
OPENAI
ChatGPT