Anthropic ने Claude Fable 5 को वैश्विक स्तर पर पुनः तैनात किया है और अपने साइबर सुरक्षा सुरक्षा वर्गीकारकों और एक प्रस्तावित AI जेलब्रेक गंभीरता फ्रेमवर्क के बारे में विस्तृत जानकारी प्रकाशित की है। कंपनी सरकारों के साथ जेलब्रेक जोखिमों पर चर्चा करने के लिए स्थिर शब्दावली स्थापित करने का लक्ष्य रखती है, जबकि व्यापक समुदाय से प्रतिक्रिया आमंत्रित करती है।

  • सुरक्षा वर्गीकारक साइबर सुरक्षा उपयोगों को चार समूहों में वर्गीकृत करते हैं: प्रतिबंधित, उच्च जोखिम द्वि-उद्देश्यीय, निम्न जोखिम द्वि-उद्देश्यीय और हानिरहित।
  • प्रतिबंधित कार्यों में रैंसमवेयर, साइबर-भौतिकsabotage, मैलवेयर विकास और इंटरनेट बैकबोन हमले शामिल हैं क्योंकि इनमें हानि का उच्च संभावना है।
  • उच्च जोखिम द्वि-उद्देश्यीय गतिविधियाँ, जैसे कि पेनेट्रेशन टेस्टिंग और एक्सप्लॉइट विकास, वर्तमान में अनुमत अभिनेताओं के लिए बेहतर एक्सेस नियंत्रण की प्रतीक्षा में अवरुद्ध हैं।
  • विभिन्न प्रकार के AI जेलब्रेक्स द्वारा उत्पन्न जोखिमों का सुसंगत रूप से वर्णन करने में डेवलपर्स और सरकारों की सहायता के लिए एक नया जेलब्रेक गंभीरता फ्रेमवर्क प्रस्तावित किया गया है।

यह पहल अकादमिक, उद्योग और सरकार के बीच चर्चा को बढ़ावा देने का लक्ष्य रखती है ताकि मानकों को परिभाषित किया जा सके जो रक्षात्मक तकनीकी उपयोग को सक्षम बनाएं जबकि दुरुपयोग को रोकें।