शोधकर्ता बहु-छवि निहित विषाक्तता (MIIT) की चुनौती को संबोधित करते हैं, जहां हानिकारक अर्थ केवल तभी उभरते हैं जब निर्दोष छवियों को संयुक्त रूप से व्याख्या किया जाता है। वे MIIT-dataset पेश करते हैं, एक नया केवल-छवि सुरक्षा डेटासेट जो सात जोखिम श्रेणियों को कवर करता है, और इन खतरों की पहचान करने के लिए MiShield को प्रशिक्षित करते हैं।

  • टीम ने MIIT-dataset का निर्माण स्वचालित जनरेशन पाइपलाइन का उपयोग करके सात प्रतिनिधि जोखिम श्रेणियों को कवर करने के लिए किया।
  • MiShield को खतरों का कारण बनने वाली सहसंबद्ध इकाइयों के स्पष्ट विश्लेषण उत्पन्न करने के लिए क्रमिक रूप से विलीन तर्क पर्यवेक्षण के साथ प्रशिक्षित किया गया है।
  • प्रयोग दिखाते हैं कि MiShield-8B मॉडल प्रतिनिधि मॉडरेशन सेवाओं और बड़े-स्तर के मॉडलों को हराते हैं।

यह कार्य बहु-छवि फॉर्मेट में निहित विषाक्तता की पहचान के लिए एक व्यावहारिक समाधान प्रदान करता है, जिसे मौजूदा वाणिज्यिक API अक्सर स्पष्ट जोखिम संकेतों की कमी के कारण चूक जाते हैं।