MiShield सहसंबद्ध इकाइयों का विश्लेषण करके बहु-छवि निहित विषाक्तता का पता लगाता है

शोधकर्ता बहु-छवि निहित विषाक्तता (MIIT) की चुनौती को संबोधित करते हैं, जहां हानिकारक अर्थ केवल तभी उभरते हैं जब निर्दोष छवियों को संयुक्त रूप से व्याख्या किया जाता है। वे MIIT-dataset पेश करते हैं, एक नया केवल-छवि सुरक्षा डेटासेट जो सात जोखिम श्रेणियों को कवर करता है, और इन खतरों की पहचान करने के लिए MiShield को प्रशिक्षित करते हैं।

टीम ने MIIT-dataset का निर्माण स्वचालित जनरेशन पाइपलाइन का उपयोग करके सात प्रतिनिधि जोखिम श्रेणियों को कवर करने के लिए किया।
MiShield को खतरों का कारण बनने वाली सहसंबद्ध इकाइयों के स्पष्ट विश्लेषण उत्पन्न करने के लिए क्रमिक रूप से विलीन तर्क पर्यवेक्षण के साथ प्रशिक्षित किया गया है।
प्रयोग दिखाते हैं कि MiShield-8B मॉडल प्रतिनिधि मॉडरेशन सेवाओं और बड़े-स्तर के मॉडलों को हराते हैं।

यह कार्य बहु-छवि फॉर्मेट में निहित विषाक्तता की पहचान के लिए एक व्यावहारिक समाधान प्रदान करता है, जिसे मौजूदा वाणिज्यिक API अक्सर स्पष्ट जोखिम संकेतों की कमी के कारण चूक जाते हैं।