AI summary 1 แหล่ง · วันนี้ · 05:16

นักวิจัยพบช่องโหว่ใหม่ใน Vision-Language Models — ปล่อยชุดข้อมูลโจมตี 47,524 ตัวอย่าง

ทีมวิจัยเปิดตัว PHANTOM — ชุดข้อมูลโจมตีแบบ adversarial ขนาดใหญ่สำหรับ vision-language models ที่ครอบ 55 หมวดหมู่ของเจตนาอันตราย พร้อมกับค้นพบช่องโหว่ใหม่ชื่อ \"Forced Deferral\" ที่ให้攻击者ควบคุมการตัดสินใจของระบบ cascade โดยจัดการค่า confidence ของโมเดลอ่อน เพื่อบังคับให้ query ไปยังโมเดลแรงเสมอ

01
แหล่งข่าว
03
ประเด็น
วันนี้ · 05:16
อัปเดต
  • PHANTOM dataset มี 47,524 adversarial samples ครอบ 10 หมวดหมู่หลักและ 55 subcategories ของการโจมตี
  • Forced Deferral attack ใช้การจัดการ confidence score เพื่อบังคับให้ระบบ cascade ใช้โมเดลแรงแทนโมเดลอ่อน
  • ช่องโหว่เกิดจากการออกแบบ cascade ที่ให้ confidence ของโมเดลอ่อนควบคุมการจัดสรรทรัพยากร
แหล่งต้นทาง · 2

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง