AI summary 1 แหล่ง · วันนี้ · 05:16

นักวิจัยพบช่องโหว่ใหม่ใน Vision-Language Models — ปล่อยชุดข้อมูลโจมตี 47,524 ตัวอย่าง

ทีมวิจัยเปิดตัว PHANTOM — ชุดข้อมูลโจมตีแบบ adversarial ขนาดใหญ่สำหรับ vision-language models ที่ครอบ 55 หมวดหมู่ของเจตนาอันตราย พร้อมกับค้นพบช่องโหว่ใหม่ชื่อ \"Forced Deferral\" ที่ให้攻击者ควบคุมการตัดสินใจของระบบ cascade โดยจัดการค่า confidence ของโมเดลอ่อน เพื่อบังคับให้ query ไปยังโมเดลแรงเสมอ

แหล่งข่าว

ประเด็น

วันนี้ · 05:16

อัปเดต

PHANTOM dataset มี 47,524 adversarial samples ครอบ 10 หมวดหมู่หลักและ 55 subcategories ของการโจมตี
Forced Deferral attack ใช้การจัดการ confidence score เพื่อบังคับให้ระบบ cascade ใช้โมเดลแรงแทนโมเดลอ่อน
ช่องโหว่เกิดจากการออกแบบ cascade ที่ให้ confidence ของโมเดลอ่อนควบคุมการจัดสรรทรัพยากร

แหล่งต้นทาง · 2

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI วันนี้ · 04:00

PHANTOM: A Large-Scale Dataset of Multimodal Adversarial Attacks for Vision-Language Models

arXiv — cs.AI 16 มิ.ย.

Forced Deferral: Manipulating Routing Decisions in Multimodal LLM Cascades

แชร์