AI summary 1 แหล่ง
· วันนี้ · 05:16
นักวิจัยพบช่องโหว่ใหม่ใน Vision-Language Models — ปล่อยชุดข้อมูลโจมตี 47,524 ตัวอย่าง
ทีมวิจัยเปิดตัว PHANTOM — ชุดข้อมูลโจมตีแบบ adversarial ขนาดใหญ่สำหรับ vision-language models ที่ครอบ 55 หมวดหมู่ของเจตนาอันตราย พร้อมกับค้นพบช่องโหว่ใหม่ชื่อ \"Forced Deferral\" ที่ให้攻击者ควบคุมการตัดสินใจของระบบ cascade โดยจัดการค่า confidence ของโมเดลอ่อน เพื่อบังคับให้ query ไปยังโมเดลแรงเสมอ
01
แหล่งข่าว
03
ประเด็น
วันนี้ · 05:16
อัปเดต
- PHANTOM dataset มี 47,524 adversarial samples ครอบ 10 หมวดหมู่หลักและ 55 subcategories ของการโจมตี
- Forced Deferral attack ใช้การจัดการ confidence score เพื่อบังคับให้ระบบ cascade ใช้โมเดลแรงแทนโมเดลอ่อน
- ช่องโหว่เกิดจากการออกแบบ cascade ที่ให้ confidence ของโมเดลอ่อนควบคุมการจัดสรรทรัพยากร
แหล่งต้นทาง · 2
ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้
แชร์
ข่าวที่เกี่ยวข้อง
AI ในการแพทย์ต้องมีระบบควบคุมความปลอดภัย — นักวิจัยเปิดตัว 12 benchmark ใหม่
2 แหล่ง · วันนี้ · 05:16
วิจัยใหม่เร่ง RLHF และ RL สำหรับ LLM — ลดคอขวดการ generate ด้วย adaptive parallelism
1 แหล่ง · วันนี้ · 05:15
โมเดล AI สร้างภาพ MRI สมองและข้อมูลทางการแพทย์ได้เอง ลดต้นทุนการตรวจวินิจฉัย
1 แหล่ง · วันนี้ · 05:15
AI Agent ยุคใหม่: Claude Opus 4.8 ทำงานได้ 89% แต่ปัญหาจริงคือ Memory และ State Management
1 แหล่ง · วันนี้ · 05:15
LLM ในคลินิกไม่รู้ว่าตัวเองไม่รู้ — วิจัยเผย AI ทำการวินิจฉัยผิดเมื่อถูกกดดัน
1 แหล่ง · วันนี้ · 05:12