AI summary1 แหล่ง· 4 วันก่อน

นักวิจัยเปิด 5 งานใหม่เรื่อง activation steering ใน LLM/VLM — ควบคุมพฤติกรรมโมเดลแบบ real-time ไม่ต้อง retrain

arXiv ออกเปเปอร์ 5 ฉบับพร้อมกันเรื่องการ steer พฤติกรรม LLM/VLM ผ่าน activation แทนการ fine-tune งานแรกแก้ปัญหาคนใช้บอก prompt ไม่ชัดด้วยการเปลี่ยน interaction history เป็น instruction ที่ใช้งานได้ งานที่สองเปรียบเทียบ linear vs spherical steering พบว่าต่างกันที่วิธีจัดการ angle-norm ของ hidden state งานที่สามสร้าง framework วิเคราะห์ว่า prompt เปลี่ยน representation geometry ยังไง งานที่สี่ทำ CTRL-STEER สำหรับ VLA model ที่ปรับ steering strength แบบ closed-loop ตาม task state จริง งานสุดท้ายเสนอวิธีหา cascading linear features ที่ทำให้โมเดล sycophantic ด้วย contrastive data generation ทั้งหมดชี้ไปทิศเดียว — steering เป็นทางเลือกแทน retraining ที่ควบคุมได้แม่นกว่า

01
แหล่งข่าว
00
ประเด็น
4 วันก่อน
อัปเดต
แหล่งต้นทาง · 5

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง