AI summary 1 แหล่ง · 11 มิ.ย.

นักวิจัยเสนอวิธีใหม่ติดตามพฤติกรรม AI แบบยาว — ข้ามขั้นตอนอธิบายได้

ปัญหาใหญ่ของ LLM ตัวใหญ่คือ ไม่สามารถอธิบายการให้เหตุผลแบบยาว (long reasoning trajectory) ได้ดี เพราะวิธีอธิบายแบบเดิมทำได้แค่ token เดียว นักวิจัย arXiv เสนอสองแนวทาง: (1) ข้ามขั้นตอนอธิบาย แล้วสอนโมเดลให้ทำนายพฤติกรรมของตัวเองแทน (2) ใช้ Behavior Cues — token พิเศษที่โมเดลปล่อยออกมาก่อนทำการใดการหนึ่ง เพื่อให้ monitor ภายนอกจับได้ง่าย ทั้งสองวิธีช่วยให้ควบคุมและตรวจสอบ AI ได้ดีขึ้น

01
แหล่งข่าว
00
ประเด็น
11 มิ.ย.
อัปเดต
แหล่งต้นทาง · 2

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง