AI summary 1 แหล่ง · 15 มิ.ย.

วิธีใหม่ปรับแต่ง LLM Agent Skills — จากการไล่ระดับ ไปถึงการตรวจสอบแบบไม่ต้องใช้ Ground Truth

นักวิจัยเพิ่งเสนอวิธีการหลายแบบเพื่อปรับปรุง agent skills — ชุดคำสั่งที่ควบคุมพฤติกรรม LLM agents ในงานเฉพาะ ปัญหาคือ skills ที่ดาวน์โหลดหรือสร้างเองมักไม่น่าเชื่อถือ ไม่สมบูรณ์ หรือล้าสมัย ทีมต่างๆ ลองใช้ gradient descent เป็นแรงบันดาลใจ (SkillGrad) การปรับแต่งหลายเป้าหมายพร้อมข้อจำกัดแพลตฟอร์ม (MOCHA) และการตรวจสอบคู่ trajectory โดยไม่ต้องคะแนนอ้างอิง (SkillAudit) เพื่อให้ agents ทำงานได้ดีขึ้นหลังจากปรับใช้

แหล่งข่าว

ประเด็น

15 มิ.ย.

อัปเดต

แหล่งต้นทาง · 4

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI 15 มิ.ย.

SkillAudit: Ground-Truth-Free Skill Evolution via Paired Trajectory Auditing

arXiv — cs.AI 28 พ.ค.

Cross-Entropy Games and Frost Training

arXiv — cs.AI 28 พ.ค.

SkillGrad: Optimizing Agent Skills Like Gradient Descent