AI summary 1 แหล่ง · 15 มิ.ย.

วิธีใหม่ปรับแต่ง LLM Agent Skills — จากการไล่ระดับ ไปถึงการตรวจสอบแบบไม่ต้องใช้ Ground Truth

นักวิจัยเพิ่งเสนอวิธีการหลายแบบเพื่อปรับปรุง agent skills — ชุดคำสั่งที่ควบคุมพฤติกรรม LLM agents ในงานเฉพาะ ปัญหาคือ skills ที่ดาวน์โหลดหรือสร้างเองมักไม่น่าเชื่อถือ ไม่สมบูรณ์ หรือล้าสมัย ทีมต่างๆ ลองใช้ gradient descent เป็นแรงบันดาลใจ (SkillGrad) การปรับแต่งหลายเป้าหมายพร้อมข้อจำกัดแพลตฟอร์ม (MOCHA) และการตรวจสอบคู่ trajectory โดยไม่ต้องคะแนนอ้างอิง (SkillAudit) เพื่อให้ agents ทำงานได้ดีขึ้นหลังจากปรับใช้

01
แหล่งข่าว
00
ประเด็น
15 มิ.ย.
อัปเดต
แหล่งต้นทาง · 4

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง