AI summary 1 แหล่ง · 2 วันก่อน

LoRA ปรับแต่ง LLM: ค้นพบ scaling factor สำคัญกว่า learning rate

นักวิจัยค้นพบว่าใน LoRA (Low-Rank Adaptation) ตัวแปร scaling factor α มีบทบาทสำคัญกว่าที่คิดไว้ — มันขับเคลื่อนการเพิ่มประสิทธิภาพได้ดีกว่าการปรับ learning rate เพียงอย่างเดียว พร้อมกับนั้น งานวิจัยอื่นแยกแยะระหว่าง capability elicitation (ปลดปล่อยความสามารถที่มีอยู่) กับ capability creation (สร้างความสามารถใหม่) ในการ post-training และศึกษาว่าควรเลือกคู่ข้อมูลไหนเพื่อให้ labeling budget มีประสิทธิภาพสูงสุด

01
แหล่งข่าว
03
ประเด็น
2 วันก่อน
อัปเดต
  • Scaling factor α ในLoRA มีผลต่อการเพิ่มประสิทธิภาพมากกว่า learning rate scaling เพียงอย่างเดียว
  • Post-training ต้องแยกความแตกต่างระหว่างการปลดปล่อยความสามารถที่มีอยู่กับการสร้างความสามารถใหม่
  • เลือกคู่ข้อมูลที่มีข้อมูลสูงสุดเพื่อลดค่าใช้จ่าย human labeling ในการ preference-based post-training
แหล่งต้นทาง · 3

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง