AI summary 1 แหล่ง · 2 วันก่อน

LoRA ปรับแต่ง LLM: ค้นพบ scaling factor สำคัญกว่า learning rate

นักวิจัยค้นพบว่าใน LoRA (Low-Rank Adaptation) ตัวแปร scaling factor α มีบทบาทสำคัญกว่าที่คิดไว้ — มันขับเคลื่อนการเพิ่มประสิทธิภาพได้ดีกว่าการปรับ learning rate เพียงอย่างเดียว พร้อมกับนั้น งานวิจัยอื่นแยกแยะระหว่าง capability elicitation (ปลดปล่อยความสามารถที่มีอยู่) กับ capability creation (สร้างความสามารถใหม่) ในการ post-training และศึกษาว่าควรเลือกคู่ข้อมูลไหนเพื่อให้ labeling budget มีประสิทธิภาพสูงสุด

แหล่งข่าว

ประเด็น

2 วันก่อน

อัปเดต

Scaling factor α ในLoRA มีผลต่อการเพิ่มประสิทธิภาพมากกว่า learning rate scaling เพียงอย่างเดียว
Post-training ต้องแยกความแตกต่างระหว่างการปลดปล่อยความสามารถที่มีอยู่กับการสร้างความสามารถใหม่
เลือกคู่ข้อมูลที่มีข้อมูลสูงสุดเพื่อลดค่าใช้จ่าย human labeling ในการ preference-based post-training

แหล่งต้นทาง · 3

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI 3 วันก่อน

Which Pairs to Compare for LLM Post-Training?

arXiv — cs.AI 12 มิ.ย.

The Hidden Power of Scaling Factor in LoRA Optimization

arXiv — cs.AI 12 พ.ค.

On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective

แชร์