AI summary1 แหล่ง· 4 วันก่อน

โมเดล AI ใช้ token มากขึ้นตอนทำผิด แตกต่างจากคนที่ยอมแพ้

นักวิจัยพบว่า Large Reasoning Models (LRMs) มีพฤติกรรมตรงข้ามกับมนุษย์ — เมื่อโมเดลตอบผิด มันใช้ token (ความพยายาม) มากขึ้น แต่คนจะใช้เวลาน้อยลงตอนทำผิด งานใหม่ชื่อ DyCon พยายามแก้ปัญหา \"overthinking\" โดยปรับความยากของปัญหาแบบ dynamic ขณะที่โมเดลกำลังคิด แทนที่จะใช้ static difficulty estimate

แหล่งข่าว

ประเด็น

4 วันก่อน

อัปเดต

LRMs ใช้ token มากขึ้นตอนตอบผิด ตรงข้ามกับมนุษย์ที่ยอมแพ้เร็ว
ปัญหา \"overthinking\" เกิดจากโมเดลไม่รู้ว่าปัญหาเปลี่ยนความยากไปตามขั้นตอนการคิด
DyCon ใช้ dynamic difficulty modeling เพื่อให้โมเดลรู้เมื่อไหร่ควรหยุดคิด

แหล่งต้นทาง · 2

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI5 วันก่อน

Humans Disengage, Reasoning Models Persist: Separating Difficulty Registration from Deliberation Allocation

arXiv — cs.AI8 มิ.ย.

DyCon: Dynamic Reasoning Control via Evolving Difficulty Modeling

แชร์