AI summary1 แหล่ง· 4 วันก่อน

โมเดล AI ใช้ token มากขึ้นตอนทำผิด แตกต่างจากคนที่ยอมแพ้

นักวิจัยพบว่า Large Reasoning Models (LRMs) มีพฤติกรรมตรงข้ามกับมนุษย์ — เมื่อโมเดลตอบผิด มันใช้ token (ความพยายาม) มากขึ้น แต่คนจะใช้เวลาน้อยลงตอนทำผิด งานใหม่ชื่อ DyCon พยายามแก้ปัญหา \"overthinking\" โดยปรับความยากของปัญหาแบบ dynamic ขณะที่โมเดลกำลังคิด แทนที่จะใช้ static difficulty estimate

01
แหล่งข่าว
03
ประเด็น
4 วันก่อน
อัปเดต
  • LRMs ใช้ token มากขึ้นตอนตอบผิด ตรงข้ามกับมนุษย์ที่ยอมแพ้เร็ว
  • ปัญหา \"overthinking\" เกิดจากโมเดลไม่รู้ว่าปัญหาเปลี่ยนความยากไปตามขั้นตอนการคิด
  • DyCon ใช้ dynamic difficulty modeling เพื่อให้โมเดลรู้เมื่อไหร่ควรหยุดคิด
แหล่งต้นทาง · 2

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง