AI summary 3 แหล่ง
· 2 วันก่อน
LLM agents ต้องเลือกเครื่องมือให้ดีขึ้น — วิจัยใหม่แก้ปัญหา tool retrieval และ context overflow
กลุ่มวิจัยจาก Hugging Face, arXiv และ Google ออกเครื่องมือและวิธีการใหม่เพื่อให้ LLM agents ใช้เครื่องมือภายนอกได้เหมาะสมขึ้น ปัญหาหลักคือ agents เลือกเครื่องมือผิด, ใช้ context เกินขีด, และไม่รู้เมื่อไหร่ต้องขอความชี้แจง วิธีแก้ไขรวมถึง parametric tool retrieval, context pruning, causal tool filtering, และ uncertainty-aware clarification ที่ช่วยให้ agents ตัดสินใจได้ดีขึ้นในสถานการณ์จริง
03
แหล่งข่าว
03
ประเด็น
2 วันก่อน
อัปเดต
- Tool retrieval bottleneck: embedding-based retrieval ไม่จับ specialized semantics ได้ดี — parametric approach (virtual tokens) แก้ได้ดีกว่า
- Context overflow: verbose tool responses ทำให้ inference cost สูง — context pruning + importance-aware compression ช่วยลด token ที่ไม่จำเป็น
- Agent uncertainty: agents ไม่รู้เมื่อไหร่ต้องขอชี้แจง หรือเมื่อไหร่ tool ไม่เหมาะ — information gain reward + conflict-aware decoding ช่วยให้ตัดสินใจดีขึ้น
แหล่งต้นทาง · 12
ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้
EN EN EN EN EN EN EN EN EN EN EN EN
arXiv — cs.AI 3 วันก่อน
DeXposure-Claw: An Agentic System for DeFi Risk Supervision
Hugging Face Blog 12 มิ.ย.
olmo-eval: An evaluation workbench for the model development loop
arXiv — cs.AI 12 มิ.ย.
ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledge in LLMs
arXiv — cs.AI 12 มิ.ย.
Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents
arXiv — cs.AI 11 มิ.ย.
Knowing When to Ask: Self-Gated Clarification for Hierarchical Language Agents
arXiv — cs.AI 10 มิ.ย.
Less Context, Better Agents: Efficient Context Engineering for Long-Horizon Tool-Using LLM Agents
arXiv — cs.AI 10 มิ.ย.
From Context-Aware to Conflict-Aware: Generalizing Contrastive Decoding for Knowledge Conflict in LLMs
arXiv — cs.AI 9 มิ.ย.
Contract2Tool: Learning Preconditions and Effects for Reliable Tool-Augmented LLM Agents
arXiv — cs.AI 8 มิ.ย.
Exploring Agentic Tool-Calling Decisions via Uncertainty-Aligned Reinforcement Learning
arXiv — cs.AI 3 มิ.ย.
From Long News to Accurate Forecast: Importance-Aware Fusion and PRM-Guided Reflection for Time Series Forecasting
arXiv — cs.AI 3 มิ.ย.
Uncertainty-Aware Clarification in LLM Agents with Information Gain
Google Research 12 มี.ค.
Introducing Groundsource: Turning news reports into data with Gemini
แชร์
ข่าวที่เกี่ยวข้อง
iOS 27 เตรียมอัปเกรด Siri ด้วย AI — chat interface และ Dynamic Island integration
1 แหล่ง · วันนี้ · 17:09
OpenAI แก้ปัญหาคณิตศาสตร์ 80 ปีด้วย AI reasoning model ต้นทุนต่ำกว่า $1000
3 แหล่ง · วันนี้ · 17:08
ทรัมป์บล็อก Anthropic ดึง Fable 5 และ Mythos 5 ออกจากต่างประเทศ
2 แหล่ง · วันนี้ · 17:08
OpenAI และ Adobe เพิ่มเครื่องมือตรวจจับ AI — ตั้งมาตรฐาน provenance เนื้อหา
4 แหล่ง · เมื่อวาน · 23:08
บอร์ดถามเรื่อง AI ROI และความเสี่ยง — IT leader ต้องเตรียมคำตอบเรื่องความรับผิดชอบและการควบคุม
2 แหล่ง · เมื่อวาน · 23:08