คุณเคยสงสัยมั้ยครับ ว่าทำไมบางครั้ง AI ถึงตอบคำถามผิดๆ หรือให้ข้อมูลที่ไม่สมเหตุสมผล?

ปัญหานี้กำลังจะหมดไป เพราะนักวิจัยจาก Alibaba และ University of Science and Technology of China ได้พัฒนา AI ตัวใหม่ที่ชื่อว่า START (Self-Taught Reasoner with Tools) หรือแปลเป็นไทยง่ายๆ ว่า "ระบบเรียนรู้การใช้เหตุผลด้วยตนเองพร้อมเครื่องมือ"

START ไม่ใช่แค่ AI ธรรมดา แต่มันเป็น AI ที่คิดเป็นขั้นเป็นตอน และรู้จักใช้เครื่องมือช่วยคิด เหมือนกับที่เราใช้เครื่องคิดเลขหรือโปรแกรมคอมพิวเตอร์ช่วยแก้ปัญหายากๆ นั่นเอง ทำให้ START มีความสามารถในการแก้ปัญหาที่ซับซ้อนได้ดีกว่า AI รุ่นก่อนๆ

START ทำงานอย่างไร? อะไรที่ทำให้ START แตกต่าง

START เป็น AI ที่ต่อยอดมาจากแนวคิด Large Reasoning Models (LRMs) หรือโมเดลภาษาขนาดใหญ่ที่เน้นการใช้เหตุผลเป็นหลัก โดย START มีคุณสมบัติเด่นที่น่าสนใจดังนี้:

  • Chain-of-Thought (CoT): คิดเป็นขั้นตอนอย่างเป็นระบบ:

    • START ใช้วิธีที่เรียกว่า "Chain-of-Thought" หรือ "การคิดแบบลูกโซ่" คือการแตกปัญหาที่ซับซ้อนออกเป็นขั้นตอนย่อยๆ แล้วค่อยๆ แก้ไปทีละขั้น ทำให้สามารถวิเคราะห์และจัดการกับปัญหาที่ซับซ้อนได้ดีกว่าเดิม เหมือนเวลาที่เราแก้โจทย์คณิตศาสตร์ยากๆ ก็ต้องทำทีละขั้นตอน

  • การใช้เครื่องมือภายนอก (External Tools): Python Interpreter:

    • เมื่อเจอปัญหาที่ต้องคำนวณซับซ้อน หรือต้องการข้อมูลเพิ่มเติม START จะเรียกใช้โปรแกรม Python เพื่อช่วยคำนวณ, ตรวจสอบข้อมูล หรือสร้างผลลัพธ์ที่ต้องการ ทำให้ได้คำตอบที่แม่นยำและน่าเชื่อถือ เหมือนมีเครื่องคิดเลขอัจฉริยะและผู้ช่วยวิเคราะห์ข้อมูลส่วนตัว

  • Self-Taught Learning: เรียนรู้และปรับปรุงตัวเอง:

    • START มีระบบที่ช่วยให้มันเรียนรู้จากประสบการณ์ของตัวเอง และปรับปรุงความสามารถในการใช้เหตุผลและการใช้เครื่องมือให้ดีขึ้นเรื่อยๆ คล้ายๆ กับที่เราฝึกทำโจทย์ซ้ำๆ จนเก่งขึ้น 

    • ใช้เทคนิคที่เรียกว่า Hint-infer และ Hint Rejection Sampling Fine-Tuning (Hint-RFT) ซึ่งช่วยให้โมเดลสามารถเรียนรู้วิธีการใช้เครื่องมือภายนอกได้อย่างมีประสิทธิภาพ โดยไม่จำเป็นต้องมีข้อมูลตัวอย่างจำนวนมาก

กลไกการทำงานของ START 

(เทคนิคหน่อย ข้ามไปได้ครับ)

รูปภาพประกอบการทำงานของ START จากเปเปอร์งานวิจัย

START ทำงานผ่านกระบวนการสำคัญ 2 ขั้นตอน:

  1. Hint-infer:

    1. ในขั้นตอนนี้ START จะแทรก "คำใบ้" (hints) เข้าไปในกระบวนการให้เหตุผล เพื่อกระตุ้นให้โมเดลเรียกใช้เครื่องมือภายนอก

    2. ตัวอย่างคำใบ้ เช่น "Wait, maybe using Python here is a good idea." ซึ่งจะถูกแทรกเข้าไปหลังคำเชื่อมต่างๆ หรือก่อน stop token 1

  2. Hint Rejection Sampling Fine-Tuning (Hint-RFT):

    1. ขั้นตอนนี้จะนำผลลัพธ์จาก Hint-infer มาคัดกรอง ให้คะแนน และปรับแต่ง เพื่อสร้างชุดข้อมูลคุณภาพสูง (Dseed)

    2. จากนั้นจะนำ Dseed ไป fine-tune โมเดลพื้นฐาน (QwQ-32B-Preview) เพื่อสร้าง START-0

    3. START-0 จะถูกใช้ในการสร้างชุดข้อมูลที่หลากหลายยิ่งขึ้น (DSTART) ซึ่งจะนำไปสู่การ fine-tune ครั้งสุดท้ายเพื่อสร้าง START

START เก่งแค่ไหน? ตัวอย่างความสามารถที่น่าทึ่ง

START ไม่ใช่แค่ "เก่ง" แต่มัน "เก่งมาก" ครับลองดูตัวอย่างความสามารถที่น่าทึ่งของ START กัน

  • แก้โจทย์คณิตศาสตร์ระดับแข่งขัน:

    • START ทำคะแนนได้สูงในการแข่งขันคณิตศาสตร์ระดับสูง เช่น MATH500 และ AMC23 โดยมีความแม่นยำถึง 95% ในการแข่งขันบางรายการ ซึ่งสูงกว่านักเรียนหัวกะทิหลายๆ คน

  • ตอบคำถามวิทยาศาสตร์ระดับปริญญาเอก:

    • START สามารถตอบคำถามที่ยากและซับซ้อนในระดับปริญญาเอกได้อย่างแม่นยำ ในการทดสอบ GPQA (Graduate-Level Science Questions) START ทำคะแนนได้ดีกว่า AI รุ่นก่อนๆ อย่างเห็นได้ชัด

  • เขียนโค้ดคอมพิวเตอร์และแก้ไขข้อผิดพลาด (Debugging):

    • START ไม่เพียงแต่เขียนโค้ดโปรแกรมได้เท่านั้น แต่ยังสามารถตรวจสอบและแก้ไขข้อผิดพลาดในโค้ดได้ด้วยตัวเอง ซึ่งเป็นทักษะที่สำคัญอย่างยิ่งในการพัฒนาซอฟต์แวร์

ที่น่าทึ่งไปกว่านั้นคือ START ทำสิ่งเหล่านี้ได้โดยไม่ต้องมีคนคอยบอกทุกขั้นตอน มันรู้จักคิด วิเคราะห์ และแก้ปัญหาด้วยตัวเอง คล้ายกับที่มนุษย์เราทำ 

เก่งขึ้นจนน่าตกใจ (แอบกลัวเบาๆ 😆)

เทคโนโลยีเบื้องหลัง START: QwQ-32B-Preview และ Fine-Tuning

START สร้างขึ้นจากพื้นฐานของโมเดล QwQ-32B-Preview ซึ่งเป็น Large Language Model (LLM) ที่มีประสิทธิภาพสูง และใช้ภาษา Python เป็นเครื่องมือสำคัญในการช่วยคิดและประมวลผลข้อมูล

นอกจากนี้ START ยังใช้กระบวนการ Fine-Tuning แบบสองขั้นตอน (Two-Phase Fine-Tuning) เพื่อปรับแต่งโมเดลให้มีความสามารถในการใช้เหตุผลและการใช้เครื่องมือได้ดียิ่งขึ้น

START จะเปลี่ยนโลกของเราไปอย่างไร? ศักยภาพในการประยุกต์ใช้

START มีศักยภาพในการปฏิวัติและเปลี่ยนแปลงโลกของเราในหลายๆ ด้าน เช่น

  • การวิจัยทางวิทยาศาสตร์:

    • START สามารถช่วยนักวิทยาศาสตร์วิเคราะห์ข้อมูลที่ซับซ้อน, ค้นหาความสัมพันธ์ที่ซ่อนอยู่, หรือแม้แต่ช่วยคิดค้นทฤษฎีใหม่ๆ ได้อย่างมีประสิทธิภาพ

  • การศึกษา:

    • START สามารถนำมาใช้ในการพัฒนาสื่อการเรียนรู้ที่ชาญฉลาดและปรับให้เหมาะกับผู้เรียนแต่ละคน ช่วยให้เข้าใจเนื้อหาที่ยากได้ง่ายขึ้น

  • การพัฒนาซอฟต์แวร์:

    • START สามารถช่วยโปรแกรมเมอร์เขียนโค้ด, ตรวจสอบข้อผิดพลาด, และเพิ่มประสิทธิภาพของโปรแกรม ทำให้การพัฒนาซอฟต์แวร์เป็นไปได้รวดเร็วและมีคุณภาพมากยิ่งขึ้น

  • การแก้ปัญหาที่ซับซ้อน:

    • ไม่ว่าจะเป็นการวิเคราะห์ข้อมูลทางการเงิน, การวางแผนกลยุทธ์ทางธุรกิจ, หรือการจัดการโลจิสติกส์ START สามารถช่วยให้เราตัดสินใจได้ดีขึ้น และแก้ปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพ

อนาคตของ AI ที่ "คิดเป็น" ไม่ใช่แค่ "จำได้"

START ไม่ใช่แค่ AI ธรรมดา แต่เป็นก้าวกระโดดครั้งใหญ่ของวงการเทคโนโลยีปัญญาประดิษฐ์ มันแสดงให้เห็นว่า AI สามารถ "คิดเป็น" ได้จริงๆ ไม่ใช่แค่จำข้อมูลมาตอบ

แม้ว่า START จะยังมีข้อจำกัดบางอย่าง เช่น ความสามารถในการทำงานกับภาษาอื่นๆ นอกเหนือจาก Python

แต่ก็เปิดประตูสู่โลกใหม่ของ AI ที่ฉลาดขึ้น เข้าใจบริบทมากขึ้น และพร้อมที่จะช่วยมนุษย์แก้ปัญหาที่ซับซ้อนยิ่งขึ้นในอนาคต

ใครจะรู้ ในอีกไม่กี่ปีข้างหน้า เราอาจได้เห็น AI ที่สามารถโต้ตอบและให้เหตุผลได้เหมือนมนุษย์จริงๆ ก็เป็นได้

START อาจเป็นจุดเริ่มต้นของการปฏิวัติครั้งใหญ่ในวงการ AI ที่จะเปลี่ยนโลกของเราไปตลอดกาล

แชทกับเปเปอร์งานวิจัย

แหล่งอ้างอิง

Reply

or to participate

Recommended for you

No posts found