Andrew Ng เผยเทรนด์ AI Agents และ Agentic Reasoning ใน BUILD 2024

AI กำลังเปลี่ยนแปลงโลกอย่างรวดเร็ว และ Andrew Ng หนึ่งในผู้เชี่ยวชาญด้าน AI ที่มีชื่อเสียง ได้แบ่งปันมุมมองและแนวโน้มสำคัญในวงการ AI ผ่านการบรรยายที่ BUILD 2024 โดยเขาเน้นถึงโอกาสใหม่ๆ ที่เกิดขึ้นจากเทคโนโลยี AI agents และ agentic reasoning ซึ่งเป็นแนวทางใหม่ในการพัฒนาแอปพลิเคชัน AI ที่ทรงพลังและประหยัดต้นทุน

AI คือไฟฟ้าแห่งยุคดิจิทัล

Andrew Ng เปรียบ AI ว่าเป็น “ไฟฟ้าแห่งยุคใหม่” เพราะเป็นเทคโนโลยีที่มีประโยชน์ครอบคลุมหลากหลายด้านเหมือนไฟฟ้าในอดีต ทำให้เราสามารถสร้างแอปพลิเคชันใหม่ๆ ที่ไม่เคยเป็นไปได้มาก่อน AI จึงเป็นเทคโนโลยีพื้นฐานที่มีหลายชั้นซ้อนกัน ตั้งแต่ฮาร์ดแวร์ เช่น เซมิคอนดักเตอร์ จนถึงโครงสร้างพื้นฐานบนคลาวด์ เช่น Snowflake และชั้นของโมเดลพื้นฐาน (foundation models) ที่ได้รับความสนใจอย่างมากในช่วงนี้

อย่างไรก็ตาม สิ่งที่สำคัญและมักถูกมองข้ามคือชั้นแอปพลิเคชัน ที่จะสร้างมูลค่าและรายได้ให้กับเทคโนโลยีด้านล่าง การพัฒนาแอปพลิเคชัน AI จึงเป็นพื้นที่ที่มีโอกาสมากที่สุดในการสร้างนวัตกรรมใหม่

การพัฒนา AI เร็วขึ้นด้วย Generative AI

เทรนด์ที่เห็นได้ชัดในช่วงสองสามปีที่ผ่านมา คือการพัฒนาโมเดล AI ที่รวดเร็วขึ้นมาก โดยเฉพาะอย่างยิ่ง Generative AI ที่ช่วยให้การสร้างแอปพลิเคชันทำได้ในเวลาสั้นลงอย่างมาก

ตัวอย่างเช่น การสร้าง sentiment classifier ที่ใช้ตรวจสอบอารมณ์จากข้อความ จากเดิมที่ต้องใช้เวลาหลายเดือนในการเตรียมข้อมูล เทรนโมเดล และนำไปใช้งาน ปัจจุบันสามารถทำได้ในเวลาเพียงไม่กี่วันด้วยการเขียน prompt ที่เหมาะสมและนำไป deploy ทันที

การพัฒนา sentiment classifier ที่รวดเร็วขึ้นด้วย generative AI

การพัฒนาที่รวดเร็วนี้เปิดโอกาสให้ทีม AI สามารถทดลองสร้างต้นแบบได้จำนวนมากภายในเวลาสั้นๆ เช่น สร้างต้นแบบ 20 แบบในช่วงสุดสัปดาห์ แล้วคัดเลือกเฉพาะแบบที่ได้ผลดีที่สุด นี่คือการเปลี่ยนแปลงวิธีคิดจากการวางแผนล่วงหน้าระยะยาวสู่การทดลองและปรับปรุงอย่างรวดเร็ว

ความท้าทายใหม่: การประเมินผล (Evaluation) และการพัฒนาแอปพลิเคชัน

ถึงแม้การเทรนโมเดลจะเร็วขึ้นมาก แต่การประเมินผลหรือที่เรียกว่า evals กลับกลายเป็นคอขวดสำคัญ เพราะในแอปที่ใช้โมเดลภาษาใหญ่ (LLMs) บางครั้งไม่จำเป็นต้องมีข้อมูลเทรนมาก แต่ต้องการข้อมูลทดสอบจำนวนมากเพื่อความแม่นยำและความน่าเชื่อถือ

ดังนั้นกระบวนการพัฒนาใหม่จึงกลายเป็นการสร้างและเก็บข้อมูลควบคู่ไปพร้อมกัน แทนที่จะทำตามลำดับเหมือนเดิม นอกจากนี้ การสร้างแอปพลิเคชันยังมีหลายขั้นตอน เช่น การออกแบบผลิตภัณฑ์ การผสานระบบ และการดูแลหลังการ deploy ที่ยังไม่เร็วขึ้นเท่ากับการพัฒนาโมเดล AI

ความเร็วในการเทรนโมเดลที่เพิ่มขึ้นกดดันให้องค์กรต้องเร่งพัฒนาส่วนอื่นๆ ให้เร็วขึ้นเช่นกัน เพื่อให้สามารถนำ AI ไปใช้ในเชิงพาณิชย์ได้อย่างมีประสิทธิภาพ

แนวคิดใหม่: “Move Fast and Be Responsible”

ในอดีตมีคำขวัญว่า “Move fast and break things” ที่เน้นการเร่งทดลองแม้อาจจะเกิดข้อผิดพลาด แต่คำขวัญนี้ถูกมองในแง่ลบเพราะทำให้เกิดผลเสีย อย่างไรก็ตาม Andrew Ng เสนอว่า แนวคิดที่เหมาะสมในยุคนี้คือ “Move fast and be responsible” คือการพัฒนาอย่างรวดเร็วแต่ต้องคำนึงถึงความรับผิดชอบ ไม่ปล่อยของที่อาจก่อให้เกิดความเสียหายออกสู่สาธารณะ

ทีมพัฒนา AI ที่ฉลาดสามารถสร้างต้นแบบ ตรวจสอบ และทดสอบอย่างละเอียดก่อนปล่อยใช้งานจริงได้อย่างรวดเร็วและปลอดภัย ซึ่งเป็นสิ่งที่น่าตื่นเต้นและเปลี่ยนแปลงวงการ AI อย่างมาก

เทคโนโลยีที่น่าจับตามอง: Agentic AI Workflows

หนึ่งในเทรนด์ที่ Andrew Ng ให้ความสนใจมากที่สุด คือ “Agentic AI” หรือการออกแบบ AI ที่ทำงานแบบมีตัวแทน (agents) และกระบวนการ reasoning ที่มีหลายขั้นตอน (agentic workflows) ซึ่งแตกต่างจากการใช้งานโมเดลภาษาใหญ่แบบเดิมที่เรียกว่า zero-shot prompting

ใน zero-shot prompting เราเพียงแค่ส่งคำสั่งให้โมเดลตอบคำถามหรือเขียนเนื้อหาแบบทีเดียวจบ เช่น การเขียนเรียงความตั้งแต่ต้นจนจบโดยไม่แก้ไขระหว่างทาง ซึ่งแม้จะทำได้ดี แต่ไม่ใช่กระบวนการที่มีประสิทธิภาพที่สุด

เปรียบเทียบ zero-shot prompting กับ agentic workflows

ในทางกลับกัน agentic workflow จะทำงานเป็นขั้นตอน เช่น เริ่มจากร่างโครงเรื่อง ทำการค้นคว้าข้อมูลเพิ่มเติม ปรับปรุงร่างต้นฉบับ และทำซ้ำขั้นตอนเหล่านี้หลายรอบ จนได้ผลงานที่มีคุณภาพสูงกว่า

ตัวอย่างการใช้งาน agentic AI ได้แก่ การวิเคราะห์เอกสารกฎหมายซับซ้อน การช่วยวินิจฉัยทางการแพทย์ หรือการจัดการเอกสารราชการที่ซับซ้อน ซึ่งช่วยเพิ่มประสิทธิภาพและความแม่นยำได้อย่างมาก

หลักการออกแบบ Agentic Workflows มี 4 รูปแบบหลัก

Reflection: ให้โมเดลตรวจสอบและวิจารณ์ผลงานของตัวเอง เช่น เขียนโค้ดแล้วนำมาให้โมเดลตรวจสอบข้อผิดพลาดและแก้ไขจนดีขึ้น
To Use: ให้โมเดลตัดสินใจเรียกใช้งาน API หรือฟังก์ชันอื่นๆ เช่น ค้นหาข้อมูลบนเว็บ ส่งอีเมล หรือจัดการตารางนัดหมาย
Planning: ให้โมเดลวางแผนลำดับขั้นตอนการทำงาน เช่น การสร้างภาพโดยแยกขั้นตอนตรวจจับท่าทางก่อน แล้วสร้างภาพ จากนั้นอธิบายภาพ และปิดท้ายด้วยการสร้างเสียงประกอบ
Multi-Agent Collaboration: ให้โมเดลจำลองบทบาทหลายตัว เช่น coder กับ critic ที่ทำงานร่วมกันเพื่อลดข้อผิดพลาดและเพิ่มคุณภาพผลงาน

ตัวอย่าง reflection design pattern ใน agentic workflows

รูปแบบเหล่านี้ช่วยให้นักพัฒนาสามารถสร้างระบบที่ซับซ้อนขึ้นและมีประสิทธิภาพมากขึ้นได้อย่างรวดเร็ว

การมาของ Large Multimodal Models (LMMs) และ Visual AI

นอกจากโมเดลภาษาใหญ่แล้ว การพัฒนาโมเดลที่รองรับข้อมูลหลายรูปแบบ เช่น รูปภาพ วิดีโอ และเสียง หรือที่เรียกว่า Large Multimodal Models (LMMs) กำลังเป็นเทรนด์ที่น่าจับตามอง

โมเดลเหล่านี้สามารถประมวลผลข้อมูลภาพและวิดีโอได้ดีขึ้นเมื่อใช้ agentic workflows เช่น การนับจำนวนผู้เล่นในสนามฟุตบอลจากภาพถ่าย หรือการแยกคลิปวิดีโอที่มีเหตุการณ์สำคัญ เช่น การทำประตูในเกมฟุตบอล

นับจำนวนผู้เล่นในสนามฟุตบอลด้วย visual AI agent

ตัวอย่างเดโมที่ Andrew Ng และทีม Landing AI สาธิต คือ การใช้ vision agent เพื่อเขียนโค้ดวิเคราะห์ภาพและวิดีโอโดยอัตโนมัติ ช่วยให้บริษัทที่มีข้อมูลภาพและวิดีโอจำนวนมากสามารถนำข้อมูลเหล่านั้นมาใช้ประโยชน์ได้ง่ายขึ้น

ตัวอย่างการวิเคราะห์คลิปวิดีโอหาช่วงเวลาการทำประตู

นอกจากนี้ยังสามารถสร้างเมตาดาต้าจากวิดีโอ เช่น การแบ่งคลิปเป็นช่วงสั้นๆ พร้อมบรรยายและจัดเก็บข้อมูลในรูปแบบตารางเพื่อการค้นหาและวิเคราะห์ต่อไป

โค้ดสำหรับจัดการข้อมูลวิดีโอและเมตาดาต้า

ประโยชน์และโอกาสของ Agentic AI ในธุรกิจ

ด้วยความสามารถของ agentic AI และ visual AI ทำให้ธุรกิจที่มีข้อมูลไม่เป็นโครงสร้าง เช่น ข้อความ รูปภาพ และวิดีโอ สามารถสร้างมูลค่าได้มากขึ้น

ตัวอย่างเช่น การค้นหาคลิปวิดีโอที่มีเหตุการณ์เฉพาะเจาะจง การติดตามวัตถุในวิดีโอ หรือการวิเคราะห์ภาพในสภาพแวดล้อมต่างๆ ซึ่งก่อนหน้านี้เป็นเรื่องยากและใช้เวลานาน

นอกจากนี้ การสร้างแอปพลิเคชันเหล่านี้ทำได้ง่ายและรวดเร็วขึ้นมาก ทำให้ทีมเล็กๆ ก็สามารถสร้างนวัตกรรมได้โดยไม่ต้องลงทุนสูง

ภาพรวมเทรนด์สำคัญใน AI ที่ควรจับตามอง

Andrew Ng สรุปเทรนด์สำคัญ 4 ข้อที่กำลังผลักดันวงการ AI ไปข้างหน้า:

การเร่งความเร็วในการสร้าง token เพราะ agentic workflows ต้องอ่านและสร้างข้อความจำนวนมาก ทำให้มีการพัฒนาเทคโนโลยีฮาร์ดแวร์และซอฟต์แวร์เพื่อเพิ่มประสิทธิภาพ
โมเดลภาษาใหญ่ที่ถูกเทรนเพื่อรองรับการใช้งานจริง (to use) มากกว่าการตอบคำถามทั่วไป เช่น Anthropic ที่เปิดตัวโมเดลที่รองรับการใช้คอมพิวเตอร์จริง
ความสำคัญของ data engineering กับข้อมูลไม่เป็นโครงสร้าง เช่น ข้อความ รูปภาพ วิดีโอ ที่มีปริมาณมากขึ้นเรื่อยๆ และต้องจัดการอย่างมีประสิทธิภาพเพื่อสร้างคุณค่า
การปฏิวัติการประมวลผลภาพกำลังมา แม้ว่าการประมวลผลข้อความจะเป็นที่แพร่หลายแล้ว แต่การประมวลผลภาพกำลังเข้าสู่ช่วงเริ่มต้นและจะสร้างโอกาสใหม่ๆ มากมาย

บทสรุปจาก Insiderly

ช่วงเวลานี้ถือเป็นโอกาสทองของนักพัฒนา AI ที่สามารถทดลองและสร้างสรรค์นวัตกรรมได้รวดเร็วกว่าที่เคย ด้วย Generative AI ที่ช่วยลดเวลาพัฒนา และ agentic AI ที่ขยายขอบเขตความสามารถของโมเดลให้ซับซ้อนและยืดหยุ่นมากขึ้น การเกิดขึ้นของ Large Multimodal Models ทำให้เราสามารถจัดการข้อมูลภาพและวิดีโอได้อย่างมีประสิทธิภาพมากขึ้น

การพัฒนา agentic workflows ไม่เพียงแต่ช่วยเพิ่มคุณภาพของงาน AI แต่ยังเปลี่ยนวิธีคิดในการออกแบบระบบให้เป็นกระบวนการที่มีการวางแผน วิเคราะห์ และปรับปรุงอย่างต่อเนื่อง ซึ่งเป็นกุญแจสำคัญสู่ความสำเร็จในโลก AI ที่เปลี่ยนแปลงอย่างรวดเร็ว

สุดท้าย การจัดการข้อมูลไม่เป็นโครงสร้างและการสร้างแอปพลิเคชันที่รวดเร็วและมีความรับผิดชอบ จะกลายเป็นหัวใจหลักขององค์กรที่ต้องการนำ AI มาสร้างมูลค่าและเปลี่ยนแปลงธุรกิจอย่างแท้จริง

สำหรับผู้ที่สนใจทดลอง visual AI demos ที่ Andrew Ng และทีม Landing AI สร้างขึ้น สามารถเข้าไปที่ va.landing.ai เพื่อทดลองใช้งานและดูตัวอย่างโค้ดได้ทันที

ศัพท์เทคนิคที่ควรรู้

Agentic AI: AI ที่ทำงานแบบตัวแทน มีการวางแผนและตัดสินใจหลายขั้นตอน แทนการตอบคำถามทีเดียวจบ
Zero-shot prompting: การให้โมเดล AI ตอบคำถามหรือทำงานโดยไม่ต้องเทรนเพิ่มเติม แค่ส่งคำสั่งตรงๆ
Foundation models: โมเดลพื้นฐานขนาดใหญ่ เช่น GPT หรือ BERT ที่ใช้เป็นฐานในการพัฒนาแอปพลิเคชัน AI
Large Multimodal Models (LMMs): โมเดล AI ที่รองรับข้อมูลหลายรูปแบบ เช่น ข้อความ รูปภาพ วิดีโอในโมเดลเดียวกัน
Evaluation (evals): การทดสอบและประเมินผลโมเดล AI เพื่อตรวจสอบประสิทธิภาพและความถูกต้อง
Data engineering: การจัดการและเตรียมข้อมูลให้เหมาะสมกับการใช้งาน AI โดยเฉพาะข้อมูลไม่เป็นโครงสร้าง

OpenAI to Z Challenge: ทีม Black Bean ใช้ Deep Learning และ OpenAI เปลี่ยนข้อมูล LiDAR เป็นแผนที่ค้นหาแหล่งโบราณคดีในผืนป่าฝนอะเมซอน

Threat Intelligence: วิธีที่ Anthropic ป้องกันอาชญากรรมไซเบอร์ที่ใช้ปัญญาประดิษฐ์

Canva โปรโตไทป์ได้รวดเร็วยิ่งขึ้นด้วย GPT-5

Andrew Ng สำรวจการเติบโตของ AI Agents และ Agentic Reasoning | BUILD 2024 Keynote