รับ Brief ฟรี

Frontier AI และอนาคตของธุรกิจ เมื่อ AI ไปไกลกว่าแชตบอต

deepmind google llm ship video-recap Apr 19, 2026
สรุปจากคลิป ดูคลิปต้นฉบับ

สิ่งที่น่าสนใจที่สุดจากเวทีของ AI Engineer ไม่ใช่การพูดถึงโมเดลแชตตัวใหม่ แต่คือการชี้ให้เห็นว่า Frontier AI กําลังขยับออกจากกรอบเดิมของคําว่า AI ที่คนส่วนใหญ่คุ้นเคยกันอยู่ เรามักนึกถึง AI เป็น chatbot, ผู้ช่วยเขียนงาน, หรือเครื่องมือสรุปเอกสาร แต่สิ่งที่ Raia Hadsell จาก Google DeepMind พูดถึง คือ AI ที่เริ่ม “รับรู้โลก”, “คาดการณ์โลก” และ “สร้างโลก” ได้

ประเด็นนี้สําคัญกับเจ้าของธุรกิจและคนทํางานมาก เพราะมันแปลว่าโอกาสของ AI ไม่ได้หยุดอยู่ที่การลดเวลางานเอกสารอีกต่อไป แต่มันกําลังขยายไปสู่การค้นหาข้อมูลแบบข้ามสื่อ การพยากรณ์ระบบที่ซับซ้อน และการสร้างประสบการณ์โต้ตอบแบบใหม่ทั้งหมด

หัวใจของบทความนี้จึงไม่ใช่การตามข่าวเทคโนโลยี แต่คือการตีความว่า Frontier AI และระยะถัดไปของ intelligence จะส่งผลต่อการทํางาน การตัดสินใจ และโมเดลธุรกิจอย่างไร โดยเฉพาะถ้าเรามองจากมุมของธุรกิจไทยที่อยากเอา AI ไปใช้จริง

สารบัญ

Step 1: เริ่มจากการเข้าใจว่า Frontier AI ไม่ได้เท่ากับ LLM

Raia Hadsell เปิดประเด็นไว้ชัดว่า งานวิจัยที่เธอดูแลไม่ได้มองแค่คําถามว่า Gemini รุ่นถัดไปจะเก่งขึ้นอย่างไร แต่กําลังมองต่อไปถึงคําถามที่ใหญ่กว่านั้น คือ AI ควรมีสถาปัตยกรรมแบบไหนเพื่อแก้ปัญหาที่ซับซ้อนจริงในโลก

มุมนี้น่าสนใจ เพราะตลาด AI ช่วงที่ผ่านมาโฟกัสกับ LLM มากจนหลายองค์กรเผลอคิดว่า AI = แชตบอต แต่ DeepMind กําลังชี้ว่า frontier จริงๆ อยู่ในหลายชั้น เช่น

  • การทําความเข้าใจข้อมูลหลายรูปแบบพร้อมกัน
  • การคาดการณ์ระบบที่เปลี่ยนตลอดเวลา เช่น สภาพอากาศ
  • การสร้าง world model ที่โต้ตอบได้แบบ real-time

ถ้าแปลเป็นภาษาธุรกิจง่ายๆ นี่คือการเปลี่ยนจาก “AI ช่วยตอบ” ไปเป็น “AI ช่วยมอง”, “AI ช่วยคาดการณ์”, และ “AI ช่วยจําลอง”

อีกจุดที่ควรเก็บไว้คือแนวคิดเรื่อง root nodes หรือการแก้ปัญหาที่ต้นตอ ไม่เสียเวลาวิ่งไล่แก้ปลายทางอย่างเดียว แนวคิดนี้ใช้กับธุรกิจได้ดีมาก หลายบริษัทรีบซื้อ AI tool มาใส่ workflow เดิม แต่ไม่ได้ถามก่อนว่าปัญหาจริงอยู่ตรงไหน เช่น ปัญหาไม่ได้อยู่ที่พนักงานตอบช้า แต่อยู่ที่ข้อมูลแตกเป็นไซโลและค้นหาไม่เจอ

Step 2: มอง Embedding Models ให้เป็นมากกว่าของหลังบ้าน

หนึ่งในส่วนที่มีค่ามาก แต่คนทั่วไปพูดถึงน้อย คือ embedding models Raia ยกตัวอย่างจาก neuroscience เรื่อง “Jennifer Aniston cells” ซึ่งหมายถึงกลุ่มเซลล์ประสาทที่ตอบสนองต่อแนวคิดเดียวกันได้แม้ข้อมูลจะมาในหลายรูปแบบ เช่น ได้ยินชื่อ เห็นภาพ หรือได้ยินเสียง ก็โยงไปยังสิ่งเดียวกันได้

สิ่งนี้คือภาพเปรียบเทียบที่ดีมากของ embedding model เพราะหน้าที่ของมันไม่ใช่การสร้างข้อความใหม่ แต่คือการแปลงข้อมูลให้เป็นตัวแทนเชิงความหมายที่ค้นหา เปรียบเทียบ และเรียกคืนได้เร็ว

DeepMind พูดถึง Gemini Embeddings 2 ในฐานะโมเดลแบบ omnimodal ที่รวมข้อความ วิดีโอ เสียง และเอกสารให้อยู่ใน semantic space เดียวกัน จุดนี้สําคัญมากกับการใช้งานจริง เพราะในองค์กร ข้อมูลแทบไม่เคยอยู่ในรูปแบบเดียว

ตัวอย่างของจริงในธุรกิจไทยจะเห็นภาพชัดมาก เช่น

  • ทีมขายมีข้อมูลลูกค้าอยู่ทั้งใน PDF proposal, สรุปประชุม, ไฟล์เสียงจากการคุย และคลิปสาธิตสินค้า
  • ทีมบริการลูกค้ามีทั้งแชต ข้อความเสียง รูปภาพปัญหาจากลูกค้า และคู่มือภายใน
  • ทีม HR มี resume, วิดีโอสัมภาษณ์, แบบประเมิน และบันทึก feedback

ถ้าใช้ LLM อย่างเดียว เราอาจถามตอบได้เก่ง แต่ถ้าข้อมูลต้นทางหาไม่เจอหรือโยงกันไม่ได้ คําตอบก็ไม่ดีพออยู่ดี Embedding จึงเป็นชั้นฐานรากของระบบ AI ในองค์กร โดยเฉพาะงานแนว retrieval, recommendation, semantic search และ agent workflow

ประเด็นที่น่าสนใจอีกอย่างคือการทํา representation แบบหลายระดับมิติผ่านแนวคิด Matryoshka RepresentationLearning ซึ่งช่วยให้เริ่มค้นหาแบบเร็วด้วยเวกเตอร์เล็กก่อน แล้วค่อยขยายความละเอียดเมื่อจําเป็น ภาษาธุรกิจคือ “ไม่ต้องจ่ายแพงทุกครั้งตั้งแต่แรก” เราเริ่มจาก retrieval ที่เบาและเร็ว แล้วค่อยลงลึกในเคสที่สําคัญ

นี่คือมุมที่หลายบริษัทมองข้าม เวลาอยากทํา AI search ภายในองค์กร มักรีบไปหาหน้าแชตสวยๆ ก่อน แต่ของสําคัญจริงคือ วิธีแทนความหมายของข้อมูล ถ้าชั้นนี้ดี การใช้งานข้างบนจะดีตาม

Step 3: เรียนรู้จาก AI พยากรณ์อากาศ ว่าคุณค่าของ AI ไม่ได้อยู่แค่การสร้างคอนเทนต์

ส่วนที่ทรงพลังที่สุดช่วงหนึ่งของงานนี้คือการเล่าเรื่อง weather forecasting DeepMind เริ่มจากโจทย์ง่ายแต่ยากมาก คือ “AI จะพยากรณ์ฝนได้ดีกว่าโมเดลฟิสิกส์หรือไม่” คําตอบที่ทีมค้นพบคือ ได้ และในหลายกรณีดีขึ้นชัดเจน

GraphCast เป็นโมเดลที่พยากรณ์สภาวะบรรยากาศล่วงหน้าได้ถึง 15 วัน โดยใช้ spherical graph neural network เพื่อแทนโลกและชั้นบรรยากาศ แล้วทํานายตัวแปรจํานวนมาก เช่น ลม อุณหภูมิ และความชื้น

ตัวอย่างที่ถูกยกขึ้นมาคือ Hurricane Lee ซึ่งโมเดลสามารถทํานายตําแหน่ง landfall ได้แม่นยําล่วงหน้าถึง 9 วัน ขณะที่โมเดลมาตรฐานแบบฟิสิกส์แม่นได้ราว 6 วัน ความต่าง 3 วันฟังดูเหมือนไม่เยอะ แต่สําหรับพายุใหญ่ 3 วันมีมูลค่าสูงมากในแง่การอพยพ การจัดการโลจิสติกส์ และการป้องกันความเสียหาย

ต่อมาทีมพัฒนา GenCast ซึ่งเป็นโมเดลแบบ probabilistic เพื่อสะท้อนความจริงว่าสภาพอากาศมีความเป็น chaotic สูง เราไม่ได้ต้องการแค่ค่าคาดการณ์เดียว แต่ต้องรู้ด้วยว่าความเสี่ยงฝั่งปลายๆ หรือ tail risk เป็นอย่างไร โมเดลนี้แม่นยํากว่ามาตรฐานอ้างอิง 97% ของกรณีที่ทดสอบ และสร้าง forecast 15 วันได้ใน 8 นาทีบนชิปเดียว

จากนั้นมี FGN หรือ functional generative network ที่ขยับจากการทํานายอากาศโดยรวม ไปสู่การทํานาย cyclone โดยตรง ทั้งการจําแนก เส้นทาง ความเร็วลม และการก่อตัวของ eye ของพายุ ซึ่งถูกนําไปใช้แล้วโดย US National Hurricane Center

ประเด็นที่ควรเก็บไม่ใช่แค่ “AI เก่งพยากรณ์อากาศ” แต่คือกรอบคิดนี้:

  • ถ้ามีข้อมูลย้อนหลังจํานวนมาก
  • ถ้าระบบนั้นซับซ้อนและเปลี่ยนตามเวลา
  • ถ้าการคาดการณ์ล่วงหน้ามีผลต่อการตัดสินใจ

ระบบนั้นอาจเป็นพื้นที่ที่ AI สร้างมูลค่าได้สูงมาก

สําหรับธุรกิจไทย เราไม่จําเป็นต้องเริ่มจากสภาพอากาศ แต่เรามีปัญหา “คล้ายกัน” เต็มไปหมด เช่น

  • คาดการณ์ demand ของสินค้าแต่ละจังหวัด
  • คาดการณ์ churn ของลูกค้าแบบราย segment
  • คาดการณ์ปริมาณเคลม ประกัน หรือภาระของ call center
  • คาดการณ์ความเสี่ยงซัพพลายเชนในฤดูกาลต่างๆ

หลายองค์กรยังใช้ spreadsheet กับค่าเฉลี่ยย้อนหลังแบบตรงไปตรงมา ซึ่งใช้งานได้ระดับหนึ่ง แต่เมื่อโลกจริงมีความผันผวนสูง วิธีคิดแบบ probabilistic และ model ที่เรียนรู้จากข้อมูลจริงมักตอบโจทย์กว่า

อย่างไรก็ตาม เราควรเห็นข้อจํากัดด้วย โมเดลพยากรณ์จะดีได้ก็ต่อเมื่อองค์กรมีข้อมูลสะอาด สม่ําเสมอ และมีนิยามเป้าหมายชัด ถ้าข้อมูลยอดขายจากแต่ละสาขายังกรอกไม่เหมือนกัน ต่อให้ซื้อ AI ดีแค่ไหน ผลลัพธ์ก็ไม่นิ่ง

Step 4: เข้าใจ World Models ว่าอาจเป็นอินเทอร์เฟซใหม่ของการเรียนรู้และการขาย

ส่วนสุดท้ายของงานคือ world models และโปรเจกต์ Genie ซึ่งถือว่าไกลจากภาพ AI แบบแชตพอสมควร DeepMind เริ่มจากการวิจัยเกมและ simulation เพื่อทําความเข้าใจ agency และ environment จากนั้นพัฒนาไปสู่การสร้าง “โลก” ที่ผู้ใช้โต้ตอบได้

ลําดับของ Genie สะท้อนวิวัฒนาการชัดมาก

  • Genie 1 สร้างโลก 2D แบบ platformer ที่มีปฏิสัมพันธ์ได้ในระดับต้น
  • Genie 2 ขยับเป็นโลก 3D ที่เริ่มเล่นได้ แต่ยังไม่ real-time มากพอ
  • Genie 3 มุ่งรวมหลายอย่างเข้าด้วยกัน คือ real-time, interactive, คุณภาพสูง และมี memory ของโลก

ตัวอย่างที่ถูกเล่าไว้มีตั้งแต่การสร้างโลกที่เป็น “ทางโคลนใน Kent” ไปจนถึงโลก origami ที่ผู้ใช้เป็นกิ้งก่ากระดาษในสภาพแวดล้อมกระดาษทั้งหมด ประเด็นไม่ได้อยู่ที่ความแปลกของ prompt แต่อยู่ที่โลกนั้น จําได้, คงสภาพต่อเนื่อง, และ ตอบสนองต่อการกระทําได้

อีกจุดที่น่าสนใจมากคือความสามารถในการ เปลี่ยนโลกด้วย prompt ระหว่างที่อยู่ในโลกนั้น นี่ไม่ใช่แค่ demo สวยๆ แต่มันบอกใบ้ถึง UI แบบใหม่ที่กว้างกว่าแอปหรือเว็บเพจ เราอาจเข้าไป “อยู่ในข้อมูล” หรือ “อยู่ในประสบการณ์” แล้วเปลี่ยนมันได้ด้วยภาษาธรรมดา

ถ้ามองจากมุมธุรกิจไทย โอกาสมีหลายแบบ

  • การขายอสังหา ให้ลูกค้าเดินในบ้านตัวอย่างที่สร้างจาก prompt และปรับวัสดุ แสง หรือบรรยากาศได้ทันที
  • การท่องเที่ยว สร้างประสบการณ์ pre-visit ให้ลูกค้าได้ลองเดินในเส้นทาง โรงแรม หรือกิจกรรมก่อนซื้อ
  • การฝึกอบรม ให้พนักงานฝึกในสถานการณ์จําลองที่เปลี่ยนเงื่อนไขได้แบบสด
  • การศึกษา ให้ผู้เรียนเข้าไปอยู่ในโลกของประวัติศาสตร์ วิทยาศาสตร์ หรือกระบวนการผลิตจริง

แต่เราก็ควรตั้งคําถามด้วยเหมือนกันว่า world model แบบนี้ยังอยู่ในช่วงต้น และยังมีโจทย์เรื่องต้นทุน ความน่าเชื่อถือ ความปลอดภัย และการควบคุมผลลัพธ์ ถ้าเอาไปใช้เชิงธุรกิจจริง เราอาจเริ่มจาก use case ปิด เช่น training simulation หรือ showroom เฉพาะทาง ก่อนจะไปถึงโลกเปิดแบบเกมเต็มรูปแบบ

Step 5: สรุปภาพใหญ่ให้ชัดว่าระยะถัดไปของ intelligence มี 3 ชั้น

ถ้าจะย่นทุกอย่างให้เหลือกรอบคิดเดียว งานนี้กําลังบอกเราว่า AI กําลังขยายตัวใน 3 ชั้นสําคัญ

  1. ชั้นการเข้าใจความหมาย ผ่าน embedding และ multimodal representation
  2. ชั้นการคาดการณ์โลก ผ่านโมเดลอย่าง GraphCast, GenCast และ FGN
  3. ชั้นการสร้างโลกและโต้ตอบกับโลก ผ่าน world models อย่าง Genie

สําหรับคนทําธุรกิจ สิ่งที่ควรถามไม่ใช่ “เราจะมี chatbot ของตัวเองไหม” แต่ควรถามใหม่ว่า

  • ข้อมูลของเราพร้อมให้ AI เข้าใจจริงหรือยัง
  • มีระบบไหนในธุรกิจที่ควรคาดการณ์ล่วงหน้าได้ดีกว่านี้
  • มีประสบการณ์ไหนที่ควรเปลี่ยนจากหน้าจอ 2 มิติไปเป็นโลกโต้ตอบได้

นี่คือคําถามที่มีมูลค่ากว่าการไล่ตาม tool รายวันมาก

Actionable Insights

  • เริ่มจาก data retrieval ก่อน generative AI ถ้าข้อมูลหายาก กระจัดกระจาย หรือโยงกันไม่ได้ ให้แก้จุดนี้ก่อนทําแชต AI ภายในองค์กร
  • หา use case ที่เป็นการคาดการณ์ ไม่ใช่แค่การเขียน เช่น forecast demand, churn, staffing หรือความเสี่ยงซัพพลายเชน
  • ทดลอง multimodal search โดยรวมเอกสาร เสียง รูป และวิดีโอไว้ในระบบค้นหาเดียวสําหรับทีมขายหรือบริการลูกค้า
  • มอง simulation เป็นเครื่องมือธุรกิจ โดยเฉพาะงานฝึกอบรม การสาธิตสินค้า และประสบการณ์ก่อนซื้อ
  • อย่าเริ่มจาก tool ให้เริ่มจากปัญหา root node ถามก่อนว่าคอขวดจริงอยู่ตรงไหน แล้วค่อยเลือก AI ที่ตอบโจทย์นั้น

Troubleshooting

- ปัญหา: ทํา AI search แล้วตอบไม่ตรงงานจริง
- สาเหตุ: ข้อมูลในองค์กรอยู่คนละที่และคนละรูปแบบ ไม่มีโครงสร้างเดียวกัน
- วิธีแก้: เริ่มจากรวมแหล่งข้อมูลหลัก 2-3 แหล่งก่อน เช่น เอกสาร คู่มือ และบันทึกประชุม แล้วออกแบบ retrieval ให้ชัดก่อนต่อ LLM

- ปัญหา: ผู้บริหารคาดหวังว่า AI ต้องทําได้ทุกอย่างแบบ chatbot
- สาเหตุ: มอง AI แค่มุมการสร้างข้อความ ไม่เห็นงานพยากรณ์และการจําลอง
- วิธีแก้: แยก use case เป็น 3 กลุ่ม คือ ค้นหา คาดการณ์ และสร้างประสบการณ์ แล้วประเมิน ROI แยกกัน

- ปัญหา: มีข้อมูลย้อนหลังเยอะ แต่โมเดลทํานายไม่ดี
- สาเหตุ: ข้อมูลไม่สะอาด นิยามตัวแปรเปลี่ยนบ่อย หรือ label ไม่ชัด
- วิธีแก้: audit ข้อมูลย้อนหลัง ตรวจความสม่ําเสมอของฟิลด์ และกําหนด KPI เป้าหมายให้แน่นก่อน train model

- ปัญหา: อยากทําประสบการณ์ immersive แต่ยังไม่รู้จะเริ่มตรงไหน
- สาเหตุ: เริ่มจากภาพใหญ่เกินไป เช่น อยากสร้าง metaverse ของแบรนด์ทั้งก้อน
- วิธีแก้: เริ่มจาก simulation เล็กๆ ที่วัดผลได้ เช่น virtual showroom, product demo หรือ training scenario

- ปัญหา: ทีมคิดว่า AI ระดับ frontier ไกลตัวเกินไป
- สาเหตุ: มองว่าเป็นเรื่องห้องวิจัย ไม่เกี่ยวกับธุรกิจประจําวัน
- วิธีแก้: แปลงแนวคิดให้เป็นภาษางาน เช่น embedding = ระบบค้นหาฉลาดขึ้น, forecasting model = วางแผนแม่นขึ้น, world model = ประสบการณ์ลูกค้าแบบใหม่

การต่อยอด

  • สร้าง AI knowledge layer สําหรับองค์กร ที่รวมเอกสาร เสียง และวิดีโอไว้ใน semantic search เดียวกัน
  • เลือก 1 กระบวนการที่ต้อง “ทํานายล่วงหน้า” ทุกสัปดาห์ แล้วทํา pilot project เปรียบเทียบกับวิธีเดิม
  • ทดลองประสบการณ์แบบ interactive สําหรับการขายหรือการสอน แทนการใช้สไลด์หรือวิดีโอแบบเดิมอย่างเดียว

สรุป Checklist ทั้งหมด

  • ☐ เข้าใจให้ชัดว่า Frontier AI ไม่ได้มีแค่ LLM
  • ☐ แยก use case ขององค์กรเป็น ค้นหา คาดการณ์ และจําลอง
  • ☐ ตรวจว่าข้อมูลขององค์กรพร้อมสําหรับ embedding และ retrieval หรือยัง
  • ☐ มองหางาน forecast ที่มีผลต่อการตัดสินใจจริง
  • ☐ ประเมินว่า simulation หรือ world model จะช่วยการขาย การสอน หรือการฝึกอบรมได้ตรงไหน
  • ☐ เริ่มจาก root problem ไม่ใช่เริ่มจาก tool
  • ☐ ทํา pilot เล็กที่วัดผลได้ ก่อนขยายทั้งองค์กร

สรุปแล้ว สิ่งที่ Raia Hadsell สื่อออกมาชัดมากคือ ระยะถัดไปของ AI จะไม่ได้วัดกันแค่ว่าใครตอบเก่งกว่าใคร แต่จะวัดกันที่ว่าใครเข้าใจข้อมูลได้ดีกว่า คาดการณ์โลกได้แม่นกว่า และสร้างประสบการณ์โต้ตอบได้มีประโยชน์กว่ากัน

สําหรับธุรกิจไทย นี่คือสัญญาณให้เลิกมอง AI เป็นแค่ของเล่นฝั่งการตลาดหรือเครื่องมือเขียนงาน แล้วเริ่มมองมันเป็นโครงสร้างใหม่ของการค้นหา การตัดสินใจ และการออกแบบประสบการณ์ ถ้าเริ่มคิดจากมุมนี้ เราจะไม่แค่ “ใช้ AI” แต่จะใช้มันในจุดที่สร้างความต่างได้จริง

Insiderly Pro

อ่านฟรีให้ตามทัน สมัครสมาชิกเมื่ออยากตัดสินใจให้คมขึ้น

บทความเปิดให้อ่านได้ตามปกติ ส่วนสมาชิกจะได้ brief เชิงลึก คลังย้อนหลัง และมุมวิเคราะห์สำหรับใช้คุยงานกับทีม

ดูสมาชิก