Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ำสมัยจาก Google

สำรวจการเปิดตัว Gemini 2.5 Pro โมเดล AI ล้ำสมัย พร้อมโครงสร้างพื้นฐาน TPU Ironwood และนวัตกรรม AI จาก Google I/O 2025 ที่จะเปลี่ยนแปลงโลกเทคโนโลยีและการใช้งาน AI ในชีวิตประจำวัน

เวที Google IO 2025 ที่ Shoreline

การประชุมนวัตกรรมประจำปี Google I/O 2025 ได้เปิดฉากขึ้นอย่างยิ่งใหญ่ พร้อมการประกาศเปิดตัวเทคโนโลยี AI ใหม่ล่าสุดที่น่าตื่นเต้นที่สุดในยุคนี้ นำโดยโมเดล AI ขั้นสูง "Gemini 2.5 Pro" และนวัตกรรมต่าง ๆ ที่ผสมผสานความคิดสร้างสรรค์และประสิทธิภาพเพื่อเปลี่ยนแปลงวิธีที่เราใช้เทคโนโลยีในชีวิตประจำวัน บทความนี้จะพาเราไปสำรวจทุกแง่มุมของการเปิดตัวครั้งนี้ พร้อมวิเคราะห์ความหมายและผลกระทบที่อาจเกิดขึ้นในวงการ AI และเทคโนโลยีโลกในอนาคต

เวที Google IO 2025 ที่ Shoreline

การพัฒนาและความก้าวหน้าของโมเดล Gemini

Gemini 2.5 Pro คือโมเดล AI ที่ Google ภูมิใจนำเสนอในปีนี้ โดยมีการปรับปรุงอย่างรวดเร็วและต่อเนื่องตั้งแต่รุ่นแรกที่เปิดตัว ด้วยคะแนน Elo ที่เพิ่มขึ้นกว่า 300 คะแนน และครองแชมป์บนแหล่งข้อมูล Ella Marina ในทุกหมวดหมู่ นอกจากนี้ Gemini ยังทำผลงานโดดเด่นในด้านการเขียนโค้ด โดยรุ่น 2.5 Pro สามารถทำคะแนนสูงสุดบน WebDev Arena ด้วยคะแนนที่เพิ่มขึ้นถึง 142 Elo points ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือชั้นในการสร้างโค้ดคุณภาพสูงอย่างรวดเร็ว

การเติบโตของ Gemini ไม่ได้หยุดอยู่แค่การประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่เติบโตเร็วที่สุดในแพลตฟอร์ม Cursor ซึ่งเป็น AI editor สำหรับโค้ด โดยมีการสร้างโค้ดที่ผ่านการยอมรับหลายแสนบรรทัดต่อวินาที ซึ่งสะท้อนถึงความนิยมและการนำไปใช้งานที่แพร่หลายอย่างรวดเร็วในวงการนักพัฒนา

Gemini AI เล่นเกม Pokemon Blue จนชนะทั้งหมด

ไฮไลต์ที่น่าประทับใจอีกอย่างคือ Gemini สามารถเล่นเกม Pokemon Blue จนสำเร็จได้อย่างสมบูรณ์ ทั้งการสะสมเหรียญครบ 8 เหรียญ เดินทางถึง Victory Road และเอาชนะ Elite Four รวมถึงแชมป์ ทำให้เราเข้าใกล้เป้าหมายของ "Artificial Pokemon Intelligence" อย่างจริงจัง

โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI

เบื้องหลังความสำเร็จของ Gemini คือโครงสร้างพื้นฐาน TPU รุ่นที่ 7 ที่ชื่อ Ironwood ซึ่งเป็นชิปประมวลผลที่ออกแบบมาเพื่อรองรับการประมวลผล AI ในระดับใหญ่ ด้วยประสิทธิภาพที่สูงกว่ารุ่นก่อนถึง 10 เท่า และรองรับการประมวลผลได้ถึง 42.5 exaflops ต่อพอร์ต ซึ่งจะเปิดให้บริการแก่ลูกค้า Google Cloud ภายในปีนี้

การผสมผสานระหว่างโครงสร้างพื้นฐานและโมเดล AI ทำให้ Gemini ครองอันดับ 1-3 ในการสร้าง token ต่อวินาทีบน LM arena leaderboard พร้อมกับลดราคาค่าใช้จ่ายลงอย่างมีนัยสำคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการจัดการสมดุลระหว่างคุณภาพและต้นทุนในการให้บริการ AI

TPU Ironwood ชิปประมวลผล AI รุ่นใหม่

การเติบโตของการใช้งาน AI และการนำไปใช้จริง

ในปีที่ผ่านมา การประมวลผลข้อมูลผ่านผลิตภัณฑ์และ API ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้าน tokens ต่อเดือน เป็น 480 ล้านล้าน tokens ต่อเดือน หรือเพิ่มขึ้นประมาณ 50 เท่า ซึ่งแสดงถึงการยอมรับและการใช้งาน AI ที่พุ่งสูงขึ้นอย่างมหาศาล

นักพัฒนา AI มากกว่า 7 ล้านคนได้สร้างสรรค์แอปพลิเคชันด้วย Gemini API ผ่าน Google AI Studio และ Vertex AI ซึ่งเติบโตขึ้นกว่า 5 เท่าตั้งแต่ Google I/O ครั้งก่อน นอกจากนี้ การใช้งาน Gemini บน Vertex AI ยังเพิ่มขึ้นกว่า 40 เท่าในระยะเวลาเพียงหนึ่งปี

ในส่วนของผู้ใช้ทั่วไป แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะโมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้นถึง 45% ซึ่งชี้ให้เห็นว่า AI กำลังกลายเป็นส่วนสำคัญในชีวิตประจำวันของผู้คนมากขึ้นเรื่อย ๆ

Google Search กับ AI Overview มีผู้ใช้กว่า 1.5 พันล้านคนต่อเดือน

นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา

หนึ่งในโครงการวิจัยที่ได้รับความสนใจอย่างมากคือ Project Starline ซึ่งเป็นเทคโนโลยีวิดีโอ 3 มิติที่สร้างความรู้สึกเหมือนอยู่ในห้องเดียวกันแม้จะอยู่ไกลกัน โดยล่าสุด Google ได้เปิดตัว Google Beam ซึ่งเป็นแพลตฟอร์มสื่อสารวิดีโอ AI-first ที่ใช้กล้อง 6 ตัวจับภาพจากหลายมุม พร้อม AI ประมวลผลและแสดงผลบนจอแสดงผล 3 มิติที่ติดตามการเคลื่อนไหวของศีรษะได้อย่างแม่นยำและเรียลไทม์

นอกจากนี้ Google Meet ยังนำเทคโนโลยีแปลภาษาแบบเรียลไทม์มาใช้ ช่วยลดอุปสรรคด้านภาษาอย่างมีประสิทธิภาพ เช่น การสนทนาเกี่ยวกับการจองที่พักในต่างประเทศที่ใช้ภาษาแตกต่างกัน โดยสามารถจับโทนเสียงและการแสดงออกของผู้พูดได้อย่างแม่นยำ และตอนนี้ฟีเจอร์แปลภาษาแบบเรียลไทม์นี้เปิดให้ผู้ใช้ที่สมัครสมาชิกใช้งานภาษาอังกฤษและสเปนก่อน และจะขยายไปยังภาษาอื่น ๆ และองค์กรในเร็ว ๆ นี้

ฟีเจอร์แปลภาษาแบบเรียลไทม์ใน Google Meet

Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทำงานบนเว็บ

Project Astra คือการพัฒนาผู้ช่วย AI สากลที่เข้าใจโลกผ่านกล้องและหน้าจอ ช่วยให้เราพูดคุยและโต้ตอบกับสิ่งที่เห็นได้อย่างเป็นธรรมชาติ เช่น การฝึกสัมภาษณ์งาน หรือการฝึกซ้อมมาราธอน โดย Gemini Live ได้ผสานฟีเจอร์ของ Astra เช่น การแชร์หน้าจอและกล้อง ทำให้ผู้ใช้สามารถพูดคุยเกี่ยวกับสิ่งที่เห็นได้ทันที

ความน่ารักของ Astra คือความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดของผู้ใช้ เช่น การแยกแยะว่าสิ่งที่เห็นเป็นรถขยะ ไม่ใช่รถเปิดประทุน หรือการบอกว่าคนที่ตามเราไม่ใช่ใครแต่เป็นเงาของเราเอง ซึ่งช่วยเพิ่มความน่าเชื่อถือและความเป็นธรรมชาติในการสื่อสาร

Project Astra ช่วยแยกแยะวัตถุต่าง ๆ อย่างแม่นยำ

ในขณะเดียวกัน Project Mariner คือเอเจนต์ AI ที่สามารถทำงานบนเว็บแทนเราได้อย่างอัจฉริยะ โดยมีฟีเจอร์ multitasking ที่สามารถจัดการงานพร้อมกันได้ถึง 10 งาน และระบบ "teach and repeat" ที่ช่วยให้เอเจนต์เรียนรู้และทำงานซ้ำได้ตามคำสั่งที่สอนครั้งแรก ซึ่งเปิดให้เหล่านักพัฒนาสามารถใช้งานผ่าน Gemini API และจะเปิดให้ใช้กันอย่างกว้างขวางในช่วงฤดูร้อนนี้

ความน่าสนใจของ Mariner คือการเป็นส่วนหนึ่งของระบบเอเจนต์ที่สามารถสื่อสารกันได้ผ่านโปรโตคอล open agent to agent และเชื่อมต่อกับบริการต่าง ๆ ผ่าน model context protocol (MCP) ทำให้สามารถทำงานร่วมกันและตอบสนองความต้องการของผู้ใช้ได้อย่างครอบคลุม

Agent Mode ในแอป Gemini ช่วยค้นหาที่อยู่อาศัยและนัดหมาย

การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ

Google กำลังพัฒนาให้ Gemini สามารถเข้าถึงและใช้ข้อมูลส่วนตัวที่เกี่ยวข้องจากแอปต่าง ๆ ของ Google ได้อย่างปลอดภัยและเป็นส่วนตัว เพื่อสร้างประสบการณ์ AI ที่เหมาะสมกับแต่ละคนมากขึ้น เช่น ฟีเจอร์ Personalized Smart Replies ใน Gmail ที่สามารถตอบอีเมลโดยใช้สไตล์และโทนเสียงของผู้ใช้เอง โดย Gemini จะค้นหาข้อมูลการเดินทางและแผนการต่าง ๆ จาก Google Drive และ Docs มาใช้ประมวลผลคำตอบ ทำให้การสื่อสารดูเป็นธรรมชาติและมีรายละเอียดที่น่าประทับใจ

Personalized Smart Replies ใน Gmail

นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity

Gemini 2.5 Pro ไม่ได้เป็นเพียงโมเดลที่เก่งในการประมวลผลภาษาและโค้ดเท่านั้น แต่ยังสามารถแปลงภาพร่างสเก็ตช์ 2 มิติให้กลายเป็นแอนิเมชัน 3 มิติที่ซับซ้อนได้อย่างรวดเร็วและแม่นยำ ผ่าน Google AI Studio ซึ่งช่วยลดความซับซ้อนในการเรียนรู้เทคโนโลยี 3 มิติลงอย่างมาก

นอกจากนี้ Gemini ยังมีฟีเจอร์เสียงพูด (text-to-speech) ที่รองรับหลายเสียงและหลายภาษา สามารถเปลี่ยนโทนเสียงได้อย่างลื่นไหล รวมถึงสร้างเสียงกระซิบได้อย่างน่าทึ่ง ช่วยเพิ่มความสมจริงให้กับแอปพลิเคชันที่ต้องการสื่อสารด้วยเสียง

ในส่วนของการสร้างวิดีโอ Google ได้เปิดตัว VO3 ซึ่งเป็นโมเดลสร้างวิดีโอที่สามารถสร้างเสียงประกอบและบทสนทนาได้ในตัวเดียวกัน เช่น การสร้างฉากป่าและบทสนทนาของสัตว์ในนั้นอย่างสมจริง ซึ่งถือเป็นก้าวสำคัญของการสร้างสื่อดิจิทัลที่ผสมผสานภาพและเสียงด้วย AI

AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview

Google Search กำลังเปลี่ยนโฉมหน้าด้วย AI Mode ที่สร้างประสบการณ์ค้นหาขั้นสูง โดยใช้โมเดล Gemini 2.5 ที่มีความสามารถในการวิเคราะห์คำถามที่ซับซ้อนและตอบกลับด้วยข้อมูลที่เชื่อถือได้ พร้อมแสดงผลลัพธ์ในรูปแบบที่เหมาะสม เช่น ตาราง กราฟ หรือแผนที่

ฟีเจอร์ Query Fan Out ช่วยให้ AI แบ่งคำถามออกเป็นหลายส่วน และค้นหาข้อมูลจากหลายแหล่งพร้อมกัน เพื่อให้ได้คำตอบที่ครบถ้วนและแม่นยำ นอกจากนี้ยังมีฟีเจอร์ Deep Research ที่ช่วยค้นคว้าเชิงลึกโดยการสืบค้นข้อมูลหลายสิบถึงร้อยครั้ง เพื่อสร้างรายงานที่อ้างอิงได้เต็มรูปแบบภายในไม่กี่นาที

ในด้านการช็อปปิ้ง AI Mode ยังรวมข้อมูลจาก Google Images และ Shopping Graph ที่มีสินค้ากว่า 50 พันล้านรายการ พร้อมฟีเจอร์ Try On ที่ใช้ AI สร้างภาพเสื้อผ้าที่เหมาะกับรูปร่างและท่าทางของผู้ใช้จริง ๆ ช่วยให้ตัดสินใจซื้อได้ง่ายขึ้น รวมถึง Agent Checkout ที่สามารถติดตามราคาและซื้อสินค้าให้โดยอัตโนมัติผ่าน Google Pay

AI Mode ใน Google Search พร้อมฟีเจอร์ช็อปปิ้ง

Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจำกัด

Android XR คือแพลตฟอร์มที่ออกแบบมาเพื่อรองรับอุปกรณ์หลากหลายรูปแบบ ตั้งแต่แว่นตาอัจฉริยะจนถึงแว่น VR ที่ให้ประสบการณ์เสมือนจริง โดยร่วมมือกับ Samsung และ Qualcomm เพื่อสร้างระบบนิเวศที่สมบูรณ์แบบสำหรับการใช้งาน AI ในชีวิตประจำวัน

ตัวอย่างเช่น Project Muhan ซึ่งเป็นอุปกรณ์ Android XR รุ่นแรกที่ให้ผู้ใช้สัมผัสประสบการณ์หน้าจอแบบไม่จำกัด พร้อม AI ที่ช่วยในการนำทาง ดูข้อมูล หรือแม้แต่ดูการแข่งขันกีฬาในแบบเสมือนจริง ขณะที่แว่นตา Android XR รุ่นใหม่มีขนาดเบา ใส่สบาย เหมาะสำหรับใช้งานตลอดวัน พร้อมกล้อง ไมโครโฟน และลำโพงที่ช่วยให้ AI สามารถรับรู้และตอบสนองโลกภายนอกได้อย่างแม่นยำ

ฟีเจอร์เด่นอีกอย่างคือการแปลภาษาสดผ่านแว่นตาที่สามารถแสดงคำแปลแบบเรียลไทม์ ทำให้การสื่อสารข้ามภาษาง่ายขึ้นมาก ซึ่งแสดงให้เห็นถึงความก้าวหน้าของ AI ที่จะช่วยเราฟัง พูด และเข้าใจโลกได้มากขึ้นทุกวัน

Android XR แว่นตาอัจฉริยะพร้อม AI

บทสรุปจาก Insiderly

Google I/O 2025 ได้เผยให้เห็นถึงการก้าวกระโดดครั้งสำคัญของเทคโนโลยี AI ผ่านโมเดล Gemini 2.5 Pro ที่ไม่เพียงแค่ฉลาดขึ้นในด้านการประมวลผลภาษาและโค้ด แต่ยังขยายสู่ความสามารถหลากหลาย ตั้งแต่การสื่อสารวิดีโอ 3 มิติ การสร้างภาพและวิดีโอแบบมีเสียง ไปจนถึงการช่วยงานแบบอัตโนมัติบนเว็บ และการค้นหาข้อมูลอย่างลึกซึ้ง

สิ่งที่น่าจับตามองคือการผสาน AI เข้ากับอุปกรณ์ใหม่ ๆ อย่าง Android XR ซึ่งจะทำให้ AI กลายเป็นผู้ช่วยที่อยู่เคียงข้างเราตลอดเวลา ไม่ว่าจะเป็นแว่นตา หรือแว่น VR ที่ให้ประสบการณ์ใหม่ในการติดต่อสื่อสารและการเรียนรู้

การเชื่อมโยง AI กับข้อมูลส่วนบุคคลอย่างปลอดภัยผ่านฟีเจอร์ Personal Context จะช่วยให้ AI เข้าใจและตอบสนองได้เหมาะสมกับแต่ละบุคคลมากขึ้น เพิ่มความสะดวกและประสิทธิภาพในการใช้งาน

โดยรวมแล้ว Google กำลังสร้างระบบนิเวศ AI ที่ครบวงจร ตั้งแต่โมเดลพื้นฐานไปจนถึงแอปพลิเคชันและอุปกรณ์ใหม่ ๆ ที่ช่วยให้ AI เป็นมากกว่าผู้ช่วย แต่เป็นเพื่อนร่วมทางในชีวิตดิจิทัลอย่างแท้จริง

สำหรับวงการเทคโนโลยีและผู้ที่สนใจ AI การเปิดตัวครั้งนี้เป็นสัญญาณที่ชัดเจนว่าโลกกำลังก้าวเข้าสู่ยุคที่ AI จะเปลี่ยนแปลงทุกมิติของการใช้ชีวิตและการทำงานอย่างไม่เคยมีมาก่อน

คำศัพท์เฉพาะทางที่น่าสนใจ

  • Elo Score: ระบบการวัดประสิทธิภาพของโมเดล AI โดยอ้างอิงจากคะแนนการแข่งขันหรือประสิทธิภาพในงานเฉพาะด้าน
  • TPU (Tensor Processing Unit): ชิปประมวลผลที่ออกแบบเฉพาะสำหรับงาน AI โดย Google เพื่อเพิ่มความเร็วและประสิทธิภาพในการเทรนและรันโมเดล
  • Multitasking: ความสามารถของ AI ในการจัดการหลายงานพร้อมกัน
  • Teach and Repeat: ระบบที่ AI เรียนรู้จากการสอนครั้งแรกและสามารถทำซ้ำงานที่คล้ายกันได้ในอนาคต
  • Model Context Protocol (MCP): โปรโตคอลที่ช่วยให้โมเดล AI สามารถเชื่อมต่อและใช้บริการอื่น ๆ ได้อย่างมีประสิทธิภาพ
  • Diffusion Model: โมเดล AI ที่สร้างผลลัพธ์โดยการปรับปรุงจากสัญญาณรบกวนทีละขั้นตอน ทำให้ได้ผลลัพธ์ที่มีความแม่นยำและรวดเร็ว
  • Agentic Capability: ความสามารถของ AI ในการทำงานแทนผู้ใช้และตัดสินใจภายใต้การควบคุมของผู้ใช้

Great! You’ve successfully signed up.

Welcome back! You've successfully signed in.

You've successfully subscribed to บทความและข่าวอัพเดท จาก Insiderly.

Success! Check your email for magic link to sign-in.

Success! Your billing info has been updated.

Your billing was not updated.