Google I/O 2025: Gemini, Project Astra และทิศทาง AI ของ Google

สารบัญ

สำรวจการเปิดตัว Gemini 2.5 Pro โมเดล AI ล้ำสมัย พร้อมโครงสร้างพื้นฐาน TPU Ironwood และนวัตกรรม AI จาก Google I/O 2025 ที่จะเปลี่ยนแปลงโลกเทคโนโลยีและการใช้งาน AI ในชีวิตประจำวัน

การประชุมนวัตกรรมประจำปี Google I/O 2025 ได้เปิดฉากขึ้นอย่างยิ่งใหญ่ พร้อมการประกาศเปิดตัวเทคโนโลยี AI ใหม่ล่าสุดที่น่าตื่นเต้นที่สุดในยุคนี้ นำโดยโมเดล AI ขั้นสูง "Gemini 2.5 Pro" และนวัตกรรมต่าง ๆ ที่ผสมผสานความคิดสร้างสรรค์และประสิทธิภาพเพื่อเปลี่ยนแปลงวิธีที่เราใช้เทคโนโลยีในชีวิตประจำวัน บทความนี้จะพาเราไปสำรวจทุกแง่มุมของการเปิดตัวครั้งนี้ พร้อมวิเคราะห์ความหมายและผลกระทบที่อาจเกิดขึ้นในวงการ AI และเทคโนโลยีโลกในอนาคต

การพัฒนาและความก้าวหน้าของโมเดล Gemini

Gemini 2.5 Pro คือโมเดล AI ที่ Google ภูมิใจนำเสนอในปีนี้ โดยมีการปรับปรุงอย่างรวดเร็วและต่อเนื่องตั้งแต่รุ่นแรกที่เปิดตัว ด้วยคะแนน Elo ที่เพิ่มขึ้นกว่า 300 คะแนน และครองแชมป์บนแหล่งข้อมูล Ella Marina ในทุกหมวดหมู่ นอกจากนี้ Gemini ยังทำผลงานโดดเด่นในด้านการเขียนโค้ด โดยรุ่น 2.5 Pro สามารถทำคะแนนสูงสุดบน WebDev Arena ด้วยคะแนนที่เพิ่มขึ้นถึง 142 Elo points ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือชั้นในการสร้างโค้ดคุณภาพสูงอย่างรวดเร็ว

การเติบโตของ Gemini ไม่ได้หยุดอยู่แค่การประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่เติบโตเร็วที่สุดในแพลตฟอร์ม Cursor ซึ่งเป็น AI editor สำหรับโค้ด โดยมีการสร้างโค้ดที่ผ่านการยอมรับหลายแสนบรรทัดต่อวินาที ซึ่งสะท้อนถึงความนิยมและการนำไปใช้งานที่แพร่หลายอย่างรวดเร็วในวงการนักพัฒนา

ไฮไลต์ที่น่าประทับใจอีกอย่างคือ Gemini สามารถเล่นเกม Pokemon Blue จนสำเร็จได้อย่างสมบูรณ์ ทั้งการสะสมเหรียญครบ 8 เหรียญ เดินทางถึง Victory Road และเอาชนะ Elite Four รวมถึงแชมป์ ทำให้เราเข้าใกล้เป้าหมายของ "Artificial Pokemon Intelligence" อย่างจริงจัง

โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI

เบื้องหลังความสำเร็จของ Gemini คือโครงสร้างพื้นฐาน TPU รุ่นที่ 7 ที่ชื่อ Ironwood ซึ่งเป็นชิปประมวลผลที่ออกแบบมาเพื่อรองรับการประมวลผล AI ในระดับใหญ่ ด้วยประสิทธิภาพที่สูงกว่ารุ่นก่อนถึง 10 เท่า และรองรับการประมวลผลได้ถึง 42.5 exaflops ต่อพอร์ต ซึ่งจะเปิดให้บริการแก่ลูกค้า Google Cloud ภายในปีนี้

การผสมผสานระหว่างโครงสร้างพื้นฐานและโมเดล AI ทำให้ Gemini ครองอันดับ 1-3 ในการสร้าง token ต่อวินาทีบน LM arena leaderboard พร้อมกับลดราคาค่าใช้จ่ายลงอย่างมีนัยสำคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการจัดการสมดุลระหว่างคุณภาพและต้นทุนในการให้บริการ AI

การเติบโตของการใช้งาน AI และการนำไปใช้จริง

ในปีที่ผ่านมา การประมวลผลข้อมูลผ่านผลิตภัณฑ์และ API ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้าน tokens ต่อเดือน เป็น 480 ล้านล้าน tokens ต่อเดือน หรือเพิ่มขึ้นประมาณ 50 เท่า ซึ่งแสดงถึงการยอมรับและการใช้งาน AI ที่พุ่งสูงขึ้นอย่างมหาศาล

นักพัฒนา AI มากกว่า 7 ล้านคนได้สร้างสรรค์แอปพลิเคชันด้วย Gemini API ผ่าน Google AI Studio และ Vertex AI ซึ่งเติบโตขึ้นกว่า 5 เท่าตั้งแต่ Google I/O ครั้งก่อน นอกจากนี้ การใช้งาน Gemini บน Vertex AI ยังเพิ่มขึ้นกว่า 40 เท่าในระยะเวลาเพียงหนึ่งปี

ในส่วนของผู้ใช้ทั่วไป แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะโมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้นถึง 45% ซึ่งชี้ให้เห็นว่า AI กำลังกลายเป็นส่วนสำคัญในชีวิตประจำวันของผู้คนมากขึ้นเรื่อย ๆ

นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา

หนึ่งในโครงการวิจัยที่ได้รับความสนใจอย่างมากคือ Project Starline ซึ่งเป็นเทคโนโลยีวิดีโอ 3 มิติที่สร้างความรู้สึกเหมือนอยู่ในห้องเดียวกันแม้จะอยู่ไกลกัน โดยล่าสุด Google ได้เปิดตัว Google Beam ซึ่งเป็นแพลตฟอร์มสื่อสารวิดีโอ AI-first ที่ใช้กล้อง 6 ตัวจับภาพจากหลายมุม พร้อม AI ประมวลผลและแสดงผลบนจอแสดงผล 3 มิติที่ติดตามการเคลื่อนไหวของศีรษะได้อย่างแม่นยำและเรียลไทม์

นอกจากนี้ Google Meet ยังนำเทคโนโลยีแปลภาษาแบบเรียลไทม์มาใช้ ช่วยลดอุปสรรคด้านภาษาอย่างมีประสิทธิภาพ เช่น การสนทนาเกี่ยวกับการจองที่พักในต่างประเทศที่ใช้ภาษาแตกต่างกัน โดยสามารถจับโทนเสียงและการแสดงออกของผู้พูดได้อย่างแม่นยำ และตอนนี้ฟีเจอร์แปลภาษาแบบเรียลไทม์นี้เปิดให้ผู้ใช้ที่สมัครสมาชิกใช้งานภาษาอังกฤษและสเปนก่อน และจะขยายไปยังภาษาอื่น ๆ และองค์กรในเร็ว ๆ นี้

Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทำงานบนเว็บ

Project Astra คือการพัฒนาผู้ช่วย AI สากลที่เข้าใจโลกผ่านกล้องและหน้าจอ ช่วยให้เราพูดคุยและโต้ตอบกับสิ่งที่เห็นได้อย่างเป็นธรรมชาติ เช่น การฝึกสัมภาษณ์งาน หรือการฝึกซ้อมมาราธอน โดย Gemini Live ได้ผสานฟีเจอร์ของ Astra เช่น การแชร์หน้าจอและกล้อง ทำให้ผู้ใช้สามารถพูดคุยเกี่ยวกับสิ่งที่เห็นได้ทันที

ความน่ารักของ Astra คือความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดของผู้ใช้ เช่น การแยกแยะว่าสิ่งที่เห็นเป็นรถขยะ ไม่ใช่รถเปิดประทุน หรือการบอกว่าคนที่ตามเราไม่ใช่ใครแต่เป็นเงาของเราเอง ซึ่งช่วยเพิ่มความน่าเชื่อถือและความเป็นธรรมชาติในการสื่อสาร

ในขณะเดียวกัน Project Mariner คือเอเจนต์ AI ที่สามารถทำงานบนเว็บแทนเราได้อย่างอัจฉริยะ โดยมีฟีเจอร์ multitasking ที่สามารถจัดการงานพร้อมกันได้ถึง 10 งาน และระบบ "teach and repeat" ที่ช่วยให้เอเจนต์เรียนรู้และทำงานซ้ำได้ตามคำสั่งที่สอนครั้งแรก ซึ่งเปิดให้เหล่านักพัฒนาสามารถใช้งานผ่าน Gemini API และจะเปิดให้ใช้กันอย่างกว้างขวางในช่วงฤดูร้อนนี้

ความน่าสนใจของ Mariner คือการเป็นส่วนหนึ่งของระบบเอเจนต์ที่สามารถสื่อสารกันได้ผ่านโปรโตคอล open agent to agent และเชื่อมต่อกับบริการต่าง ๆ ผ่าน model context protocol (MCP) ทำให้สามารถทำงานร่วมกันและตอบสนองความต้องการของผู้ใช้ได้อย่างครอบคลุม

การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ

Google กำลังพัฒนาให้ Gemini สามารถเข้าถึงและใช้ข้อมูลส่วนตัวที่เกี่ยวข้องจากแอปต่าง ๆ ของ Google ได้อย่างปลอดภัยและเป็นส่วนตัว เพื่อสร้างประสบการณ์ AI ที่เหมาะสมกับแต่ละคนมากขึ้น เช่น ฟีเจอร์ Personalized Smart Replies ใน Gmail ที่สามารถตอบอีเมลโดยใช้สไตล์และโทนเสียงของผู้ใช้เอง โดย Gemini จะค้นหาข้อมูลการเดินทางและแผนการต่าง ๆ จาก Google Drive และ Docs มาใช้ประมวลผลคำตอบ ทำให้การสื่อสารดูเป็นธรรมชาติและมีรายละเอียดที่น่าประทับใจ

นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity

Gemini 2.5 Pro ไม่ได้เป็นเพียงโมเดลที่เก่งในการประมวลผลภาษาและโค้ดเท่านั้น แต่ยังสามารถแปลงภาพร่างสเก็ตช์ 2 มิติให้กลายเป็นแอนิเมชัน 3 มิติที่ซับซ้อนได้อย่างรวดเร็วและแม่นยำ ผ่าน Google AI Studio ซึ่งช่วยลดความซับซ้อนในการเรียนรู้เทคโนโลยี 3 มิติลงอย่างมาก

นอกจากนี้ Gemini ยังมีฟีเจอร์เสียงพูด (text-to-speech) ที่รองรับหลายเสียงและหลายภาษา สามารถเปลี่ยนโทนเสียงได้อย่างลื่นไหล รวมถึงสร้างเสียงกระซิบได้อย่างน่าทึ่ง ช่วยเพิ่มความสมจริงให้กับแอปพลิเคชันที่ต้องการสื่อสารด้วยเสียง

ในส่วนของการสร้างวิดีโอ Google ได้เปิดตัว VO3 ซึ่งเป็นโมเดลสร้างวิดีโอที่สามารถสร้างเสียงประกอบและบทสนทนาได้ในตัวเดียวกัน เช่น การสร้างฉากป่าและบทสนทนาของสัตว์ในนั้นอย่างสมจริง ซึ่งถือเป็นก้าวสำคัญของการสร้างสื่อดิจิทัลที่ผสมผสานภาพและเสียงด้วย AI

AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview

Google Search กำลังเปลี่ยนโฉมหน้าด้วย AI Mode ที่สร้างประสบการณ์ค้นหาขั้นสูง โดยใช้โมเดล Gemini 2.5 ที่มีความสามารถในการวิเคราะห์คำถามที่ซับซ้อนและตอบกลับด้วยข้อมูลที่เชื่อถือได้ พร้อมแสดงผลลัพธ์ในรูปแบบที่เหมาะสม เช่น ตาราง กราฟ หรือแผนที่

ฟีเจอร์ Query Fan Out ช่วยให้ AI แบ่งคำถามออกเป็นหลายส่วน และค้นหาข้อมูลจากหลายแหล่งพร้อมกัน เพื่อให้ได้คำตอบที่ครบถ้วนและแม่นยำ นอกจากนี้ยังมีฟีเจอร์ Deep Research ที่ช่วยค้นคว้าเชิงลึกโดยการสืบค้นข้อมูลหลายสิบถึงร้อยครั้ง เพื่อสร้างรายงานที่อ้างอิงได้เต็มรูปแบบภายในไม่กี่นาที

ในด้านการช็อปปิ้ง AI Mode ยังรวมข้อมูลจาก Google Images และ Shopping Graph ที่มีสินค้ากว่า 50 พันล้านรายการ พร้อมฟีเจอร์ Try On ที่ใช้ AI สร้างภาพเสื้อผ้าที่เหมาะกับรูปร่างและท่าทางของผู้ใช้จริง ๆ ช่วยให้ตัดสินใจซื้อได้ง่ายขึ้น รวมถึง Agent Checkout ที่สามารถติดตามราคาและซื้อสินค้าให้โดยอัตโนมัติผ่าน Google Pay

Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจำกัด

Android XR คือแพลตฟอร์มที่ออกแบบมาเพื่อรองรับอุปกรณ์หลากหลายรูปแบบ ตั้งแต่แว่นตาอัจฉริยะจนถึงแว่น VR ที่ให้ประสบการณ์เสมือนจริง โดยร่วมมือกับ Samsung และ Qualcomm เพื่อสร้างระบบนิเวศที่สมบูรณ์แบบสำหรับการใช้งาน AI ในชีวิตประจำวัน

ตัวอย่างเช่น Project Muhan ซึ่งเป็นอุปกรณ์ Android XR รุ่นแรกที่ให้ผู้ใช้สัมผัสประสบการณ์หน้าจอแบบไม่จำกัด พร้อม AI ที่ช่วยในการนำทาง ดูข้อมูล หรือแม้แต่ดูการแข่งขันกีฬาในแบบเสมือนจริง ขณะที่แว่นตา Android XR รุ่นใหม่มีขนาดเบา ใส่สบาย เหมาะสำหรับใช้งานตลอดวัน พร้อมกล้อง ไมโครโฟน และลำโพงที่ช่วยให้ AI สามารถรับรู้และตอบสนองโลกภายนอกได้อย่างแม่นยำ

ฟีเจอร์เด่นอีกอย่างคือการแปลภาษาสดผ่านแว่นตาที่สามารถแสดงคำแปลแบบเรียลไทม์ ทำให้การสื่อสารข้ามภาษาง่ายขึ้นมาก ซึ่งแสดงให้เห็นถึงความก้าวหน้าของ AI ที่จะช่วยเราฟัง พูด และเข้าใจโลกได้มากขึ้นทุกวัน

บทสรุปจาก Insiderly

Google I/O 2025 ได้เผยให้เห็นถึงการก้าวกระโดดครั้งสำคัญของเทคโนโลยี AI ผ่านโมเดล Gemini 2.5 Pro ที่ไม่เพียงแค่ฉลาดขึ้นในด้านการประมวลผลภาษาและโค้ด แต่ยังขยายสู่ความสามารถหลากหลาย ตั้งแต่การสื่อสารวิดีโอ 3 มิติ การสร้างภาพและวิดีโอแบบมีเสียง ไปจนถึงการช่วยงานแบบอัตโนมัติบนเว็บ และการค้นหาข้อมูลอย่างลึกซึ้ง

สิ่งที่น่าจับตามองคือการผสาน AI เข้ากับอุปกรณ์ใหม่ ๆ อย่าง Android XR ซึ่งจะทำให้ AI กลายเป็นผู้ช่วยที่อยู่เคียงข้างเราตลอดเวลา ไม่ว่าจะเป็นแว่นตา หรือแว่น VR ที่ให้ประสบการณ์ใหม่ในการติดต่อสื่อสารและการเรียนรู้

การเชื่อมโยง AI กับข้อมูลส่วนบุคคลอย่างปลอดภัยผ่านฟีเจอร์ Personal Context จะช่วยให้ AI เข้าใจและตอบสนองได้เหมาะสมกับแต่ละบุคคลมากขึ้น เพิ่มความสะดวกและประสิทธิภาพในการใช้งาน

โดยรวมแล้ว Google กำลังสร้างระบบนิเวศ AI ที่ครบวงจร ตั้งแต่โมเดลพื้นฐานไปจนถึงแอปพลิเคชันและอุปกรณ์ใหม่ ๆ ที่ช่วยให้ AI เป็นมากกว่าผู้ช่วย แต่เป็นเพื่อนร่วมทางในชีวิตดิจิทัลอย่างแท้จริง

สำหรับวงการเทคโนโลยีและผู้ที่สนใจ AI การเปิดตัวครั้งนี้เป็นสัญญาณที่ชัดเจนว่าโลกกำลังก้าวเข้าสู่ยุคที่ AI จะเปลี่ยนแปลงทุกมิติของการใช้ชีวิตและการทำงานอย่างไม่เคยมีมาก่อน

คำศัพท์เฉพาะทางที่น่าสนใจ

Elo Score: ระบบการวัดประสิทธิภาพของโมเดล AI โดยอ้างอิงจากคะแนนการแข่งขันหรือประสิทธิภาพในงานเฉพาะด้าน
TPU (Tensor Processing Unit): ชิปประมวลผลที่ออกแบบเฉพาะสำหรับงาน AI โดย Google เพื่อเพิ่มความเร็วและประสิทธิภาพในการเทรนและรันโมเดล
Multitasking: ความสามารถของ AI ในการจัดการหลายงานพร้อมกัน
Teach and Repeat: ระบบที่ AI เรียนรู้จากการสอนครั้งแรกและสามารถทำซ้ำงานที่คล้ายกันได้ในอนาคต
Model Context Protocol (MCP): โปรโตคอลที่ช่วยให้โมเดล AI สามารถเชื่อมต่อและใช้บริการอื่น ๆ ได้อย่างมีประสิทธิภาพ
Diffusion Model: โมเดล AI ที่สร้างผลลัพธ์โดยการปรับปรุงจากสัญญาณรบกวนทีละขั้นตอน ทำให้ได้ผลลัพธ์ที่มีความแม่นยำและรวดเร็ว
Agentic Capability: ความสามารถของ AI ในการทำงานแทนผู้ใช้และตัดสินใจภายใต้การควบคุมของผู้ใช้

เขียนโดย

Wora AI

Founder & Editorial Lead

ผู้ก่อตั้ง Wize และบรรณาธิการที่โฟกัสการแปลเรื่อง AI ให้กลายเป็นการตัดสินใจและ execution ที่ใช้ได้จริงในงานวันต่อวัน

โปรไฟล์ผู้เขียน → X LinkedIn

อ่านต่อ

บทความที่ควรอ่านต่อ

Video Recap Radar

จดหมายข่าว

สรุป AI ส่งทางอีเมล

1,200+ builders อ่านทุกสัปดาห์ · ส่งทุกเช้า · ยกเลิกได้ทุกเมื่อ · ไม่ส่งถี่ให้รกกล่อง

สมัครรับฟรี

ข่าวสำคัญพร้อมคำอธิบายสั้น ๆ ว่าเรื่องนี้เกี่ยวกับเราอย่างไร ส่งให้อ่านต่อได้ทันที