Google I/O 2025: Gemini, Project Astra และทิศทาง AI ของ Google
บทความบรรณาธิการ 4 นาที
Editorial Brief

Google I/O 2025: Gemini, Project Astra และทิศทาง AI ของ Google

<user-supplied>Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ำสมัยจาก Google</user-supplied>

19 กันยายน 2568 อัปเดตล่าสุด 22 มิถุนายน 2569 อ่าน 4 นาที 638 คำ Wora AI
เหมาะกับคนที่
01

ต้องตามข่าว AI สำคัญแบบไม่เสียเวลาทั้งวัน

02

ต้องอธิบายประเด็นนี้ให้ทีมฟังแบบกระชับ

03

อยากแยกเรื่องที่ควรลงมือออกจากข่าวที่ผ่านไปเร็ว

สำหรับสมาชิก

สมาชิกได้อ่านต่อว่าเรื่องนี้ควรมองยังไง

เรื่องนี้สำคัญกับหมวด AI แค่ไหน
ควรลองตอนนี้ หรือรอดูอีกสักพัก
เรื่องนี้อาจกระทบเครื่องมือและวิธีทำงานอย่างไร
ดูสิทธิ์สมาชิก
Google I/O 2025: Gemini, Project Astra และทิศทาง AI ของ Google
ให้ AI ช่วยอ่านต่อ
แชร์

เปิดบทความนี้ต่อในเครื่องมือที่คุณใช้ แล้วให้ช่วยสรุปมุมที่ควรคุยกับทีม: <user-supplied>Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ำสมัยจาก Google</user-supplied>

สารบัญ

สำรวจการเปิดตัว Gemini 2.5 Pro โมเดล AI ล้ำสมัย พร้อมโครงสร้างพื้นฐาน TPU Ironwood และนวัตกรรม AI จาก Google I/O 2025 ที่จะเปลี่ยนแปลงโลกเทคโนโลยีและการใช้งาน AI ในชีวิตประจำวัน

 

การประชุมนวัตกรรมประจำปี Google I/O 2025 ได้เปิดฉากขึ้นอย่างยิ่งใหญ่ พร้อมการประกาศเปิดตัวเทคโนโลยี AI ใหม่ล่าสุดที่น่าตื่นเต้นที่สุดในยุคนี้ นำโดยโมเดล AI ขั้นสูง "Gemini 2.5 Pro" และนวัตกรรมต่าง ๆ ที่ผสมผสานความคิดสร้างสรรค์และประสิทธิภาพเพื่อเปลี่ยนแปลงวิธีที่เราใช้เทคโนโลยีในชีวิตประจำวัน บทความนี้จะพาเราไปสำรวจทุกแง่มุมของการเปิดตัวครั้งนี้ พร้อมวิเคราะห์ความหมายและผลกระทบที่อาจเกิดขึ้นในวงการ AI และเทคโนโลยีโลกในอนาคต

การพัฒนาและความก้าวหน้าของโมเดล Gemini

Gemini 2.5 Pro คือโมเดล AI ที่ Google ภูมิใจนำเสนอในปีนี้ โดยมีการปรับปรุงอย่างรวดเร็วและต่อเนื่องตั้งแต่รุ่นแรกที่เปิดตัว ด้วยคะแนน Elo ที่เพิ่มขึ้นกว่า 300 คะแนน และครองแชมป์บนแหล่งข้อมูล Ella Marina ในทุกหมวดหมู่ นอกจากนี้ Gemini ยังทำผลงานโดดเด่นในด้านการเขียนโค้ด โดยรุ่น 2.5 Pro สามารถทำคะแนนสูงสุดบน WebDev Arena ด้วยคะแนนที่เพิ่มขึ้นถึง 142 Elo points ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือชั้นในการสร้างโค้ดคุณภาพสูงอย่างรวดเร็ว

การเติบโตของ Gemini ไม่ได้หยุดอยู่แค่การประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่เติบโตเร็วที่สุดในแพลตฟอร์ม Cursor ซึ่งเป็น AI editor สำหรับโค้ด โดยมีการสร้างโค้ดที่ผ่านการยอมรับหลายแสนบรรทัดต่อวินาที ซึ่งสะท้อนถึงความนิยมและการนำไปใช้งานที่แพร่หลายอย่างรวดเร็วในวงการนักพัฒนา

ไฮไลต์ที่น่าประทับใจอีกอย่างคือ Gemini สามารถเล่นเกม Pokemon Blue จนสำเร็จได้อย่างสมบูรณ์ ทั้งการสะสมเหรียญครบ 8 เหรียญ เดินทางถึง Victory Road และเอาชนะ Elite Four รวมถึงแชมป์ ทำให้เราเข้าใกล้เป้าหมายของ "Artificial Pokemon Intelligence" อย่างจริงจัง

โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI

เบื้องหลังความสำเร็จของ Gemini คือโครงสร้างพื้นฐาน TPU รุ่นที่ 7 ที่ชื่อ Ironwood ซึ่งเป็นชิปประมวลผลที่ออกแบบมาเพื่อรองรับการประมวลผล AI ในระดับใหญ่ ด้วยประสิทธิภาพที่สูงกว่ารุ่นก่อนถึง 10 เท่า และรองรับการประมวลผลได้ถึง 42.5 exaflops ต่อพอร์ต ซึ่งจะเปิดให้บริการแก่ลูกค้า Google Cloud ภายในปีนี้

การผสมผสานระหว่างโครงสร้างพื้นฐานและโมเดล AI ทำให้ Gemini ครองอันดับ 1-3 ในการสร้าง token ต่อวินาทีบน LM arena leaderboard พร้อมกับลดราคาค่าใช้จ่ายลงอย่างมีนัยสำคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการจัดการสมดุลระหว่างคุณภาพและต้นทุนในการให้บริการ AI

การเติบโตของการใช้งาน AI และการนำไปใช้จริง

ในปีที่ผ่านมา การประมวลผลข้อมูลผ่านผลิตภัณฑ์และ API ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้าน tokens ต่อเดือน เป็น 480 ล้านล้าน tokens ต่อเดือน หรือเพิ่มขึ้นประมาณ 50 เท่า ซึ่งแสดงถึงการยอมรับและการใช้งาน AI ที่พุ่งสูงขึ้นอย่างมหาศาล

นักพัฒนา AI มากกว่า 7 ล้านคนได้สร้างสรรค์แอปพลิเคชันด้วย Gemini API ผ่าน Google AI Studio และ Vertex AI ซึ่งเติบโตขึ้นกว่า 5 เท่าตั้งแต่ Google I/O ครั้งก่อน นอกจากนี้ การใช้งาน Gemini บน Vertex AI ยังเพิ่มขึ้นกว่า 40 เท่าในระยะเวลาเพียงหนึ่งปี

ในส่วนของผู้ใช้ทั่วไป แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะโมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้นถึง 45% ซึ่งชี้ให้เห็นว่า AI กำลังกลายเป็นส่วนสำคัญในชีวิตประจำวันของผู้คนมากขึ้นเรื่อย ๆ

นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา

หนึ่งในโครงการวิจัยที่ได้รับความสนใจอย่างมากคือ Project Starline ซึ่งเป็นเทคโนโลยีวิดีโอ 3 มิติที่สร้างความรู้สึกเหมือนอยู่ในห้องเดียวกันแม้จะอยู่ไกลกัน โดยล่าสุด Google ได้เปิดตัว Google Beam ซึ่งเป็นแพลตฟอร์มสื่อสารวิดีโอ AI-first ที่ใช้กล้อง 6 ตัวจับภาพจากหลายมุม พร้อม AI ประมวลผลและแสดงผลบนจอแสดงผล 3 มิติที่ติดตามการเคลื่อนไหวของศีรษะได้อย่างแม่นยำและเรียลไทม์

นอกจากนี้ Google Meet ยังนำเทคโนโลยีแปลภาษาแบบเรียลไทม์มาใช้ ช่วยลดอุปสรรคด้านภาษาอย่างมีประสิทธิภาพ เช่น การสนทนาเกี่ยวกับการจองที่พักในต่างประเทศที่ใช้ภาษาแตกต่างกัน โดยสามารถจับโทนเสียงและการแสดงออกของผู้พูดได้อย่างแม่นยำ และตอนนี้ฟีเจอร์แปลภาษาแบบเรียลไทม์นี้เปิดให้ผู้ใช้ที่สมัครสมาชิกใช้งานภาษาอังกฤษและสเปนก่อน และจะขยายไปยังภาษาอื่น ๆ และองค์กรในเร็ว ๆ นี้

Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทำงานบนเว็บ

Project Astra คือการพัฒนาผู้ช่วย AI สากลที่เข้าใจโลกผ่านกล้องและหน้าจอ ช่วยให้เราพูดคุยและโต้ตอบกับสิ่งที่เห็นได้อย่างเป็นธรรมชาติ เช่น การฝึกสัมภาษณ์งาน หรือการฝึกซ้อมมาราธอน โดย Gemini Live ได้ผสานฟีเจอร์ของ Astra เช่น การแชร์หน้าจอและกล้อง ทำให้ผู้ใช้สามารถพูดคุยเกี่ยวกับสิ่งที่เห็นได้ทันที

ความน่ารักของ Astra คือความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดของผู้ใช้ เช่น การแยกแยะว่าสิ่งที่เห็นเป็นรถขยะ ไม่ใช่รถเปิดประทุน หรือการบอกว่าคนที่ตามเราไม่ใช่ใครแต่เป็นเงาของเราเอง ซึ่งช่วยเพิ่มความน่าเชื่อถือและความเป็นธรรมชาติในการสื่อสาร

ในขณะเดียวกัน Project Mariner คือเอเจนต์ AI ที่สามารถทำงานบนเว็บแทนเราได้อย่างอัจฉริยะ โดยมีฟีเจอร์ multitasking ที่สามารถจัดการงานพร้อมกันได้ถึง 10 งาน และระบบ "teach and repeat" ที่ช่วยให้เอเจนต์เรียนรู้และทำงานซ้ำได้ตามคำสั่งที่สอนครั้งแรก ซึ่งเปิดให้เหล่านักพัฒนาสามารถใช้งานผ่าน Gemini API และจะเปิดให้ใช้กันอย่างกว้างขวางในช่วงฤดูร้อนนี้

ความน่าสนใจของ Mariner คือการเป็นส่วนหนึ่งของระบบเอเจนต์ที่สามารถสื่อสารกันได้ผ่านโปรโตคอล open agent to agent และเชื่อมต่อกับบริการต่าง ๆ ผ่าน model context protocol (MCP) ทำให้สามารถทำงานร่วมกันและตอบสนองความต้องการของผู้ใช้ได้อย่างครอบคลุม

การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ

Google กำลังพัฒนาให้ Gemini สามารถเข้าถึงและใช้ข้อมูลส่วนตัวที่เกี่ยวข้องจากแอปต่าง ๆ ของ Google ได้อย่างปลอดภัยและเป็นส่วนตัว เพื่อสร้างประสบการณ์ AI ที่เหมาะสมกับแต่ละคนมากขึ้น เช่น ฟีเจอร์ Personalized Smart Replies ใน Gmail ที่สามารถตอบอีเมลโดยใช้สไตล์และโทนเสียงของผู้ใช้เอง โดย Gemini จะค้นหาข้อมูลการเดินทางและแผนการต่าง ๆ จาก Google Drive และ Docs มาใช้ประมวลผลคำตอบ ทำให้การสื่อสารดูเป็นธรรมชาติและมีรายละเอียดที่น่าประทับใจ

นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity

Gemini 2.5 Pro ไม่ได้เป็นเพียงโมเดลที่เก่งในการประมวลผลภาษาและโค้ดเท่านั้น แต่ยังสามารถแปลงภาพร่างสเก็ตช์ 2 มิติให้กลายเป็นแอนิเมชัน 3 มิติที่ซับซ้อนได้อย่างรวดเร็วและแม่นยำ ผ่าน Google AI Studio ซึ่งช่วยลดความซับซ้อนในการเรียนรู้เทคโนโลยี 3 มิติลงอย่างมาก

นอกจากนี้ Gemini ยังมีฟีเจอร์เสียงพูด (text-to-speech) ที่รองรับหลายเสียงและหลายภาษา สามารถเปลี่ยนโทนเสียงได้อย่างลื่นไหล รวมถึงสร้างเสียงกระซิบได้อย่างน่าทึ่ง ช่วยเพิ่มความสมจริงให้กับแอปพลิเคชันที่ต้องการสื่อสารด้วยเสียง

ในส่วนของการสร้างวิดีโอ Google ได้เปิดตัว VO3 ซึ่งเป็นโมเดลสร้างวิดีโอที่สามารถสร้างเสียงประกอบและบทสนทนาได้ในตัวเดียวกัน เช่น การสร้างฉากป่าและบทสนทนาของสัตว์ในนั้นอย่างสมจริง ซึ่งถือเป็นก้าวสำคัญของการสร้างสื่อดิจิทัลที่ผสมผสานภาพและเสียงด้วย AI

AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview

Google Search กำลังเปลี่ยนโฉมหน้าด้วย AI Mode ที่สร้างประสบการณ์ค้นหาขั้นสูง โดยใช้โมเดล Gemini 2.5 ที่มีความสามารถในการวิเคราะห์คำถามที่ซับซ้อนและตอบกลับด้วยข้อมูลที่เชื่อถือได้ พร้อมแสดงผลลัพธ์ในรูปแบบที่เหมาะสม เช่น ตาราง กราฟ หรือแผนที่

ฟีเจอร์ Query Fan Out ช่วยให้ AI แบ่งคำถามออกเป็นหลายส่วน และค้นหาข้อมูลจากหลายแหล่งพร้อมกัน เพื่อให้ได้คำตอบที่ครบถ้วนและแม่นยำ นอกจากนี้ยังมีฟีเจอร์ Deep Research ที่ช่วยค้นคว้าเชิงลึกโดยการสืบค้นข้อมูลหลายสิบถึงร้อยครั้ง เพื่อสร้างรายงานที่อ้างอิงได้เต็มรูปแบบภายในไม่กี่นาที

ในด้านการช็อปปิ้ง AI Mode ยังรวมข้อมูลจาก Google Images และ Shopping Graph ที่มีสินค้ากว่า 50 พันล้านรายการ พร้อมฟีเจอร์ Try On ที่ใช้ AI สร้างภาพเสื้อผ้าที่เหมาะกับรูปร่างและท่าทางของผู้ใช้จริง ๆ ช่วยให้ตัดสินใจซื้อได้ง่ายขึ้น รวมถึง Agent Checkout ที่สามารถติดตามราคาและซื้อสินค้าให้โดยอัตโนมัติผ่าน Google Pay

Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจำกัด

Android XR คือแพลตฟอร์มที่ออกแบบมาเพื่อรองรับอุปกรณ์หลากหลายรูปแบบ ตั้งแต่แว่นตาอัจฉริยะจนถึงแว่น VR ที่ให้ประสบการณ์เสมือนจริง โดยร่วมมือกับ Samsung และ Qualcomm เพื่อสร้างระบบนิเวศที่สมบูรณ์แบบสำหรับการใช้งาน AI ในชีวิตประจำวัน

ตัวอย่างเช่น Project Muhan ซึ่งเป็นอุปกรณ์ Android XR รุ่นแรกที่ให้ผู้ใช้สัมผัสประสบการณ์หน้าจอแบบไม่จำกัด พร้อม AI ที่ช่วยในการนำทาง ดูข้อมูล หรือแม้แต่ดูการแข่งขันกีฬาในแบบเสมือนจริง ขณะที่แว่นตา Android XR รุ่นใหม่มีขนาดเบา ใส่สบาย เหมาะสำหรับใช้งานตลอดวัน พร้อมกล้อง ไมโครโฟน และลำโพงที่ช่วยให้ AI สามารถรับรู้และตอบสนองโลกภายนอกได้อย่างแม่นยำ

ฟีเจอร์เด่นอีกอย่างคือการแปลภาษาสดผ่านแว่นตาที่สามารถแสดงคำแปลแบบเรียลไทม์ ทำให้การสื่อสารข้ามภาษาง่ายขึ้นมาก ซึ่งแสดงให้เห็นถึงความก้าวหน้าของ AI ที่จะช่วยเราฟัง พูด และเข้าใจโลกได้มากขึ้นทุกวัน

บทสรุปจาก Insiderly

Google I/O 2025 ได้เผยให้เห็นถึงการก้าวกระโดดครั้งสำคัญของเทคโนโลยี AI ผ่านโมเดล Gemini 2.5 Pro ที่ไม่เพียงแค่ฉลาดขึ้นในด้านการประมวลผลภาษาและโค้ด แต่ยังขยายสู่ความสามารถหลากหลาย ตั้งแต่การสื่อสารวิดีโอ 3 มิติ การสร้างภาพและวิดีโอแบบมีเสียง ไปจนถึงการช่วยงานแบบอัตโนมัติบนเว็บ และการค้นหาข้อมูลอย่างลึกซึ้ง

สิ่งที่น่าจับตามองคือการผสาน AI เข้ากับอุปกรณ์ใหม่ ๆ อย่าง Android XR ซึ่งจะทำให้ AI กลายเป็นผู้ช่วยที่อยู่เคียงข้างเราตลอดเวลา ไม่ว่าจะเป็นแว่นตา หรือแว่น VR ที่ให้ประสบการณ์ใหม่ในการติดต่อสื่อสารและการเรียนรู้

การเชื่อมโยง AI กับข้อมูลส่วนบุคคลอย่างปลอดภัยผ่านฟีเจอร์ Personal Context จะช่วยให้ AI เข้าใจและตอบสนองได้เหมาะสมกับแต่ละบุคคลมากขึ้น เพิ่มความสะดวกและประสิทธิภาพในการใช้งาน

โดยรวมแล้ว Google กำลังสร้างระบบนิเวศ AI ที่ครบวงจร ตั้งแต่โมเดลพื้นฐานไปจนถึงแอปพลิเคชันและอุปกรณ์ใหม่ ๆ ที่ช่วยให้ AI เป็นมากกว่าผู้ช่วย แต่เป็นเพื่อนร่วมทางในชีวิตดิจิทัลอย่างแท้จริง

สำหรับวงการเทคโนโลยีและผู้ที่สนใจ AI การเปิดตัวครั้งนี้เป็นสัญญาณที่ชัดเจนว่าโลกกำลังก้าวเข้าสู่ยุคที่ AI จะเปลี่ยนแปลงทุกมิติของการใช้ชีวิตและการทำงานอย่างไม่เคยมีมาก่อน

คำศัพท์เฉพาะทางที่น่าสนใจ

  • Elo Score: ระบบการวัดประสิทธิภาพของโมเดล AI โดยอ้างอิงจากคะแนนการแข่งขันหรือประสิทธิภาพในงานเฉพาะด้าน
  • TPU (Tensor Processing Unit): ชิปประมวลผลที่ออกแบบเฉพาะสำหรับงาน AI โดย Google เพื่อเพิ่มความเร็วและประสิทธิภาพในการเทรนและรันโมเดล
  • Multitasking: ความสามารถของ AI ในการจัดการหลายงานพร้อมกัน
  • Teach and Repeat: ระบบที่ AI เรียนรู้จากการสอนครั้งแรกและสามารถทำซ้ำงานที่คล้ายกันได้ในอนาคต
  • Model Context Protocol (MCP): โปรโตคอลที่ช่วยให้โมเดล AI สามารถเชื่อมต่อและใช้บริการอื่น ๆ ได้อย่างมีประสิทธิภาพ
  • Diffusion Model: โมเดล AI ที่สร้างผลลัพธ์โดยการปรับปรุงจากสัญญาณรบกวนทีละขั้นตอน ทำให้ได้ผลลัพธ์ที่มีความแม่นยำและรวดเร็ว
  • Agentic Capability: ความสามารถของ AI ในการทำงานแทนผู้ใช้และตัดสินใจภายใต้การควบคุมของผู้ใช้
เขียนโดย
Wora AI
Wora AI
Founder & Editorial Lead

ผู้ก่อตั้ง Wize และบรรณาธิการที่โฟกัสการแปลเรื่อง AI ให้กลายเป็นการตัดสินใจและ execution ที่ใช้ได้จริงในงานวันต่อวัน

อ่านต่อ

บทความที่ควรอ่านต่อ

Video Recap Radar

Qwen 3.6 คืออะไร และทำไมธุรกิจควรจับตา AI ฟรีตัวนี้

AI ที่น่าจับตาในรอบนี้ไม่ใช่แค่ model ใหม่ที่ตัวเลขใหญ่ขึ้น แต่เป็นตัวอย่างชัดเจนว่าโลก AI กำลังขยับจากการแข่งขันเรื่อง “ขนาด” ไปสู่การแข่งขันเรื่อง “สถาปัตยกรรม” คลิปจากช่อง Julian Goldie SEO หยิบ Al

Video Recap Radar

AI News สัปดาห์นี้บอกชัดว่า AI กำลังจะกลายเป็นคอมของเรา

สัญญาณที่น่าสนใจที่สุดของวงการ AI ตอนนี้ ไม่ใช่แค่ model ตอบคำถามเก่งขึ้น แต่คือ AI เริ่ม “ลงมือทำงานแทน” บนคอมพิวเตอร์ได้จริงแล้ว คลิปจากช่อง Julian Goldie SEO สรุปอัปเดตหลายตัวจาก OpenAI, Anthropic,

Video Recap Ship

Google AI Studio อัปเดตใหม่ ทำให้คนทำธุรกิจสร้างงานไวขึ้น

สิ่งที่น่าสนใจกับ Google AI Studio รอบนี้ ไม่ใช่แค่ว่ามัน “เก่งขึ้น” แต่คือมันลดแรงเสียดทานในการลงมือทำลงเยอะมาก จนคนที่ไม่ได้เขียนโค้ด ไม่ได้เป็นดีไซเนอร์ และไม่ได้อัดเสียงเอง ก็เริ่มสร้างของที่ใช้งา

หรือ
จดหมายข่าว

สรุป AI ส่งทางอีเมล

1,200+ builders อ่านทุกสัปดาห์ · ส่งทุกเช้า · ยกเลิกได้ทุกเมื่อ · ไม่ส่งถี่ให้รกกล่อง

สมัครรับฟรี

ข่าวสำคัญพร้อมคำอธิบายสั้น ๆ ว่าเรื่องนี้เกี่ยวกับเราอย่างไร ส่งให้อ่านต่อได้ทันที

อ่านฟรี ยกเลิกได้ทุกเมื่อ