Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ําสมัยจาก Google

การประชุมนวัตกรรมประจําปี Google I/O 2025 ได้เปิดฉากขึ้นอย่างยิ่งใหญ่ พร้อมการประกาศเปิดตัวเทคโนโลยี AI ใหม่ล่าสุดที่น่าตื่นเต้นที่สุดในยุคนี้ นําโดยโมเดล AI ขั้นสูง "Gemini 2.5 Pro" และนวัตกรรมต่าง ๆ ที่ผสมผสานความคิดสร้างสรรค์และประสิทธิภาพเพื่อเปลี่ยนแปลงวิธีที่เราใช้เทคโนโลยีในชีวิตประจําวัน บทความนี้จะพาเราไปสํารวจทุกแง่มุมของการเปิดตัวครั้งนี้ พร้อมวิเคราะห์ความหมายและผลกระทบที่อาจเกิดขึ้นในวงการ AI และเทคโนโลยีโลกในอนาคต

การพัฒนาและความก้าวหน้าของโมเดล Gemini

Gemini 2.5 Pro คือโมเดล AI ที่ Google ภูมิใจนําเสนอในปีนี้ โดยมีการปรับปรุงอย่างรวดเร็วและต่อเนื่องตั้งแต่รุ่นแรกที่เปิดตัว ด้วยคะแนน Elo ที่เพิ่มขึ้นกว่า 300 คะแนน และครองแชมป์บนแหล่งข้อมูล Ella Marina ในทุกหมวดหมู่ นอกจากนี้ Gemini ยังทําผลงานโดดเด่นในด้านการเขียนโค้ด โดยรุ่น 2.5 Pro สามารถทําคะแนนสูงสุดบน WebDev Arena ด้วยคะแนนที่เพิ่มขึ้นถึง 142 Elo points ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือชั้นในการสร้างโค้ดคุณภาพสูงอย่างรวดเร็ว

การเติบโตของ Gemini ไม่ได้หยุดอยู่แค่การประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่เติบโตเร็วที่สุดในแพลตฟอร์ม Cursor ซึ่งเป็น AI editor สําหรับโค้ด โดยมีการสร้างโค้ดที่ผ่านการยอมรับหลายแสนบรรทัดต่อวินาที ซึ่งสะท้อนถึงความนิยมและการนําไปใช้งานที่แพร่หลายอย่างรวดเร็วในวงการนักพัฒนา

ไฮไลต์ที่น่าประทับใจอีกอย่างคือ Gemini สามารถเล่นเกม Pokemon Blue จนสําเร็จได้อย่างสมบูรณ์ ทั้งการสะสมเหรียญครบ 8 เหรียญ เดินทางถึง Victory Road และเอาชนะ Elite Four รวมถึงแชมป์ ทําให้เราเข้าใกล้เป้าหมายของ "Artificial Pokemon Intelligence" อย่างจริงจัง

โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI

เบื้องหลังความสําเร็จของ Gemini คือโครงสร้างพื้นฐาน TPU รุ่นที่ 7 ที่ชื่อ Ironwood ซึ่งเป็นชิปประมวลผลที่ออกแบบมาเพื่อรองรับการประมวลผล AI ในระดับใหญ่ ด้วยประสิทธิภาพที่สูงกว่ารุ่นก่อนถึง 10 เท่า และรองรับการประมวลผลได้ถึง 42.5 exaflops ต่อพอร์ต ซึ่งจะเปิดให้บริการแก่ลูกค้า Google Cloud ภายในปีนี้

การผสมผสานระหว่างโครงสร้างพื้นฐานและโมเดล AI ทําให้ Gemini ครองอันดับ 1-3 ในการสร้าง token ต่อวินาทีบน LM arena leaderboard พร้อมกับลดราคาค่าใช้จ่ายลงอย่างมีนัยสําคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการจัดการสมดุลระหว่างคุณภาพและต้นทุนในการให้บริการ AI

การเติบโตของการใช้งาน AI และการนําไปใช้จริง

ในปีที่ผ่านมา การประมวลผลข้อมูลผ่านผลิตภัณฑ์และ API ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้าน tokens ต่อเดือน เป็น 480 ล้านล้าน tokens ต่อเดือน หรือเพิ่มขึ้นประมาณ 50 เท่า ซึ่งแสดงถึงการยอมรับและการใช้งาน AI ที่พุ่งสูงขึ้นอย่างมหาศาล

นักพัฒนา AI มากกว่า 7 ล้านคนได้สร้างสรรค์แอปพลิเคชันด้วย Gemini API ผ่าน Google AI Studio และ Vertex AI ซึ่งเติบโตขึ้นกว่า 5 เท่าตั้งแต่ Google I/O ครั้งก่อน นอกจากนี้ การใช้งาน Gemini บน Vertex AI ยังเพิ่มขึ้นกว่า 40 เท่าในระยะเวลาเพียงหนึ่งปี

ในส่วนของผู้ใช้ทั่วไป แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะโมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้นถึง 45% ซึ่งชี้ให้เห็นว่า AI กําลังกลายเป็นส่วนสําคัญในชีวิตประจําวันของผู้คนมากขึ้นเรื่อย ๆ

นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา

หนึ่งในโครงการวิจัยที่ได้รับความสนใจอย่างมากคือ Project Starline ซึ่งเป็นเทคโนโลยีวิดีโอ 3 มิติที่สร้างความรู้สึกเหมือนอยู่ในห้องเดียวกันแม้จะอยู่ไกลกัน โดยล่าสุด Google ได้เปิดตัว Google Beam ซึ่งเป็นแพลตฟอร์มสื่อสารวิดีโอ AI-first ที่ใช้กล้อง 6 ตัวจับภาพจากหลายมุม พร้อม AI ประมวลผลและแสดงผลบนจอแสดงผล 3 มิติที่ติดตามการเคลื่อนไหวของศีรษะได้อย่างแม่นยําและเรียลไทม์

นอกจากนี้ Google Meet ยังนําเทคโนโลยีแปลภาษาแบบเรียลไทม์มาใช้ ช่วยลดอุปสรรคด้านภาษาอย่างมีประสิทธิภาพ เช่น การสนทนาเกี่ยวกับการจองที่พักในต่างประเทศที่ใช้ภาษาแตกต่างกัน โดยสามารถจับโทนเสียงและการแสดงออกของผู้พูดได้อย่างแม่นยํา และตอนนี้ฟีเจอร์แปลภาษาแบบเรียลไทม์นี้เปิดให้ผู้ใช้ที่สมัครสมาชิกใช้งานภาษาอังกฤษและสเปนก่อน และจะขยายไปยังภาษาอื่น ๆ และองค์กรในเร็ว ๆ นี้

Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทํางานบนเว็บ

Project Astra คือการพัฒนาผู้ช่วย AI สากลที่เข้าใจโลกผ่านกล้องและหน้าจอ ช่วยให้เราพูดคุยและโต้ตอบกับสิ่งที่เห็นได้อย่างเป็นธรรมชาติ เช่น การฝึกสัมภาษณ์งาน หรือการฝึกซ้อมมาราธอน โดย Gemini Live ได้ผสานฟีเจอร์ของ Astra เช่น การแชร์หน้าจอและกล้อง ทําให้ผู้ใช้สามารถพูดคุยเกี่ยวกับสิ่งที่เห็นได้ทันที

ความน่ารักของ Astra คือความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดของผู้ใช้ เช่น การแยกแยะว่าสิ่งที่เห็นเป็นรถขยะ ไม่ใช่รถเปิดประทุน หรือการบอกว่าคนที่ตามเราไม่ใช่ใครแต่เป็นเงาของเราเอง ซึ่งช่วยเพิ่มความน่าเชื่อถือและความเป็นธรรมชาติในการสื่อสาร

ในขณะเดียวกัน Project Mariner คือเอเจนต์ AI ที่สามารถทํางานบนเว็บแทนเราได้อย่างอัจฉริยะ โดยมีฟีเจอร์ multitasking ที่สามารถจัดการงานพร้อมกันได้ถึง 10 งาน และระบบ "teach and repeat" ที่ช่วยให้เอเจนต์เรียนรู้และทํางานซ้ําได้ตามคําสั่งที่สอนครั้งแรก ซึ่งเปิดให้เหล่านักพัฒนาสามารถใช้งานผ่าน Gemini API และจะเปิดให้ใช้กันอย่างกว้างขวางในช่วงฤดูร้อนนี้

ความน่าสนใจของ Mariner คือการเป็นส่วนหนึ่งของระบบเอเจนต์ที่สามารถสื่อสารกันได้ผ่านโปรโตคอล open agent to agent และเชื่อมต่อกับบริการต่าง ๆ ผ่าน model context protocol (MCP) ทําให้สามารถทํางานร่วมกันและตอบสนองความต้องการของผู้ใช้ได้อย่างครอบคลุม

การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ

Google กําลังพัฒนาให้ Gemini สามารถเข้าถึงและใช้ข้อมูลส่วนตัวที่เกี่ยวข้องจากแอปต่าง ๆ ของ Google ได้อย่างปลอดภัยและเป็นส่วนตัว เพื่อสร้างประสบการณ์ AI ที่เหมาะสมกับแต่ละคนมากขึ้น เช่น ฟีเจอร์ Personalized Smart Replies ใน Gmail ที่สามารถตอบอีเมลโดยใช้สไตล์และโทนเสียงของผู้ใช้เอง โดย Gemini จะค้นหาข้อมูลการเดินทางและแผนการต่าง ๆ จาก Google Drive และ Docs มาใช้ประมวลผลคําตอบ ทําให้การสื่อสารดูเป็นธรรมชาติและมีรายละเอียดที่น่าประทับใจ

นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity

Gemini 2.5 Pro ไม่ได้เป็นเพียงโมเดลที่เก่งในการประมวลผลภาษาและโค้ดเท่านั้น แต่ยังสามารถแปลงภาพร่างสเก็ตช์ 2 มิติให้กลายเป็นแอนิเมชัน 3 มิติที่ซับซ้อนได้อย่างรวดเร็วและแม่นยํา ผ่าน Google AI Studio ซึ่งช่วยลดความซับซ้อนในการเรียนรู้เทคโนโลยี 3 มิติลงอย่างมาก

นอกจากนี้ Gemini ยังมีฟีเจอร์เสียงพูด (text-to-speech) ที่รองรับหลายเสียงและหลายภาษา สามารถเปลี่ยนโทนเสียงได้อย่างลื่นไหล รวมถึงสร้างเสียงกระซิบได้อย่างน่าทึ่ง ช่วยเพิ่มความสมจริงให้กับแอปพลิเคชันที่ต้องการสื่อสารด้วยเสียง

ในส่วนของการสร้างวิดีโอ Google ได้เปิดตัว VO3 ซึ่งเป็นโมเดลสร้างวิดีโอที่สามารถสร้างเสียงประกอบและบทสนทนาได้ในตัวเดียวกัน เช่น การสร้างฉากป่าและบทสนทนาของสัตว์ในนั้นอย่างสมจริง ซึ่งถือเป็นก้าวสําคัญของการสร้างสื่อดิจิทัลที่ผสมผสานภาพและเสียงด้วย AI

AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview

Google Search กําลังเปลี่ยนโฉมหน้าด้วย AI Mode ที่สร้างประสบการณ์ค้นหาขั้นสูง โดยใช้โมเดล Gemini 2.5 ที่มีความสามารถในการวิเคราะห์คําถามที่ซับซ้อนและตอบกลับด้วยข้อมูลที่เชื่อถือได้ พร้อมแสดงผลลัพธ์ในรูปแบบที่เหมาะสม เช่น ตาราง กราฟ หรือแผนที่

ฟีเจอร์ Query Fan Out ช่วยให้ AI แบ่งคําถามออกเป็นหลายส่วน และค้นหาข้อมูลจากหลายแหล่งพร้อมกัน เพื่อให้ได้คําตอบที่ครบถ้วนและแม่นยํา นอกจากนี้ยังมีฟีเจอร์ Deep Research ที่ช่วยค้นคว้าเชิงลึกโดยการสืบค้นข้อมูลหลายสิบถึงร้อยครั้ง เพื่อสร้างรายงานที่อ้างอิงได้เต็มรูปแบบภายในไม่กี่นาที

ในด้านการช็อปปิ้ง AI Mode ยังรวมข้อมูลจาก Google Images และ Shopping Graph ที่มีสินค้ากว่า 50 พันล้านรายการ พร้อมฟีเจอร์ Try On ที่ใช้ AI สร้างภาพเสื้อผ้าที่เหมาะกับรูปร่างและท่าทางของผู้ใช้จริง ๆ ช่วยให้ตัดสินใจซื้อได้ง่ายขึ้น รวมถึง Agent Checkout ที่สามารถติดตามราคาและซื้อสินค้าให้โดยอัตโนมัติผ่าน Google Pay

Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจํากัด

Android XR คือแพลตฟอร์มที่ออกแบบมาเพื่อรองรับอุปกรณ์หลากหลายรูปแบบ ตั้งแต่แว่นตาอัจฉริยะจนถึงแว่น VR ที่ให้ประสบการณ์เสมือนจริง โดยร่วมมือกับ Samsung และ Qualcomm เพื่อสร้างระบบนิเวศที่สมบูรณ์แบบสําหรับการใช้งาน AI ในชีวิตประจําวัน

ตัวอย่างเช่น Project Muhan ซึ่งเป็นอุปกรณ์ Android XR รุ่นแรกที่ให้ผู้ใช้สัมผัสประสบการณ์หน้าจอแบบไม่จํากัด พร้อม AI ที่ช่วยในการนําทาง ดูข้อมูล หรือแม้แต่ดูการแข่งขันกีฬาในแบบเสมือนจริง ขณะที่แว่นตา Android XR รุ่นใหม่มีขนาดเบา ใส่สบาย เหมาะสําหรับใช้งานตลอดวัน พร้อมกล้อง ไมโครโฟน และลําโพงที่ช่วยให้ AI สามารถรับรู้และตอบสนองโลกภายนอกได้อย่างแม่นยํา

ฟีเจอร์เด่นอีกอย่างคือการแปลภาษาสดผ่านแว่นตาที่สามารถแสดงคําแปลแบบเรียลไทม์ ทําให้การสื่อสารข้ามภาษาง่ายขึ้นมาก ซึ่งแสดงให้เห็นถึงความก้าวหน้าของ AI ที่จะช่วยเราฟัง พูด และเข้าใจโลกได้มากขึ้นทุกวัน

บทสรุปจาก Insiderly

Google I/O 2025 ได้เผยให้เห็นถึงการก้าวกระโดดครั้งสําคัญของเทคโนโลยี AI ผ่านโมเดล Gemini 2.5 Pro ที่ไม่เพียงแค่ฉลาดขึ้นในด้านการประมวลผลภาษาและโค้ด แต่ยังขยายสู่ความสามารถหลากหลาย ตั้งแต่การสื่อสารวิดีโอ 3 มิติ การสร้างภาพและวิดีโอแบบมีเสียง ไปจนถึงการช่วยงานแบบอัตโนมัติบนเว็บ และการค้นหาข้อมูลอย่างลึกซึ้ง

สิ่งที่น่าจับตามองคือการผสาน AI เข้ากับอุปกรณ์ใหม่ ๆ อย่าง Android XR ซึ่งจะทําให้ AI กลายเป็นผู้ช่วยที่อยู่เคียงข้างเราตลอดเวลา ไม่ว่าจะเป็นแว่นตา หรือแว่น VR ที่ให้ประสบการณ์ใหม่ในการติดต่อสื่อสารและการเรียนรู้

การเชื่อมโยง AI กับข้อมูลส่วนบุคคลอย่างปลอดภัยผ่านฟีเจอร์ Personal Context จะช่วยให้ AI เข้าใจและตอบสนองได้เหมาะสมกับแต่ละบุคคลมากขึ้น เพิ่มความสะดวกและประสิทธิภาพในการใช้งาน

โดยรวมแล้ว Google กําลังสร้างระบบนิเวศ AI ที่ครบวงจร ตั้งแต่โมเดลพื้นฐานไปจนถึงแอปพลิเคชันและอุปกรณ์ใหม่ ๆ ที่ช่วยให้ AI เป็นมากกว่าผู้ช่วย แต่เป็นเพื่อนร่วมทางในชีวิตดิจิทัลอย่างแท้จริง

สําหรับวงการเทคโนโลยีและผู้ที่สนใจ AI การเปิดตัวครั้งนี้เป็นสัญญาณที่ชัดเจนว่าโลกกําลังก้าวเข้าสู่ยุคที่ AI จะเปลี่ยนแปลงทุกมิติของการใช้ชีวิตและการทํางานอย่างไม่เคยมีมาก่อน

คําศัพท์เฉพาะทางที่น่าสนใจ

Elo Score: ระบบการวัดประสิทธิภาพของโมเดล AI โดยอ้างอิงจากคะแนนการแข่งขันหรือประสิทธิภาพในงานเฉพาะด้าน
TPU (Tensor Processing Unit): ชิปประมวลผลที่ออกแบบเฉพาะสําหรับงาน AI โดย Google เพื่อเพิ่มความเร็วและประสิทธิภาพในการเทรนและรันโมเดล
Multitasking: ความสามารถของ AI ในการจัดการหลายงานพร้อมกัน
Teach and Repeat: ระบบที่ AI เรียนรู้จากการสอนครั้งแรกและสามารถทําซ้ํางานที่คล้ายกันได้ในอนาคต
Model Context Protocol (MCP): โปรโตคอลที่ช่วยให้โมเดล AI สามารถเชื่อมต่อและใช้บริการอื่น ๆ ได้อย่างมีประสิทธิภาพ
Diffusion Model: โมเดล AI ที่สร้างผลลัพธ์โดยการปรับปรุงจากสัญญาณรบกวนทีละขั้นตอน ทําให้ได้ผลลัพธ์ที่มีความแม่นยําและรวดเร็ว
Agentic Capability: ความสามารถของ AI ในการทํางานแทนผู้ใช้และตัดสินใจภายใต้การควบคุมของผู้ใช้

Update your email preferences or unsubscribe here

1309 Coffeen Avenue STE 1200
Sheridan, Wyoming 82801, United States

Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ําสมัยจาก Google

สมาชิกได้อ่านต่อว่าเรื่องนี้ควรมองยังไง

Google I/O '25 Keynote: ก้าวสู่ยุคใหม่ของ AI กับ Gemini และนวัตกรรมล้ําสมัยจาก Google

การพัฒนาและความก้าวหน้าของโมเดล Gemini

โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI

การเติบโตของการใช้งาน AI และการนําไปใช้จริง

นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา

Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทํางานบนเว็บ

การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ

นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity

AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview

Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจํากัด

บทสรุปจาก Insiderly

คําศัพท์เฉพาะทางที่น่าสนใจ

บทความที่ควรอ่านต่อ

Qwen 3.6 คืออะไร และทำไมธุรกิจควรจับตา AI ฟรีตัวนี้

AI News สัปดาห์นี้บอกชัดว่า AI กำลังจะกลายเป็นคอมของเรา

Google AI Studio อัปเดตใหม่ ทำให้คนทำธุรกิจสร้างงานไวขึ้น

สรุป AI ส่งทางอีเมล