|
|
การประชุมนวัตกรรมประจําปี Google I/O 2025 ได้เปิดฉากขึ้นอย่างยิ่งใหญ่ พร้อมการประกาศเปิดตัวเทคโนโลยี AI ใหม่ล่าสุดที่น่าตื่นเต้นที่สุดในยุคนี้ นําโดยโมเดล AI ขั้นสูง "Gemini 2.5 Pro" และนวัตกรรมต่าง ๆ ที่ผสมผสานความคิดสร้างสรรค์และประสิทธิภาพเพื่อเปลี่ยนแปลงวิธีที่เราใช้เทคโนโลยีในชีวิตประจําวัน บทความนี้จะพาเราไปสํารวจทุกแง่มุมของการเปิดตัวครั้งนี้ พร้อมวิเคราะห์ความหมายและผลกระทบที่อาจเกิดขึ้นในวงการ AI และเทคโนโลยีโลกในอนาคต |
|
การพัฒนาและความก้าวหน้าของโมเดล Gemini |
Gemini 2.5 Pro คือโมเดล AI ที่ Google ภูมิใจนําเสนอในปีนี้ โดยมีการปรับปรุงอย่างรวดเร็วและต่อเนื่องตั้งแต่รุ่นแรกที่เปิดตัว ด้วยคะแนน Elo ที่เพิ่มขึ้นกว่า 300 คะแนน และครองแชมป์บนแหล่งข้อมูล Ella Marina ในทุกหมวดหมู่ นอกจากนี้ Gemini ยังทําผลงานโดดเด่นในด้านการเขียนโค้ด โดยรุ่น 2.5 Pro สามารถทําคะแนนสูงสุดบน WebDev Arena ด้วยคะแนนที่เพิ่มขึ้นถึง 142 Elo points ซึ่งแสดงให้เห็นถึงความสามารถที่เหนือชั้นในการสร้างโค้ดคุณภาพสูงอย่างรวดเร็ว |
การเติบโตของ Gemini ไม่ได้หยุดอยู่แค่การประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่เติบโตเร็วที่สุดในแพลตฟอร์ม Cursor ซึ่งเป็น AI editor สําหรับโค้ด โดยมีการสร้างโค้ดที่ผ่านการยอมรับหลายแสนบรรทัดต่อวินาที ซึ่งสะท้อนถึงความนิยมและการนําไปใช้งานที่แพร่หลายอย่างรวดเร็วในวงการนักพัฒนา |
|
ไฮไลต์ที่น่าประทับใจอีกอย่างคือ Gemini สามารถเล่นเกม Pokemon Blue จนสําเร็จได้อย่างสมบูรณ์ ทั้งการสะสมเหรียญครบ 8 เหรียญ เดินทางถึง Victory Road และเอาชนะ Elite Four รวมถึงแชมป์ ทําให้เราเข้าใกล้เป้าหมายของ "Artificial Pokemon Intelligence" อย่างจริงจัง |
โครงสร้างพื้นฐานและประสิทธิภาพของระบบ AI |
เบื้องหลังความสําเร็จของ Gemini คือโครงสร้างพื้นฐาน TPU รุ่นที่ 7 ที่ชื่อ Ironwood ซึ่งเป็นชิปประมวลผลที่ออกแบบมาเพื่อรองรับการประมวลผล AI ในระดับใหญ่ ด้วยประสิทธิภาพที่สูงกว่ารุ่นก่อนถึง 10 เท่า และรองรับการประมวลผลได้ถึง 42.5 exaflops ต่อพอร์ต ซึ่งจะเปิดให้บริการแก่ลูกค้า Google Cloud ภายในปีนี้ |
การผสมผสานระหว่างโครงสร้างพื้นฐานและโมเดล AI ทําให้ Gemini ครองอันดับ 1-3 ในการสร้าง token ต่อวินาทีบน LM arena leaderboard พร้อมกับลดราคาค่าใช้จ่ายลงอย่างมีนัยสําคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการจัดการสมดุลระหว่างคุณภาพและต้นทุนในการให้บริการ AI |
|
การเติบโตของการใช้งาน AI และการนําไปใช้จริง |
ในปีที่ผ่านมา การประมวลผลข้อมูลผ่านผลิตภัณฑ์และ API ของ Google เพิ่มขึ้นจาก 9.7 ล้านล้าน tokens ต่อเดือน เป็น 480 ล้านล้าน tokens ต่อเดือน หรือเพิ่มขึ้นประมาณ 50 เท่า ซึ่งแสดงถึงการยอมรับและการใช้งาน AI ที่พุ่งสูงขึ้นอย่างมหาศาล |
นักพัฒนา AI มากกว่า 7 ล้านคนได้สร้างสรรค์แอปพลิเคชันด้วย Gemini API ผ่าน Google AI Studio และ Vertex AI ซึ่งเติบโตขึ้นกว่า 5 เท่าตั้งแต่ Google I/O ครั้งก่อน นอกจากนี้ การใช้งาน Gemini บน Vertex AI ยังเพิ่มขึ้นกว่า 40 เท่าในระยะเวลาเพียงหนึ่งปี |
ในส่วนของผู้ใช้ทั่วไป แอป Gemini มีผู้ใช้งานมากกว่า 400 ล้านคนต่อเดือน โดยเฉพาะโมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้นถึง 45% ซึ่งชี้ให้เห็นว่า AI กําลังกลายเป็นส่วนสําคัญในชีวิตประจําวันของผู้คนมากขึ้นเรื่อย ๆ |
|
นวัตกรรมด้านการสื่อสารและการเข้าใจภาษา |
หนึ่งในโครงการวิจัยที่ได้รับความสนใจอย่างมากคือ Project Starline ซึ่งเป็นเทคโนโลยีวิดีโอ 3 มิติที่สร้างความรู้สึกเหมือนอยู่ในห้องเดียวกันแม้จะอยู่ไกลกัน โดยล่าสุด Google ได้เปิดตัว Google Beam ซึ่งเป็นแพลตฟอร์มสื่อสารวิดีโอ AI-first ที่ใช้กล้อง 6 ตัวจับภาพจากหลายมุม พร้อม AI ประมวลผลและแสดงผลบนจอแสดงผล 3 มิติที่ติดตามการเคลื่อนไหวของศีรษะได้อย่างแม่นยําและเรียลไทม์ |
นอกจากนี้ Google Meet ยังนําเทคโนโลยีแปลภาษาแบบเรียลไทม์มาใช้ ช่วยลดอุปสรรคด้านภาษาอย่างมีประสิทธิภาพ เช่น การสนทนาเกี่ยวกับการจองที่พักในต่างประเทศที่ใช้ภาษาแตกต่างกัน โดยสามารถจับโทนเสียงและการแสดงออกของผู้พูดได้อย่างแม่นยํา และตอนนี้ฟีเจอร์แปลภาษาแบบเรียลไทม์นี้เปิดให้ผู้ใช้ที่สมัครสมาชิกใช้งานภาษาอังกฤษและสเปนก่อน และจะขยายไปยังภาษาอื่น ๆ และองค์กรในเร็ว ๆ นี้ |
|
Project Astra และ Project Mariner: สู่ผู้ช่วย AI อัจฉริยะและผู้ช่วยทํางานบนเว็บ |
Project Astra คือการพัฒนาผู้ช่วย AI สากลที่เข้าใจโลกผ่านกล้องและหน้าจอ ช่วยให้เราพูดคุยและโต้ตอบกับสิ่งที่เห็นได้อย่างเป็นธรรมชาติ เช่น การฝึกสัมภาษณ์งาน หรือการฝึกซ้อมมาราธอน โดย Gemini Live ได้ผสานฟีเจอร์ของ Astra เช่น การแชร์หน้าจอและกล้อง ทําให้ผู้ใช้สามารถพูดคุยเกี่ยวกับสิ่งที่เห็นได้ทันที |
ความน่ารักของ Astra คือความสามารถในการตรวจจับและแก้ไขข้อผิดพลาดของผู้ใช้ เช่น การแยกแยะว่าสิ่งที่เห็นเป็นรถขยะ ไม่ใช่รถเปิดประทุน หรือการบอกว่าคนที่ตามเราไม่ใช่ใครแต่เป็นเงาของเราเอง ซึ่งช่วยเพิ่มความน่าเชื่อถือและความเป็นธรรมชาติในการสื่อสาร |
|
ในขณะเดียวกัน Project Mariner คือเอเจนต์ AI ที่สามารถทํางานบนเว็บแทนเราได้อย่างอัจฉริยะ โดยมีฟีเจอร์ multitasking ที่สามารถจัดการงานพร้อมกันได้ถึง 10 งาน และระบบ "teach and repeat" ที่ช่วยให้เอเจนต์เรียนรู้และทํางานซ้ําได้ตามคําสั่งที่สอนครั้งแรก ซึ่งเปิดให้เหล่านักพัฒนาสามารถใช้งานผ่าน Gemini API และจะเปิดให้ใช้กันอย่างกว้างขวางในช่วงฤดูร้อนนี้ |
ความน่าสนใจของ Mariner คือการเป็นส่วนหนึ่งของระบบเอเจนต์ที่สามารถสื่อสารกันได้ผ่านโปรโตคอล open agent to agent และเชื่อมต่อกับบริการต่าง ๆ ผ่าน model context protocol (MCP) ทําให้สามารถทํางานร่วมกันและตอบสนองความต้องการของผู้ใช้ได้อย่างครอบคลุม |
|
การปรับแต่งส่วนบุคคล (Personal Context) และการสื่อสารที่เป็นธรรมชาติ |
Google กําลังพัฒนาให้ Gemini สามารถเข้าถึงและใช้ข้อมูลส่วนตัวที่เกี่ยวข้องจากแอปต่าง ๆ ของ Google ได้อย่างปลอดภัยและเป็นส่วนตัว เพื่อสร้างประสบการณ์ AI ที่เหมาะสมกับแต่ละคนมากขึ้น เช่น ฟีเจอร์ Personalized Smart Replies ใน Gmail ที่สามารถตอบอีเมลโดยใช้สไตล์และโทนเสียงของผู้ใช้เอง โดย Gemini จะค้นหาข้อมูลการเดินทางและแผนการต่าง ๆ จาก Google Drive และ Docs มาใช้ประมวลผลคําตอบ ทําให้การสื่อสารดูเป็นธรรมชาติและมีรายละเอียดที่น่าประทับใจ |
|
นวัตกรรมการสร้างสรรค์ด้วย AI: From Code to Creativity |
Gemini 2.5 Pro ไม่ได้เป็นเพียงโมเดลที่เก่งในการประมวลผลภาษาและโค้ดเท่านั้น แต่ยังสามารถแปลงภาพร่างสเก็ตช์ 2 มิติให้กลายเป็นแอนิเมชัน 3 มิติที่ซับซ้อนได้อย่างรวดเร็วและแม่นยํา ผ่าน Google AI Studio ซึ่งช่วยลดความซับซ้อนในการเรียนรู้เทคโนโลยี 3 มิติลงอย่างมาก |
นอกจากนี้ Gemini ยังมีฟีเจอร์เสียงพูด (text-to-speech) ที่รองรับหลายเสียงและหลายภาษา สามารถเปลี่ยนโทนเสียงได้อย่างลื่นไหล รวมถึงสร้างเสียงกระซิบได้อย่างน่าทึ่ง ช่วยเพิ่มความสมจริงให้กับแอปพลิเคชันที่ต้องการสื่อสารด้วยเสียง |
ในส่วนของการสร้างวิดีโอ Google ได้เปิดตัว VO3 ซึ่งเป็นโมเดลสร้างวิดีโอที่สามารถสร้างเสียงประกอบและบทสนทนาได้ในตัวเดียวกัน เช่น การสร้างฉากป่าและบทสนทนาของสัตว์ในนั้นอย่างสมจริง ซึ่งถือเป็นก้าวสําคัญของการสร้างสื่อดิจิทัลที่ผสมผสานภาพและเสียงด้วย AI |
AI ในการค้นหาและช็อปปิ้ง: AI Mode และ AI Overview |
Google Search กําลังเปลี่ยนโฉมหน้าด้วย AI Mode ที่สร้างประสบการณ์ค้นหาขั้นสูง โดยใช้โมเดล Gemini 2.5 ที่มีความสามารถในการวิเคราะห์คําถามที่ซับซ้อนและตอบกลับด้วยข้อมูลที่เชื่อถือได้ พร้อมแสดงผลลัพธ์ในรูปแบบที่เหมาะสม เช่น ตาราง กราฟ หรือแผนที่ |
ฟีเจอร์ Query Fan Out ช่วยให้ AI แบ่งคําถามออกเป็นหลายส่วน และค้นหาข้อมูลจากหลายแหล่งพร้อมกัน เพื่อให้ได้คําตอบที่ครบถ้วนและแม่นยํา นอกจากนี้ยังมีฟีเจอร์ Deep Research ที่ช่วยค้นคว้าเชิงลึกโดยการสืบค้นข้อมูลหลายสิบถึงร้อยครั้ง เพื่อสร้างรายงานที่อ้างอิงได้เต็มรูปแบบภายในไม่กี่นาที |
ในด้านการช็อปปิ้ง AI Mode ยังรวมข้อมูลจาก Google Images และ Shopping Graph ที่มีสินค้ากว่า 50 พันล้านรายการ พร้อมฟีเจอร์ Try On ที่ใช้ AI สร้างภาพเสื้อผ้าที่เหมาะกับรูปร่างและท่าทางของผู้ใช้จริง ๆ ช่วยให้ตัดสินใจซื้อได้ง่ายขึ้น รวมถึง Agent Checkout ที่สามารถติดตามราคาและซื้อสินค้าให้โดยอัตโนมัติผ่าน Google Pay |
|
Android XR และอนาคตของการใช้งาน AI แบบไร้ขีดจํากัด |
Android XR คือแพลตฟอร์มที่ออกแบบมาเพื่อรองรับอุปกรณ์หลากหลายรูปแบบ ตั้งแต่แว่นตาอัจฉริยะจนถึงแว่น VR ที่ให้ประสบการณ์เสมือนจริง โดยร่วมมือกับ Samsung และ Qualcomm เพื่อสร้างระบบนิเวศที่สมบูรณ์แบบสําหรับการใช้งาน AI ในชีวิตประจําวัน |
ตัวอย่างเช่น Project Muhan ซึ่งเป็นอุปกรณ์ Android XR รุ่นแรกที่ให้ผู้ใช้สัมผัสประสบการณ์หน้าจอแบบไม่จํากัด พร้อม AI ที่ช่วยในการนําทาง ดูข้อมูล หรือแม้แต่ดูการแข่งขันกีฬาในแบบเสมือนจริง ขณะที่แว่นตา Android XR รุ่นใหม่มีขนาดเบา ใส่สบาย เหมาะสําหรับใช้งานตลอดวัน พร้อมกล้อง ไมโครโฟน และลําโพงที่ช่วยให้ AI สามารถรับรู้และตอบสนองโลกภายนอกได้อย่างแม่นยํา |
ฟีเจอร์เด่นอีกอย่างคือการแปลภาษาสดผ่านแว่นตาที่สามารถแสดงคําแปลแบบเรียลไทม์ ทําให้การสื่อสารข้ามภาษาง่ายขึ้นมาก ซึ่งแสดงให้เห็นถึงความก้าวหน้าของ AI ที่จะช่วยเราฟัง พูด และเข้าใจโลกได้มากขึ้นทุกวัน |
|
บทสรุปจาก Insiderly |
Google I/O 2025 ได้เผยให้เห็นถึงการก้าวกระโดดครั้งสําคัญของเทคโนโลยี AI ผ่านโมเดล Gemini 2.5 Pro ที่ไม่เพียงแค่ฉลาดขึ้นในด้านการประมวลผลภาษาและโค้ด แต่ยังขยายสู่ความสามารถหลากหลาย ตั้งแต่การสื่อสารวิดีโอ 3 มิติ การสร้างภาพและวิดีโอแบบมีเสียง ไปจนถึงการช่วยงานแบบอัตโนมัติบนเว็บ และการค้นหาข้อมูลอย่างลึกซึ้ง |
สิ่งที่น่าจับตามองคือการผสาน AI เข้ากับอุปกรณ์ใหม่ ๆ อย่าง Android XR ซึ่งจะทําให้ AI กลายเป็นผู้ช่วยที่อยู่เคียงข้างเราตลอดเวลา ไม่ว่าจะเป็นแว่นตา หรือแว่น VR ที่ให้ประสบการณ์ใหม่ในการติดต่อสื่อสารและการเรียนรู้ |
การเชื่อมโยง AI กับข้อมูลส่วนบุคคลอย่างปลอดภัยผ่านฟีเจอร์ Personal Context จะช่วยให้ AI เข้าใจและตอบสนองได้เหมาะสมกับแต่ละบุคคลมากขึ้น เพิ่มความสะดวกและประสิทธิภาพในการใช้งาน |
โดยรวมแล้ว Google กําลังสร้างระบบนิเวศ AI ที่ครบวงจร ตั้งแต่โมเดลพื้นฐานไปจนถึงแอปพลิเคชันและอุปกรณ์ใหม่ ๆ ที่ช่วยให้ AI เป็นมากกว่าผู้ช่วย แต่เป็นเพื่อนร่วมทางในชีวิตดิจิทัลอย่างแท้จริง |
สําหรับวงการเทคโนโลยีและผู้ที่สนใจ AI การเปิดตัวครั้งนี้เป็นสัญญาณที่ชัดเจนว่าโลกกําลังก้าวเข้าสู่ยุคที่ AI จะเปลี่ยนแปลงทุกมิติของการใช้ชีวิตและการทํางานอย่างไม่เคยมีมาก่อน |
คําศัพท์เฉพาะทางที่น่าสนใจ |
Elo Score: ระบบการวัดประสิทธิภาพของโมเดล AI โดยอ้างอิงจากคะแนนการแข่งขันหรือประสิทธิภาพในงานเฉพาะด้าน TPU (Tensor Processing Unit): ชิปประมวลผลที่ออกแบบเฉพาะสําหรับงาน AI โดย Google เพื่อเพิ่มความเร็วและประสิทธิภาพในการเทรนและรันโมเดล Multitasking: ความสามารถของ AI ในการจัดการหลายงานพร้อมกัน Teach and Repeat: ระบบที่ AI เรียนรู้จากการสอนครั้งแรกและสามารถทําซ้ํางานที่คล้ายกันได้ในอนาคต Model Context Protocol (MCP): โปรโตคอลที่ช่วยให้โมเดล AI สามารถเชื่อมต่อและใช้บริการอื่น ๆ ได้อย่างมีประสิทธิภาพ Diffusion Model: โมเดล AI ที่สร้างผลลัพธ์โดยการปรับปรุงจากสัญญาณรบกวนทีละขั้นตอน ทําให้ได้ผลลัพธ์ที่มีความแม่นยําและรวดเร็ว Agentic Capability: ความสามารถของ AI ในการทํางานแทนผู้ใช้และตัดสินใจภายใต้การควบคุมของผู้ใช้
|